• 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

大模型参数高效微调方法综述: 技术、趋势与挑战

唐岸达 林宙辰

唐岸达, 林宙辰. 大模型参数高效微调方法综述: 技术、趋势与挑战. 自动化学报, xxxx, xx(x): x−xx doi: 10.16383/j.aas.c250451
引用本文: 唐岸达, 林宙辰. 大模型参数高效微调方法综述: 技术、趋势与挑战. 自动化学报, xxxx, xx(x): x−xx doi: 10.16383/j.aas.c250451
Tang An-Da, Lin Zhou-Chen. A survey on parameter-efficient fine-tuning of large models: techniques, trends, and challenges. Acta Automatica Sinica, xxxx, xx(x): x−xx doi: 10.16383/j.aas.c250451
Citation: Tang An-Da, Lin Zhou-Chen. A survey on parameter-efficient fine-tuning of large models: techniques, trends, and challenges. Acta Automatica Sinica, xxxx, xx(x): x−xx doi: 10.16383/j.aas.c250451

大模型参数高效微调方法综述: 技术、趋势与挑战

doi: 10.16383/j.aas.c250451 cstr: 32138.14.j.aas.c250451
基金项目: 国家自然科学基金(62276004), 北京市自然科学基金(L257007)资助
详细信息
    作者简介:

    唐岸达:北京大学智能学院博士后. 2024年获得中国科学院大学数学科学学院理学博士学位. 主要研究方向为机器学习, 深度学习和优化. E-mail: tanganda@pku.edu.cn

    林宙辰:2000年获得北京大学博士学位, 现为北京大学智能学院博雅特聘教授, 主要研究方向为机器学习和数值优化. 本文通讯作者. E-mail: zlin@pku.edu.cn

A Survey on Parameter-efficient Fine-tuning of Large Models: Techniques, Trends, and Challenges

Funds: Supported by National Natural Science Foundation of China (62276004) and Beijing Natural Science Foundation (L257007)
More Information
    Author Bio:

    TANG An-Da Postdoctor at the school of Intelligence Science and Technology, Peking University. He received his Ph.D. degree in Science from the School of Mathematical Sciences, University of Chinese Academy of Sciences in 2024. His research interests include machine learning, deep learning, and optimization

    LIN Zhou-Chen Professor at the School of Intelligence Science and Technology, Peking University. He received his Ph.D. degree from Peking University in 2000. His research interests include machine learning and numerical optimization. Corresponding author of this paper

  • 摘要: 大规模预训练模型已经在自然语言处理等领域展现出强大的能力. 为更好地适配下游任务, 微调预训练模型是一个常用的方法. 然而, 大模型的全参数微调面临计算成本高昂、存储需求巨大等严峻挑战. 参数高效微调(PEFT)作为解决这些问题的关键技术范式, 仅引入或选择极少量可训练参数, 在显著降低计算和存储开销的同时, 有效保持模型的能力. 该综述系统梳理PEFT领域的主流方法体系、关键技术进展与发展趋势. 首先, 将现有方法归纳为四大范式: 添加式、局部式、重参数化式以及融合式, 并深入剖析各类方法的核心机理、性能特征、应用场景及策略优势. 进而, 重点探讨PEFT的技术演进, 从技术变化中分析出现该发展的内在本质规律, 总结出PEFT 方法从单一方法创新向存储、计算、性能三元权衡, 以及自动化、智能化、软硬件协同等统一框架发展的技术趋势. 更进一步, 该综述对各类PEFT中的代表性方法进行系统性的定量比较, 在统一的模型与数据集上评估其性能与参数效率. 此外, 本综述还涵盖PEFT 技术在视觉、语音及跨模态模型等领域的拓展应用, 展现其广泛的适用性. 最后, 总结并探讨未来研究方向, 以推动更高效、更适应多样化任务的大型模型微调技术的发展.