⼤模型量化感知训练研究
价格 双方协商
地区: 北京市 市辖区 海淀区
需求方: 北京***公司
行业领域
电子信息技术
需求背景
模型量化作为⼀种模型压缩技术,可以减少模型⼤⼩并加速推理,但常常以牺牲模型性能为代价。量化感知训练提出了在模型训练后,再进⾏有限token的训练,使得量化后的模型能够接近原始模型的性能。
需解决的主要技术难题
1.⾃适应量化策略:研究如何基于模型的特性和任务需求,⾃动选择最适合的量化策略。 2. 多阶段微调:考虑在不同训练阶段引⼊不同的量化和微调策略,使模型在整个训练周期中都保持较⾼的性能。 3.领域适应性量化感知训练:对于特定领域的⼤模型,探索更有针对性的量化和微调策略。
期望实现的主要技术目标
1.研究⼤模型在不同量化策略下的性能表现,并确定最优的量化策略。 2.优化量化感知训练过程,使其更加稳健和⾼效。 3.分析量化感知训练在各种⼤模型上的通⽤性及特定领域中的适⽤性。
需求解析
解析单位:“科创中国”工业互联网产业科技服务团(中国计算机学会) 解析时间:2023-10-12
杨平乐
上海理工大学
副教授,智能控制与数据处理研究所副所长
综合评价
处理进度