⻓窗⼝训练研究
价格 双方协商
地区: 北京市 市辖区 海淀区
需求方: 北京***公司
行业领域
电子信息技术
需求背景
context window的⼤⼩影响到⼤模型能够接受外部prompt输⼊的⻓度,是⼤模型基础能⼒中重要的因素。
需解决的主要技术难题
1.⻓窗⼝友好的⽹络架构:研究位置编码以及⻓窗⼝友好的⽹络架构等。2. ⻓窗⼝友好的数据及训练⽅法:研究⻓窗⼝友好的数据、训练的⽅法(全量还是增量)等。3. ⻓窗⼝能⼒的评测:研究如何进⾏⻓窗⼝能⼒的评测。 4. ⻓窗⼝外推⽅案探索:研究⻓窗⼝外推⽅案,外推原理,做到 train short,inference longer。
期望实现的主要技术目标
1.窗⼝⻓度。2.如何使⽤更低成本实现⻓窗⼝的能⼒。3.⻓窗⼝的能⼒评测。
需求解析
解析单位:“科创中国”工业互联网产业科技服务团(中国计算机学会) 解析时间:2023-10-15
赵娜
云南大学
副教授
综合评价
处理进度