大语言模型研究员
价格: 自行协商
旌阳区 | 1年以下 | 硕士/研究生及同等学历 | 人才招聘 | 新一代信息技术产业,人工智能
需求描述
一、岗位职责
1.负责长文本LLM的增量训练以及效果优化,包括但不限于预训练、微调、对齐等;
2.根据产品需求,设计并提供模块化算法系统的技术路线和优化方案,如模块化RAG系统、Agent;
3.跟踪NLP大模型前沿探索,进行可落地成果转化,推动模型效果达到业界领先的水平。
二、任职要求
1.计算机相关专业硕士及以上学历;发表过NLP相关研究顶会论文优先;
2.对NLP主流预训练语言模型有一定的了解(BERT/GPT/T5/PaLM/GLM/Bloom/LLaMA);
3.熟练掌握主流深度学习框架TensorFlow/Pytorch,有大模型训练框架Megatron-LM/Deepspeed使用经验者优先;
4.熟练掌握linux基础命令和操作,能独立完成集群运行环境的搭建;
5.有良好的学习,沟通和团队协作能力;
6.有较好的英文科学文献阅读能力。
办公地址
德阳特斯联AI CITY
处理进度