大语言模型研究员

发布时间: 2024-07-09

价格: 自行协商

旌阳区 | 1年以下 | 硕士/研究生及同等学历 | 人才招聘 | 新一代信息技术产业,人工智能

需求描述

一、岗位职责

1.负责长文本LLM的增量训练以及效果优化，包括但不限于预训练、微调、对齐等；

2.根据产品需求，设计并提供模块化算法系统的技术路线和优化方案，如模块化RAG系统、Agent；

3.跟踪NLP大模型前沿探索，进行可落地成果转化，推动模型效果达到业界领先的水平。

二、任职要求

1.计算机相关专业硕士及以上学历；发表过NLP相关研究顶会论文优先；

2.对NLP主流预训练语言模型有一定的了解（BERT/GPT/T5/PaLM/GLM/Bloom/LLaMA）；

3.熟练掌握主流深度学习框架TensorFlow/Pytorch，有大模型训练框架Megatron-LM/Deepspeed使用经验者优先；

4.熟练掌握linux基础命令和操作，能独立完成集群运行环境的搭建；

5.有良好的学习，沟通和团队协作能力；

6.有较好的英文科学文献阅读能力。

办公地址

德阳特斯联AI CITY

处理进度

科创中国