行业领域:
电子信息技术,新一代信息技术产业,计算机及网络技术,互联网与云计算、大数据服务
成果介绍
通过企业私有数据对大语言模型进行微调来打造符合企业需求的垂直领域大语言模型,自ChatGPT问世后,国内互联网大厂纷纷发布自己的大语言模型,如百度的文心一言,阿里的通义千问等 针对大语言模型的定制化是一个全新的方向,大型互联网公司和很多其他初创企业处在同一起跑线.
成果亮点
• 全链路一体化服务,大大降低AI定制化门槛
• 提供全方位的数据准备、模型微调、模型评估、模型部署等服务
• 训练流程自动化,极大提升模型迭代速度和效率
• 模型一键部署
• 模型多样化
• 支持ChatGPT以及各种开源大语言模型,如redpajama, open llama等
• 低延迟、低成本、高稳定性
• 自研向量数据库、模型压缩、自动化模型评估系统、弹性扩容等技术
• 拥抱和支持开源大语言模型,降低使用成本
• 数据安全
• 支持模型私有化部署
团队介绍
罗琼(Advisor),香港科技大学教授,研究领域包括大数据系统,高效并行计算,GPU高效计算等.
王森洪,2012年毕业于上海交通大学计算机系,后在香港科技大学深造从事GPGPU研究并于2014年获得计算机硕士学位。毕业后到2021年先后任职于美国谷歌,Meta(原Facebook)等公司领导大规模搜索和广告等AI系统的架构开发,领导开发了服务十亿QPS的向量数据库,模型内存管理系统等。
张翔,佛罗里达大学计算机硕士,北京航空航天大学本科。2016-2021年间在Snapchat广告平台担任资深软件工程师,负责广告产品开发、infra建设、性能尤化等核心业务。搭建了具有数千机器集群的超大规模ads infrastructure,具有百万qps的处理能力和百亿级别数据处理经验。
成果资料