大规模全栈式机器学习流水线的关键技术及应用
成果类型:: 发明专利
发布时间: 2023-03-17 15:43:36
人工智能(AI)技术正在对人类社会产生重大深远影响。党中央、国务院高度重视人工智能“新基建 ”,出台一系列政策进行重点支持。伴随各行各业数“智”化转型推进,业界逐渐认识到:AI赋能千行 百业的真正挑战不是构建机器学习模型,而是构建机器学习模型开发流水线并在生产环境中高效应用。当 前面临的主要困难有:AI数据管理效率低、成本高、可信性难以保证;AI数据处理标准不统一、标注成 本高;AI模型开发门槛高、自动化程度低;AI模型过于臃肿、跨平台部署困难。为了克服这些问题,中 兴通讯与北京大学进行联合研究,在海量数据可信管理、数据处理及标注、模型分布式自动化训练、模型 部署优化等方面取得了重大技术突破。 项目发表论文27篇,申请发明专利29项,授权17项,获软件著作权1项。牵头制定多项国内外标准,主导 两个AI开源社区。研制的大规模全栈式机器学习流水线平台,广泛应用于电信、金融、政务、智能制造 等领域,取得显著的经济和社会效益,近三年新增销售额69.95亿元,利润7.94亿元。
本项目主要技术创新有:大容量高可信数据管理技术。提出多级智能存储技术,实现高性价比 AI 存储;提出海量 AI 数据隐私保护技术框架,实现可用性与安全性的平衡;提出分布式存储可靠性保障技术,实现可信可靠AI 数据存储。低成本标准化数据处理技术。提出标准化数据处理框架,充分发挥AI 数据价值;提出自监督主动标注技术,降低数据标注代价;提出图神经网络主动学习技术,减少数据依赖、提升训练效率。分布式自学习模型训练优化技术。提出多尺度模型架构自动搜索技术,实现 AI 模型设计自动化;提出自动算法优选和超参调优技术,大幅提升 AI 流水线效率;提出分布式训练优化技术,有效克服分布式通信瓶颈。广兼容高效率 AI 模型优化编译部署技术。提出跨平台自动部署技术框架,降低部署成本;提出基于微内核的模型高效编译技术,消除算子编译性能瓶颈;提出模型蒸馏技术,克服线上部署模型精度下降的问题。
本项目成果已获得产业化应用,在电信运营商、政府、垂直行业的多个单位成功商用,取得了良好的经济效益,同时 AI 平台在 Linux 基金会开源,取得了良好的社会效益,促进了我国人工智能技术领域的产业发展和自主创新。典型应用案例如下: (1)中国电信集团“企业级 AI 平台”。中国电信在企业数字化转型中为了提供智能化的增效降本技术保障,与中兴通讯合作进行了企业级AI 通用平台建设,通过一站式 AI 通用平台,助力中国电信快速实现企业数字化转型和跨越式升级,作为中国电信数字化转型的“核心大脑”,该平台构建电信集团层面的“数据适配及预处理、数据标注、模型训练(机器学习、深度学习大规模分布式训练,可视化编排)、模型推理和加速、AI 能力开放”等能力,双方持续大合作做深做强 AI 平台,使其成为业界数字化转型的标杆。平台商用以来,已逐步完成电信集团 500 台 GPU 服务器、2000 块 GPU 卡的管理,支撑电信集团40 多位标注工程师、60 多位算法工程师的数据标注、算法研发及模型训练等日常工作。(2)中国商用飞机公司“构型比对系统项目”。中兴通讯与中国商飞合作,利用 AI 云平台提供的全方位、端到端的算法研发能力,为产品建立数字孪生模型,工艺设计数据全部纳入平台赋能的智能制造知识图谱的管控之下。解决了传统工艺数据管理难以跟踪维护、难以处理变更扩散、难以维护全生命周期的设计和工艺数据三大痛点问题,为中国商飞研发了“国产大飞机设计制造全三维全生命周期构型比对系统”。 (3)茅台集团“制酒酿造技艺机器学习系统研究项目”。中兴通讯与茅台集团合作“制酒酿造技艺机器学习系统研究项目”,以茅台优秀的传统制酒酿造技艺数字化提取为核心,基于 AI 平台构建从标注、训练、部署等端到端自动化 AI 模型生产技术,通过数据挖掘、机器视觉等先进的信息技术手段,采集制酒酿造过程中的数字密码,形成茅台制酒酿造技艺数据仓库,生成可视化应用,大大提高生产效率和生产的自动化程度。
“大规模全栈式机器学习流水线的关键技术及应用“成果由中兴通讯股份有 限公司、北京大学合作完成。本项目的第1 、3 、4 、6~15 完成人屠要峰、韩炳涛、高洪、王永成、周祥生、刘涛、牛家浩、徐进、潘佳懿、董修岗、张洋铭、李忠良、王晓龙在中兴通讯股份有限公司工作,长期共同从事人工智能技术与产品的研发工作与应用推广。本项目的第2 、5 完成人崔斌、杨全在北京大学计算机学院工作,长期从事人工智能的学术研究工作。
社会效益 1)提升效率,减少人工工作量,解放生产力:在电信运营商局点部署根因分析算法模块后,告警的压减率达到 47%,故障恢复速度提升50%,辅助运维人员高效处理工单,大幅缩短故障定位时间。基于 AI 云平台提供的“国产大飞机设计制造全三维全生命周期构型比对系统”为中国商飞降低人工工作量90%以上,将历史产生的 10 万+条工程指令全部结构化并纳入系统管控。2)加快数字化转型,助力数字经济发展壮大:平台为工业、冶金钢铁、交通、矿山、数字城市、文旅、媒体等 15 个行业以及各级政府机构提供产业数字化和社区智慧治理方案,赋能湖南省政府、中国电信、中国商飞、茅台、柳钢等政府或国有大型企业实现数字化、智能化转型,为助力数字经济高质量发展做出突出贡献。 3)建立产学研联合体,培养大批人工智能人才:中兴通讯和北京大学建立基础软件联合实验室,共同深耕人工智能技术,培养了博士生10 余名,硕士生120 余名,研发技术人才 600 余名,为人工智能产业发展培养了人才。4)贡献标准和开源,促进技术进步:主导国际标准(ITU-T Y.3174, Y.3179)和国家标准(YD/T 3806-2020)制定,促进技术进步。建立Adlik 开源项目及社区,积极致力于社区交流及技术布道,让更多的企业了解、使用Adlik,共同促进人工智能技术在生产实践中的应用。开源 Adlik 项目在GitHub 平台的Star 数超过 500,访问量超过 40000 次,代码 clone 次数超过10000 次,已经成为非常有活力的 AI 开源社区。开源 open-box 项目在 GitHub 平台的Star 数达到190。
本项目成果已获得产业化应用,在电信运营商、政府、垂直行业的多个单位成功商用,取得了良好的经济效益,同时 AI 平台在 Linux 基金会开源,取得了良好的社会效益,促进了我国人工智能技术领域的产业发展和自主创新。典型应用案例如下: (1)中国电信集团“企业级 AI 平台”。中国电信在企业数字化转型中为了提供智能化的增效降本技术保障,与中兴通讯合作进行了企业级AI 通用平台建设,通过一站式 AI 通用平台,助力中国电信快速实现企业数字化转型和跨越式升级,作为中国电信数字化转型的“核心大脑”,该平台构建电信集团层面的“数据适配及预处理、数据标注、模型训练(机器学习、深度学习大规模分布式训练,可视化编排)、模型推理和加速、AI 能力开放”等能力,双方持续大合作做深做强 AI 平台,使其成为业界数字化转型的标杆。平台商用以来,已逐步完成电信集团 500 台 GPU 服务器、2000 块 GPU 卡的管理,支撑电信集团40 多位标注工程师、60 多位算法工程师的数据标注、算法研发及模型训练等日常工作。(2)中国商用飞机公司“构型比对系统项目”。中兴通讯与中国商飞合作,利用 AI 云平台提供的全方位、端到端的算法研发能力,为产品建立数字孪生模型,工艺设计数据全部纳入平台赋能的智能制造知识图谱的管控之下。解决了传统工艺数据管理难以跟踪维护、难以处理变更扩散、难以维护全生命周期的设计和工艺数据三大痛点问题,为中国商飞研发了“国产大飞机设计制造全三维全生命周期构型比对系统”。 (3)茅台集团“制酒酿造技艺机器学习系统研究项目”。中兴通讯与茅台集团合作“制酒酿造技艺机器学习系统研究项目”,以茅台优秀的传统制酒酿造技艺数字化提取为核心,基于 AI 平台构建从标注、训练、部署等端到端自动化 AI 模型生产技术,通过数据挖掘、机器视觉等先进的信息技术手段,采集制酒酿造过程中的数字密码,形成茅台制酒酿造技艺数据仓库,生成可视化应用,大大提高生产效率和生产的自动化程度。