基于国产GPU的计算软件栈建设
价格 双方协商
地区: 湖南省 长沙市 岳麓区
需求方: 长沙***公司
行业领域
新材料技术
需求背景
目前在技术方面存在的困难以及需解决的问题图形处理器(GPU)是计算机显卡的核心芯片,也是高性能计算与深度学习的关键部件,软件生态是决定GPU产品应用的核心因素,任何一个成功的计算平台都需拥有广泛而丰富的软件生态系统。如NVIDIA的成功依赖于CUDA生态系统可用的工具、库、应用程序和合作伙伴,通过软件生态的建设,构筑了强大的技术壁垒,使竞争对手难以逾越和替换。由于没有企业可提供与国产GPU配套的软件开发平台,国内所有高端军事应用系统,自动驾驶、人工智能等民用领域,基本都采用NVIDIA的CUDA平台开发应用产品,同时,由于国外GPU厂商软件开发平台完全不支持国产计算机平台,在国产计算机平台上,根本无法开发高端GPU国产应用软件。“安全与可靠”已成为国家信息产业发展的重要目标,目前计算软件的发展方向仍掌握在国外几个大公司手中,在国产GPU平台上构建自己的软件生态已经成为自主软件发展的重中之重。
需解决的主要技术难题
针对国产GPU的高性能虚拟化技术,需要解决以下几方面的需求:
1)国产GPU虚拟化体系结构设计
针对景嘉微电子的JM7200、JM9200国产GPU,实现一套高效的GPU虚拟化方案,使其初步具备虚拟化功能。项目需要先从软件层面对GPU进行虚拟化体系结构设计,使其具备虚拟化能力,并且在虚拟域内达到物理GPU性能的75%以上。
2)国产GPU虚拟化的资源划分
GPU虚拟化技术的目的是实现高性能高效率的一对多,在使已有国产GPU具备虚拟化能力之后,需要解决多虚拟域环境下GPU的虚拟化及资源分配和调度技术。研究基于国产GPU的GPU分片虚拟化技术,对物理GPU在时间片上进行划分以实现多个虚拟域的逻辑独占和物理共享,对物理GPU的资源(如显存)进行空间上的划分与隔离,以保证每个虚拟机的GPU资源需求和安全性。
3)国产GPU虚拟化的公平调度算法
基于国产GPU当前在性能方面与国外最新产品尚有一定差距的现状,还需要研究和设计调度方案,以尽可能地实现对GPU资源的高效和公平调度。通过解决以上需求,争取实现单卡(JM7200或JM9200)支持不少于4台虚拟机,对GPU资源的调度效率评估不低于75%的技术指标。
4)国产GPU虚拟化的安全性
目前GPU虚拟化主要集中在虚拟化的功能实现和通信效率之上。然而,在信息爆炸的大背景下,安全性将会是GPU虚拟化另一个不可忽视的问题。项目需结合国产虚拟化平台和国产GPU内存隔离机制两个角度进行安全研究。
5)结合硬件支持的国产GPU虚拟化方法
在结合已有的软件层面实现的高效GPU虚拟化方案的基础上,通过积累对国产GPU虚拟化技术研究和实现的经验,反馈和指导下一代GPU芯片的设计以添加硬件支持的虚拟化功能,通过在芯片层面引入相关硬件单元并适配虚拟化场景,实现高性能的针对国产GPU的硬件虚拟化功能,将虚拟域内GPU的性能提升至物理GPU的90%以上。
期望实现的主要技术目标
预期成果及经济社会生态效益
预期成果:(1)国产GPU的虚拟化技术路线研究分析报告,在分析现有国产GPU的技术特性的基础上,提出实现虚拟化所必须的硬件功能及其软件接口,设计相应的虚拟化支撑软件;(2)基于国产GPU或其仿真验证平台上的虚拟化示范系统。
经济社会生态效益:在云计算作为国家战略的大背景下,实现针对国产GPU的虚拟化技术的突破,可以推动云计算系统中GPU的国产替换,进一步保障信息安全和解决技术封锁的限制。同时,也有利于我省的GPU芯片企业(如景嘉微)的产品在云计算领域的切入和市场推广,加速我省GPU产业向民用芯片市场的渗透,促进我省的GPU相关产业链的发展和转型升级。
另外,GPU芯片需要长年累月的迭代和优化,需要巨大的研发费用和资本开销。通过国产GPU的虚拟化技术的突破,有助于国产GPU芯片企业在云计算市场落地,获取持续的利润支撑,并累计数据和经验,进一步驱动对GPU技术的跨代研发和发展,反过来又推动虚拟化技术的性能跨越,实现良性循环,最终达到并超越国际先进水平。
项目成果产业化后,预计可达数十亿级的经济规模,新增就业岗位数千人。
处理进度