您所在的位置: 需求库 技术需求 GPU 内核态虚拟化共享技术研究

GPU 内核态虚拟化共享技术研究

发布时间: 2023-10-02
来源: 科技服务团
截止日期:2023-10-07

价格 双方协商

地区: 北京市 市辖区 海淀区

需求方: 联想**

行业领域

电子信息技术

需求背景

GPU 虚拟化技术对于提升 AI 和科学计算等场景的算力资源利 用率具有重要的意义,本指南旨在突破当前面向 NVIDIA GPU 的虚拟化 技术,在保障应用服务质量(QoS)的前提下,具备 GPU 显存、算力资源 和故障隔离效果,最小化应用在使用虚拟 GPU 和物理 GPU 设备时在性能 和使用方式上的差异。

需解决的主要技术难题

内核态下 GPU 细粒度共享技术,支持容器化共享;研究 跨网络的远程虚拟化 GPU 设备访问技术,以及虚拟机环境下 GPU 热迁移 技术;设计一套基于 NVIDIA GPU 设备灵活、高效的虚拟化框架与计算 平台,兼容 Kubernetes 云原生平台与虚拟机环境。

期望实现的主要技术目标

1.支持显存资源上限与算力资源隔离,以及细粒度资源配置和任务监控能力;兼容 Turing、Volta、Ampere、Hoper 等主流 Nvidia GPU 架构。 *** 虚拟化设备的存储与计算性能与同规格物理 GPU 设备保持5%以内的差距(不考虑跨网络远程访问情况)。 3.在不重启虚拟机的前提下,能够将虚拟 GPU 设备动态迁移至其他不同的物理 GPU 之上。 4.发表体系结构/虚拟化技术相关领域 CCF A 类会议1-2篇。

需求解析

解析单位:“科创中国”工业互联网产业科技服务团(中国计算机学会) 解析时间:2023-10-15

赵娜

云南大学

副教授

综合评价

本项目的研发内容主要包括:GPU细粒度共享技术、跨网络的远程虚拟化GPU设备访问技术、虚拟机环境下GPU热迁移技术、基于NVIDIA GPU设备的虚拟化框架与计算平台。 针对以上研发内容,目前市场上尚未有成熟的解决方案,因此,本项目在云计算和大规模并行计算等领域具有巨大的应用价值,主要包括: 1、提升GPU资源利用率和计算性能。 2、拓展GPU应用场景,实现远程工作和协作。 3、提高虚拟机GPU资源管理的灵活性和可用性,支持高可用和负载均衡的需求。 4、推动云原生应用与GPU计算的融合发展,提供高效的GPU计算平台。
查看更多>
更多

处理进度

  1. 提交需求
    2023-10-02 22:28:07
  2. 确认需求
    2023-10-07 17:56:49
  3. 需求服务
    2023-10-07 17:56:49
  4. 需求签约
  5. 需求完成