GPU 内核态虚拟化共享技术研究
价格 双方协商
地区: 北京市 市辖区 海淀区
需求方: 联想**
行业领域
电子信息技术
需求背景
GPU 虚拟化技术对于提升 AI 和科学计算等场景的算力资源利 用率具有重要的意义,本指南旨在突破当前面向 NVIDIA GPU 的虚拟化 技术,在保障应用服务质量(QoS)的前提下,具备 GPU 显存、算力资源 和故障隔离效果,最小化应用在使用虚拟 GPU 和物理 GPU 设备时在性能 和使用方式上的差异。
需解决的主要技术难题
内核态下 GPU 细粒度共享技术,支持容器化共享;研究 跨网络的远程虚拟化 GPU 设备访问技术,以及虚拟机环境下 GPU 热迁移 技术;设计一套基于 NVIDIA GPU 设备灵活、高效的虚拟化框架与计算 平台,兼容 Kubernetes 云原生平台与虚拟机环境。
期望实现的主要技术目标
1.支持显存资源上限与算力资源隔离,以及细粒度资源配置和任务监控能力;兼容 Turing、Volta、Ampere、Hoper 等主流 Nvidia GPU 架构。 *** 虚拟化设备的存储与计算性能与同规格物理 GPU 设备保持5%以内的差距(不考虑跨网络远程访问情况)。 3.在不重启虚拟机的前提下,能够将虚拟 GPU 设备动态迁移至其他不同的物理 GPU 之上。 4.发表体系结构/虚拟化技术相关领域 CCF A 类会议1-2篇。
需求解析
解析单位:“科创中国”工业互联网产业科技服务团(中国计算机学会) 解析时间:2023-10-15
赵娜
云南大学
副教授
综合评价
处理进度