信息探测、信息处 理和信息传递领域 的技术和综合应用
价格 双方协商
地区: 湖南省 长沙市 市辖区
需求方: 长沙***公司
行业领域
新一代信息技术产业,信息传输、软件和信息技术服务业
需求背景
图形处理器(GPU)是计算机显卡的核心芯片,也是高性能计算与深度学习的关键部件。与CPU相比, GPU是一个庞大的计算阵列,拥有数千个处理单元, 除了能完成真实感图形生成外,在矩阵处理、卷积 操作、神经网络等运算中具有先天优势,在浮点运 算、并行处理等方面提供百倍于CPU的性能,同时在通用计算能力方面优于定制化AI芯片。GPU在装备信息可视化、大型航天工程测控、电磁频谱态势感知、分布式协同电子对抗、无人装备等军民事领域具有广泛的应用前景,是未来支撑我军网络化、无人化、智能化体系作战的核心关键元器件,也是支撑AI、云计算等新技术的核心关键元器件。基础软件栈是决定GPU产品应用的核心因素。在各种智能化计算系统中,硬件是支撑算力的基础,软件则是决定应用是否成功的关键因素,任何一个成功的计算平台都需拥有广泛而丰富的软件库支持,如 NVIDIA 的成功依赖于 CUDA 提供完善和强大的软件栈,在自动驾驶、人工智能等民用领域,基本上也都采用CUDA软件栈开发应用产品,已形成了生态绑架。国内企业没有提供与国产 GPU 配套的软件栈,难以建立起相应的应用生态链。由于国外GPU厂商软件开发平台完全不支持国产计算机平台,在国产计算机平台上,根本无法开发高端GPU国产应用软件。
需解决的主要技术难题
1、常用计算库的移植与优 化利用OpenCL 编程接口对主要计算 库进行移植与优化,包括clFFT、clBLAS、clDNN、clSPARSE、clLAPACKclRNG。要求能完整支持计算库的所有接口及功能,应用能保持接口兼容,相关接口性能达到AMD RX550同等水平。2、常用图像处理库的移植与优化利用OpenCL编程接口对主要图像处理库进行移植与优化,包括OpenCV、OpenVX。要求能完整支持图像处理库的所有接口及功能,应用能保持接口兼容, 相关接口性能达到AMD RX550同等水平。3、主要深度学习框架的移植,适配与优化利用OpenCL编程接口对主要深度学习框架进行二次开发,将JM9200 作为后端加速设备融入计算框架,提供对CPU+ JM9200加速器高效的并行异构资源调度、自适应异构计算核心的任务映射以及多级存储的统一访问,实现JM9200对常用算子的加速。将深度学习框架移植到主要国产操作系统运行。要求能在国产操作系统平台上运行Tensorflow, Pytorch, Paddle框架,可以使用JM9200作为其加速设备。要求能完整支持Tensorflow, Pytorch, Paddle 框架提供的所有功能,能支持训练和 推理,应用能保持接口兼容,相关接口性能达到AMD RX550同等水平。
期望实现的主要技术目标
1、基于***的常用计算库、图像处理库、深度学习框架。计算库包括:clFFT、 clBLAS、clDNN、clSPARSE、clLAPACK 、clRNG;图像处理库,包括:OpenCV、OpenVX;深度学习框架包括:Tensorflow、Pytorch、Paddle; 2、为支持以上计算库、图像处理库、深度学习框架所必要的 IDE 开发环境、调试工具等;3、设计文档、测试报告、分析报告等。
处理进度