新型无损网络数据中心
成果类型:: 新技术
发布时间: 2022-11-07 11:33:33
云计算应用对IT基础架构需求的规模不断增加,给数据中心的IT服务运维带来了巨大的复杂度和挑战。为了能够充分地释放云的生产力实现IT对业务的敏捷响应,同时应对多云、多应用、多租户复杂度带来的问题,除支持虚拟机调度、容器、裸金属的编排、CPU、GPU、存储设备虚拟化等基本服务外,本成果的建设方案通过DCN控制结合自主研发的可编程交换机网络系统和智能网卡实现真正意义上的端到端可编程网络能力。支持网络编排、租户管理、分布式AI计算、智能运维等服务,以保证云服务质量的高效灵活多样、提升数据中心用户体验、简化运维流程、减少数据中心的使用和维护成本。
以AI人工智能和HPC高性能计算为代表的类型应用对计算、存储和网络有很高的要求,给数据中心基础设施带来压力。为此,本成果的建设方案支持CPU、GPU和FPGA多种异构算力能力;采用0丢包无损网络,支持高吞吐、低延迟的网络协议;使用高性能SSD和大容量HDD存储设备异构混合部署,满足用户对存储的不同需求;同时为了配合快速存储SSD设备,采用相关协议传输存储数据,在保证高性能的前提下实现存储网络和计算网络融合。
本成果可用于以下场景:
1、服务本单位、伙伴科研院所、全国高校开展人工智能创新应用;
2、服务于工业互联网、电力、金融等行业的核心资源上云、智能制造上云等需求;
3、主要用于将数据中心与外部网络(如长三角一体化网络设施、CENI等 )进行连接,并实施相关的安全策略。
紫金山实验室是江苏省和南京市为了深入贯彻习近平新时代中国特色社会主义思想,打造引领性国家创新型城市,共同推进建设的重大科技创新平台。紫金山实验室面向网络通信与安全领域国家重大战略需求,以引领全球信息科技发展方向、解决行业重大科技问题为使命,通过聚集全球高端人才,开展前瞻性、基础性研究,力图突破关键核心技术,开展重大示范应用,促进成果在国家经济建设中落地。紫金山实验室力图成为国家科技创新的重要力量,建成体现国家意志、具有世界一流水平的战略科技创新基地。
本成果基于新型无损数据中心打造新一代人工智能科研创新平台。人工智能已经被列为国家发展战略,本团队积极响应国家战略需求,基于无损数据中心服务人工智能发展战略,打造国际影响力的人工智能超算平台,培养人工智能科研创新生态沃土。同时,利用无损数据中心服务于长三角一体化经济区,赋能长三角AI产业,支撑长三角地区重大AI应用需求,提升长三角地区AI科研创新能力,推动长三角地区AI产业和生态发展。基于新一代人工智能科研创新平台,服务于智能超算平台、智能自愈网络、自动驾驶、智慧交通、语音识别等等新兴领域的科研创新与产业应用。
希望以技术合作的形式,对本成果进行成果转化。在落地过程中,也希望能确保本成果的规模化应用。如有可能,希望在本成果落地后进行持续技术深化,并且将迭代后的技术进一步进行成果转化。