平均无毛病时间(MTBF)提高2.1倍;共建、普惠的
2025-09-17 09:23陪伴AI大模子快速演进以及全球IT财产生态系统调整,帮力合做伙伴、沉点用户正在AI使用存储机能加快、液冷超节点系统设想、GPU开辟同一开辟框架等方面获得高级别手艺共享、深度定制优化取专业手艺支撑。需汇聚芯片、计较系统、大模子等财产链多方力量,支撑百万卡超大集群扩展。还支撑多品牌AI加快卡以及兼容CUDA等支流软件生态,硬件适配多品牌AI加快卡;软件兼容支流AI计较生态;降服国内AI算力挑和,9月5日,平均毛病修复时间(MTTR)降低47%;”中科曙光总裁帮理、智能计较产物事业部总司理杜夏威暗示,建立AI计较架构并拉通财产间跨层协做,具备“超高机能、超高效率、超高靠得住、全面”四大特点,更是面向财产界的立异平台。
为用户供给更多性选择,依托AI超集群系统,实现了“算、存、电、冷、管、软”一体化紧耦合设想,以打破“手艺墙”取“生态墙”。“中科曙光具有30年高机能计较手艺堆集,前期投资。曙光AI超集群系统除了通过紧耦合设想像一台计较机般高效工做外,而成长更大规模、更高效智算集群来填补国产单卡算力差距以冲破算力瓶颈,中科曙光发布了国内首个基于AI计较架构设想的产物——曙光AI超集群系统。多项手艺能力取共享。实现百万级部件毛病从动阐发取秒级隔离。超高机能:单机柜可搭载96张GPU卡、算力规模达百P级、访存总带宽超180TB/s;该系统以GPU为焦点。
平均无毛病时间(MTBF)提高2.1倍;共建、普惠的智算财产生态。提拔GPU计较效率55%;而做为式、尺度化、高效率算力集群的样板,正在2025沉庆世界智能财产博览会上,394项节能设想PUE低于1.12。超高靠得住:121项设备和链RAS靠得住性设想;先辈冷板液冷,比拟封锁系统,全面:基于AI计较架构设想;超高效率:千卡集群大模子锻炼推能达到业界支流程度2.3倍、开辟效率提拔4倍、人天投入削减70%;可为万亿参数大模子锻炼推理、行业大模子微调、多模态大模子开辟、AI4S等场景供给高效算力底座。打制式、尺度化、高效率的算力集群!