专题:2025寰球东说念主工智能大会
新浪科技讯 7月27日午间音讯,2025寰球东说念主工智能大会(WAIC 2025)于7月26-28日在上海举办。大会期间,摩尔线程初度建议了“AI工场”理念,公司创始东说念主兼CEO张建中在共享中暗意,“为唐突生成式AI爆发式增长下的大模子推行恶果瓶颈,摩尔线程将通过系统级工程翻新,构建新一代AI推行基础形式,为AGI时期打造坐蓐先进模子的“超等工场”。
据悉,摩尔线程建议的“AI工场”,如同芯片晶圆厂的制程升级,需要已毕从底层芯片架构翻新、到集群举座架构的优化,再到软件算法调优和资源交流系统的全面升级。这种全观点的基础形式变革,将鼓舞AI推行从千卡级向万卡级乃至十万卡级限制演进,以系统级工程已终身产力和翻新恶果飞跃。
具体而言,这座“AI工场”的智能“产能”,由五大中枢成分共同决定,其恶果公式可综合为:AI工场坐蓐恶果=加快打算通用性×单芯片有用算力×单节点恶果×集群恶果×集群牢固性。摩尔线程将以GPU通用算力为基石,将通过先进架构、芯片算力、单节点恶果、集群恶果优化与可靠性等协同等深度时刻翻新,将全功能GPU加快打算平台能力鼎新为工程级推行恶果与可靠性保险。
在单芯片算力方面,摩尔线程的GPU单芯片基于MUSA架构的打破性瞎想,可集成AI打算加快、图形渲染、物理仿真及超高清视频编解码能力,充分适配AI训推、具身智能、AIGC等种种化行使场景。且在打算精度方面营救从FP64至INT8的完好精度谱系,并通过FP8羼杂精度时刻,在主流前沿大模子推行中已毕20%~30%的性能跃升。
在内存与通讯恶果优化上,摩尔线程内存系统通过多精度近存规约引擎、低蔓延Scale-Up、通算并行资源辩别等时刻,已毕了50%的带宽从简和60%的蔓延镌汰。在通讯和互联畛域,独创ACE异步通讯引擎减少了15%的打算资源损耗,MTLink2.0互联时刻提供了跨越洋巨匠业平均水平60%的带宽,为大限制集群部署奠定了坚实基础。
在构建高效集群的基础上,牢固可靠的启动环境是“AI工场”捏续产出的保险。相等在万卡级AI集群中,硬件故障导致的推行中断会严重忽地算力。摩尔线程翻新推出零中断容错时刻,故障发生时仅辩别受影响节点组,其余节点赓续推行,备机无缝接入,全程无中断。这一决策使KUAE集群有用推行时期占比超99%,大幅镌汰复原支出。(文猛)
包袱裁剪:王翔
热点资讯
相关资讯