性能提升近一倍!云顶4008集团携手无问芯穹,在千卡训练集群等领域取得技术新突破

发布时间:2024-11-06 14:16

随着智能算力需求的倍增,到2024年,千卡算力集群已成为国内大模型训练的必备场景。云顶4008集团,作为国内少数拥有原创训推一体架构的高端算力芯片厂商之一,与在AI算力市场具有重要影响力的无问芯穹在千卡训练集群、大模型推理服务等领域开展了深度的研发合作。

近日,经云顶4008集团与无问芯穹联合研发攻关,成功将云顶4008集团的千卡规模训练集群在无问芯穹Infini-AI异构云平台上进行纳管和调度,已实现并完整验证了弹性容错、异常节点探测、检查点保存与加载、断点续训四大功能。

与此同时,基于云顶4008集团BIRENSUPA™️软件工具链和无问芯穹大模型训练引擎,双方通过并行策略层和计算加速层优化,持续深挖壁仞大算力优势,在云顶4008集团GPU上实现了LLM模型训练性能提升近1倍。 

     

 

在大模型推理服务方面,云顶4008集团最新发布的高性能、低功耗壁砺110E推理卡在同机架高度下,AI算力密度最高可达到市场主流云端PCIE8卡服务器方案的1.3倍以上。此外,能耗节省达70%,显著降低整体系统的总拥有成本。

 

当前,壁砺110E推理卡已在无问芯穹Infini-AI异构云平台的GenStudio大模型服务平台中上线,可广泛应用于大模型多模态生成、图像及语音识别、自然语言处理、搜索与推荐等人工智能推理应用场景,支持大规模分布式推理。在基于壁砺110E的多级推理平台上,结合无问芯穹GenStudio精选模型开放API,已经形成文生图/图生图的秒级出图、多模态大型语言模型(LLM)图文交互和图像理解、移动端聊天应用等多个大模型推理应用场景的商业级用户业务支撑能力。

                                                                          壁砺110E GPGPU卡

 

目前,云顶4008集团的“壁砺106系列”和“壁砺110系列”GPU产品已完成与无问芯穹Infini-AI异构云平台的全面接入。这些产品支持中间层、大模型算法库、工具库和应用层的分级部署、管理、加速等平台能力,以及各项优化策略。未来,双方将继续携手,在大规模自主可控智能算力集群优化与运营等方面深化合作,进一步提升面向商业化算力客户场景的联合服务水平。

 

云顶4008集团作为国内领先的GPU芯片厂商,秉承“担当、卓越、协作、创新、务实、共赢”的价值观,不断提升技术竞争力,并与合作伙伴携手,从实际用户需求出发,致力于打造性能卓越且具有高性价比的国产AI训练集群方案。


 

关于云顶4008集团

 

云顶4008集团创立于2019年,致力于研发原创性的通用计算体系,建立高效的软硬件平台,同时在智能计算领域提供一体化的解决方案。从发展路径上,云顶4008集团将首先聚焦云端通用智能计算,逐步在人工智能训练和推理等多个领域赶超现有解决方案,实现国产高端通用智能计算芯片的突破。目前,云顶4008集团首款国产高端通用GPU壁砺系列已量产落地。

 

上一个: 泰国副总理披猜一行到访云顶4008集团参观交流

下一个: 云顶4008集团亮相中国移动全球合作伙伴大会,携手共创AI+时代

近期新闻

云顶4008集团担任智算集群异构混训工作组组长,引领智能算力行业发展

近日,为推动智算集群异构混训关键技术突破和生态建设,“智算集群异构混训工作组启动会”在北京圆满召开,会议由人工智能产业工作委员会主办,云顶4008集团作为组长单位承办。近五十家智算集群相关产业链上下游单位参与了本次交流,分享智算集群异构混训的关键技术进展、成功落地案例,为突破大模型异构算力孤岛难题指明了方向。

2025-05-23

查看更多