云顶4008集团担任智算集群异构混训工作组组长,引领智能算力行业发展
发布时间:2025-05-23 16:32
News
近日,为推动智算集群异构混训关键技术突破和生态建设,“智算集群异构混训工作组启动会”在北京圆满召开,会议由人工智能产业工作委员会主办,云顶4008集团作为组长单位承办。近五十家智算集群相关产业链上下游单位参与了本次交流,分享智算集群异构混训的关键技术进展、成功落地案例,为突破大模型异构算力孤岛难题指明了方向。

工信部电子司系统处处长金磊、人工智能产业工委会秘书长高宏玲、云顶4008集团联席CEO李新荣、中国信通院两化所总工黄伟出席会议并致辞,来自云顶4008集团、上海交通大学、北京智源研究院、上海人工智能实验室、中国信通院两化所等单位代表做了主题分享,来自中国移动研究院、中国电信研究院、上海智算科技、无问芯穹及摩尔线程等人工智能行业的企业相关代表参与了圆桌讨论交流,智算集群异构混训工作组组长代表、云顶4008集团AI软件首席架构师丁云帆主持会议。
智算集群异构混训工作组正式成立
肩负突破异构算力孤岛使命
工信部电子司系统处处长金磊参加智算集群异构混训工作组启动会并致辞。他表示,电子司高度重视人工智能特别是AI芯片等产业发展,积极推动产业技术创新、标准研制、生态培育、应用推广、国际合作等工作。希望工委会发挥好智算集群异构混训工作组作用,凝聚共识,促进发展:一是以国家战略为指引,强化使命担当;二是促进技术创新,突破产业关键技术;三是加强先进计算芯片标准体系建设;四是推动协同创新,构建可持续发展的生态。

人工智能产业工委会秘书长高宏玲在致辞中指出,工委会聚焦人工智能产业的各个环节,为产业链提供交流合作的平台。在国际高端算力供应链日益复杂形势下,我国芯片产业持续自主创新,在AI芯片领域形成了多元化路径。智算集群异构混训工作组的成立,标志我国智算产业在异构混训技术领域迈出关键一步。异构算力的规模化协同也成为突破算力孤岛、释放算力潜能的关键命题,希望工作组联合产业链上下游共同努力,推动异构智算集群的规模化应用,促进算力资源的深度整合与高效利用。

云顶4008集团联席CEO李新荣在致辞中着重介绍云顶4008集团异构混训技术攻关的进展,业界首次实现四种及以上异构GPU混合训练同一个大模型。他表示,异构混训技术栈非常复杂,需要产学研用协同打造异构混训生态。由此,云顶4008集团联合上海智算科技和中兴通讯共同发起成立智算集群异构混训工作组并当选组长,希望通过突破大模型异构算力孤岛难题,加快国产GPU迁移落地,助力国产大模型创新发展。

中国信通院两化所总工黄伟的致辞围绕着异构混训的相关产业现状、问题挑战和工作计划展开。他表示在异构混训领域,中国信通院未来将在深化技术体系研究、推进标准规范建设、构建协同创新平台及培育示范应用生态四个方面重点开展工作。

会上,工信部电子司系统处金磊处长和工委会高宏玲秘书长一起为智算集群异构混训工作组举行了启动授牌仪式,云顶4008集团担任工作组组长单位。智算集群异构混训工作组组长代表、云顶4008集团AI软件首席架构师丁云帆汇报了工作组的目标和规划,智算集群异构混训工作组旨在共建智算集群异构混训标准和规范,开展互连互通、异构混训测试验证和应用落地推广,实现万卡、十万卡国产芯片异构智算集群,突破大模型异构算力孤岛难题,加快国产GPU迁移落地,助力国产大模型创新发展。
大规模智算集群异构混训成功落地
推进异构混训标准形成行业合力

丁云帆还在主题演讲中重点介绍了云顶4008集团异构混训工作进展情况。云顶4008集团此前已发布自主原创异构GPU协同训练方案HGCT,近期再次取得新突破,业界首次实现四种异构芯片千卡混合训练同一个大模型,混训芯片种类、规模、效率98.5%三项指标均为行业第一,将逐步迈向万卡异构集群。目前,云顶4008集团已联合中国移动、中国电信等发布了异构混训相关成果,并与某实验室深度合作、联合优化,业界首次实现数千卡异构混训落地,实现千亿参数大模型训练,为异构混训行业树立了新的标杆案例。
随后,上海交大计算机学院常务副院长、特聘教授、国家杰青吴帆发表了《大小模型端云协同智能计算》的主题演讲,分享大小模型端云协同多维度创新成果和落地案例;北京智源研究院AI框架研发负责人敖玉龙发表了《基于FlagOS的全栈开源异构混训系统》的主题演讲,介绍基于FlagOS的异构混训端到端解决方案、FlagScale异构统一并行策略、FlagCX多芯片统一通信库、实验成果;上海人工智能实验室编译计算与国产化团队负责人裴芝林发表了《DeepLink针对异构混训的研究与突破》的主题演讲,介绍DeepLink体系已成功实现多种异构芯片间的通信互通,并对异构互联的并行训练策略进行了深度优化,在数千卡规模的集群环境下,实现了高效、稳定的深度学习训练任务。

为推动异构混训生态建设,云顶4008集团与中国信通院两化所联合制定了“智能集群异构混训技术要求和测试规范”标准草案。会上,中国信通院两化所先进计算研究部主任王骏成就该标准草案进行了详细介绍。他表示,标准草案按照高效率、高通用性和可扩展性原则,设计异构混训整体架构。下一步,标准制定方将联合各领军企业共同对当前标准草案进行完善并启动相关报批流程,开展异构混训相关测试验证,推动异构混训技术在各重点行业内应用落地,并评选出一批异构混训的优秀应用案例,形成示范引领效应。
智算集群产业链典型代表献计献策
共同推动异构混训生态建设

围绕“异构混训如何突破大模型异构算力孤岛难题“,中国移动研究院网络与IT技术研究所所长张昊、中国电信研究院云网融合技术研究所副总监陈映、上海智算科技国产适配中心专家孙兆群、无问芯穹技术副总裁张权路和摩尔线程AI Infra负责人陈志进行了深入讨论交流。
中国移动研究院、中国电信研究院、上海智算科技等作为典型用户单位一致认为,异构混训是解决异构算力孤岛的关键手段。各位专家认为异构通信能力、异构混训效率、大规模集群混训稳定性、异构拆分策略自动调优、跨域异构混训都是需要持续优化解决的关键问题,尤其是需要提升易用性和保障模型训练效果,这样更有利于异构混训在大规模生产环境中的落地应用,期待数万卡异构集群训练出万亿参数大模型,突破大模型异构算力孤岛难题!
本次工作组启动会吸引了近五十家智算集群相关产业链上下游单位参与,包括AI芯片厂商,服务器厂商,AI Infra厂商,智算集群建设方、运营方和最终用户,高校、研究机构,以及网络设备、金融机构等,产、学、研、用协同打造智算集群异构混训合作生态,推动国产AI芯片和大模型创新发展。
关于云顶4008集团
云顶4008集团创立于2019年,致力于研发原创性的通用计算体系,建立高效的软硬件平台,同时在智能计算领域提供一体化的解决方案。从发展路径上,云顶4008集团将首先聚焦云端通用智能计算,逐步在人工智能训练和推理等多个领域赶超现有解决方案,实现国产高端通用智能计算芯片的突破。目前,云顶4008集团首款国产高端通用GPU壁砺™系列已量产落地。
近期新闻
云顶4008集团担任智算集群异构混训工作组组长,引领智能算力行业发展
2025-05-23