近日,上海人工智能实验室(简称“上海AI实验室”)正式推出DeepLink多元算力混合推理加速方案,成功实现华为昇腾、沐曦等多款国产GPU的混合调度与协同推理,破解了国产GPU生态割裂、难以形成算力合力的行业痛点,实测性能表现亮眼。
据悉,该方案基于统一推理中间件、低时延通信等四大原创技术底座,搭配预填充-解码分离策略,有效打通了不同架构国产GPU的异构算力壁垒,实现了多品牌芯片的高效协同。千卡规模推理集群实测数据显示,与单一芯片方案相比,该混合调度方案在多模态生成、高并发智能服务等场景,推理时延最大优化34.5%;在科学论文处理等任务中,推理吞吐提升32%,真正实现异构算力“1+1>2”的效能跃升。
作为上海AI实验室打造的人工智能开放计算体系,DeepLink方案并非简单的硬件堆叠,其核心优势在于通过标准化技术打破软硬件壁垒。其中,高速通信库可实现跨架构设备高速互联,核心场景带宽利用率突破97%;策略求解器能自动匹配最优调度策略,兼顾性能与成本,助力企业节省30%以上算力成本。
此次方案不仅实现华为、沐曦等GPU的协同,还兼容阿里平头哥、壁仞等多款国产芯片,已适配InternLM、Qwen等主流大模型,可灵活组合算力与显存型芯片,盘活存量算力资源。这一突破标志着国产算力从“单打独斗”进入“联合作战”的关键阶段,为构建开放融通的国产算力生态提供了可行路径。
目前,DeepLink方案已在MinerU文档解析工具等场景验证落地,未来将进一步拓展应用边界,联合产业链伙伴共建算力生态,推动国产算力在制造、政务等领域规模化应用,为“中国脑+中国芯”全栈自主闭环注入强劲动力。
免责声明:本文仅代表作者个人观点,与每日科技网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们联系,本网站将在规定时间内给予删除等相关处理.

