联想引领大模型2.0时代,基础设施全面升级推动AI普惠
邹大斌
责任编辑:邹大斌
ISMB
时间:2025-05-13 12:02
联想 联想创新技术大会 算力 AI
生成式AI的爆发式发展正在重塑应用生态,并对算力基础设施提出全新挑战。进入2025年,DeepSeek的横空出世加速了这一变革进程,同时也进一步凸显了算力基础设施面临的挑战。为助力企业应对新的挑战,基础设施相关产品和技术加快了迭代速度。
在5月7日举行的2025联想创新技术大会上,联想围绕基础设施宣布了6项创新技术(包括AI推理加速算法集、AI编译优化器、AI训推慢节点故障预测与自愈系统、专家并行通信算法、“飞鱼”仿生散热设计与浸没式制冷系统、算力服务“成本-效能”双优运营系统)以及两大重磅升级(联想万全异构智算平台3.0、算力基础设施),直指当前用户在落地AI应用时最为关切的痛点,旨在帮助用户升级基础设施,早日实现AI算力赋能业务。
助力人工智能快速落地,加速AI价值的充分释放
在人工智能向千行百业快速渗透的背景下,DeepSeek通过技术创新大大地降低了大模型的应用门槛,推动了AI普惠的进程,也标志着大模型逐步进入规模化落地新阶段。中国信通院云计算与大数据研究所所长何宝宏称其为“大模型2.0”阶段。
“此前人们追求的是更大参数规模的大语言模型,如今人们开始关注如何让AI普惠,能以更高性价比让大模型落地,而DeepSeek就是一个标志——一个从对大模型的探索转向规模化应用的标志。”中国信通院云计算与大数据研究所所长何宝宏在联想AI算力基础设施技术创新论坛暨春季新品发布会主题演讲时表示。
中国信通院云计算与大数据研究所所长 何宝宏
随着大模型2.0时代的来临,大模型的应用边界不断突破,催生了AI绘画、文本创作、代码生成等颠覆性应用,推动AI从辅助工具向生产力平台转变。这一转变导致算力需求结构发生根本性变化:传统以推理为主的算力模式,被训练与推理并重、且训练算力占比持续攀升的新模式取代。
为应对需求的变化,作为AI应用的能力底座,算力技术也在不断演进。联想集团副总裁、中国基础设施业务群总经理陈振宽在发布会上表示:“万卡、十万卡级算力集群的出现,要求在超大规模算力集群里,实现“算存网”能力的高效协同;而模型本地部署的应用潮流,又带来对大模型一体机单机性能的极致要求。此外,如何获得极致算力效率与能效也促使异构智算等技术创新快速取得突破。”
联想集团副总裁、中国基础设施业务群总经理 陈振宽
在这样的时代背景下,陈振宽介绍,联想正通过构建更强大、更高效、更稳定、更绿色的混合式基础设施,助力混合式人工智能快速落地,加速AI价值的充分释放。
具体举措包括:深度构建以计算力、存储力、运载力为核心的AI基础设施,打造覆盖AI全场景、性能领先的AI算力产品组合;持续升级联想万全异构智算平台,融入四大技术创新,为高效算力提供强大支撑;坚定拥抱生态,全面打造万全生态,实现从芯片、系统再到应用的全栈能力整合,为客户提供多种一站式AI解决方案。
四大创新技术,打造智算平台差异化优势
联想万全异构智算平台就是上述战略的落地手段之一。联想万全异构智算平台是去年推出的一款算力管理平台。针对大模型预训练和传统模型推理的算力诉求,联想万全异构智算平台推出了五大技术,包括算力匹配魔方、超智融合调度、AI高效断点续训、联想集合通信库和GPU内核态虚拟化。
凭着这些创新,平台获得了22项核心发明,在多个应用案例中出创出佳绩。不过,联想并不满足现有的成绩,而是一直在打磨这一平台,在今年的联想创新科技大会上宣布重磅升级,推出了联想万全异构智算平台3.0。
联想万全异构智算平台的研发负责人、联想中国基础设施业务群战略管理部总监黄山介绍,联想万全异构智算平台3.0中新增的四大差异化技术就是为了助力众多用户在AI预训练、后训练、推理的过程中取得最高效、最稳定的算力。
AI推理加速算法集:通过实现MLA、投机推理等关键技术,结合联想自己的混合精度量化和分布式并行技术,最大程度地发挥GPU效能,使AI推理性能相对业界最优方案保持20%以上优势。
AI编译优化器:自动替换低效算子、优化计算路径并重新编译,大幅简化AI计算过程,节省算力和显存资源,相比同类编译器可降低训练和推理计算开销各15%以上。
AI训推慢节点故障与自愈系统:通过异步实时状态监测与全面故障分析,提前预知并自动化解决故障,将发现故障及自愈时间控制在百卡秒级、千卡分钟级、万卡十分钟级。
专家并行通信算法:通过协同优化通信计算原语、访存方式和网络路由算法,减少通信延迟和带宽占用,将推理延时降低至原来的1/3以下,同时将训推过程中网络带宽利用率从50%提升至90%。
联想中国基础设施业务群战略管理部总监 黄山
黄山表示,联想万全异构智算平台的创新技术已经得到实践验证。比如,联想单机部署DeepSeek 671B模型吞吐突破12000 tokens/s,在极限场景下更是创下37000+ tokens/s的行业新纪录;在国家级高质量AI集群场景中,联想与东数西算第一大智算枢纽紧密合作,在千卡训练场景中将MFU从30%提升至60%。这些成绩的取得,正是因为联想万全异构智算平台的加持。
重新定义AI算力底座:从“三高一低”到“四更”
除了联想万全异构智算平台3.0的发布外,在今年的联想创新技术大会上另一个重磅发布是AI算力基础设施的全线升级。
“作为一家拥有33年发展史的服务器厂商,联想一直坚持不懈地引领着服务器的技术创新,为客户业务应用不断重新定义算力。”联想中国基础设施业务群服务器产品部总经理周韬表示。
联想中国基础设施业务群服务器产品部总经理 周韬
为了更好地服务中国市场、满足中国用户的需求,2023年,联想曾推出了联想问天 + 联想 ThinkSystem 服务器双品牌战略,提出了“三高一低”的服务器设计理念,即高性能、高可靠、高可扩展和低能耗。
“随着AI应用进入后训练时代,根据用户业务从数据到智能的过程中对数据处理、AI训练、推理、应用等新要求,联想将‘三高一低’演进为更强大、更稳定、更高效、更绿色的三种算力,即通用算力、智慧算力、科学算力。”周韬介绍。
基于上述设计理念,联想重磅推出基于英特尔®至强®6处理器的全新算力服务器家族,涵盖三大算力产品线:包括联想问天 WA7880a家族在内的AI训练算力服务器家族、联想ThinkSystem SC750 V4在内的数据处理算力服务器家族;联想问天 WA5480 G5、WR5220 G5、联想ThinkSystem SR650 V4、SR650a V4、SR630 V4在内的推理应用算力服务器家族。
而在绿色计算领域,联想也宣布了两个重大技术突破:一个是在单相浸没技术方向上,联想采用"飞鱼"仿生散热设计,模拟鱼类游动姿态优化流体设计,支持下一代600W芯片散热,最大功耗提升20%。另一个是在相变浸没技术方向,联想通过“双循环”相变浸没制冷系统实现PUE低至1.035的业界领先水平,为更冷静、更可靠的服务器及数据中心产品提供有力支持。
除了服务器产品线外,联想还对超融合、存储和数据网络进行了重磅升级。在超融合领域,联想发布了AIO V6系列产品和联想问天WX系列虚拟化超融合8.0.2版本。
在存储产品方面,联想凌拓推出了新存储品牌——联想问天,并对联想凌拓从数据管理到存储架构均进行了全方位升级,发布了联想问天DXN AI 存储解决方案、DXN2000系列、DXN 全闪系列等联想凌拓全新存储产品家族。
在数据网络方面,发布了专为AI场景深度优化的高密度400G交换机联想问天NE8770-64QC以及面向下一代融合网络的多业务核心交换机NE7550G-8C和支持超大规模组网的新一代高性能核心交换机NE9770G-4C,能为构建高性能网络基础设施提供有力支撑。
值得一提的是,联想不只是在算力效率与能效方面发力,也在打造算力服务为用户赋能。在今年的大会上,联想首次发布了算力服务“成本-效能”双优运营系统,以持续助力客户优化运营效能与成本。其中智能调度引擎与FinOps引擎,将数据输送到混合云,完成企业AI模型训练,待模型培育成熟后,可弹性部署在边缘设备或终端硬件,实现分布式推理运算,可提升集群资源利用率13%,并精准识别58%无效实例,最大化用户效益。这一创新对于提升企业AI基础设施的投资回报率具有重要价值。
结束语
生成式AI的火爆带火了AI服务器市场。IDC预测,2025年中国市场出货的服务器中AI计算服务器超过52%,到2029年甚至会超过70%。联想此次AI算力基础设施的全线升级,不仅体现了联想对市场变化和技术趋势的敏锐洞察,更展现了其助力客户实现智能化转型的坚定决心。
今天,站在大模型2.0时代的潮头,联想正以一系列创新技术和产品升级,积极回应时代对算力基础设施的迫切需求。从联想万全异构智算平台3.0的四大核心技术突破,到AI算力基础设施的全线升级,再到“万全生态”的全面布局,联想通过构建更强大、更稳定、更高效、更绿色的算力基础设施,正助力千行百业跨越AI落地鸿沟,加速实现智能化转型,共同开启人工智能驱动的新篇章。