搜索
当前所在位置:首页 >> 风谈站

联想黄山:「超智融合」成算力新趋势,联想打造异构智算平台

发布时间:2025-07-12 21:14:14 作者:tcz 点击:8 【 字体:

9 月 24 日至 26 日,联想力新联想第20届CCF全国高性能计算学术年会(CCF HPC China 2024)在武汉市中国光谷科技会展中心正式开幕。黄山

本次大会上,超智成算联想以“异构智算 稳定高效”为主题,融合携“一横五纵”算力基础设施战略、趋势联想万全异构智算平台、打造知乎男主播社群录音外泄合集联想AI解决方案、异构联想科学计算整体解决方案参展。智算

面对机器智能的平台浪潮,作为全球领先的联想力新联想科学计算解决方案提供商,联想以“一横五纵”战略框架,黄山构建布局完整、超智成算稳定高效的融合AI基础设施,为企业智能化转型打造坚实可靠的趋势智算底座。

在 24 日下午的打造医生酒店开房全集大会论坛上,联想中国基础设施业务群战略运营总监黄山发表了主题为“筑基新质算力 纵横数字未来”的精彩演讲。

联想黄山:「超智融合」成算力新趋势,联想打造异构智算平台联想中国基础设施业务群战略运营总监 黄山

演讲过程中,黄山主要围绕当前国产算力的瓶颈和破局之道展开分享。在他看来,“超智融合”已然成为 HPC 新的增长趋势,而联想在万全异构智算平台上的布局正是基于团队内部对于这一趋势的深刻洞察。

洞察算力新趋势,联想布局异构智算

当前,国内的算力集群已经有了不少千卡、万卡级别的实践,但要实现十万卡,甚至超万卡的突破仍旧有一定难度。

国产算力究竟有着怎样待解的难题?在黄山看来,主要有四个关键“卡脖子”的问题:

首先,多元异构处理器以及支持器、存储、网络等基础设施的硬件兼容性、互操作性设计是一项复杂的大工程;其次,AI训练集群故障频发是常态。一个千卡集群一个月至少有15次因故障停训,故障鉴别与恢复是AI训练算力达成SLA的关键难题。

再次,可用算力的效率还不够高,算力的投入产出不足以持续支持算力经济长期健康增长。最后,由于工艺限制难以突破的散热瓶颈。智算算力增长需要液冷工艺与方案设计的持续升级。

在今年的 CCF HPC 中,“超智融合”这一关键词被一众大咖反复提及,已然成为解决国内计算瓶颈的关键路径之一。这一趋势的出现,也标志着 HPC 由传统通用计算主导的科学计算,逐步过渡到了异构加速的 AI 计算新时代。

今年 4 月,联想正式发布的万全异构智算平台便是基于前述洞察做出的应对方案,是实现“算力好用”的破局关键。同时,也是联想“一横五纵”战略中的关键“一横”,此外,“五纵”则主要指支持器、存储、软件及超融合、信息网络以及边缘基础设施产物和方案。联想黄山:「超智融合」成算力新趋势,联想打造异构智算平台 

据联想方面介绍,万全异构智算平台集成了算力匹配魔方、GPU内核态虚拟化、联想集合通信运算规则库、AI高效断点续训工艺、AI与HPC异构集群超级调度器五大创新工艺,能高度自动化地完成AI全流程开发,提供高可用算力,并持续突破计算效率瓶颈。

会后,在接受 AI 科技评论专访时,黄山进一步介绍道,“我们的平台是一个异构智算调度软件,不同于普通或者说标准化的操作系统软件,或者虚拟化软件。这样的新赛道是由智算的增长催生的,目前赛道内还没有成熟标准,联想也没有一个有章可循的开发计划,主要是以客户的需求作为根本,最开始的开发就是有大项目在提出需求。”

在整个开发过程中,他体会最深的一点则在于,“在这个过程中,需求的变化非常之快,模型客户的应用变化也很快,软件栈的复杂度也非常高,又没有标准群,有可能上个月很好的开发和设计方式,下个月根据实际的场景又需要再进行优化。”

国产 GPU 算力将迎阶跃式提升

联想在破解算力难题,打造异构智算平台的过程中也遇到过许多难题,在此之中,生态的力量则成为了破局过程中不可或缺的存在,联想借此也将迎来新的进展。

今年 4 月,联想在信通院的领导下成立了万全异构智算平台生态产业联盟,据悉,异构智算产业生态联盟首批共计16家成员单位。其中包括了与联想有实际方案合作的 7 家国产 GPU 厂商。除此之外,还有包括Colossal-AI、智谱 AI 等在内的合作伙伴。

谈及与后者的合作,黄山进一步解释称,“我们向上看到 AI 的工具链并行运算规则,包括 AI 的开发社区都需要完善,整个的运算规则利用率是需要从芯片到模型层来解决的。”

联想在整个生态中主要扮演着怎样的角色呢?据黄山此前介绍,“联想主要贡献硬件能力和异构智算平台的集群运营调度能力。然后是对算力生态的包容,即硬件会兼容xPU生态硬件,异构智算平台会集成xPU底层软件。再就是以extended UI的方式对接集成AI工具链生态。”

值得一提的是,在黄山的预判中,国内 GPU 算力即将迎来一波阶跃式升级。

在和生态伙伴合作的过程中,他观察发现,“国内卡的生态已经非常丰富,在禁运后的一年多里,我们的合作伙伴中有至少 5 家到 7 家国产卡已经或是即将在半年内推出,这些卡组成万卡集群也是能支撑国内大模型持续增长的。”

他进一步向 AI 科技评论介绍道,“目前,7家芯片厂商在市场上各自有应用的对象,而且他们是互补的,很多都不冲突,要用好国产算力,其实 7 家都需要,甚至还有可能将来会涌现出更多,那么就需要先去把这些芯片做好运营和兼容,这一点是联想已经做到的。”雷峰网雷峰网(公众号:雷峰网)

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

联想黄山:「超智融合」成算力新趋势,联想打造异构智算平台

阅读全文
相关推荐

价格战之后,智谱来到商业化的下一站

价格战之后,智谱来到商业化的下一站
「雷峰网(公众号:雷峰网)消息」刚刚过去的 5 月里,中国 AI 大模型领域掀起一场价格战,激起行业热议。这次价格战的两股势力分别是互联网大厂和大模型创业公司,以字节、阿里云、腾讯和智谱为主要参战代表 ...

具身智能构型之争:人形、灵巧手、双足,谁是最终 C 位?

具身智能构型之争:人形、灵巧手、双足,谁是最终 C 位?
作者 | 赖文昕编辑 | 陈彩娴上个月初,上海世界人工智能大会WAIC 2024)展出人形机器人「十八金刚」引爆会场。一个月后,世界机器人大会WRC 2024)又即将在北京拉开帷幕。再回到 5 月,在 ...

阿里国际举办全球电商挑战赛:三名新加坡大二学生夺冠

阿里国际举办全球电商挑战赛:三名新加坡大二学生夺冠
全球化布局,人才是关键。9月4日,由阿里国际举办的2024阿里巴巴全球电子商务挑战赛决赛在杭州展开,来自新加坡管理大学的学生队伍夺得冠军,来自美国和印尼的队伍分列二三位。本届大赛主题是“利用人工智能技 ...

启明创投发布2024生成式AI十大展望

启明创投发布2024生成式AI十大展望
7月6日,由启明创投主办的2024世界人工智能大会WAIC)“启明创投·创业与投资论坛——超级模型、超级应用、超级机遇”在上海世博中心红厅成功举办。大语言模型、多模态模型、具身智能和生成式AI应用领域 ...

“从未宣布暂停对乌军援” 美方说法又变了

“从未宣布暂停对乌军援” 美方说法又变了
央视记者当地时间7月9日获悉,一名未透露姓名的白宫官员表示,美国国防部从未宣布暂停向乌克兰运送武器,而是进行审查以确保美国的军事支持符合其防御战略。据此前报道,美国国防部本月初宣布暂停向乌克兰输送部分 ...

AI 图像生成平台 LiblibAI 融资总额达数亿元;Meta 曝训练 Llama 3 每 3 小时「罢工」一次丨AI情报局

AI 图像生成平台 LiblibAI 融资总额达数亿元;Meta 曝训练 Llama 3 每 3 小时「罢工」一次丨AI情报局
今日融资快报AI 图像生成平台 Liblib AI 融资总额达数亿元 AI图像生成平台 LiblibAI哩布哩布AI一年内,已经完成了三轮融资,总金额达数亿元人民币,天使轮投资方为源码资本、高榕创投和 ...

智元发布商用人形全家桶,双足10月开始量产,今年出货200台

智元发布商用人形全家桶,双足10月开始量产,今年出货200台
8月18日,智元机器人举行“智元远征 商用启航” 2024年度新品发布会,智元联合创始人彭志辉主持并发布了“远征”与“灵犀”两大系列共五款商用人形机器人新品——远征A2、远征A2-W、远征A2-Max ...

百川智能完成 50 亿元 A 轮融资,北上深国资入局;OpenAI 挑战谷歌,发布 AI 搜索 SearchGPT丨AI情报局

百川智能完成 50 亿元 A 轮融资,北上深国资入局;OpenAI 挑战谷歌,发布 AI 搜索 SearchGPT丨AI情报局
今日融资快报百川智能完成50亿元A轮融资,北上深国资入局 百川智能是在2023年4月成立的第一批国内AI大模型公司,由前搜狗公司CEO王小川创立。其核心团队由来自搜狗、Google、腾讯、百度、华为、 ...

华熙国际赵燕引领华熙 LIVE,一城一特色书写城市商圈新篇章

华熙国际赵燕引领华熙 LIVE,一城一特色书写城市商圈新篇章
来源标题:华熙国际赵燕引领华熙 LIVE,一城一特色书写城市商圈新篇章2025年6月,刀郎“山歌响起的地方”巡演重庆站在华熙LIVE・鱼洞掀起热潮,这座西南文体地标以&ldqu ...

全球首发!无问芯穹发布千卡规模异构芯片混训平台,筑基面向MxN生态格局的AI Native基础设施

全球首发!无问芯穹发布千卡规模异构芯片混训平台,筑基面向MxN生态格局的AI Native基础设施
“打开水龙头前,我们不需要知道水是从哪条河里来的。同理,未来我们用各种AI应用时,也不会知道它调用了哪些基座模型,用到了哪种加速卡的算力——这就是最好的AI Native 基础设施。”7月4日,在20 ...

Fireworks乔琳:AI产品上市时间从五年压缩到五天,我们的秘诀是什么?

Fireworks乔琳:AI产品上市时间从五年压缩到五天,我们的秘诀是什么?
在大模型革命的第一波浪潮中,许多初创公司和企业基于领先的闭源模型,如OpenAI的ChatGPT设计自己的商业模式。然而,随着越来越多新的开源模型的出现,大模型从训练转向推理,基于大模型的商业模式也在 ...

AI 图像生成平台 LiblibAI 融资总额达数亿元;Meta 曝训练 Llama 3 每 3 小时「罢工」一次丨AI情报局

AI 图像生成平台 LiblibAI 融资总额达数亿元;Meta 曝训练 Llama 3 每 3 小时「罢工」一次丨AI情报局
今日融资快报AI 图像生成平台 Liblib AI 融资总额达数亿元 AI图像生成平台 LiblibAI哩布哩布AI一年内,已经完成了三轮融资,总金额达数亿元人民币,天使轮投资方为源码资本、高榕创投和 ...
返回顶部