算力荒缓解,自主化智算还有必要吗?倪光南世界人工智能大会

2023年大炼模型兴起,全球范围内都出现了算力供不应求、一卡难求的情况。各地纷纷兴建数据中心、智算中心,来解决国产大模型的算力短缺问题。

今年算力市场又倒向了另一个方向,算力开始过剩和大量闲置了。

主要体现在,高端显卡囤积居奇的生意不好做了,“GPU倒爷”的朋友圈已经从“欲购从速,过时不候”,变成了“A100/H100滞销,帮帮我们”。而算力租赁市场,理想情况下的上架率应该是80%,但很多集群只能达到30%甚至更低,投入大量资金建设的算力闲置,租不出去。

于是一种声音开始甚嚣尘上,认为算力荒已经缓解了,供过于求,应该放慢自主化智算的建设。还有人说,智算中心建的太多了,大模型都用不完了。

发展自主化智算,到底还有没有必要?

从短缺到过剩,算力是怎么一步步闲置的?

2.不好用。国产卡组成的算力集群,也存在上架率不高、资源闲置的问题,主要是不好用。因为国产卡的集中度不高,一个千卡或万卡集群,往往是由各类国产算力卡组成的,异构算力之间的协同调度,涉及大量工程化细节,没有做好就无法开箱即用。勉强用了,又时不时出现业务中断、算效不高、恢复训练慢等各种问题,导致客户流失。这类被迫闲置的国产算力,正是没有考虑配套,盲目建设的低水平智算中心。

3.用不上。“百模大战”之后,企业不再大炼模型,预训练的算力需求也就大幅下降,算力市场开始转向以推理算力为主。但推理市场的爆发,需要一个过程,目前AI的行业渗透率还比较低,总体不到10%,很多企业对AI的投入以尝试为主,还没有大规模爆发。所以,训练用算力开始出现闲置,而推理用算力还未大规模崛起,因此短缺问题尚未完全显现。

低水平算力的闲置与过剩,再一次警醒我们:一个繁荣健康的算力市场,关键不是建出来,而是用起来。

自主化智算,不能标注“已完成”

这种情况下,仍然大力发展自主化智算,还有必要吗?

我们认为,这个问题的答案不该有犹豫,要旗帜鲜明地,鼓励自主化智算基础设施的继续建设、加速建设。

首先,从长期看,国内智算属于后发,基础仍然薄弱。

所以,国内自主化智算近年来的发展虽然迅猛,也是在积极补课,打牢基础。这时候如果停止,不仅会前功尽弃,还会让中美在AI基础设施上的差距进一步拉大。

从近期看,自主化AI算力需求仍然没有得到充分满足,算力荒仍在。

一方面,海外AI算力进口受到限制,极不稳定。目前,国内AI训练芯片市场英伟达占据了80%~80%的市场份额,要避免威胁供应链安全,这种情况必须尽快改变。上海的“算力浦江”智算行动实施方案(2024—2025年)要在2025年,实现新建智算中心的国产算力芯片使用占比超过50%;《北京市算力基础设施建设实施方案(2024—2027年)》则提出,2027年要具备100%自主可控智算中心建设能力。

三年左右,从不到20%发展到100%。所以,如今的自主化智算不是太多了,而是还不够。

与此同时,算力需求仍在增长。大模型的规模法则仍在继续,以Sora为代表的视频生成模型对算力的需求量是LLM大模型的数倍,已经出现了“一栋楼放不下一个模型”“一个模型需要多个集群”的情况,超万卡智算中心是必不可少的基础设施,目前国内的十万卡集群还远远不足。

此外,大炼模型的阶段虽然结束了,但基础模型的市场集中度提高和能力提高,又会释放AI应用需求,促进AI的行业渗透率、普及率,导致AI推理算力的需求爆发,急需要更多高质量算力来满足。目前部分国产AI算力集群的利用率极高,西安昇腾智能科技有限公司的人工智算中心算力使用率就高达98.5%;曙光在长沙的5A级智算中心,也吸引上百家企业入驻,实现万余个商业应用接入。因此,随着产业智能化升级的继续推进,国产AI算力荒不是已经解决,而是从现在开始重视和应对。

互联网产业的核心,当然不是宽带和机房,但没有“宽带高速公路”,就没有美国互联网经济的爆发;移动互联网的核心,也不是基站,但没有广泛覆盖的4G基站,就没有智能手机和移动应用软件的兴起。AI大模型也是一样,AI作为一种依附在基础设施之上的软件技术,核心不是智算,但没有自主化智算,国内AI绝不可能独善其身、独自蓬勃发展。

因此,自主化智算并不存在过剩,更不该就此放慢发展。

承上启下,高质量智算接下来怎么建?

综上,“国内AI算力过剩”,是个假问题,“如何合理地推进自主化智算的建设”,才是真问题。

解决这个真问题,国内智算产业已经来到了承上启下的新阶段。不仅要追求把智算中心“建起来”,还要能运营好、用起来。

因此,智算厂商的竞争,也从售卖硬件资源与智算解决方案,转变为多维度、综合性、长期服务的竞争。比如华为昇腾AI全栈、中科曙光的“立体计算”、宁畅的“全局智算”、联想的“万全生态”,新华三的“1+N”智算等,以更全面的能力,支撑自主化智算的建设运营。

追求全面,并不意味着胡子眉毛一把抓,目前来看,智算厂商们主要集中解决自主化AI算力的几个痛点问题:

1.异构问题。目前,国产AI芯片还无法规模化出货,市场集中度较低,因此都是以混合算力的形式,来加入智算集群。多元异构算力的协同调度、管理、算效、业务可靠性等,面临很多技术挑战。如果一个企业或开发者,要针对ABCD不同厂商的卡进行适配开发,是不可能的。所以,就需要智算厂商提供相应的系统平台,屏蔽底层异构硬件的复杂性,让大家用好国产算卡。比如联想的万全异构智算平台,实现异构化AI算力的管理与调配;新华三面向异构智算的智能管理平台,一站式应对多样化的AI应用场景。

2.算效问题。解决“低质量算力过剩,自主化高质量算力不足”的结构性问题,需要进一步提高国产AI的性能。面对工艺制程的限制,可以通过软硬件系统的无缝配合,从而实现国产算卡性能的充分释放。以昇腾为例,就与昇思紧密结合,为各类智算场景提供高性能的自主化AI算力,深圳鹏城实验室的“鹏城云脑Ⅱ”就依托昇腾实现了中国首个自主可控的E级智能算力平台,可以提供不低于1000Pops的整机AI计算能力。

3.运营问题。如今,一些地方在智算中心建设之前,开始提出上架率、收益率等要求,需要保证项目投运后有一定的使用率。同时,也会要求建设方提供设计、使用、运营等一体化服务,避免智算中心因无人运营而成为“数字烂尾楼”。以用促建、以服促用,已经是自主化智算发展的必然潮流。比如新华三与杭州市合作,打造“图灵小镇”,培育AIGC产业和数字人才;中科曙光“立体计算”主张“算力建设、应用赋能、生态共生”三位一体,推动多元算力向新质生产力转化,目前已经在5A级智算中心落地实践。

回顾这一年多来,国内智算的发展突飞猛进,取得了举世瞩目的成绩,我们不必再为算力荒而忧心忡忡。但人无远虑必有近忧,AI算力的自主化之路不能就此戛然而止,而要一鼓作气,再加把劲,把已经取得的成果夯实,为接下来的智能浪潮做好准备。

避免低质量算力过剩,与加速自主化智算发展,这两件事可以并行不悖,也应该理性分开看待。

THE END
1.深圳供电局申请运算资源分配相关专利,提升运算资源费的利用率深圳供电局申请运算资源分配相关专利,提升运算资源费的利用率 金融界2024年12月18日消息,国家知识产权局信息显示,深圳供电局有限公司申请一项名为“运算资源分配方法、装置、计算机设备、可读存储介质和程序产品”的专利,公开号CN 119127469 A,申请日期为2024年8月。专利摘要显示,本申请涉及一种运算资源分配方法、https://baijiahao.baidu.com/s?id=1818758875866123010&wfr=spider&for=pc
2.计划和管理AzureAIStudio的成本本文介绍如何计划和管理 Azure AI Studio 的成本。 首先,使用 Azure 定价计算器来帮助规划 Azure AI Studio 成本,然后再添加任何服务资源来估算成本。 接下来,在添加 Azure 资源时,查看预估成本。 提示 Azure AI Studio 在 Azure 定价计算器中没有专门的页面。 Azure AI Studio 由其他几个 Azure 服务组成,其中一https://docs.microsoft.com/zh-cn/azure/cognitive-services/plan-manage-costs/
3.秒抢地作试图通过用叠加体来解决数组二分这个“最容易的难题”,来探寻叠加体支撑“特例计算”…阅读全文? ?赞同? ?添加评论 ?分享?收藏 赞同了文章2024-08-12 23:29 图形演算和向上平面性 I 大道至简 中国科学技术大学 数学博士 A. 向上平面性的理论基础 A.1 向上平面性的意义 向上平面画法(https://www.zhihu.com/people/zhishipanyan
4.自主计算概述DB2 自主计算环境能够自我配置、自我修复、自我优化和自我保护。自主计算通过对发生的各种情况进行检测和作出响应,将由数据库管理员来管理计算环境更改为通过一些技术来管理。https://www.ibm.com/docs/zh/db2/10.1.0?topic=servers-autonomic-computing-overview
5.自主计算2 自主计算的描述 3 自主系统的特点 自主计算 编辑 自主计算(AC)是具有自我管理特性的分布式计算资源,能够适应不可预测的变化,同时向操作者和用户隐藏内在的复杂性。由IBM在2001年发起,这一倡议最终旨在开发能够自我管理的计算机系统,克服迅速增长的计算系统管理的复杂性,并减少复杂性对进一步增长的障碍。 自主计算的https://vibaike.com/176705/
6.什么是自主计算?自主计算是计算机通过自适应技术自动管理自身的能力,该技术可进一步提高计算能力并减少计算机专业人员解决系统难题和其他维护(如软件更新)所需的时间。 对成本的渴望推动了向自主计算的转变 减少和消除计算机带来的障碍的需要 系统的复杂性以支持更高级的计算技术。 https://blog.csdn.net/dfsgwe1231/article/details/105994550
7.《小数加减法计算综合练习课》教案范文(精选6篇)师:观察我们刚才计算的结果,老师有一个问题,大家选择的都是一顶帽子、一幅手套,为什么计算的结果相差那么多呢? 生:皮帽子、皮手套都比毛线的贵。 师:那么,皮帽子比毛线帽子贵多少钱?皮手套比毛线手套贵多少钱?请你选择一种,试着算一下。 学生自主计算,教师个别指导。请两个学生板演。 https://www.ruiwen.com/doc/1812167635.html
8.龙芯自主可信计算及应用本书从国家大力发展自主可信的安全战略需求出发,结合我国龙芯CPU自主计算技术和TCM国产可信计算技术,介绍具有完全自主知识产权的龙芯自主可信计算平台及其应用,从可信的物理安全、数据安全和软件安全3方面提升信息安全,对我国信息系统的自主可信安全建设具有重要的参考价值。 本书主要介绍龙芯自主可信计算的研究背景、相关理论https://www.epubit.com/bookDetails?id=UB6c692e2446a34
9.现代计算工具(精选三篇)利用计算器来进行计算。正确使用存储运算键。【教学过程】 一、直接导入: 1.师:(出示:计算器)这是什么? 2.揭示课题: 师:数学总是离不开计算,而计算器是一种常用的计算工具。今天我们就来一起认识计算工具。 (板书课题:计算工具的认识) 二、自主探究计算工具 https://www.360wenmi.com/f/cnkeyqnpvlo7.html
10.万物皆可“算”世界计算大会聚焦“数字中国”基于鲲鹏和昇腾,拓维信息推出了自主计算品牌“兆瀚”,同时打造了智能边缘服务器、AI集群等10多款智能计算产品,广泛运用于运营商、金融、交通、制造、教育等10多个重点行业,覆盖全国20多个省份。 据介绍,拓维信息与湘江实验室携手,同时搭载开源鸿蒙和AI视觉技术,实现了车路协同和智慧路网打造。在展会现场,拓维信息相https://company.cnstock.com/company/scp_gsxw/202211/4976574.htm
11.自主移动机器人(AMR)成功的4个关键边缘计算和云计算的策略是更好的解决方案。开发人员可以利用云来管理训练 AMR 所需的大型数据集。然后,部署的机器人可以在边缘运行,利用即时工作所需的自主计算能力。我们的ROScube ROS 2 机器人控制器例如,将凌华科技领先的军用级 DDS 软件与直接位于 AMR 边缘的坚固边缘硬件相结合,用于 AMR 导航。 https://blog.adlinktech.com/cn/2021/07/24/%E5%A6%82%E4%BD%95%E4%BD%BF%E8%87%AA%E4%B8%BB%E7%A7%BB%E5%8A%A8%E6%9C%BA%E5%99%A8%E4%BA%BA-amrs-%E6%88%90%E5%8A%9F/
12.《除得尽吗》教学设计(精选10篇)在自主计算的过程中,经历初步认识循环小数的过程。 知道什么是循环小数,能指出哪些数是循环小数 。 在进行数学探究的过程中获得成功的体验。 重点难点: 重点:知道什么是循环小数,能指出哪些数是循环小数 。 难点:知道什么是循环小数,能指出哪些数是循环小数 。 https://www.9136.com/jiaoyufanwen/jiaoxuesheji/255203.html
13.时间的计算教学设计(通用10篇)今天这节课我们就来学习时间的计算。 【设计意图:兴趣是需求的内驱力,只有培养学生对数学的浓厚兴趣,他们才会积极主动地去学习,课一开始就给学生引入一则学生富有兴趣的广告,调动了学生学习的积极性,提高了本节课的教学效率】 (二)自主探索 形成算法 https://www.yuwenmi.com/jiaoxuesheji/1561016.html
14.《商的近似值》五年级数学教案(精选7篇)二、自主计算 1、提出“平均每个果篮中有多少钱的水果”的问题,鼓励学生试着用竖式算一算。 (设计意图:给学生提供在已有知识背景下自主探索,初步体验商的小数位数特别多的过程,激发学习兴趣。) 2、交流计算情况。让计算出不同位数的同学生汇报计算结果,教师板书,使学生体验商的小数位太多啦。 https://mip.wenshubang.com/jiaoan/860988.html
15.自主择业工资计算方法律师普法关于自主择业工资计算方法是:月退役金数额={(职务工资+军衔(级别)工资+军队统一规定的津贴补贴)╳(80%+增发%)}+军龄工资。军队统一规定的津贴补贴包括:军人职业津贴、自主择业生活补贴、房租补贴和地区津贴(含艰苦边远地区津贴、高山海岛津贴、驻西藏部队特殊津贴和地区生活津贴)。 https://www.110ask.com/tuwen/3909739326636534995.html
16.国家新一代自主安全计算系统产业集群推进会召开新闻新闻 经视新闻 2024 00:00/00:00 自动 倍速 国家新一代自主安全计算系统产业集群推进会召开 节目简介https://www.mgtv.com/b/607542/20471488.html
17.小学数学试讲教案(精选15篇)学生自主计算并订正结果。 2、教师引入:在计算这些题目时,同学们是不是感到很麻烦?这时我们可以使用计算器。用计算器还可以帮助我们探索一些规律呢? (板书课题:用计算器探索规律) (二)讲授新课 1、出示教材第35页例9例题。 让学生用计算器计算下列各题。 https://www.unjs.com/jiaoan/shuxue/xiaoxue/20230112163818_6256709.html
18.五年级上册数学的教案(18篇范文精选)二、自主计算 1、提出“平均每个果篮中有多少钱的水果”的问题,鼓励学生试着用竖式算一算。 (设计意图:给学生在已有知识背景下自主探索,初步体验商的小数位数特别多的过程,激发学习兴趣。) 2、交流计算情况。让计算出不同位数的同学生汇报计算结果,教师板书,使学生体验商的小数位太多啦。 http://www.jiaoyubaba.com/shuxue/73537.html
19.小学数学教案精选15篇二、探究计算方法 1、根据所提问题,列式计算。 2、讨论:怎么算? 3、智慧老人说,小数末尾添上“0”或去掉“0”,小数的大小不变。为了计算需要,45可以怎么写? 4、自主计算,检查反馈。 三、巩固与应用 1、独立完成第17页1、4 2、第17页2、5 https://www.cnfla.com/jiaoan/3628457.html
20.人教版长方体教学设计10篇(全文)2、(出示第10张幻灯片)通过多媒体课件动态演示、总结长方形周长的计算方法。(老师在黑板上板书计算方法) 方法一:长方形周长=长+宽+长+宽 方法二:长方形周长=长+长+宽+宽=长×2+宽×2 方法三:长方形周长=(长+宽)×2 3、学生自主计算,算法可能有(出示第11张幻灯片): https://www.99xueshu.com/w/fileo3a6n22z.html
21.百分数的认识听课笔记3.自主计算: 师:化成分数比较大小,你觉得怎么样? 生1:约分后分母不同,不能直接比大小。 生2:通分比较麻烦,要找到几个数的公倍数做公分母。 师:如果要比较六所学校的近视情况,用分数比较可行吗? 生:要找的分母太大了,比较麻烦。 师:那有没有更好的办法呢? https://www.meipian.cn/2itgnh7r
22.循环小数教学设计(精选10篇)2、出示第33页例8的两道计算题,让学生自主计算,并说说商的特点。 78.6÷11算到商的第三位小数时,让学生停一停,看看余数是多少,然后再接着除出两位小数,指导学生和除得的前几步,比较,想想继续除下去,商会是什么? 通过观察比较,引导学生发现:余数重复出现5和6,商会重复出现4和5总也除不尽。 https://www.fwsir.com/jiaoan/html/jiaoan_20080802204556_135638.html
23.如何查询股票资产股票频道5. 自主计算 如果你愿意花一些时间,也可以自己计算股票资产。通过记录每次买入和卖出的价格、数量,以及分红等信息,可以计算出股票资产的总价值。 查询股票资产的注意事项: 查询股票资产时,需要注意以下几点: 注意事项说明 及时更新账户信息证券账户的密码、交易密码等信息需要定期更新,以保护账户安全。 https://stock.hexun.com/2024-05-11/212813206.html