每日科技头条讯:一个礼拜前的CES 2025上,英伟达创始人黄仁勋宣布Blackwell芯片已经处于全面投产阶段,其中GB200芯片可以为大语言模型推理负载带来30倍的性能提升,将成本和能耗降低25倍。
外界还在为这样的利好消息兴奋时,一份168页的“临时最终规则”迅速让市场添加了几分悲观情绪。
1月13日,白宫官网公布了针对人工智能的临时最终出口管制规则,以国家安全为由,将进一步限制人工智能芯片和技术的出口。有媒体将其形容为“人类史上首个全球AI出口管制规则”,直言中国的科技企业将受到冲击。
经历了2024年的铺垫后,2025年注定会上演一场AI全球竞赛。而在算力上被“卡脖子”的中国AI,又将何去何从?
01 “芯片新规”的影响有多大
“禁止中国获取先进GPU”,似乎算不上什么新闻,毕竟在过去三个月里,诸如此类的事件就发生了多次。
2024年11月10日,台积电被迫向中国大陆客户暂停供应7nm及以下更先进制程的代工服务,原因是收到了美方的要求。
2024年12月2日,美国宣布了新一轮对华出口限制措施,将140余家中国企业加入贸易限制清单,涉及半导体制造设备、电子设计自动化工具等多个种类。
既然“芯片限令”如此高频,为何市场依旧在新规出台后表现出了悲观情绪?英伟达和AMD的股价应声下跌3%和2%,甲骨文执行副总裁Ken Glueck直言“这项新规可能成为美国科技行业历史上最具破坏性的政策之一”。
原因在于,这份“临时最终规则”除了对AI芯片提出了全球许可要求,还对“模型权重”进行了管制(不仅定义了模型的决策机制,还决定了模型的性能和通用性)。
先来看AI芯片的部分。
新的禁令将全球的国家和地区分为三级:Tier 1的少数盟友可以不受限制地获取AI芯片,但必须严格遵守美国政府的安全要求;Tier 2的国家和地区,将面临以国为单位的总算力限制,2025年到2027年之间最多购买约32万块H100的算力;中国大陆在内的Tier 3的国家和地区,将被全面禁止进口先进芯片。
再来看模型权重管控。
企业不能在属于Tier 3的国家和地区部署高性能的闭源模型;在Tier 2的国家和地区进行部署时,必须严格遵守安全标准;如果需要对通用开源模型进行微调,且过程需要消耗大量算力,必须向美国政府申请许可;同时还增加了一条红旗警示,美国本土运营的IaaS提供商可能需要申请才能向客户交付大模型。
也就是说,国内的科技企业或将进一步面临GPU短缺的问题,特别是在“万卡智算集群”的趋势下,没有足够的算力供给,将直接影响大模型的训练,制约Agent、自动驾驶、具身智能、数智化转型等产业进程,继而削弱中国AI产业的竞争力,确保美国在人工智能领域的绝对优势。
而“模型权重”的管制,某种程度上为中国企业在海外训练的大模型带来了合规风险,在海外使用美国企业的云服务,不再是一种安全选项,甚至可能会对中国企业的出海进程增加不必要的麻烦。
“首个全球AI出口管制规则”的出台,既有对旧问题的加码,也带来了新的挑战。在找到新的解题方法前,焦虑情绪的出现是一种可以理解的常态。比较乐观的是,相关的替代方案早已经成熟。
02 独立自主的算力在“云端”
古代战争中,面对骑兵的速度和冲击力,步兵常常会结成方阵,比如汉代步兵对抗匈奴骑兵时使用的“拒马阵”。
正在发生的“AI争夺战”,有着相似的一幕。
典型的例子就是华为副董事长、轮值董事长徐直军在华为全联接大会2024主题演讲中提出的判断:“美国在AI芯片领域对中国的制裁长期不会取消,而中国半导体制造工艺由于也受美国制裁,将在相当长时间处于落后状态,这就意味着我们所能制造的芯片的先进性将受到制约。”
徐直军提出的对策,和步兵方阵异曲同工。
“人工智能正在成为主导性算力需求,促使计算系统正在发生结构性变化,需要的是系统算力,而不仅仅是单处理器的算力;我们的战略核心就是,基于实际可获得的芯片制造工艺,计算、存储和网络技术协同创新,开创计算架构,打造“超节点+集群”系统算力解决方案,长期持续满足算力需求。”
其实在2023年9月,华为云就上线了昇腾AI云服务,给出了满足算力需求的“中国方案”:通过整合大规模算力集群、计算引擎CANN、AI框架MindSpore、ModelArts AI 开发生产线和ModelArts Studio大模型即服务平台,为大模型的训练、推理,AI应用的开发和运行提供稳定可靠、自主可控的全栈算力保障。
其中一项关键技术是华为云的AI原生云基础设施CloudMatrix:将CPU、NPU、DPU、存储和内存等资源池化,形成了一个紧耦合的矩阵算力;再借助超高带宽Scale-Up网络,实现了资源的对等连接,既可以水平扩展,还可以垂直扩展;同时可以按需组合多样化算力资源,并根据应用需求灵活调整。
有了“阵型”后,战场上的对垒不再是一对一的单兵,而是比拼战术、装备和地形利用,一次又一次创造了步兵打破骑兵的战绩。
算力也是如此。
在大模型训练的过程中,芯片并不能直接和算力划等号,需要通过建立数据中心的方式将芯片集群,并解决算力适配、框架兼容、软件环境、数据传输、运维等一系列问题。
单单是在基础设施环节,就是大多数企业吃不消的。
同样的需求放在昇腾云上,得到的是“即开即用”的AI算力,而且有着自建数据中心无法企及的稳定性:目前业界万亿参数模型训练的平均无中断时长约2.8天,昇腾AI云服务可实现40天无中断;业界平均集群故障恢复时间约60分钟,昇腾AI云服务可以缩短到10分钟;大模型的资源开通时间也从月级缩短到了天级……
正如《芯片战争》作者Chris Miller的说法:“训练人工智能系统的云就是未来的工厂。”所谓的“芯片战争”早已演变为“云战争”。
也许针对中国企业的芯片禁令还将继续出现,然而“AI争夺战”的主战场早已转移到了云端,只需要一个指令,就能获得澎湃的AI算力,在算力上“卡脖子”迟早会成为伪命题。
03 向上生长的大模型新生态
有意思的是,白宫的“临时最终规则”发布后,最先表达不满态度的,居然是掌控着全球算力话语权的英伟达。
按照英伟达官方的回应:新规不但无法减轻任何威胁,反而只会削弱美国的全球竞争力,破坏使美国保持领先地位的创新能力。限制对主流计算技术的使用可能会阻碍国内外各行业的AI进步。
表面上的原因,新规可能会打压英伟达的出货量;深层次的原因,则是对独立于英伟达的大模型生态的担忧。
早在2023年初,芯片禁令的靴子还未落地时,科大讯飞就开始思考“怎么将大模型的能力架构在一个自主创新的体系上”。
科大讯飞董事长刘庆峰后来在一次主题分享中公开谈到:“在我们自己建算力集群之后,我们发现在华为云上做训练推理建设比自己做更轻松、效率更高,更能满足短时瞬间的规模化算力应用之后,释放波峰波谷(减少能耗闲置,算力削峰填谷),对整个行业都是效率最高的。”
根据科大讯飞官方给出的数据,基于自主算力训练的讯飞星火4.0 Turbo,在数学能力、代码等方面的能力超过了GPT 4o,并已完成超长思维链、树搜索和自我反思评价等算法验证。
做出同样选择的,还有腾讯音乐。
腾讯音乐旗下的天琴实验室,自研的MUSELight大模型框架与昇腾AI云服务深度合作创新,联合发布了行业领先的Stable Diffusion系列视觉大模型推理加速方案lyraSD。
相比传统AI算力解决方案,推理速度提升超过166%,性价比提升了35%,为微信、QQ音乐、全民K歌等平台带来了更高效的AI内容生成能力。
这些案例的背后,折射出的是中国科技企业的创新精神,站在新一轮技术革命浪尖的中国企业,没有被不公平的打压卡住脖子,而是用有限的资源,实现了一流的性能,让世界看到了解决问题的中国智慧。
更重要的是,昇腾云、科大讯飞、腾讯音乐、顺丰、知乎、奇瑞等产业上下游的玩家们,一同构筑起了中国的大模型生态,打通了底层算力到通用大模型再到行业应用的路径。
比如华为云已经在贵州贵安、内蒙古乌兰察布、安徽芜湖部署了三大AI算力中心,拥有超大电力、土地、网络等资源储备,能够进一步满足大模型训练、推理的算力需求。同时在华北、华东、华南等热点区域部署了30多个数据中心节点,通过华为云云边缘枢纽提供最低时延的AI训推服务。
再比如100+开源大模型已经基于昇腾云适配优化,企业可一键调用大模型能力,并且能够和云市场打通实现资产变现;而昇腾AI云服务AI Gallery百模千态专区的上线,再度缩短了大模型落地的路径,企业和开发者可以使用Maas的方式,快速构建自己的大模型应用,抓住新技术的红利期。
联想到“临时最终规则”中对基础IaaS服务的限制,探索出算力供给新范式的中国云厂商,无疑“等”来了海外扩张的机会。
04 结语
君子不立危墙之下。
AI作为一种通用的基础性使能技术,正持续催生新产业、新业态,改变我们的生活方式、生产方式、工作方式,甚至可能在接下来的几十年里,深度影响一个国家的竞争力,左右新的世界秩序。
幸运的是,华为云、科大讯飞等已经已经证明,AI算力供给不会受限于芯片,应用创新也不会受制于AI算力,为担心算力卡脖子的企业,找到了一条切实可行的解决路径。
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。