您的位置 首页 科技 产业

李开复:中国大模型公司没有美国大厂的GPU数量,要采取更务实的战略

进入2024年,大模型竞争已经进入一个新的阶段,行业已经从“模型能力秀肌肉”,到不仅关注模型能力的逐渐提升,而更强调商业生态、PMF及用户的增长:从模型能力上看…

进入2024年,大模型竞争已经进入一个新的阶段,行业已经从“模型能力秀肌肉”,到不仅关注模型能力的逐渐提升,而更强调商业生态、PMF及用户的增长:从模型能力上看,GPT-4作为一个黄金指标,似乎已经成为模型公司可以探索后续应用的先决条件,如何有公信力地证明模型能力已经达到标准;另外,在未来的商业化道路上,究竟如何考虑开源和闭源?大模型提供的能力同质化,如何找到PMF和差异化竞争优势。这些问题都是摆在大模型公司面前最急需解决的问题。
5月13日,零一万物在成立一周年,CEO李开复宣布了Yi-Large模型的发布,并宣布将之前发布的Yi-34B、Yi-9B/6B模型升级为Yi-1.5系列,每个版本均达到同尺寸中最佳性能。此外,零一万物宣布了从应用到生态的产品线,包括2C生产力应用“万知”和2B生态的“API开放平台”。李开复博士在发布会上阐述了公司的双轨大模型战略,并提出了大模型赛道的发展方向。
李开复认为,大模型赛道的发展将取决于如何有效实现技术、产品、市场和成本的契合。大模型的训练和服务成本高昂,算力紧缺是行业面临的共同挑战。他呼吁行业避免不理性的烧钱模式,以实现大模型的健康良性发展。
在这次发布会上,李开复也首次深谈了对未来AI商业生态发展的判断,他认为在移动互联网的鼎盛时期,PMF(Product-Market Fit,产品市场契合)曾是众多初创企业追求的核心目标。然而,随着大语言模型成为新的创业焦点,仅仅追求产品与市场契合远远不够。
两个时代在创业基础设施层面存在着决定性的差异——在移动互联网时代,用户规模增长所带来的边际成本很低,但是在大模型时代,模型训练和推理成本构成了每一个创业公司必须要面临的增长陷阱。用户增长需要优质的应用,而优质应用离不开强大的基座模型,强大基座模型的背后往往是高昂的训练成本,接着还需要考虑随用户规模增长的推理成本。这一普惠点如何达成、何时到来变得越发难以捉摸。
图片
李开复认为,PMF 这一概念已经不能完整定义以大模型为基础的 AI-First 创业,应当引入 Technology(技术)与 Cost(成本)组成四维概念——TC-PMF。“做 Technology-Cost Product-Market-Fit(TC-PMF),技术成本 X 产品市场契合度,尤其推理成本下降是个‘移动目标’,这比传统 PMF 难上一百倍。”
随着高性能计算硬件的迭代和模型优化技术的普及,大模型推理成本的大幅度下降已经成为可预见的趋势所在。在普惠点终将到来的前提下,能够率先察觉、并达到 TC-PMF 这一普惠点的玩家无疑会占尽先机。要做到这一点,模型、AI Infra、应用这“三位一体” 的优异能力缺一不可。基于此,零一万物提出了 “模基共建”、“模应一体”列为公司的顶层核心战略。
一、模型公司依托AI Infra能力走出增长陷阱
在国内大模型赛道向前狂奔的第一年,模型结构成为行业焦点,鲜少有人注意到 AI Infra 的重要性。
一个不容忽视的事实在于,中国大模型公司没有美国大厂的GPU数量,所以必须采取更务实的战术和战略。AI Infra(AI Infrastructure  人工智能基础架构技术)主要涵盖大模型训练和部署提供各种底层技术设施,在李开复博士看来,自研 AI Infra 是模型公司必然要走过的路,零一万物也自成立起便将 AI Infra 设立为重要方向。
“第一年大模型行业在卷算法,第二年大家在卷算法 + Infra。在国外一线大厂,最高效训练模型的方式是算法与 Infra 共建,不仅仅关注模型架构,而是从优化底层训练方法出发。”零一万物模型训练负责人黄文灏表示,“这对大模型人才的知识能力提出了全新要求。”
目前来看,模型研究人员只关注算法而忽视 AI Infra 是国内大模型行业现状。零一万物选择模型团队和 AI Infra 团队高度共建,人数比为1比1。“我们要求做模型研究的人一定要‘往下沉淀’,具备工程能力。这也对齐我们倡导的 TC-PMF 的方法论。”黄文灏说。
据李开复在发布会上介绍,多方面优化后,零一万物千亿参数模型的训练成本同比降幅达一倍之多。
二、AI2.0将不再支持共享单车式的烧钱大战
国内大模型领域陷入混战的 2023 年初,各式各样的评测榜单铺天盖地,跻身各大榜单 TOP 的模型不在少数。大模型进入第二年,行业进入更为现实的商业落地阶段,客户/用户都会按照应用侧所展现的能力,用脚投票。如何基于基座模型能力,尽可能提升应用效果,是追赶 TC-PMF 的重要课题。
“AI-First 不等于 AI Only,”零一万物生产力产品负责人曹大鹏表示,“模型、工程、算法、产品要基于场景深度结合,模型长板匹配刚需高价值场景,构建AI-First 工作流,追求极致体验、一站式解决用户问题,而不是单纯秀模型能力肌肉,拿锤子找钉子。”
在零一万物 API 平台负责人蓝雨川看来,已经在海外充分得到商业模式验证的 API 会是更好的选择。作为标准化产品的 API 复用性更强,商业模式也更趋近于云服务。比起 AI 1.0 定制化重交付的模式,API 能够更快穿透千行百业。
去年9月开始,零一万物便聚焦生产力、社交赛道于海外应用展开探索,已有 4 款产品陆续上线。据李开复介绍:“目前零一万物海外生产力应用总用户接近千万,营收今年预期过亿人民币,产品 ROI 为1,初步摆脱烧钱获客,验证了 AI-First 产品的用户订阅制商业模式。”
由于海外市场与国内市场在付费意愿、市场环境方面存在差异,目前万知采取限时免费模式。但据曹大鹏介绍,后续万知会结合产品发展和用户反馈推出收费模式。
李开复表示:“TC-PMF 所带来的 AI 普惠点终将来临,这一次市场竞争将不再支持共享单车式的烧钱大战,采用以资金“跑马圈地”商业模式的企业必然会率先力竭,冷静判断行业发展进程,脚踏实地打磨TC-PMF 才是更符合长期主义的路线。这场较量将包含模型、AI Infra、产品应用等三位一体多个方面。
李开复博士表示,ofo 式的补贴逻辑不再适用于 AI 2.0,希望大模型赛道的竞争聚焦于达成 TC-PMF。
图片
三、访谈实录,李开复谈营收构成、行业演变及未来选择
作为在大模型赛道探索一年的AI-First创业企业,李开复和他的团队对未来的商业落地也有一些一线的思考,在发布会现场,接受了包括腾讯科技在内的媒体的访谈,以下为访谈实录:
Q:请问您对国产推理芯片的发展怎么看?然后现在美国有很多新兴的推理芯片创业公司,国产芯片有哪些机会?未来是否会考虑国产推理芯片?
李开复:国产的训练芯片和推理芯片我们都要全力支持。
但是两个差别是比较大的,训练芯片还是有一定的难度。推理芯片的好处,一是它本身就比较简单,第二它不需要那么难的制造过程,所以我们对国产的AI推理芯片是看好的,我们也会在合适的时候去采用,我们在创新工场也一直在关注这方面的投资的机会。
Q:零一万物最关注的市场反馈和数据指标有哪些?大模型初创公司还有哪些独立发展机会?
李开复:我们本身就是AI初创公司,从独角兽做到了超级独角兽,不可否认融了比较多的钱,有了丰富的算力,用刚刚我的同事文灏的话说就是先追求GPU、其次考虑应用。我们认为我们可以走出比较适合我们的路,模式更务实一点。
我们是务实的API的信仰者,所以我们一定要用最少的芯片最低的成本训练出我们能训练最好的模型,同时我们会不断的去摸索找TC-PMF。
我觉得国内的初创公司相对硅谷公司的一个差异,我们能够仰望星空,也同时能够脚踏实地。去考虑非常复杂的题目就是一方面要预测技术可以多快进步,然后我们能力所及产生什么样的模型。第二怎么把推理成本做到最低。
第三当然还有PMF,这些都是国内的特色。因为如果大家谈大模型的时候,往往会觉得说美国这方面论文写得最多,人才密度最高,但是同时你要考虑到做一个伟大的大中型公司,它不只是底层,底层当然不能差,答案是要能够在世界第一梯队,应用更重要。
怎么开发、怎么找到复杂的芯片,懂模型也懂应用的人在一起写作,这是我们在硅谷的公司一般没有看到的。
我们也不会用纯大力出奇迹的思维一味地追求AGI。OpenAI有资格尝试这条路,但这不是我们要走的道路。未来真正的价值一定是谁能打造AI时代的抖音、微信、淘宝。
AGI是梦想,但是你用梦想去指点一个公司的执行,而你又没有这种财力去做一个超级大力出奇迹的事情,就是徒劳无功的。
Q:您之前说2024是AI应用爆发的元年,但是朱啸虎说是2025年,这两个时间有差别吗?我们一定会迎来应用的爆发,但是爆发的临界点是什么?
李开复:我觉得朱啸虎说的有他的道理,刚才我也提到一年降低10倍的推理成本,两年100倍,所以有100倍推理成本的下降,就好像GDP的获得能力,只要今天1/100的价钱来做推理成本,很多应用肯定是可以爆发的。
但是我认为今年是元年,是因为我觉得有些领域今年就会爆发,爆发不是同时到来的。我觉得今年在生产力工具肯定会发生的,如果你看Office Copilot,虽然他不见得是AI,也已经非常多用户在使用了,所以我觉得今年开始,明年会更大的爆发。
Q:开复老师,请问您提到的万知海外一个亿的营收构成是什么?预期未来增幅怎样?另外,看到现在很多CEO都在带货,您作为万知的首席体验官,也会带货吗?
李开复:我先回答最后一个问题,我最近确实是开了短视频账号,但是不会直播带货卖东西,会和大家分享万知,它是一个免费的产品,希望帮助大家把它用好。
另外,大家都知道我在AI方面写了三本书,我一直建议大家要了解AI的重要性,无论为了孩子的教育,自己的工作等,我也希望能够用我的短视频账号来做一个非常实诚的分享,然后让大家了解怎么去把这个工具用好,别只看到会不会取代我们的工作。
关于收入方面,我们的海外产品采用了一种在软件领域内可被视为健康的商业模式,即会员订阅制。这种模式类似于国内视频网站的会员服务,用户一旦订阅,如果满意,下个月将自动续订,我们提供月度和年度的订阅选项。这种商业模式优于传统的充值式或纯广告模式,后者的收益与流量关系密切,如果没有达到高流量,很难实现盈利。
我们发现,尽管用户数量可能不多,但通过订阅费也能支持公司的增长和成本,这对于初创公司来说是非常有利的。此外,我们还观察到,尽管两个月内用户数达到上亿,但AI产品的全球渗透率仍然很低。具体来说,我们的产品自去年九十月份推出以来,收入增长了10倍甚至20倍,这表明AI渗透正在快速增长,随着新模型或产品的发布,我们的产品力和获客效率也在不断优化,这让我们对公司的健康发展和高速增长充满信心。
对于未来的收入预期,我们保持乐观态度,预计随着下半年或明年更强大的模型的推出,我们的收入将进一步增长。
此外,尽管我们对今年能够实现1到2亿收入感到自豪,但与全球生产领域的巨头如Microsoft Office相比,其Office 365每年有数十亿美元的收入,说明生产经营产品的市场潜力巨大。
Q:AI行业的洗牌大概会发生在什么时间?可能会淘汰多少创业公司?
李开复:我认为中国市场目前正处于一个充满活力和快速成长的阶段,在这一过程中,我们观察到许多竞争对手采取了不同的发展路径。充分展现了中国公司在新环境中迅速而充满活力地成长的过程。因此,现在就对市场进行定论可能还为时过早。
在美国,目前普遍的认知是,只有少数几家公司能够训练超大型模型,而这些训练的成本非常高昂。与此同时,其他公司开始寻找解决方案,比如开发尺寸适中、更适合商业应用的人工智能模型,这既是我们的方向,也是一些美国公司正在探索的方向。此外,还有一些公司正在探索超小型模型或开源模型。
我对中国的超级模型持乐观态度。我认为中国创业者的生命力超出了简单的想象。虽然市场洗牌可能会导致一些公司转型或退出,但我们不应低估中国的创业创新能力。
Q:目前大模型的应用场景主要为娱乐和生产力提升,看到零一万物目前主要聚焦生产力提升,未来会专注这个赛道,还是也会探索别的场景,如果有的话具体可能有哪些场景?
李开复:人类的需求几千年来一直未变,但随着科技的洗礼,我们的工作方式、沟通方式、娱乐方式、交友方式以及购物方式都在不断演变。我相信这些变化也必将在AI时代发生。在众多的AI应用中,我们需要关注哪些会首先被点燃。我们特别看好生产力工具和娱乐社交应用,尽管这些应用目前还处于初期阶段,应用场景有限。未来,我们需要通过TC-PMF(来观察哪些领域可以借助强大的模型和用户愿意支付的费用来实现突破。
同时,也存在一些应用,用户可能不会直接支付,但它们的使用量需要先做起来,因为它们具有很强的粘性和传播力。然后,我们会探索其他的商业模式来实现盈利。这个过程与移动互联网的发展过程相似,就像移动互联网最终发展出了视频订阅模式一样,AI领域也会出现类似的模式。在AI时代,我们也会看到类似于抖音、微信、滴滴、美团这样的创新应用。
关键在于不断探索哪些领域技术足够好、推理足够便宜,并且用户需求足够强。无论是通过直接付费还是通过其他商业模式,最终能够最早推出并胜出的应用将是关键。关于这一点,我不能再透露更多信息了。


本文来源于网络,不代表每日科技头条立场,转载请注明出处:http://www.toutiao365.com.cn/news/202405/16590.html

为您推荐

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

联系我们

联系我们

18099612802

Q Q: 893973906

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部