狂飙200多天,“百模大战”毫不夸张地记录了这个顶流赛道的火热,背后是企业群雄逐鹿的野心。随着战事升级,一种共识也逐渐成型:通用大模型注定是少数玩家的游戏,行业大模型或许才是机遇。
悬疑剧《漫长的季节》结尾,当象征着时代的火车驶过玉米地,老年的王响冲着年轻时的自己大喊:“往前看,别回头。”
大模型也正在经历一个这样的季节,当大模型回归理性,市场必然要经历一场大浪淘沙。关乎技术,更关乎商业模式。无论是入局还是出局,结果未知,只能一路向前。
这是大模型留给市场的大悬疑。
从“20”到“80”
8月3日,“神秘”的腾讯混元大模型传来新进展,目前已经进入公司内应用测试阶段。
通用大模型队伍即将“+1”,但在过去200多天里大模型的密集发布中,“场景”已经取代“参数”成为新的关键词,行业大模型也逐渐成为新的竞争焦点。
上一个备受关注的是京东。本月中旬,京东言犀大模型面世,“融合70%通用数据与30%数智供应链原生数据”的招牌,垂直瞄准了零售、物流、金融、健康等带有强烈京东色彩的业务领域。再早些时候,华为云盘古大模型3.0版本发布,“不作诗只做事”的“豪言”一度出圈。
5月的报告显示,中国10亿参数规模以上的大模型发布数量已经达到了79个。那时候距离ChatGPT在国内“破圈”后引起轰动不过3个月。
在接受北京商报记者采访时,无界AI联合创始人马千里提供了一种国际视角的看法:中国大模型像是三国时期的东吴,大、中、小厂皆入其局,宛如江东六郡八十一州,实力不可小觑。
这种视角下的魏国是美国,OpenAI和Google在大模型方面的实力毋庸置疑,而其“挟算力以令诸侯”的做法更加剧了这种标签。蜀国则是以LLama为代表的开源势力,也是因其开源而深得人心。
据悉,今年上半年全球新发布的大模型已超过400个。麦肯锡的报告《生成式人工智能的经济潜力》中提到,在其研究的63种应用中使用生成式AI,将为全球经济带来每年2.6万亿-4.4万亿美元的增长。
传统的人工智能在落地产业的时候,需要以特定场景、海量数据这两点为前提,进行非常定制化的训练和交付。在效果方面,如果假设一家企业有100个需要AI解决的具体问题,由于数据量的限制和极高的定制化成本,传统人工智能可能只可以解决其中的20个。
以大模型为代表的新一代人工智能正好可以解决以上两大痛点。百度集团科技与社会研究中心主任余欢对北京商报记者分析称,“通用”意味着大模型不再需要将所有解决问题的能力都从0到1做完全的定制,在通用大模型基础上,加上一定量的场景数据,人工智能就有望在数据不多、成本不高的情况下,解决上述100个问题中的剩余80个问题。
“这些原来难以被解决的中长尾问题得到了有效的解决。当基础模型的通用性和训练推理成本达到一个新的平衡点,就可以实现如工业生产一般的规模化效应,商业模式跑通了,才算是真正实现了AI赋能产业的目标。”余欢称。
外热内冷
2023世界人工智能大会的开幕式上,华为轮值董事长胡厚崑说,通用人工智能正带领我们走向下一个黄金十年。
几乎是同一天,网络分析公司Similarweb发布的数据显示,6月ChatGPT全球访问量出现了推出以来的首次环比负增长,降幅达到9.7%。
尽管访问量可能并不具有实际意义,但却几乎瞬时掀起了人们对于ChatGPT流量见顶以及大模型降温的探讨。于资本层面,马千里称,一级市场讨论火热,但并没有特别多的机构真正参与了这个领域的投资,“实际情况远不如当初团购、共享单车的时候”。
AIGC的故事“编不下去”了吗?今年6月,昆仑万维实控人前妻李琼减持的消息,一度带崩整个AI板块。同样的情况还有三六零集团创始人周鸿祎的“90亿”分手费。
余欢称,在最近的这些大模型相关宣传中,有一些比较重要的概念被混淆或者弱化了。如果单单只是以参数达到百亿级别来衡量的话,那么GPT2到GPT3之间的2020前后就已经是大模型了。但这一波“生成式AI大模型浪潮”的重点在于智能涌现能力、多轮对话以及更强的生成能力。这些才是催生新一波生成式AI浪潮或者说LLM大语言模型浪潮的核心要素。
自今年3月,在全球科技大厂中首发大模型产品文心一言以来,百度对于底层的大模型做了数次的迭代和升级。今年6月,文心大模型从3.0版本升级到3.5版本。百度当下的重点任务,也放在了持续优化生成效果方面,例如优化多轮对话的记忆能力等。
对于如火如荼的“百模大战”,余欢断言,在通用大模型领域,至少往前看两年以上,如果一家公司没有相关领域布局的信息,而是在当下突然宣布自己有大模型产品了,多半都是“套壳”或者接入了其他人的模型,通用大模型产品是很难一蹴而就的。绝大部分的公司和团队都是在“投机”,毕竟资本市场还是认概念、认故事的,而当下的A股市场又恰恰缺乏好标的和新概念。
商业及战略管理专家、她力量创始人&CEO卢步云也对北京商报记者分析称,AI技术在实际应用中的推广和落地,并不是单纯数据整合和效果呈现的事情,而是需要充分考虑业务需求、数据质量、模型定制等与商业模式相结合。除了模型要喂养学习外,现在AI技术人才也相对稀缺,企业同样需要投入大量资源培养。
“其次,AI技术的应用仍处于初期摸索,并未达到成熟阶段,当中存在很多的不稳定性和误差,需要不断优化和改进。另一个关键点在于AI技术的应用和数据处理,涉及隐私和安全风险,需要谨慎对待,并待有关的政策和方案出台。”卢步云称。
时间、周期与成本
大浪淘沙、优胜劣汰是市场经济的规律,对大模型来说仍是如此。
马千里分析称,当企业开始谈场景、谈应用的时候,反映出来的其实就是希望尽快将其商业化,因为大模型的开发成本太高了。人们普遍都已经意识到,宛如当年的“百团大战”,真正能够活下来的大模型可能只有个位数。
在他看来,当下大模型竞争早已超过了技术的范畴,更多是一种生态层面的竞争,具体表现在大模型基础上有多少应用、有多少插件、有多少开发者以及有多少用户。“如果没有用户使用,模型就没有数据进行提升,进而形成一种恶性循环。”
大模型不再唯技术论。余欢也提到了类似的观点,技术本身是门槛,是产业落地的充分不必要条件。大模型的to B服务需要一套非常成熟的运作体系,企业服务领域的生意三分拼的是技术,七分拼的是综合实力,比如长期服务和运维保障能力。
更重要的是,当产业落地真正实现规模化后,大模型头部效应将会越来越明显。“客户的选择通常会聚焦在几个主流模型之内,并着重参考同行友商的选择。PoC阶段并不会把所有模型都试个遍,费钱费力,且不现实。这意味着大模型创业企业的机会可能被进一步压缩。”余欢称。
从投资人和厂商的角度,华院计算数智人商业化副总裁林莱尼对北京商报记者分析称,过去半年的大模型就像是Gartner曲线一样,经历了从惊喜、盲从到趋于理性的过程。这种理性表现在商业变现的时间、周期、成本上。
“不管是投资人还是厂商,我们共同关注的是什么时候能够变现,变现的规模营收是多少。具体的应用场景在哪里,谁会为此付费。而商业应用方面,我们更加关注的是容错率,因为有些行业错误的答案会引发相当高昂的赔付成本。”林莱尼称。
百度集团科技与社会研究中心主任余欢
大模型产业化不在训练在推理
Q:您曾提到,当下的大模型正处于第一波海选结束、正赛开始的阶段,那您认为正赛期间大模型又将经历一种怎样的竞争?
A:正赛依然是个不断淘汰的过程,而且这个完整的正赛可能要持续5-10年时间以上。未来半年到一年,很有可能看到当初一窝蜂闯进来的投机团队被甩开,经历破产清算或者被收购。
近期圈内一种比较热门的观点是,选大模型要选大厂而不是创业公司,这其实反映出一个很现实的问题:在技术层面,创业公司的大模型即便在某个方面或者某个时点达到了大厂水平,但在未来的竞争中也还是难以胜出。
压力一方面来自于资金。大模型是一个需要持续烧芯片的重投入行业,对于创业公司而言,如果没有做好长期、每年数十亿甚至上百亿的投入准备时,最好不要轻易涉足。除通用数据外,很多专有数据集或者商业数据集,需要耗费大量资金购买。在技术不相上下的前提下,如果数据获取不占优势,也很难追上大厂的“进化”速度。
另外一方面是人才密度。大厂有着成建制的算法开发和工程交付人员。此外还有大量的运维保障人员。而创业公司,受限于自身资源和条件,团队规模通常不大,往往要一人身兼多职,一旦客户逐渐增多,考验的就是企业的项目管理、人员交付、运维保证等综合能力。
Q:您认为中国会不会跑出自己的“OpenAI”?
A:未来的通用大模型应该还是几家厂商之间的游戏,出现真正意义上的中国版OpenAI的机会已经不复存在了。
OpenAI能够“杀”出来,一是因为GPT的路线选择。当时所有人都不知道GPT有智能涌现的功能,将其看作一种纯烧钱的投入,OpenAI一根筋地投入更像是一种乌托邦式的做法。而中国的融资环境、企业考核机制等现实,都决定了企业不可能以这种方式“孤注一掷”地坚持在这件事情上,大厂也是一样。
OpenAI的出现类似于一种田忌赛马机制,当大厂在犹豫和做对比的时候,投入的可能只有8-10个人,这时候“小厂”押注三五十人,可以实现局部领先。但当下,所有企业都已经明白,这件事甚至不是三五十个人就能完成的,因此不计成本地进行投入,在这种情况下就不太可能出现此前的差异化打法,大家都是明牌的情况下,就很难再跑出黑马了。
Q:您认为大模型商业化的关键在哪?
A:在商业化之前,人们通常更关注大模型的训练成本,但却忽略了真正的商业化和规模化之后,最大的成本来自于推理。最后的商业化一定是效果不断提升、成本不断下降的平衡点。一方面,模型的“聪明程度”要不断地满足日益提升的需求,解决行业的实际问题。另一方面,还要充分考虑客户的实际付费能力。长期来看,大模型是基础设施,商业的生态繁荣主要还是要看应用和插件的井喷。只有大家都基于大模型做开发,把大模型的应用都用起来,才是真正的商业化落地。
北京商报记者 杨月涵