大模型，是时候谈“钱”了

　　9月13日，阿里云通义千问入局，成为最新一个面向全社会开放的大模型。而自8月31日首批国产大模型产品获批上线，这场“狂欢”已经持续了近半个月。但元语智能联合创始人兼COO朱雷在与许多具体企业和项目的接触过程中明显感到，从8月初开始，企业们便已纷纷在大模型项目采购等方面作出了实质性的布局。

　　如果说过去半年大模型商业化的探讨是困在内测里的“站在今天看明天”，那么面向公众开放后对商业化的探讨，就颇有种“站在明天看今天”的意味。这可能是迄今为止大模型最接近“赚钱”的一次，当然也是成本、模式等问题最为现实和迫切的一次。

　　命运的齿轮转起来

　　“过去7个月他们都处于一种观望的状态，但8月初就已经明显开始筹备落地，比如采购项目，找机构对潜在的大模型供应商进行测评，判断它们是否在效果上可以达到预期等。”以金融机构为例，朱雷讲述了他经历的过程和转变。

　　朱雷的另一个身份，是大模型榜单SuperCLUE的联合发起人。也是因为评测需求的走高，让朱雷能够站在第三方的角度，全面接触大模型供需最关键的两端。

　　在朱雷看来，这些大型企业关注的重点，并不是某一家大模型厂商是否通过备案，而是这个信号表明官方对大模型的广泛应用有了非常正面的态度，所以他们才会积极地响应，包括内部立项审核、公开招标等。

　　8月31日，包括百度、商汤集团、抖音、百川智能、智谱AI等在内的8家企业和机构通过《生成式人工智能服务管理暂行办法》备案，顺利面向公众开放自己的大模型。9月5日，360智脑大模型、讯飞星火认知大模型接棒，9月13日，阿里云通义千问大模型最新入局。

　　第二批备案的大模型也在加速中。9月1日，国家互联网信息办公室发布了《关于第二批深度合成服务算法备案的信息公告》，公告显示，第二批深度合成服务共计110个算法信息完成备案。至此，我国累计已有151款算法完成深度合成服务算法备案。

　　大模型“命运的齿轮开始转动”。百度创始人李彦宏曾提到，当“文心一言”向数以亿计的互联网用户大规模开放服务后，就能够获得大量真实世界中的人工反馈，这将进一步改进基础模型，并以更快速度迭代。

　　今年3月16日，百度率先推出“文心一言”，成为国内首个、全球大厂中首个生成式AI产品。数据显示，8月31日0点至24点，文心一言共计回复网友超3342万个问题，平均一分钟回答23000个问题。

　　对于上线至今包括累计回答问题、新增用户等数据及未来业务融合情况等问题，北京商报记者联系了百度、商汤集团、抖音及智谱AI，但截至发稿未收到回复。

　　“大规模推向市场，数据的飞轮才能转起来。”在接受北京商报记者采访时，无界AI联合创始人马千里作出了这样一个概括。不过在他看来，备案通过与产品的质量没有本质关联，更主要是从信息安全角度考量，但通过备案面向公众开放，也意味着可以加快技术迭代，开启商业化进程。

　　在安全问题上，蚂蚁集团大安全AI算法资深专家郑霖提到，这种安全并不是完全从模型层面或者技术层面将风险完全封锁，而是通过一套机制来保证生成过程中尽可能不出问题，即便要出问题也能够尽快响应尽可能地消除影响，“大模型给我们各行各业的发展带来新的机会和潜力，本质上是在保证安全的前提下，更注重发展”。

　　to B or not to B

　　跨过安全关之后，面向公众开放更重要的点在于，大模型的商业化探讨终于有了实质性的意义。

　　商汤集团直观地描绘出了大模型的商业化潜力。在给北京商报记者的回复中，商汤集团提到，2023年上半年，商汤集团在“日日新”大模型基础上发布了生成式AI产品系列，包括“商量SenseChat”“秒画SenseMirage”及“如影SenseAvatar”等，带动生成式AI相关收入取得三位数的强劲增长。

　　财报数据显示，2023年上半年，生成式AI相关的业务收入对商汤集团业务的贡献率已经由2022年的10.4%增至20.3%，同比增长率为670.4%。

　　北京商报记者发现，目前上线的大模型，大多提供的是一种文生文领域类似于“办公助手”或是“问答助手”的角色。

　　在不久前举行的外滩大会上，小冰CEO李笛也曾呼吁，当前行业最大的问题就是“太雷同”。有数据显示，全国有至少130家公司研究大模型产品，其中做通用大模型的有78家。

　　对于“同质化”的情况，朱雷认为，是因为在to C层面，大家普遍都还没有想清楚到底该做什么，所以只能先沿用ChatGPT的模式。

　　但他同时强调，这只是大模型发展初期的一个阶段化表现，在to C层面还无法达到万物生长的时候，先按照这个模式做，在收集到更多数据之后，下一阶段可能就会尝试新的东西。

　　这种探讨也延伸出了另一个问题，to B和to C，谁会是大模型商业化的第一站？不久前，妙鸭相机的爆火成为国内AIGC领域第一个真正意义上破圈的现象级产品，但复盘妙鸭相机的走红，却不难发现这一成功的不可复制性。

　　“to C端的开发可以短期积攒人气，增加曝光，但大模型想实现长线盈利，最先取得突破的一定是B端。”在北京市社会科学院副研究员王鹏看来，当下大模型厂商可以在自己较为擅长的领域做垂直化的市场化开发，但如果只应用在固定领域难免资源浪费，而应用至其他行业又会因为缺乏相关资源而处于相对弱势的情况，合作就会成为必然。

　　而大模型从开发到合作，本身就是一个to B的逻辑。合作方将应用融入到行业企业，又是一个以to B为核心的逻辑。

　　“总而言之，大模型商业化的根本，还是要看应用与市场的融合，要看清需求到底是什么，是否真的能够利用大模型实现企业的提质降本增效。”王鹏总结称。

　　朱雷也判断，B端对人工智能应用的场景非常明确，行业受AI厂商的“教育”持续了很多年。而且企业对于模型能力边界也有了更多的了解，再加上在科技领域的预算通常较多，因此预计B端的落地要比C端快得多，“今年四季度可能会有很多落地场景出现”。

　　但这也不意味着C端不会弯道超车。不久前，基于文心一言，百度输入法宣布全面升级，打造行业首个“基于大模型的输入法原生应用”。李彦宏也曾提到，计划逐步将文心一言融入所有业务。

　　而大模型的应用也可能为流量打开更大的入口。财报显示，百度App在2023年6月的月活跃用户达6.77亿，同比增长8%。李彦宏曾提到：“利用文心一言逐步优化百度搜索的功能，相信能够为用户提供更为新颖和直观的使用体验，推动我们的移动互联网生态获得更多流量，推动用户使用时长的增加。”

　　赔本赚吆喝？

　　不久前，印度媒体提到，OpenAI仅运行其人工智能服务ChatGPT每天就要花费约70万美元，若不加速自身商业化进程，很有可能在2024年底不得不申请破产。

　　AI和AIGC已成确定趋势的当下，OpenAI破产论显得有些荒谬。但这也折射出一个关键的问题，对于号称吞金兽的大模型，如何跑通商业模式，覆盖高昂的训练和推理成本，是一个不得不考虑的现实问题，也是困住人工智能老生常谈的问题。

　　始于计算机视觉领域，近身肉搏于安防场景，上一轮人工智能的火爆，催生了“AI四小龙”的出现。但同质化的应用场景以及技术本身高投入的烧钱特性，让AI企业始终困于亏损泥潭，人工智能企业一度陷入了越做越亏的怪圈。

　　相比起来，大模型的压力可能还要更大。马千里提到，上一阶段的人工智能浪潮，研发出的一套模型能耗其实很低，但现在的大模型需要做推理，“有100万用户可能就会有100万用户的推理成本，导致其成本更高，投入也更大”。

　　乘风大模型浪潮，商汤集团找到了翻盘的希望。2023年上半年，商汤集团亏损净额同比收窄2%，但仍达到了31.43亿元。对于大模型“烧钱”导致的亏损问题，北京商报记者也联系了商汤集团，但截至发稿未收到回复。

　　“目前国内提供大模型服务的厂商基本都是在赔本赚吆喝，或者在布局一些东西，尚未真正探索出一条可以实现盈利的商业化模式。”在郑霖看来，大模型的训练和推理成本更高，因此其应用要考虑的就是如何找到更加匹配的模式才能将成本收回。

　　事实上，包括一些大模型助手、智能客服语音等应用在内，其本质并没有改变原有的模式，这种效果早已可以以常规模型实现，现在只不过换成了大模型，因此也带来了额外的争议，即客户为什么会为这样一种多出来的成本而买单？

　　从底层向上，朱雷为北京商报记者梳理出了大模型商业化的几种可能。对于大模型本身，首先可以考虑做私有化部署，相当于卖模型的收费模式。此外，可以将模型布局到云上，进而销售API接口，“国内所有大模型厂商都会有这个模式，预计每家价格都差不多，可能会比GPT3.5贵一些，但比GPT4便宜很多”。

　　顺着这个逻辑再往上，中间层的销售思路就会转向解决方案，类似于销售一个平台，客户可以在平台上进行训练等。在这种方式下，企业可以按照平台的模式收费。而中间层可能还会进一步衍生，促进推理加速的框架、评估评测、数据集相关等大模型产业链上工具层企业的商业化转化。

　　相比起来，最上层的商业化体现也最直接，即推出商业化产品，向用户收费，典型应用如妙鸭相机。

　　王鹏提到，未来大模型形成商业模式，一方面可以走大公司路线，与成型的大企业合作，拿到稳定的订单维持足够的现金流。但不能忽略的是，大企业本身也有开发大模型的能力，可能会出现一种“悖论”的存在。

　　另一方面可以面向大量中小商户走“薄利多销”的路线，毕竟市场存在明显的二八原则，瞄准中小商户，促进其数字化转型，也是一条可尝试的路径。

　　但有数据显示，我国中小企业的发展周期基本在三年左右，创办三年之后依然可以维持正常经营的企业只占总数的1/3。“企业是否愿意去购买这样一个大模型服务，是与整个市场环境或者说与企业的特点有重要关联的。”郑霖表示。

　　北京商报记者杨月涵