图片来源:由无界 AI 生成
文丨墨行
编辑丨叶锦言
出品丨深网·腾讯新闻小满工作室
AI 大模型有先发优势还是后发优势?这是一家早期投资机构合伙人一直在思考的问题。
“大家都在追赶国外先进大模型,对于 AI 六小龙主要是看谁的造血能力强,可以等到技术平权以后再去抄,但是如果这样的话,他们的先发优势也就没有了。”该合伙人表示。
如果说 AI 大模型无法持续跟上最新模型进度,或者落后于开源模型,那么这些 AI 大模型该如何生存下去,转型还是被并购,是不是后发优势的创业公司反而更能够摸着石头过河?
谷歌研究员就曾在博客中提出,当免费的、不受限制的开源模型与闭源模型质量相当时,人们不会为受限制的模型付费,而开源模型和闭源模型的差距正在快速缩小。
曾经以为在生成式 AI 领域存在的飞轮效应的认知开始有所动摇。此前红杉美国 David Cahn 就在其发表的文章中指出,希望能够通过更多用户使用获取更多数据的大模型公司发现这并未证明有效。
对于 AI 大模型独角兽创始人而言,如何生存,这个话题将从 2024 年持续到 2025 年,这是大模型独角兽的创始人始终需要面对的一个问题。进入 2025 年,大模型独角兽的淘汰赛开启了。
1 月 6 日,一则有关“01 万物散伙了 卡和预训练团队卖给阿里了”的传闻开始出现在社交媒体。随即,零一万物创始人兼 CEO 李开复,对此进行了辟谣:
而据《智能涌现》:零一万物与部分地方政府和国资的融资进展并不顺利,“账上的钱撑不到一年”。
成本开支何时转为资产项
之前红杉美国合伙人 David Cahn 曾在《AI 的 6000 亿美元问题》文章中算过一笔账,AI 公司在训练大模型投入和产生收入之间仍然有 6000 亿的缺口。AI 何时才能将成本项转化为资产项是投资人一直疑虑的问题。
若想追赶下一代 GPT 模型且预训练 Scaling Law 持续奏效的情况下,有分析师此前预测单个十万卡集群需要 40 亿美元资本开支,这还是没有将电源等其他投入考虑进去。
百度 2023 年净利润为 203.15 亿元,想要参与下一个模型的竞争很难,更何况是还没有核心现金牛业务的其他 AI 大模型创业公司,很难投入到这场资源密集的竞争。
此前不久市场上一直有传 AI 六小龙已经在今年上半年开始不做预训练了,继而转为后训练。不过据作者多方求证,实际上 AI 六小龙仍然在做预训练,不过侧重上或许不同。
据一位早期投资人私下表示,实际上 Kimi 更侧重 Post-training(Post-training是指在预训练模型的基础上,通过进一步的训练来优化模型性能的过程),因为后者效果更好,只要工程化后产品好用就可以。王小川此前也曾私下表示认可 Post-training的做法。
海外媒体 information 就曾发表文章称 GPT 提升减速,AI 产业界正将重心转向在初始训练后再对模型进行提升。
GPT 01 的出现给大家打开了另一种 Scaling Law 的可能。通过在后训练环节进行 RL 来实现模型在推理、数学方面能力提升。GPT 01 在 post training 算力方面的需求可能仅为预训练的 1%-10%,推理算力是 GPT 40 的十倍。
对于 AI 大模型创业公司来说侧重后训练也是出于算力限制和成本方面的考虑。
据接近中芯国际相关人士透露,2024 年国内在芯片上的需求量反而下降了。“2024 年只有少量像腾讯、字节这样的大厂在正常采购,以前很多中型客户今年都没有采购,AI 六小龙其实采购量不大,租用比较多。”
Morgan Stanley 数据显示:自 2023 年 7 月开始,在 AWS 云上 H100 的租金成本从年初的 8.5 美元下降到了 5 美元以下。根据 GPU 计算市场 GPUlist.ai 上的数据,H100 的每小时租赁价格中位数仅为 2.27 美元。国内 GPU 芯片租赁情况与之类似。
相比于高投入的资本开支和吃紧的现金流,租赁对于 AI 创业公司来说便宜、快捷,可以投入更多资金在研发上。
同时由于国内阿里云、火山引擎、谷歌云、亚马逊云等多方的竞争,也让这波创业者享受了一波不错的折扣。
实际上,AI 六小龙将融资的部分钱近一半用在了投放和招聘上。
一位 AI 领域的猎头表示,2024 年 AI 六小龙的创始人们在规划如何花钱上有很大不同。Minimax 更倾向于出海,在谷歌、Facebook 投流,月之暗面则从出海业务聚焦到 Kimi 场景,招聘了非常多的产品经理。
自 2024 年 3 月 Kimi 在 B 站、小红书等各社交平台投放后,带来了一波新的增长流量,也直接将投放价格从 3 元拉到了近 30 元,3 月访问量为 126.1 万,环比增长近 3 倍,MAU 一度达到 589.7 万,环比增长近一倍此后再投放时成本也随之水涨船高了,新增用户注册量和留存率也不及预期。“能薅的也差不多了,投流效果没那么好了。”
非凡产研创始人吴畏分析,目前很多 AI 产品 ROI 打正不了,“你不可能花钱买量做一个大 DAU 的产品去卖广告,这是广告逻辑,而 AI 产品更多是付费逻辑。”
在其看来,2024 年上半年 Kimi 的投流动作更多是为了讲故事,比如打上流量最大的 chatbot 的标签。当还没有办法实现盈利时,至少在产品数据上需要让投资人看到公司的未来潜能,这是有一部分 AI 公司投流的逻辑。
不过投资人很快也清醒过来,不仅仅看 MAU,更看重 30 日留存,90 日留存,而根据 2024 年 AI 产品榜 8 月份数据,国内 AI APP 近 3 月均值日均使用时长前十名均不超过 10 天。
比如 Minimax 的虚拟陪聊产品 Talkie。据海外媒体报道,目前 Talkie 的投流 ROI 已打正。根据 AI 产品榜的数据,Talkie 的 MAU 分别为 251 万,在国内 AI 出海 APP 中留存是最高的,近 3 月均值日均使用时长 73 分钟,其主要收入模式为广告、订阅和内购。
据此前海外媒体报道,目前 Minimax2024 年净销售额预计达到约 7000 万美元,大部分来自 Talkie,Minimax 的海螺 AI 也在近期推出了付费版本。
出海做 TO C,跑通付费模式已成为 AI 大模型的一些常规操作。
从招聘需求来看,坚定走 TOB 业务的智谱则主要在拓展商务资源,据悉目前智谱规模在上千人。
不过快速扩张,高举高打也带来了人员的不稳定。据此前智谱的一商务从业者表示,智谱给商务人员制定的标准是 6 个月 100 万的销售额,这也是后期智谱很多商务人员流动性高的原因。
为了生存,去年还在拼技术的 AI 六小龙在快速寻找落地场景和产品。
寻找可变现的产品
此前微软小冰的负责人曾在某公开场合表示,小冰投入很多的技术在 AI 领域,但是最后落地在消费场景里利润率却非常低。技术上的巨额投入在真正落地时却很难变现,这是第一代 AI 公司就已面临的问题。
经历过上一波市场磨练的 AI 视觉四小龙,在技术投入上会更克制,更关注落地场景,不过资金上的压力让他们不得不快速转变。“2023 年 AI 大模型公司是以应用训模型,而 2024 年完全变了,是以模型训应用。”上述早期投资人表示。
当然找到可变现的场景和产品并非易事。
来自非凡产研数据,目前 OpenAI ARR 为 45.52 亿美元,收入主要来源于会员订阅和 API。
然而会员订阅和 API 目前对国内大模型来说行不太通。前者是由于国内付费习惯导致的,后者则主要还是仅对全球领先的技术引领者有用。
在五源资本合伙人孟醒看来,卖 API 不是一个长久的商业模式,除非它是行业第一名,并一直保持绝对领先,第三名之后都不会有机会。
实际上创业公司已经出现了一波薅羊毛党。一些大模型公司为了吸引公司调用 API,会额外赠送一部分 Token,之前 Token 相对比较贵时,部分创业者甚至会注册不同公司去薅羊毛。
知情人士认为,现在很多创业公司会更愿意去薅云厂商的羊毛。“一些云厂商可能会送你云相关的 5 万、10 万美金等不同金额的代金券,你既可以消耗云的资源,也可以消耗 token 资源,满足初创公司更多元需求。”
此外,和 Saas 服务不同,对于大模型的客户来说,模型切换几乎没有任何成本,这也进一步加剧了价格战。
那么剩下的路只有做海外 TOC,走订阅模式或者帮助行业客户做 TOB 解决方案。
目前在 AI 六小龙中,唯有智谱是坚定的走 TOB 路线。从 2024 年年初开始,智谱就开始广招 GR 和 BD。“智谱在服务 TOB 客户这块非常卷。”一位知情人士表示,即使钱不多,但是如果你在大模型这块有什么需求,他们会直接派非常贵的工程师去帮助客户做落地。
目前大模型主要服务的 TOB 客户集中在金融、政务、运营商、高校等行业。智谱对外宣传合作的客户包括华泰证券、蒙牛、上汽等。
来自非凡数据,截止到 2024 年 9 月 30 日,智谱公开场合获得 11 个招投标中标,仅次于科大讯飞、中国电信、中国移动,排名第四,而 2023 年智谱的中标项目为 5 个,2024 年以来公开数据显示的智谱在招投标中标金额为 2498 万元。在前十名中,仅有智谱为创业公司,其他均为成立多年的大型公司或者上市公司。
“大模型在 TOB 领域的营销就是价格战,比较重交付。”一位接近智谱商务的同事表示。
落地并没有那么容易,对于所有做 TOB 业务的公司来说都需要在不那么性感的业务流程中摸爬滚打一番,才能趟过那条叫做“交付”的河。之前和智谱合作过的客户就曾表示,其承诺的和最终落地效果仍有差距。
在 TO C 领域,AI 六小龙也在不断尝试各种新产品。孟醒认为这有点类似于此前自动驾驶创业公司的发展阶段,前期因为创始人是技术大牛而不断获得融资,而到了要落地变现阶段,更需要的是可以变现的产品。
AI 到底是一场生产力革命还是一场交互革命?这也是吴畏一直在思考的问题。“如果是前者,意味着就没有新的平台,也没有新的流量红利,其实更多是既有互联网公司、手机硬件厂商的机会。”
国外数据显示,目前真正用 AI 产品的还在少数,更多集中在现有场景。
如果是一场交互革命,那么 AI 大模型创业公司更多机会在于 AI native。
有关注 AI 领域的投资人认为,虽然模型很关键,但是互动、用户情绪也很重要。“现在很多教授出来做的就是大模型装了一个壳,其实并不是产品,产品是要结合需求场景可以傻瓜式的使用。”
目前看到的 AI native 的机会已经被验证的是 chatbot 、编程、数字人陪伴。而国内生态和国外不同,国内大厂更喜欢做 All in one ,从底层模型到前端应用,平台类生意或者是 DAU 上亿的应用,均在大厂的射程范围内。
最显而易见的大机会往往面临更加惨烈的竞争。例如在 Chatbot 领域,赶晚集的豆包目前 MAU 为 599 万,智谱的智谱清影并不是其重点发力方向,海螺 AI 的聊天工具战略等级在内部也有所下降,目前只剩 Kimi 还在坚持该路线。
人才抢夺战
对于六小龙来说更多机会或许藏在细分和生态中。
对于 AI 六小龙来说一边在寻找更垂直、细分的方向,比如百川已经将更多重心放在了医疗垂直大模型,另一边他们都不约而同地采取了孵化 + 投资 + 自研的模式,以搭建广泛的生态。
据一早期投资人透露,Minimax 在收购一些小型公司,主要以收购产品为主,因为他们担忧 Talkie 之后能否持续产出爆款。另一方面,他们也会孵化一些创业公司,更多以 Token 用量为核心。据悉此前 Minimax 投资 AIPPT 也是更多看到其背后的巨大用量。
智谱也在 2024 年募集了 2 支基金,其中智谱 AI、星连肇基、京成燕北三方共同出资 2.6 亿元,成立一支新投资基金星连鼎森,同时与其关系紧密的新连资本也设立了海南三亚连星尚智壹号股权投资基金。此外智谱 Z 计划联合生态伙伴发起总额 10 亿元的大模型创业基金,主要投资方向包括大模型算法、底层算子、芯片优化、行业大模型和超级应用等。目前为止智谱已投资了 13 家公司,而去年全年投资了 8 家。
此外据悉百川旗下也有一支自己的基金,同时和零一万物有着千丝万缕联系的创新工场也在前不久宣布和极客公园合作做孵化。
2024 年上半年谷歌以 25 亿美元收购 C.AI,随后公司创始人和 30 名核心员工加入谷歌,这种收购方式主要也是看中了这支团队,类似的还有微软收购 Inflection,亚马逊收购 Adept。
有法律人士分析称,这种收购方式既能获得优秀团队,同时也不承担公司过去负债和一些法律方面风险。
在 TOB 和 TOC 模式中,AI 六小龙各家都有所侧重,除了零一万物。在 TOC 方面零一走的并不顺利。据悉 POP.AI 的 ARR 预计收入为一两千万元,前不久 POP.AI 的产品负责人已离职。ToB 方面零一又面临文心一言和智谱的正面竞争,站位上相对尴尬。
实际上,AI 大模型的竞争,对外表现是生态竞争,其核心是人才竞争。
目前国内 AI 大模型仍然落后国外至少半年,处于 GPT 3.5 的水平。“因为国外的人才密度和持续的创新力,使他能够始终领先你半年,这才是真正的壁垒。”吴畏表示。
在 AI 大模型领域一个普遍的认识是,人才密度大于数据质量大于模型架构。
稀缺的人才是最重要的。昆仑万维创始人周亚辉在社交媒体上表示,字节 2024 年 AI 战略满分,组织快速迭代能力很强。一位视频生成行业从业者对于字节能在不到一年的时间里就推出效果很好的视频生成模型感到惊讶。
大力出奇迹,这背后离不开字节的人才策略。
一位字节内部人士透露,真正非常牛的人要么自己创业要么被字节挖走。
据晚点报道,零一万物联合创始人李先刚也被曝离职,回归贝壳。Noisee 前产品负责人明超平创立 AI Coding 公司,百川智能联合创始人洪涛也已离职,Minimax 联创宋亚宸出来创立了 AI+3D 公司 Vast。
不过更多人流向了字节。字节今年频繁接触了阿里 P9、P10 级别的人,目前已知的是阿里通义千问大模型负责人(P9)周畅加入,此前曾推出一系列多模态模型。更早之前零一万物加入模型预训练负责人黄文灏、面壁智能核心成员秦禹嘉加入字节 Flow 团队。
字节除了不用考虑生存问题,在流量、数据上也有明显优势。据业内人士透露,抖音平台投流主要优先自家产品,其他家产品投流则主要是非主流产品,在数据上,字节有多个超十亿的 MAU 社交平台,在资金上,抖音去年广告收入高达 4000 亿元,人才上,字节也在不遗余力大力挖人,字节缺的只是时间。
而对于 AI 六小龙来说,缺的不只是时间,还有资金、算力、流量。
不过正如上述早期投资机构合伙人所说,这六家公司里谁会明显出问题,谁的气长,可以等半年之后再看。
2025 年,让子弹先飞一会儿。
中国 AIGC 产业应用峰会回顾
2024 年 1 月 5 日,【智求共赢・中国 AIGC 产业应用峰会暨无界 AI 生态合作伙伴大会】在杭州未来科技城会议中心举行。
大会汇集行业资深专家及领军企业,共同聚焦 AIGC 领域,围绕当下热点话题进行深度延展,探讨行业激烈竞争下的运营新思路、发展新模式!点击文章,回顾精彩内容~
AI 新智界园区开放合作啦!
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。