大模型的房间里有只大象,它有两副面孔。

  它首先以高昂成本的样貌出现:最新的斯坦福报告给了很直观的数据,2017 年时 Transformer 训练成本 900 美元,2019 年 RoBERTa Large 16 万美元,而 2023 年 GPT-4 和 Gemini Ultra 的训练成本估算分别为 7800 万美元和 1.91 亿美元。用碳排放来换算,GPT-3 训练期间排了 502 吨碳,约等于 32 个普通美国人一年的碳排放量。

  这只大象还有一个样貌,就是底层技术的夸张进步速度。这是人类许久未见的技术革命。一个小参数模型今天能达到一年前百亿参数模型的能力,Sora 可以让视频一致性达到可用的程度,GPT4 上了机器人的身,机器人过去多年解决不了的问题,解决了。想象力每天都被诱惑着。

  于是,更准确地描述这只大象,就是实在太不合理的成本逻辑下依然无法错过的技术机遇。于是它困扰着每个人,但又隐身在源源不断的 fomo 情绪之中,让诸多狂奔者来不及讨论或直接避而不谈。

  这只大象也站在过钉钉的房间里。钉钉是国内对大模型反应最早的公司之一。而且它永远先从改造自己开始。2023 年 4 月钉钉就喊出要把自己所有产品都用大模型重塑一遍,然后用了 100 天就改造了自己 17 条产品线。折腾自己还不够,8 月钉钉把 AI PaaS 开放,推出基于 AI PaaS 的“数字员工”和一大堆具体场景和行业的方案。然后在 11 月,经过 50 多万家企业邀测后,在自己这个国民级产品里全面开放了 AI 能力。

  但你对 AI 拥抱的越快,大象也出现的更快。钉钉要全面拥抱 AI,但要如何拥抱呢?当时一时间似乎人人都在做模型,钉钉也要搞一个么?只是加一些 AI 功能到 app 上就足够了么?给生态提供的 AI 到底是什么呢?这些具体的策略和战略执行的方式比 all in 的大方向更难,而且它们最终都引向了这个两幅面孔的大象——巨大成本,和巨大机会,钉钉究竟怎么搞。

  决定面对这只大象,就一定带来内部争论。钉钉也如此,在这期间我们有机会和钉钉总裁不穷在几个关键节点都做过交流,而你也能发现这个团队的焦虑。产品的样子,AI 加入的方式,以及生态建设的方法,都是争论的对象。比如在 Copilot 和 Agent 的不同思路上,不穷分享过内部激烈的斗争。“我们最初也没有可以参考的剧本,一年多前尝试用 ChatGPT 的方式接入,包括类 Copilot 的做法,当时我们的想法都差不多,就是在产品上加 AI 能力。但到了6,7 月,内部开始讨论 Copilot 是不是真的适合,经过了激烈争论后,我们的路线定在 AI Agent。”他在一次分享中说。

  这些不同的争论最终可以快速达成共识,其实背后有一个最根本的判断:这是一次根本性的技术创新,钉钉没有不跟的理由,不得不上。这种“危机感”催促着团队在选好路线后的执行动作也十分之快。因为谁也等不起。2024 年 1 月,钉钉 7.5 快速推出 AI 助理,认定 AI Agent 是最佳 AI 应用入口,而钉钉要成为高频和开放的 AI 智能助理平台。

  所以这就是钉钉面对这只大象的答案:仔细去拆解,训练阶段其实才是大模型研发成本的大头(那些所谓的万亿参数万卡集群都是指向训练),而推理阶段成本较低(你所有对 AI 的直接使用都是在让大模型进行推理),但推理到底用在了什么地方,却是真正能否让这个高昂的成本“值回票价”的关键。于是不碰模型本身的钉钉,要做的就是集中力量在推理侧,AI Agent 要做的就是把有限且高昂的算力用在推理的刀刃上。

  换句更直白的话,不把天价算力用到行业需求的 AI,都是耍流氓。

  怎么用到行业需求上?把半条命豁出去,不仅改造自己,也把半条命交给生态。这就是钉钉的 AI Agent 路线。钉钉的 AI Agent 要给每个行业里真正理解需求的人使用。

  于是,你看到公安行业用它开发出了服务助手,能解答人们很复杂具体的办事问题,并输出定制方案。设计行业把企划,线稿和营销一口气通过一个智能助手来打通。钉钉最新的数据还是很惊人的,据他们透露,钉钉 AI 已经搞出来了 230 万家企业用户,3 月使用钉钉 AI 的月活企业数超过 170 万家。在这个阶段,这放在全球也是很可观的渗透率。

  还有一个很有意思的现象也是只关注一夜变天的 AI 新闻爱好者们不会在意的,就是钉钉是一个跟 OpenAI 等公司前期思路出奇同频的公司。微软基于 OpenAI 的技术推出 Copilot 的同期,钉钉也在改造自己的产品并且上线 Copilot 功能,之后内部讨论后认为 Agent 路线更符合趋势,有了最早的 Agent 平台。

  但很快钉钉又和 OpenAI 走出了不一样的路,GPT Store 脱胎于 ChatGPT——一个展示模型能力的对话框,而钉钉的 Agent 平台从一开始就是建立在钉钉这个聚满各种行业需求和细分场景的“市场”里。一个极度仰赖用户自己发掘需求的能力,等着他们来这找答案;另一个则是需求本就都堆在这里,而且场景简直不要太多。

  更有意思的是,OpenAI 最近的许多信息显示,它也开始像钉钉这样,更加重视从客户企业本身的场景去提供自己的能力。一个是全球大模型的旗帜,一个是中国的一个应用公司,为啥这俩公司能想一块去?一个是因为技术领先,另一个是因为真的够“土”,但最终要改变世界两者缺一不可。于是,殊途同归了。

  而沿着这个思路往下,AI Agent 要变成能动员行业里更多人参与的事,才有意义。钉钉的做法是,建造一个真正的 Agent 市场——4 月 18 日,钉钉正式发布了这个 AI Agent 市场,继续豁出半条命:把应用,数据和工程化,比如工作流、智能 RPA 与 AI 的结合等,都交了出来,提高复杂任务执行和准确性。而这个 AI Agent 市场发布距钉钉喊出要全面改造自己,整整过去一年。

  现在看来这一年里这家公司一直在避免一件事,就是被大模型的噱头给吸引到一种空中楼阁中去。所有动作在经历争论之后,最终都是从自己手头出发,比如对自己大刀阔斧地改造,其实很大程度解决了一些长期的产品问题,比如钉钉的文档和会议等,因为 AI 功能的加入和 LUI 等对界面的简洁化改造,而提升了口碑,文档产品月活超过了千万;而对于生态,则更是一如既往像钉钉最初发家时一样,从服务这些最接地气的客户的最真实的需求出发,务实的寻找最能带来现实回报的路线。

  并不意外的是,今天的 OpenAI 也在这样做。GPT Store 因为缺少实际价值场景而遇挫的同时,OpenAI 开始全面的向企业级转向。最近它动作频繁,包括其 COO 前往好莱坞推销 Sora 的新闻密集传出。而据一些熟悉欧美影视行业的人士最近跟我们透露,OpenAI 和好莱坞接触的方式很明确,它自己没有外界天天喊着“颠覆一切”的姿态,反而希望它可以进入这个行业一些非常细致的 pipeline 环节就行,而不是重塑整个 pipeline。

  这背后最大的不同,是“技术上帝视角”和深入行业需求的不同。钉钉这百万级的企业用户,全是凭着自己的朴素需求来把大模型用起来的。这些行业不会轻易相信一个全知全能模型能解决所有问题,但会立刻发现新技术能大幅改善的经营环节。

  最后还想提一下这次发布里两个很有意思的细节:一个是,在这次 Agent 市场的设计中,其实钉钉并没有走全量推荐的路线,而是延续 SaaS 生态时“上架-审核”的方式,控制质量和控制数量。另一个是不穷最近又忍不住对未来做了一个判断:他说了一句让每个中国 to B 从业者听了都可能心头一颤的话,“SaaS 挣不到的钱,Agent 赚回来。”这两个事放在一起,充分体现了钉钉的风格:在技术机遇期用 all in 的方式抓机会,在一年摸索改造后,沿着确定的路线开始稳定下来并继续对未来保持警惕和野心——又土又先进。而在搞 AI 这事上,这种风格还是挺有用的,不是么。