人均专属 AI 助理时代来了?

  大部分人对大模型的印象还停留在聊聊天,把玩一阵也就丢在一旁,因为确实不知道能用大模型做什么,当 OpenAI 推出了 GPT Store 之后,业内公认,GPT Store 是大模型生态构建的核心,AI Agent(智能体)也被认为是距离用户最近且主流的大模型使用方式。

  那么问题来了,有多少人用上了 AI Agent?有多少人想用却找不到合适的 AI Agent?有多少人希望能自己构建一个专属版 AI Agent?

  钛媒体 App 观察到,国内外大厂都推出了自己的 AI Agent 构建平台,也不乏已经开源的平台,基本功能都大同小异,这条赛道还没实实在在地挣钱,就开始卷起来了。

  就算是 GPT Store,在经历了最初的火热之后,也难免陷入到窘境——大量 AI Agent 重复且质量低,还存在内容侵权和数据安全风险,开发者用得不顺手也挣不到钱,AI 应用商店的模式还没有跑通。

  AI Agent 方向是确定的,路途是曲折的,总得有人先去趟路,风险和机会是一张底牌的两面。4 月 18 日,钉钉 AI 助理市场(AI Agent Store)正式上线,钛媒体也第一时间上手测试。

  AI 助理,得离用户场景够近

  进入钉钉 AI 助理商店界面,直观能看到各种琳琅满目的 AI 助理,大致可分为三类:钉钉官方出品的 Al 助理,生态伙伴和开发者构建的 Al 助理,个体用户创造的 Al 助理。

  个体用户创建的 AI 助理也可通过 “上架申请、审核”的模式,符合标准的精品 AI 助理可上架市场,并分享给所有用户选用。如此能确保出品的稳定性,不至于像 GPT Store 一样虚假繁荣,商店里躺着一堆无效 Agent,商店、用户和开发者三方都无从受益。

  对于刚刚起步的 AI Agent Store,首先得做到“有”,然后就是不断地优化。常规的 AI 助理都能在商店中找到,钉钉将大量 AI 助理分门别类,供君挑选。

  与其他大模型厂商不同的是,单纯的大模型厂商普遍缺乏贴近用户的使用场景,AI 助理也就离用户不够近。钉钉的优势在于,大量用户每天使用钉钉工作,也就诞生了和行业场景紧密相关的 AI 助理。

  钉钉将其分为四大类,角色 AI 助理——每个人的生活娱乐、办公小助手,可与大模型对话,实时搜索、问答特定领域的信息。

  专业 AI 助理——在大语言模型基础上,完成专业知识或行业知识训练的 AI 助理,例如建筑 AI 领域的 AI 助手“小筑”,学习了建筑行业的专业知识,用户让它找文件、看资讯、查找专业政策,并支持用户上传设计线稿图,快速生成建筑效果图。

  多任务处理 AI 助理——如杭州市公安局搭建的公安政务服务助手,不仅能够解答政务服务,如从居住证申领到出入境业务办理的一站式服务,还打通了多项应用,可以根据对话的需求,添加个人日程或者填写意见收集表等操作;

  跨应用 AI 助理——由用友薪酬、墨见、携程商旅等 SaaS 服务商提供的超过 30 个 AI 助理,不仅具备问答、专业知识等能力,还打通了原有 SaaS 应用。

  2024 年 1 月 9 日,钉钉更新至 7.5 版本,并且全量上线 AI Agent 产品“AI 助理”,到 4 月 18 日,首批超过 200 个 AI 助理亮相,绝对数量不算多,但体验效果还不错,可能也是严进严出的策略,以及离用户够近的场景优势。

  钛媒体 App 先挑选了一个工作类常用 AI 助理——PPT 制作师,并让 AI 助理帮我制作了一份“关于 AI 助理”的 PPT(真不是套娃),限定在 6 页内,以免大模型太过发散。

  于是,PPT 大纲很快就制作出来,基本逻辑都没什么问题,照着做就能做个大概,而且具体的内容方向也给出了建议,比起原来从零开始做 PPT 能轻松不少。

  但这距离我们的成品还有一段距离,以第一张 PPT 为例,我们按照 AI 助理输出的内容作为 prompt 提示词,直接让 AI 助理输出图片。

  AI 助理给出了图片,说明其具备多模态能力。当然,此时 AI 助理又给出了新的建议,在图片底部加上名字和日期,并选择与主题色调相协调的深灰色或金属质感的颜色,字体大小适中且清晰可辨,排列整齐,置于幻灯片底部边缘附近。

  当我把这些继续作为 prompt 提示词,试图让 AI 助理直接给出成品时——AI 助理拒绝了我,看来有些操作还需要自己上手。

请输入图说

  为了进一步测试 AI 助理处理上下文的记忆能力,钛媒体给出了新的测试题目,“在第三页 PPT 加入不同厂商在 AI Agent 领域的对比”,看看 AI 助理是否能记住前边的对话,并且能够借助外部信息来完善 PPT,结果还是比较可靠。

请输入图说

  随后钛媒体又测试了多个不同类型的助理,例如小红书账号定位大师,我给出的问题是——“编辑一条小红书,主题内容是钉钉上线 AI 助理这件事,要求结合行业趋势和钉钉的优势,普通人也能听懂,字数不超过五百字,给出适合小红书风格的标题”。

  说真的,想的还蛮周到,基本只需要再按照个人的风格和喜好,稍加修改就可以发布,省了不少事。

  再如短视频脚本助手,我给出的问题是——“我要拍摄一个代码大赛的短视频,画面要体现大赛的紧张和刺激,从赛前、赛中和赛后都要有镜头,三部分时长分别为 30 秒、90 秒、30 秒,可以给我具体的短视频脚本么?”

  受限于篇幅我们截取了一部分,AI 助手从拍摄要求、背景、服装和分镜脚本给出了较为详细的回答,依然是稍加修改可以拿来用的程度。

  随后我们又测试了一款法律助理“通义法睿”,问题是“小明离职三年,发现前公司没有按照实发工资缴纳公积金,他应该怎么办?”

  虽然问题有些粗糙,但 AI 助理给的答案也较为完整,提供了条例依据,以及先做什么、再做什么的具体操作。

  结合多款 AI 助理的测试结果可以得出结论,大部分 AI 助理能够理解给出的指令,并且提供较为详细的建议,在“胡说八道”和“幻觉”这两个问题方面有了改进。

  值得一提的是,prompt 提示词写的越具体,AI 助理给出的答案也就更精准,比如“我想做个代码大赛的短视频文案”,AI 助手也不知道要什么内容,答案也就可能不符合我们的需求。

  钉钉 AI 助理市场还提供了“钉钉官方客服”“钉钉 AI 助理答疑”,在使用过程中可以边问边做,能解答大部分的问题。

  当前 AI 助理的能力集中在总结、创作、数据分析、工具增强等方面,但是,AI 助理目前的执行力还比较有限,一是穿透到个人的信息,给出个性化的信息和建议,这涉及到数据安全问题,还需要谨慎;二是,一些需要一系列操作才能完成的事,AI 助理现在的能力还有些单薄。

  实际上,这也是目前 AI Agent 正在努力的方向,要改变“语言的巨人,行动的矮子”的形象。

  撸个“速记整理师”,“能好怎”?

  钉钉 AI 助理市场琳琅满目,但都是别人做的,自己能做么,好做么,怎么做?

  首先,我们进入到创作 AI 助理界面,其中需要我们设置的内容包括名称、头像、人物设定、语言风格和欢迎语等,按照提示一步步填写即可。我将其设置为“速记整理师”,也是码字人的高频需求。

  然后我们可以选择特定知识库、文档或上传文件,对 AI 助理进行训练,当然大模型本身就有一定的泛化能力,上传内容可以做到更精确地训练。

  接着是为“速记整理师”配置需要的 AI 能力,可直接选择官方能力,或者配置自定义能力,配置官方能力只需要点选,自定义能力则需要一些编程基础。

  AI 助理市场连接了钉钉积累的 SaaS 应用、低代码应用生态,并通过开放能力连接企业自建系统、外部第三方平台,创造 AI 助理的门槛大幅降低。

  据悉,官方能力包括钉钉助手、每日小结、待办、日程、智能创作等;

  第三方能力接入能力目前已预置天气查询、地图查询(高德能力)、病症查询、药品查询、汇率查询、1688 搜索、淘宝搜索、论文检索(arXiv 网站)、OCR 识别(车牌照、驾驶证、行驶证、银行卡、身份证、火车票、发票) 等三方工具。 

  结合我们创作的“速记整理师”来看,基本能力可以一键实现,但要想达到个人专属 AI 助理的高阶能力,需要更多内容“投喂”,也需要规划行动能力,才能实现更好的效果,要靠专业开发者实现。

  据了解,钉钉 AI 助理已支持拟人操作、工作流、自定义能力三种开发方式。

  • “拟人操作”可让 AI 学习并模拟人来操作应用。用户给 AI 演示一遍,不需任何代码,AI 助理就能学习用户的操作流程,并模拟该操作流程。此外,拟人操作支持泛化能力,不需再次学习就能举一反三,处理同类型操作。
  • “工作流”则针对解决复杂性、多环节任务,通过对 AI 执行流程进行编排,实现自动、逐步完成多环节操作,使得 AI 助理能够执行复杂的批量任务。工作流提供多类组件,包括网页访问请求、API 接口调用,建日程、发消息等钉钉功能,以及钉钉所有连接器的选择。
  • 针对专业开发者的高阶需求,“自定义能力”也支持代码开发,完成对企业存量应用的调用,或钉钉外的视频、资讯、电商等各类第三方平台连接。比如,企业创建的差旅 AI 助理,可以根据指令在第三方平台完成差旅订机票、酒店、行程安排等工作。

  制作好的 AI 助理支持权限配置,创建时可以选择助理的可见与可使用范围,最小支持分配到特定人员,可以一键保存、发布到应用商店,也可以转发给特定人使用。

  参照苹果和安卓应用商店,专业开发者开发,个人用户使用,大模型能够让更多的人参与到开发过程,AI Agent 的分层需求,还在动态调整和满足的过程中。

  总结

  AI Agent 还处于产业发展的早期,不要期盼 AI 助理无所不能,要明确助理定位,从单点出发提升效率,再逐步丰富它的工作。保证自己既不落后也不担心过于超前。话说回来,要是 AI 助理啥都能干,那“人”也太没有门槛了。

  AI 助理的功能越是强大,越会落在千千万万个用户场景里,哪怕是同类 AI 助理的某个差别,可能都会带来巨大效果和效率差异。

  感知、记忆、规划和行动能力,决定了一个 AI Agent 能否满足需求,前三者相对较为完善,行动能力将决定 AI 助理的价值。

  如果把大模型比喻成大脑,那么钉钉其实有相对齐全的“五感”和“四肢”,钉钉平台有大量的场景和经验,未来 AI 助理的丰富程度、价值厚度、分成机制等因素,是 AI Agent 商店的关键要素。

  AI 助理不要在低层次的竞争中“卷”,例如钉钉没有卷数量,而是卷质量,固然前期难度更大,但后期可能会有更大的回报。平台厂商有各自的优势,短期内将是群雄并起,快速演进的过程,大家都在试图塑造 AI 助理——应用场景的正循环。

  (本文首发钛媒体 APP 作者|张帅,欢迎添加作者 mr3right 爆料、交流)