雨说-农码一生-一文看懂百度AI开发者大会：三大AI神器、文心4.0工具版生产力拉满

　　过去一年，李彦宏与创业者、开发者交流，感受到了“FOMO”状态的盛行，即“Fearof Missing Out”，既兴奋又担心错过。不过百度一直紧追大模型风潮，大模型和生成式 AI 也正在彻底改变开发者群体。

　　在今天的百度 AI 开发者大会上，李彦宏直言，过去，开发者用代码改变世界；未来，自然语言将成为新的通用编程语言，使每个人都有可能成为开发者，用创造力改变世界。这一天即将到来，因为强大的基础大模型和低门槛的开发工具，开发者的生产力得到了显著提高。

　　谈及百度的角色定位，作为技术公司，百度希望为大家提供所需的开发工具，不断提升整个社会的创造力。具体而言，百度提供了一系列强大的基础模型，如文心大模型系列，以及基于大模型开发各种应用的工具，如智能体开发工具 AgentBuilder、AI 原生应用开发工具 AppBuilder 和各种尺寸的模型定制工具 ModelBuilder。在今天的 AI 开发者大会上，李彦宏为大家一一演示了这三款“AI 神器”，并对文心一言过去一年的成绩进行回顾。

　　谈文心大模型进展：4.0 工具版支持代码解释器

　　文心一言发布一年来，用户数突破 2 亿，API 日均调用量超过 2 亿，服务客户数达 8.5 万，利用千帆平台开发的 AI 原生应用数超过 19 万。文心一言正在改变更多人的工作和生活，支撑文心一言的基座模型是文心大模型，经历了从 3.0 版本到 4.0 版本的进化，在理解、生成、逻辑、记忆四大能力方面达到了业界领先水平。

　　文心大模型 4.0 的工具版今日发布，支持代码解释器功能，通过自然语言交互实现对复杂数据和文件的处理与分析，能够生成图表或文件，洞察数据中的特点、分析变化趋势，为决策提供支持。

　　同时，相比一年前的文心大模型，其目前算法训练效率提升到了原来的 5.1 倍，推理性能上提升了 105 倍，推理的成本降到了原来的1%，也就是说客户过去一天调用 1 万次，今天在同样的成本之下一天可以调用 100 万次，这样对于企业和开发者十分有利，因为其最关注的就是成本和效果。

　　如果做到降本增效？这是因为百度在芯片框架模型和应用这 4 层架构有着全栈的布局，通过端到端的优化，不断的把成本打下来，让更多的人可以高效低价大模型来做 AI 应用。

　　李彦宏也强调，语言模型本身并不直接创造价值，基于大模型开发出来的 AI 应用，才是能够真正满足市场需求的东西。

　　谈 AI 原生应用：三大 AI 神器满足不同应用需求

　　百度高喊了一年的“要做 AI 原生应用”，目前成果如何呢？李彦宏也现场分享了基于大模型开发 AI 原生应用的具体思路和工具。主要包括 MoE 架构、小模型、智能体。百度提供了三大 AI 神器，包括 AgentBuilder、AppBuilder 和 ModelBuilder，以满足不同应用需求。

　　1、Agentbuilder：5 分钟开发一个智能体

　　智能体是未来大型 AI 应用的主流使用方式，基于强大的基础模型，智能体可批量生成，应用于各种场景。百度升级了文心智能体平台，已有 3 万多个智能体被创建，5 万多名开发者入驻。为实现让每个人、每个组织都成为智能体的开发者的目标，百度提供了零门槛的智能体开发工具 AgentBuilder。

　　举例来说，用户可借助百度平台创建名为“新加坡旅游局”的智能体，通过自然语言交互设置其提供旅游文案、解答问题、提供酒店门票等服务。这一创新性智能体开发方式为用户节省了大量时间和精力。

　　2、AppBuilder：自然语言三步就能开发一个应用

　　AppBuilder 是当前最好用的 AI 原生应用开发工具之一，其优势在于提前封装和预置了各种组件和框架，大幅降低了开发门槛。开发者只需三步，即可用自然语言开发出一个 AI 原生应用，并轻松发布、集成到各种业务环境中。

　　在一次 AI 原生应用开发挑战赛中，有选手利用 AppBuilder 开发了一款“游乐场排队规划助手”，帮助游客更好地了解游乐场排队情况，并设计个性化的游玩路线。令人惊讶的是，冠军选手没有写一行代码，却凭借基础模型和 AppBuilder 工具赢得了 10 万元大奖。

　　以“游乐场排队助手”为例，开发过程只需三步：首先在 AppBuilder 的开发界面中给应用命名；其次，在角色指令中描述具体需求，包括调用代码解释器、计算最佳组合等；最后，在工具组件中添加代码解释器，帮助进行运算。

　　AppBuilder 已经升级，引入了“AI 优化配置”功能，能够自动优化角色指令、组件配置等环节，进一步提高开发效率。

　　AppBuilder 还提供了跨模态能力，支持用户快速创建绘画类应用，如漫画、儿童画本等。用户只需输入文本描述，即可生成相应的图画。

　　总的来说，AppBuilder 的两大优势在于功能强大和简单易用。其丰富的组件工具和自然语言开发流程使得 AI 应用开发变得更加高效和便捷。

　　3、ModelBuilder：高效低价生产模型

　　ModelBuilder 是一款适合专业开发者使用的工具，它能够根据开发者的需求定制任意尺寸的模型，并通过对模型进行精细调整，使其在特定场景下达到更好的效果。这种定制化的模型开发对于提高模型的适用性和性能至关重要。

　　以教育行业的作文批改为例，模型定制工具 ModelBuilder 通过三个步骤实现了模型精调：首先是创建数据集，包括数据清洗、数据标注和数据增强；其次是选择基础模型并配置参数进行精调；最后是将模型部署在平台上。通过这些步骤，ModelBuilder 能够生成适用于特定场景的高质量模型。

　　通过使用 MoE（混合专家模型）模型路由，可以将不同大小和性能的模型组合起来，以达到最佳的性价比。以小度为例，它根据用户的不同问题调用不同大小的模型，从而在保证效果的同时降低了成本和响应时间。通过这种方式，可以实现模型的灵活调度和资源的最优利用。

　　ModelBuilder 预置了最全面最丰富的大模型，包括旗舰版的大模型（如 ERNIE3.5 和 ERNIE4.0）以及轻量级的大模型（如 ERNIESpeed、Lite、Tiny）。此外，还支持国内外第三方主流模型，总数达到 77 个，为开发者提供了丰富的选择。通过定制化模型开发，可以有效提高模型的性能和适用性，同时降低成本和开发门槛。

　　谈大模型商业模式：开源模型会越来越落后

　　“因为有了最强大的基础模型文心 4.0，我们可以根据需要，兼顾效果、响应速度，推理成本等各种考虑，裁剪出适合各种场景的更小尺寸模型，并且支持精调和 postpretrain。”

　　李彦宏提到，这样通过降维裁剪出来的模型，比直接拿开源模型调出来的模型，同等尺寸下效果明显更好，同等效果下，成本明显更低。

　　李彦宏还指出，大家以前用开源觉得开源便宜，其实在大模型场景下，开源是最贵的。所以开源模型会越来越落后。

　　在李彦宏看来，多模态大模型是通往 AGI 的必经之路，视觉大模型最大的应用场景是自动驾驶。

　　“面向未来，我认为多模态大模型，或者说文字、图片、语音、视频等多模态的融合，是基础模型非常重要的长期发展方向，是通往 AGI 的必经之路。百度在这些领域有着长期投入，并将及时更新大模型的最新进展。”

　　李彦宏提出了非常不一样的判断：视觉大模型最大的应用场景是自动驾驶。百度不只训练 AI 如何生成视频，更训练 AI 理解真实世界发生的事情并预测未来。

　　在开发者大会最后，李彦宏有感而发：

　　“今天的中国，有 10 亿互联网用户，有强大的基础大模型，有足够多的 AI 应用场景，有全球最完备的产业体系，国家也在大力鼓励和支持‘人工智能+’行动，每一个人，每一家企业，只需要充分利用这些工具，就可以释放无限的创造力和生产力。”

　　“人人都可以成为开发者，而未来，也必将是一个由开发者一起创造出来的未来！”李彦宏总结称。