领先ChatGPT Agent三个月,国民级产品为何闯进通用Agent领域?

领先ChatGPT Agent三个月,国民级产品为何闯进通用Agent领域?

文章图片

领先ChatGPT Agent三个月,国民级产品为何闯进通用Agent领域?

文章图片

领先ChatGPT Agent三个月,国民级产品为何闯进通用Agent领域?

文章图片




【领先ChatGPT Agent三个月,国民级产品为何闯进通用Agent领域?】作者 商迪安


全球通用Agent领域的英雄榜 , 再次得到刷新 。

8月18日 , 百度文库、百度网盘联合发布全球首个全端通用Agent“GenFlow2.0” 。

在发布会后的访谈中 , 文库事业部、网盘事业部负责人王颖讲道:“文库网盘 , 发出来的都是现货 。 ”正如她所说 , 4个月前GenFlow以发布即可用的姿态闯进市场 。

最新的文库GenFlow2.0延续了这种务实风格 , 已于即日起上线百度文库网页、App全端 , 无需邀请码、立即可用 。 不仅如此 , GenFlow2.0能够调度100+Agent同时运行任务 , 并行完成5个以上复杂任务只需3分钟 , 速度可达同类产品的5-10倍 。



3分钟完成超5个复杂任务 , 多智能体协作不再“翻车”

网红通用Agent“一码难求”“高价竞购”的场景还留在用户的记忆里 , 一场祛魅就已上演 。

理想情况下 , 用户只需进行简单的自然语言交互 , 就能让通用Agent调动多智能体(Multi- Agent)协同、完成复杂任务 。 但随着用户真正“上手”实操 , 问题逐渐涌现了出来 。

不少用户经过实践后反馈 , 通用Agent存在需要反复调整描述输入、任务交付质量低、等待时间过长、答案空洞有误、无法编辑等种种问题 。 在各大论坛之中 , “为什么Multi- Agent总是失败”也成了热门讨论话题 。

这甚至得到了数据支撑 , 来自加州大学伯克利分校等机构的团队调研了海外5个Multi- Agent系统的故障率 , 其中一大工具甚至出现了高达86.7%的故障率数值 , 也从侧面说明现有的许多通用Agent并不能精准捕捉需求和执行任务、距离理想状态仍有不远距离 。



凡此种种 , 折射出的是不少通用Agent受限于系统设计缺陷、数据缺失、知识库协同不足等种种原因 , 而难以发挥出全部潜能 , 也为许多用户留下了AI能力不足的“初印象” 。 在与媒体沟通时 , 百度文库、网盘团队分享道 , 这正是GenFlow2.0希望攻克的难题 。

为了测评文库GenFlow2.0性能是否达到预期 , 「电厂」输入了一个针对全球GPU芯片龙头英伟达的企业研究任务 , 要求了解该公司的发展历程、历年财务状况与业务布局 , 并要求以不同文件格式输出研究结果 。

运行过程显示 , 文库GenFlow2.0第一时间拆分出了8个子任务 , 并使用深度检索工具搜集核心信息 , 最终在几分钟的时间内执行完毕 , 并且生成内容基本准确 , 且格式符合企业调研要求 。


图源/百度文库GenFlow2.0

另一个针对初中物理教师教学材料的生成任务(含5个子任务)则在3分钟内内运行完毕 。 官方数据显示 , GenFlow2.0的运行速度是同类产品的10倍 , 实现了实现分钟级“并行”工作和交付 。

运行速度提升背后 , 文库GenFlow2.0 采用了自研的Multi-Agent基础架构 , 而非主流的Agent串行工作流 。 为了提升交互体验 , 文库App端还将常规的“瀑布式”工作流升级为“并列式” 。

除此之外 , 在生成过程中 , 文库GenFlow2.0支持用户在任务过程随时「干预」 , 用户可根据场景需求、随时在GenFlow2.0聊天窗口要求暂停、进行追问、修改思考内容、上传文件参考等 , GenFlow2.0将根据最新要求实时调整生成内容 。

在交付能力上 , 除了「电厂」体验的PPT、文档、图片之外 , GenFlow2.0还覆盖了研报、视频绘本、海报、图表、HTML、代码、游戏、网站等多模态内容 。 全模态的生成能力背后 , 文库GenFlow2.0可调用100+多模态Agent组成的“AI专家团” , 全面满足用户需求 。

并且所有Agent均经过文库网盘数亿用户验证 。 比如 , 文库PPT Agent的用户访问量已达全球第一、采纳率接近90%;研报Agent则在行业率先实现了数万字专业报告的分钟级生成、同时生成专业级可视化图表的能力 。

王颖透露 , 为保证用户体验 , 当下GenFlow2.0接入的Agent以百度自研居多 , 但随着产品发展 , 第三方Agent也将日益丰富 。


两年全面AI重构 , 文库网盘展现焕新“增长力”要拆解GenFlow2.0性能提升的原因 , 除了前述功能设计之外 , 也不能脱离其根植于百度生态资源的背景 。

从2023年开始 , 文库网盘就陆续开始了长达两年的AI重构 。

在GenFlow2.0的发布会上 , 主创团队介绍称 , GenFlow的定位是提供一支“牢记初心、目标清晰、听从指挥、能打胜仗”高效率的AI专家团队 。 为此研发团队在技术基座上进行了大量投入 。



比如 , 在模型层 , 文库网盘自AI重构以来就坚持采用MoE(底层专家模型) , 可基于不同任务、步骤来调用不同模型——这也是当前大模型的主流架构选择 , 从2024年开始 , 不少大模型玩家开始转向MoE 。

在技术方面 , GenFlow2.0自建了Multi-Agent引擎 , 并积极优化上下文工程 , 为模型构建信息生态系统;通过动态混合推理、多模式智能化调度、公私域知识增强以及全模态渲染编辑 , 实现对复杂任务的一站式端到端交付;以及构建包括全周期消息总线、多模态数据理解、临短长记忆中枢、多级风控体系等能力的基础底座 , 致力于实现性能、效果和扩展性的最优解 。

在今年4月举办的百度Create 2025开发者大会上 , 百度文库、百度网盘携手推出内容操作系统“沧舟OS” , 并基于该系统首发“GenFlow1.0”版本 。 截至目前 , 百度文库拥有超14亿专业内容资源 , AI月活用户超9700万 , 拥有智能PPT、智能文档、AI绘本等数百项AI能力;百度网盘已累计服务超10亿用户 , 月活用户超2亿 , AI月活用户超8000万 。



此外 , GenFlow2.0兼容MCP协议 , 可灵活接入第三方服务生态 , 支持厂商、企业用户、智能体应用、开发者等接入 , 面向用户提供更加丰富的服务项 。 当前 , 荣耀已作为全球首批接入MCP生态的硬件厂商 , 将GenFlow2.0原生接入荣耀智能助理YOYO 。

借此 , 荣耀MagicOS用户可一键获取个人网盘知识库与文库专业文档 , 实现网盘检索、内容分享、联网搜索、图片理解、文件总结与问答、文库PPT生成等体验 , 实现AI Agent与硬件厂商的系统级原生调度 。

而这 , 还远未抵达通用Agent的终局 , 在那之前百度文库网盘仍将持续发力 。

活动上 , 文库网盘宣布升级开发者权益 , 将新开放和优化升级超100项能力 , 并针对所有能力提供免费额度 , 以赋能更多开发者 。

企业与市场脉搏共振 , 随着用户好奇心褪去、对于价值的拷问成了所有市场玩家无法面对的问题 , 当全球大模型应用市场步入深水区的同时 , 百度的AI重构也日益纵深 。

通用Agent市场还没有标准答案 , 但唯有历经不辍地探索与投入 , 才能将人们对“未来工作方式”“超级生产力”的想象落地现实 。 包括百度在内 , 市场仍在拔足狂奔 , 但许多有趣的变化已在发生 。

    推荐阅读