
文章图片

文章图片

文章图片
【领先ChatGPT Agent三个月,国民级产品为何闯进通用Agent领域?】作者 商迪安
全球通用Agent领域的英雄榜 , 再次得到刷新 。
8月18日 , 百度文库、百度网盘联合发布全球首个全端通用Agent“GenFlow2.0” 。
在发布会后的访谈中 , 文库事业部、网盘事业部负责人王颖讲道:“文库网盘 , 发出来的都是现货 。 ”正如她所说 , 4个月前GenFlow以发布即可用的姿态闯进市场 。
最新的文库GenFlow2.0延续了这种务实风格 , 已于即日起上线百度文库网页、App全端 , 无需邀请码、立即可用 。 不仅如此 , GenFlow2.0能够调度100+Agent同时运行任务 , 并行完成5个以上复杂任务只需3分钟 , 速度可达同类产品的5-10倍 。
3分钟完成超5个复杂任务 , 多智能体协作不再“翻车”
网红通用Agent“一码难求”“高价竞购”的场景还留在用户的记忆里 , 一场祛魅就已上演 。
理想情况下 , 用户只需进行简单的自然语言交互 , 就能让通用Agent调动多智能体(Multi- Agent)协同、完成复杂任务 。 但随着用户真正“上手”实操 , 问题逐渐涌现了出来 。
不少用户经过实践后反馈 , 通用Agent存在需要反复调整描述输入、任务交付质量低、等待时间过长、答案空洞有误、无法编辑等种种问题 。 在各大论坛之中 , “为什么Multi- Agent总是失败”也成了热门讨论话题 。
这甚至得到了数据支撑 , 来自加州大学伯克利分校等机构的团队调研了海外5个Multi- Agent系统的故障率 , 其中一大工具甚至出现了高达86.7%的故障率数值 , 也从侧面说明现有的许多通用Agent并不能精准捕捉需求和执行任务、距离理想状态仍有不远距离 。
凡此种种 , 折射出的是不少通用Agent受限于系统设计缺陷、数据缺失、知识库协同不足等种种原因 , 而难以发挥出全部潜能 , 也为许多用户留下了AI能力不足的“初印象” 。 在与媒体沟通时 , 百度文库、网盘团队分享道 , 这正是GenFlow2.0希望攻克的难题 。
为了测评文库GenFlow2.0性能是否达到预期 , 「电厂」输入了一个针对全球GPU芯片龙头英伟达的企业研究任务 , 要求了解该公司的发展历程、历年财务状况与业务布局 , 并要求以不同文件格式输出研究结果 。
运行过程显示 , 文库GenFlow2.0第一时间拆分出了8个子任务 , 并使用深度检索工具搜集核心信息 , 最终在几分钟的时间内执行完毕 , 并且生成内容基本准确 , 且格式符合企业调研要求 。
图源/百度文库GenFlow2.0
另一个针对初中物理教师教学材料的生成任务(含5个子任务)则在3分钟内内运行完毕 。 官方数据显示 , GenFlow2.0的运行速度是同类产品的10倍 , 实现了实现分钟级“并行”工作和交付 。
运行速度提升背后 , 文库GenFlow2.0 采用了自研的Multi-Agent基础架构 , 而非主流的Agent串行工作流 。 为了提升交互体验 , 文库App端还将常规的“瀑布式”工作流升级为“并列式” 。
除此之外 , 在生成过程中 , 文库GenFlow2.0支持用户在任务过程随时「干预」 , 用户可根据场景需求、随时在GenFlow2.0聊天窗口要求暂停、进行追问、修改思考内容、上传文件参考等 , GenFlow2.0将根据最新要求实时调整生成内容 。
在交付能力上 , 除了「电厂」体验的PPT、文档、图片之外 , GenFlow2.0还覆盖了研报、视频绘本、海报、图表、HTML、代码、游戏、网站等多模态内容 。 全模态的生成能力背后 , 文库GenFlow2.0可调用100+多模态Agent组成的“AI专家团” , 全面满足用户需求 。
并且所有Agent均经过文库网盘数亿用户验证 。 比如 , 文库PPT Agent的用户访问量已达全球第一、采纳率接近90%;研报Agent则在行业率先实现了数万字专业报告的分钟级生成、同时生成专业级可视化图表的能力 。
王颖透露 , 为保证用户体验 , 当下GenFlow2.0接入的Agent以百度自研居多 , 但随着产品发展 , 第三方Agent也将日益丰富 。
两年全面AI重构 , 文库网盘展现焕新“增长力”要拆解GenFlow2.0性能提升的原因 , 除了前述功能设计之外 , 也不能脱离其根植于百度生态资源的背景 。
从2023年开始 , 文库网盘就陆续开始了长达两年的AI重构 。
在GenFlow2.0的发布会上 , 主创团队介绍称 , GenFlow的定位是提供一支“牢记初心、目标清晰、听从指挥、能打胜仗”高效率的AI专家团队 。 为此研发团队在技术基座上进行了大量投入 。
比如 , 在模型层 , 文库网盘自AI重构以来就坚持采用MoE(底层专家模型) , 可基于不同任务、步骤来调用不同模型——这也是当前大模型的主流架构选择 , 从2024年开始 , 不少大模型玩家开始转向MoE 。
在技术方面 , GenFlow2.0自建了Multi-Agent引擎 , 并积极优化上下文工程 , 为模型构建信息生态系统;通过动态混合推理、多模式智能化调度、公私域知识增强以及全模态渲染编辑 , 实现对复杂任务的一站式端到端交付;以及构建包括全周期消息总线、多模态数据理解、临短长记忆中枢、多级风控体系等能力的基础底座 , 致力于实现性能、效果和扩展性的最优解 。
在今年4月举办的百度Create 2025开发者大会上 , 百度文库、百度网盘携手推出内容操作系统“沧舟OS” , 并基于该系统首发“GenFlow1.0”版本 。 截至目前 , 百度文库拥有超14亿专业内容资源 , AI月活用户超9700万 , 拥有智能PPT、智能文档、AI绘本等数百项AI能力;百度网盘已累计服务超10亿用户 , 月活用户超2亿 , AI月活用户超8000万 。
此外 , GenFlow2.0兼容MCP协议 , 可灵活接入第三方服务生态 , 支持厂商、企业用户、智能体应用、开发者等接入 , 面向用户提供更加丰富的服务项 。 当前 , 荣耀已作为全球首批接入MCP生态的硬件厂商 , 将GenFlow2.0原生接入荣耀智能助理YOYO 。
借此 , 荣耀MagicOS用户可一键获取个人网盘知识库与文库专业文档 , 实现网盘检索、内容分享、联网搜索、图片理解、文件总结与问答、文库PPT生成等体验 , 实现AI Agent与硬件厂商的系统级原生调度 。
而这 , 还远未抵达通用Agent的终局 , 在那之前百度文库网盘仍将持续发力 。
活动上 , 文库网盘宣布升级开发者权益 , 将新开放和优化升级超100项能力 , 并针对所有能力提供免费额度 , 以赋能更多开发者 。
企业与市场脉搏共振 , 随着用户好奇心褪去、对于价值的拷问成了所有市场玩家无法面对的问题 , 当全球大模型应用市场步入深水区的同时 , 百度的AI重构也日益纵深 。
通用Agent市场还没有标准答案 , 但唯有历经不辍地探索与投入 , 才能将人们对“未来工作方式”“超级生产力”的想象落地现实 。 包括百度在内 , 市场仍在拔足狂奔 , 但许多有趣的变化已在发生 。
推荐阅读
- ChatGPT负责人深度复盘:我们做错了什么?
- 突破Claude-4编程上限!自进化Agent框架拿下新SOTA,已开源
- 中国手机榜单更新:苹果跌出前五,OPPO第二,第一名再次遥遥领先
- 别再只用手机刷短视频了,小艺这些学习Agent让你在“玩中学”
- 火山引擎,燃起了Agent的星星之火
- AI Agent,搞投资?|量子位AI沙龙
- 离谱!现在的Agent都卷成100个成团了?3分钟并行干完5个复杂任务
- 遥遥领先的小米自研最强国产芯!玄戒O2+5G基带发布时间确认
- 银河通用世界人形机器人运动会夺冠,全自主操作遥遥领先,大秀落地硬实力
- 国内准旗舰手机大洗牌!华为第二,小米第三,第一名遥遥领先
