领先ChatGPT Agent三个月，国民级产品为何闯进通用Agent领域？_百度文库|chatgpt|百度网盘|人工

文章图片

文章图片

文章图片

【领先ChatGPT Agent三个月，国民级产品为何闯进通用Agent领域？】作者商迪安

全球通用Agent领域的英雄榜，再次得到刷新。

8月18日，百度文库、百度网盘联合发布全球首个全端通用Agent“GenFlow2.0” 。

在发布会后的访谈中，文库事业部、网盘事业部负责人王颖讲道：“文库网盘，发出来的都是现货。 ”正如她所说， 4个月前GenFlow以发布即可用的姿态闯进市场。

最新的文库GenFlow2.0延续了这种务实风格，已于即日起上线百度文库网页、App全端，无需邀请码、立即可用。不仅如此， GenFlow2.0能够调度100+Agent同时运行任务，并行完成5个以上复杂任务只需3分钟，速度可达同类产品的5-10倍。

3分钟完成超5个复杂任务，多智能体协作不再“翻车”

网红通用Agent“一码难求”“高价竞购”的场景还留在用户的记忆里，一场祛魅就已上演。

理想情况下，用户只需进行简单的自然语言交互，就能让通用Agent调动多智能体（Multi- Agent）协同、完成复杂任务。但随着用户真正“上手”实操，问题逐渐涌现了出来。

不少用户经过实践后反馈，通用Agent存在需要反复调整描述输入、任务交付质量低、等待时间过长、答案空洞有误、无法编辑等种种问题。在各大论坛之中， “为什么Multi- Agent总是失败”也成了热门讨论话题。

这甚至得到了数据支撑，来自加州大学伯克利分校等机构的团队调研了海外5个Multi- Agent系统的故障率，其中一大工具甚至出现了高达86.7%的故障率数值，也从侧面说明现有的许多通用Agent并不能精准捕捉需求和执行任务、距离理想状态仍有不远距离。

凡此种种，折射出的是不少通用Agent受限于系统设计缺陷、数据缺失、知识库协同不足等种种原因，而难以发挥出全部潜能，也为许多用户留下了AI能力不足的“初印象” 。在与媒体沟通时，百度文库、网盘团队分享道，这正是GenFlow2.0希望攻克的难题。

为了测评文库GenFlow2.0性能是否达到预期，「电厂」输入了一个针对全球GPU芯片龙头英伟达的企业研究任务，要求了解该公司的发展历程、历年财务状况与业务布局，并要求以不同文件格式输出研究结果。

运行过程显示，文库GenFlow2.0第一时间拆分出了8个子任务，并使用深度检索工具搜集核心信息，最终在几分钟的时间内执行完毕，并且生成内容基本准确，且格式符合企业调研要求。

图源/百度文库GenFlow2.0

另一个针对初中物理教师教学材料的生成任务（含5个子任务）则在3分钟内内运行完毕。官方数据显示， GenFlow2.0的运行速度是同类产品的10倍，实现了实现分钟级“并行”工作和交付。

运行速度提升背后，文库GenFlow2.0 采用了自研的Multi-Agent基础架构，而非主流的Agent串行工作流。为了提升交互体验，文库App端还将常规的“瀑布式”工作流升级为“并列式” 。

除此之外，在生成过程中，文库GenFlow2.0支持用户在任务过程随时「干预」，用户可根据场景需求、随时在GenFlow2.0聊天窗口要求暂停、进行追问、修改思考内容、上传文件参考等， GenFlow2.0将根据最新要求实时调整生成内容。

在交付能力上，除了「电厂」体验的PPT、文档、图片之外， GenFlow2.0还覆盖了研报、视频绘本、海报、图表、HTML、代码、游戏、网站等多模态内容。全模态的生成能力背后，文库GenFlow2.0可调用100+多模态Agent组成的“AI专家团” ，全面满足用户需求。

并且所有Agent均经过文库网盘数亿用户验证。比如，文库PPT Agent的用户访问量已达全球第一、采纳率接近90%；研报Agent则在行业率先实现了数万字专业报告的分钟级生成、同时生成专业级可视化图表的能力。

王颖透露，为保证用户体验，当下GenFlow2.0接入的Agent以百度自研居多，但随着产品发展，第三方Agent也将日益丰富。

两年全面AI重构，文库网盘展现焕新“增长力”要拆解GenFlow2.0性能提升的原因，除了前述功能设计之外，也不能脱离其根植于百度生态资源的背景。

从2023年开始，文库网盘就陆续开始了长达两年的AI重构。

在GenFlow2.0的发布会上，主创团队介绍称， GenFlow的定位是提供一支“牢记初心、目标清晰、听从指挥、能打胜仗”高效率的AI专家团队。为此研发团队在技术基座上进行了大量投入。

比如，在模型层，文库网盘自AI重构以来就坚持采用MoE（底层专家模型），可基于不同任务、步骤来调用不同模型——这也是当前大模型的主流架构选择，从2024年开始，不少大模型玩家开始转向MoE 。

在技术方面， GenFlow2.0自建了Multi-Agent引擎，并积极优化上下文工程，为模型构建信息生态系统；通过动态混合推理、多模式智能化调度、公私域知识增强以及全模态渲染编辑，实现对复杂任务的一站式端到端交付；以及构建包括全周期消息总线、多模态数据理解、临短长记忆中枢、多级风控体系等能力的基础底座，致力于实现性能、效果和扩展性的最优解。

在今年4月举办的百度Create 2025开发者大会上，百度文库、百度网盘携手推出内容操作系统“沧舟OS” ，并基于该系统首发“GenFlow1.0”版本。截至目前，百度文库拥有超14亿专业内容资源， AI月活用户超9700万，拥有智能PPT、智能文档、AI绘本等数百项AI能力；百度网盘已累计服务超10亿用户，月活用户超2亿， AI月活用户超8000万。

此外， GenFlow2.0兼容MCP协议，可灵活接入第三方服务生态，支持厂商、企业用户、智能体应用、开发者等接入，面向用户提供更加丰富的服务项。当前，荣耀已作为全球首批接入MCP生态的硬件厂商，将GenFlow2.0原生接入荣耀智能助理YOYO 。

借此，荣耀MagicOS用户可一键获取个人网盘知识库与文库专业文档，实现网盘检索、内容分享、联网搜索、图片理解、文件总结与问答、文库PPT生成等体验，实现AI Agent与硬件厂商的系统级原生调度。

而这，还远未抵达通用Agent的终局，在那之前百度文库网盘仍将持续发力。

活动上，文库网盘宣布升级开发者权益，将新开放和优化升级超100项能力，并针对所有能力提供免费额度，以赋能更多开发者。

企业与市场脉搏共振，随着用户好奇心褪去、对于价值的拷问成了所有市场玩家无法面对的问题，当全球大模型应用市场步入深水区的同时，百度的AI重构也日益纵深。

通用Agent市场还没有标准答案，但唯有历经不辍地探索与投入，才能将人们对“未来工作方式”“超级生产力”的想象落地现实。包括百度在内，市场仍在拔足狂奔，但许多有趣的变化已在发生。

领先ChatGPT Agent三个月，国民级产品为何闯进通用Agent领域？

推荐阅读

经纬度怎么表示

如何评价演员布鲁斯威利斯

电脑尺寸大小在哪里看

湖北一神秘山洞

解决win10 1709启用快速启动不能勾选的方法

大学处分的后果

石榴常温下可放多久

pscs6制作灯泡中的金鱼

魅族16th是什么处理器

如懿传永琏死是第几集如懿传永琏死是多少集

Photoshop制作彩色手写字教程

我来教你b612版本信息去哪查询

天台山在哪里天台山属于哪个省

什么时间适合练瑜伽

安徽省潜山县什么时候通高铁，安庆潜山什么时候可以通高铁

花名、颜色秋天开的花有哪些