暗潮汹涌,云厂商打响Agent Infra之战,阿里云凭什么冲出重围?

暗潮汹涌,云厂商打响Agent Infra之战,阿里云凭什么冲出重围?

文章图片

暗潮汹涌,云厂商打响Agent Infra之战,阿里云凭什么冲出重围?

文章图片

暗潮汹涌,云厂商打响Agent Infra之战,阿里云凭什么冲出重围?

文章图片

暗潮汹涌,云厂商打响Agent Infra之战,阿里云凭什么冲出重围?

智东西
作者 | 陈骏达
编辑 | 漠影
“我的数据库……没了?”
今年7月 , 一位名为“Jason”的网友在X平台上分享了一场Vibe Coding灾难 。 他在开发平台Replit上使用其内置的Agent辅助编程 , 在一次操作中 , Agent在没有明确用户指令的情况下 , 竟错误地执行了一个致命的数据库命令 。
顷刻之间 , 他长达80小时的工作成果被清空 。 这无异于一位本应协助你的“数字员工” , 在未经允许的情况下 , 走进你的办公室 , 将你写了数周的项目资料全部扔进了碎纸机 。
Jason的遭遇绝非孤例 , 这揭示了Agent从原型演示到投入生产环境之间尚未跨越的鸿沟 , 即底层基础设施(Infra)的缺失 。
当前 , AI模型正在从被动的问答工具 , 转变为能够自主规划、执行任务的Agent数字员工 。 然而 , 如何为这些员工提供足够强大的算力和工具 , 并赋予长期记忆 , 又如何为它们设定权限红线 , 确保它们不会“误触红色按钮” , 已成为Agent规模化普及前的巨大挑战 。
没有坚实可靠的Agent Infra , 再聪明的Agent也无法成为可信赖的生产力 。 Replit的这次事故 , 正是这种风险最生动的注脚 。
而这也正是阿里云、AWS、谷歌云、微软Azure等云厂商争相发力Agent Infra的核心原因 。 他们试图打造的并非一个简单的工具集 , 而是一座现代化的 “智能车间” 。
在这里 , 每个AI Agent都将在安全的环境中工作 , 拥有清晰的权限、稳定的工具和足够的数据 , 从而真正从实验室的原型 , 转变为真实生产环境中可靠数字员工 。

一、Agent规模化落地挑战大 , 配套Infra已成必选项企业为何需要这样一座Agent智能车间呢?
【暗潮汹涌,云厂商打响Agent Infra之战,阿里云凭什么冲出重围?】要让Agent在生产场景中发挥作用 , 我们需要为其提供足够的算力和数据(记忆) , 帮助Agent解决水土不服的问题 。
例如 , 当Agent分析海量数据时 , 本地设备既无法承载庞大的数据洪流 , 也无法完成复杂的推理运算 。 这时 , 云端算力的支持就成了理所当然的选择 。
此外 , 要让Agent做出正确的决策 , 就需要为其提供全面、准确且实时的信息 , 否则 , 其决策将基于不完整或过时的数据 , 导致输出结果不可靠 , 甚至产生错误 。
但这仅仅是第一关 , 更大的隐患在于安全与权限控制的缺失 。 今年 , 知名AI搜索独角兽Perplexity旗下的Comet AI浏览器就曾爆出安全丑闻 。
这款AI浏览器本质上就是一个能直接操纵用户设备的Agent , 然而 , 由于缺乏安全机制 , 它在阅读到网页上植入的恶意指令后 , 能直接打开用户邮箱、收取验证码 , 还把验证码分享给外部黑客 , 一条龙完成盗号 。
这一事件暴露了将拥有高权限的Agent直接部署在开放环境中的巨大风险 , 企业必须为Agent打造配套的基础设施 。
然而 , Agent Infra极为复杂 , 涉及底层算力调度、安全沙箱、模型集成、记忆数据库、工具调用链路等一系列核心技术模块 , 企业自建成本高昂且技术门槛难以逾越 , 后续维护也需要持续投入顶尖的研发团队 , 并时刻应对层出不穷的新型安全威胁 , 堪称一个填不满的技术深坑 。
采用云厂商们开发的现成Agent Infra套件 , 对大多数企业而言是更为现实的选择 。 例如 , 知名Agent产品Manus便是通过Agent Infra创企E2B打造的沙盒环境 , 让Manus的Agent获得了完整的终端访问权限 , 也提供了持久化的工作空间 , 这对于Manus广为人知的长链路任务而言 , 十分重要 。
除了E2B外 , AWS、谷歌云、微软Azure等云厂商也都已打造了相关套件 。
AWS的AgentCore提供记忆管理、身份验证、代码执行和浏览器工具等 , 强调安全、可扩展和多Agent协作;
谷歌云的Vertex AI Agents聚焦构建和管理多Agent系统 , 支持任务调度、跨Agent协作以及与企业数据和云服务的集成;
微软Azure的Agent Factory强调身份认证、治理、内容安全和可观测性 , 同时结合Azure云服务和Copilot工具链 , 支持企业快速落地智能体应用 。
总体来看 , 主流云厂商的思路均是:构建安全、可扩展、可组合的Agent Infra , 让企业开发者能在已有基础设施和生态下快速部署、管理和监控多Agents系统 , 形成差异化服务能力 , 同时降低企业上手门槛 。

二、国产Agent Infra突围 , 让Agent学会自我进化在Agent Infra的布局上 , 国内厂商也丝毫不落后 。 今年4月 , 阿里云开启Agent Infra开发套件——无影AgentBay的公测 , 迅速吸引了大量开发者和企业关注 。
AgentBay的核心定位是为AI Agent打造的“超级大脑”或“云上操作系统” 。 它能够动态调用云端算力、存储和工具链资源 , 将复杂任务接入高性能云电脑 , 突破了Agent在本地设备上的算力限制 。
AgentBay不仅集成了云上沙箱环境、算力调度、持久化数据存储和企业级安全等核心功能 , 还内置了视觉理解、自然语言控制和任务解析等多项AI技术 。 尤其是云上沙箱环境 , 保障了Agent对本地环境的零侵入 , 给Agent执行加了一道保险 。
同时 , 它支持原子化工具API、AI Agent API以及ASP远程串流协议等多种交互方式 , 极大地提升了自动化执行效率 , 使开发者能够在高性能、安全的云端环境中快速部署和管理AI Agent 。
而在今年的云栖大会期间 , AgentBay迎来重大升级 , 推出了自进化引擎、内存状态管理、安全围栏等全新能力 。 其中最引人关注的 , 是基于环境反馈的自进化引擎——Self-Evolving 。
阿里云无影关注到了企业在利用第三方AI Infra部署AI Agent时的一大关键挑战 。 Agent并不能在执行任务过程中实现“自我提升” , 最终其效果还需要人工调整 , 才能逐渐优化 。 这就好比你招募了一位员工 , 但他并不能主动从工作中总结经验和教训 , 始终未能进步 。
对于AgentBay自进化引擎的工作原理 , AgentBay产品经理屈立威向智东西解释道 , 自进化引擎可以理解为广义的强化学习 , 但并不直接训练模型 。 自进化引擎会针对提示词、工作流、Agent架构、工具等多个方向进行能力优化 , 每个方向使用的方法或算法各不相同 。
例如在提示词优化方面 , 对于短序列任务 , 可以直接根据目标和实际结果进行修正;而对于长序列任务 , 由于难以直接获得最终结果 , 则会采用多种算法来优化执行效果 , 比如基于文本梯度(text grad)或微调推理(mipro)的方法 。
通过这种模块化、服务化的设计 , 企业无需组建庞大AI团队 , 也能让Agent在执行过程中不断自我优化 , 提升与业务目标的匹配度 。
AgentBay自进化引擎能够在任务执行中自动分析Agent的失败案例 , 并尝试生成和测试更优的提示词 。 它还能根据任务需求自主创建或封装新工具 , 不断拓展Agent能力边界 。
这一机制不仅关注单个Agent的流程优化 , 也可在多Agent协作网络中智能部署最优工作流 , 提高整体效率 。
此外 , 平台的记忆策略使Agent具备“过目不忘”和“选择性遗忘”的能力 , 可以对长期任务进行智能管理 , 适应复杂、长周期的应用场景 。

三、Agent Infra加速发展 , 会成为下一代应用的跃升点吗?AgentBay并非凭空出现 , 屈立威在采访中介绍道 , 在云电脑时代 , 阿里积累了多项核心技术能力 , 而AgentBay的许多技术依赖 , 与云电脑是“一脉相承”的 。
例如 , 云电脑需要高流畅性和清晰的操作体验 , 而阿里云此前已自研了ASP端云实时通信协议 , 确保远程云环境操作体验接近本地 , 这也能让帮助Agent实现与云端执行环境之间的高效、实时交互 。
大规模的资源调度能力和性能保障 , 也是阿里云此前打造云电脑时重点解决的问题 。 目前 , AgentBay便依托阿里云的全球资源池进行部署 , 用户可以就近接入 , 保证了低延迟和高可用性 。
然而 , Agent也提出了新的技术挑战和升级需求 。 屈立威称 , 首先 , Agent需要更强的感知与控制能力 , 不仅要像人一样“看懂画面” , 判断鼠标点击、输入是否生效 , 还要支持文件系统操作、命令行以及撰写RPA脚本等多种工具操作 。
其次 , 其风控与安全要求也更高 , 需要阻断敏感指令、过滤不安全内容、约束上网行为 , 保障企业私域安全 。
此外 , Agent任务的执行方式呈树状、多分支 , 每个节点都需打快照(checkpoint)、支持快速回滚 , 并复制克隆环境以实现并行执行 , 这对状态管理和多维度调度提出了更高要求 , 而这些都是云电脑时代所未涉及的关键能力 , 需要重点突破 。
为此 , 阿里云自研了持久化文件系统 , 让AgentBay能够动态地按需保留用户状态和文件 , 确保了任务执行的连续性和状态的一致性 , 这对于需要执行长链条、多步骤任务的复杂Agent至关重要 。
安全方面 , AgentBay则构建了端到端安全体系 , 包括沙箱隔离、数据加密与RBAC访问控制、AI内容风险检测以及日志审计 , 保障任务安全、合规与可追溯 。
除了给企业打造Agent Infra之外 , 阿里云还在云栖大会上 , 给个人用户也提供了一款跨终端、跨模态的智能计算平台——无影Agentic Computer 。
Agentic Computer是一个拥有长期记忆的个人助手 , 具备云端弹性算力与多任务并行能力 。 它内置垂直场景Agent , 实现办公、设计、研究等专业化支持 。 它将个人计算与云端智能协同起来 , 有望让更多用户体验到Agent带来的赋能作用 。
从产业视角来看 , Agent Infra的发展与移动互联网时代App生态的兴起有一大共性:基础设施成熟 , 为新形态产品快速落地提供了支撑 。
移动互联网时代 , 智能终端、网络和云计算能力的完善 , 使海量App得以高效运行和广泛普及 , 催生了丰富的应用生态;如今 , AI Infra依托全球化云资源、弹性算力调度和全栈安全体系 , 为AI Agent提供高性能、低延迟、可控的运行环境 。
稳固的基础设施降低了创新门槛 , 推动Agent在企业自动化、内容生成等多样化场景中迅速落地 , 有望形成新一轮产业生态和创新循环 。

结语:给Agent打好Infra地基 , Agent离广泛落地又近一步Agent Infra正逐步成为新一代数字化、智能化基础设施的组成部分 , 类似于移动互联网时代的云和网络 , 为AI Agent生态提供底层支撑 。
同时 , Agent Infra的发展正在改变产业创新节奏和生态构建方式 。 企业不再需要自行搭建复杂底层架构 , 而是可以在统一、安全、可扩展的平台上试验多样化Agent应用 。
随着工具链标准化和安全机制完善 , 或许会有越来越多企业和开发者能够快速部署Agent , 推动生产、服务和研发环节的自动化与智能化 , 从而催生新型业务模式和产业应用 。

    推荐阅读