
文章图片
9月17日 , 腾讯全球数字生态大会Agent + Infra专场聚焦“智能体驱动云基础设施跃进升级”这一主题 , 汇聚众多行业领军者 , 共同探索AI时代基础设施的技术突破与产业实践 。 腾讯云智算各产品负责人及行业客户深入解读AI原生云架构、主动服务型基础设施、全链路安全体系等核心议题 , 同时发布多项重磅成果 , 为智能体规模化落地筑牢技术底座 。
在论坛中 , 腾讯云副总裁李力正式宣布 , 腾讯云智算面向“更贴近Agent的AI Infra”重磅升级 。 腾讯云建立包括Agent Infra解决方案+Cloud Mate云专家服务智能体与全链路安全能力为一体的完整解决方案 , 帮助 Agentic AI 从“实验室”走向“生产级” 。
【腾讯云智算全面升级,AI原生云基础设施迈向主动服务新时代】李力表示 , 未来两年 , 部署Agent的企业将翻倍 , GenAI相关的IaaS支出增速将达到192% 。 随着Agent数量爆发式增长 , 企业对云计算基础设施的需求 , 将会快速从“资源供给”升级为“业务价值” , AI Infra基础设施必须具备更快的推理效率、更灵活的工具集成、更可靠的系统保障和更自动化的服务能力 。 腾讯云智算体系核心优势在于 “同源同构” , 无需打造 AI 专属存储等设施 , 依托过往打磨的云原生能力 , 即可承接智算需求 , 实现云与智算能力的深度协同 。 目前 , 腾讯云智算已实现“一云多芯”软硬协同 , 支持公有云、专有云、边缘环境的同源同构部署 , 为交通、制造、具身智能等行业提供从模型训练到推理落地的全链路支撑 。
图:腾讯云智算能力升级 , 成为更贴近Agent的AI原生云在AI Infra底座层面 , 腾讯云智算基于在云计算、分布式存储、高性能网络等基础设施方面的深厚积累和场景优化 , 大幅提升云上资源的性能和利用率 , 最终实现降本增效 。 模型启动提速17倍 , 大规模服务扩容时间从10分钟缩短至34秒;多模态推理加速4倍 , 自研推理引擎覆盖生文、生图、生视频等模型;通过内存优化与通讯协议升级等创新 , 显著降低计算开销 , 推动推理集群的性能发挥到极致 。
智能体要从“实验室”走向“生产级” , 工程问题和安全问题将成为核心痛点 。 全新发布Agent infra解决方案Agent Runtime , 集成运行引擎、云沙箱、上下文服务、网关、安全可观测五大组件 , 为智能体提供坚实基础设施 , 其中云沙箱实现毫秒级启动 , 数十万实例秒并发 。
全新发布的Cloud Mate云专家服务智能体 , 将专家经验转化为自动化服务 , 利用Agent的自动化编排能力 , 在云上架构治理、风险SQL拦截、故障定位等场景大幅提升效率 , 打造能主动服务的云 。 目前已为客户提供超百万次智能架构治理服务 , 在内部实践中 , 风险SQL拦截率95% , 排障效率从30小时降低至最快3分钟 。
在安全层面 , 腾讯云通过一整套大模型与智能体安全治理框架 , 为云上客户提供安全、可控、可靠、满足监管要求的安全建设思路 。 方案贯穿模型选型、模型训练、推理部署、业务应用全流程 , 实现边界API与用户输入/输出安全、模型运行环境安全防护及态势管理、智能体与MCP身份和特权防护、智能体行为与意图安全管控、数据安全全流程安全等 。
此外 , 李力还分享了从数字世界到现实世界的思考 。 机器人是AI影响现实世界的一个关键形态 , 但具身智能与大语言模型存在显著数据差异:一方面是具身的数据采集难度比较大 , 包括视觉、环境、关节角状态等数据均要采集;另一方面 , 采集的数据与硬件高度绑定 , 进一步增加了数据采集的门槛 。 因此 , 腾讯云希望能够帮助客户跳过数采、训练环节、直接提供支持跨本体直接使用的具身模型非常重要 。 腾讯云智算联合Tairos(钛螺丝)提供了感知和规划模型服务 , 通过HAI推理集群获取专属的机器人云上大脑 。
Agent + Infra专场上 , IDC与腾讯云联合发布了《AI Infra:加速智能体落地的基础架构、发展趋势与产业实践》报告 。 报告深度剖析生成式AI(Gen AI)规模化落地背景下 , AI Infra(AI云基础设施)从基础算力平台向核心智算基础设施的演进路径 , 系统梳理其技术架构、核心能力与行业适配方案 。 报告纳入了地平线、货拉拉、一汽丰田、燧原科技、作业帮、考试宝、心言集团、尚航科技、元石科技、智诊科技、德适生物等标杆企业 , 覆盖交通出行、工业制造、教育培训、泛互联网、具身智能、智慧医疗等六大重点行业 , 为企业智能化转型提供“技术-场景-价值”三位一体的行动指南 。
在专场中 , 腾讯云多家客户及伙伴参会 , 作业帮、帕西尼感知科技、智诊科技、燧原科技等各行业代表企业 , 共同围绕AI时代基础设施的技术突破与产业实践进行深入分享 。
作业帮针对教育场景算力供需的矛盾 , 搭建统一算力网络 , 通过Docker+K8s容器调度、跨区域云联网、GPU共享(qGPU)、在离线混部等策略 , 解决算力不足难题 , 节省算力成本 。 通过腾讯云COS优化模型分发 , 全链路耗时从6小时缩至45分钟 。 同时 , 借助Agent、MCP协议与向量数据库 , 将基础服务接入效率提升10倍 , 构建起教育行业AI与基础设施协同的高效范式 。
帕西尼通过带有稀缺触觉模态的亿级全模态具身智能数据 , 助力AI理解现实物理世界 。 依托全球首座全模态超级数据采集工厂 , 年产能近2亿条全模态数据 , 构建包含触觉模态在内的高质量OmniSharing DB数据集 , 支撑具身智能大模型OmniVTLA研发 。 借助腾讯云Data Platform 解决方案实现亿级全模态数据的存储和管理 , 海量数据通过迁移服务统一采集进入对象存储 COS , GooseFS 提升数据读写性能 , 加速模型训练效率 , 让数据自由流转;依托腾讯云算力对全模态数据深加工 , 可重定向至不同机器人本体;腾讯云TAIROS具身智能开放平台提供完整工具链 , 将仿真、云服务与前沿具身智能模型快速对接数据和本体 , 推动全模态数据集 OmniSharing DB赋能具身智能快速落地 。
智诊科技 , 希望基于海量的算力、极致的通信效率和海量数据的高速读取 , 训练一个能实现“主动式关怀”的医疗大模型 , 破解医疗成本/医疗效果/医疗可及性这一全球医疗健康的“不可能三角” 。 其自主研发的千亿参数多模态大模型WiseDiag-Z1 , 通过腾讯云稳定高效弹性的训推集群、星脉网络(为GPU集群铺设无拥堵超级高速路)、CFS Turbo(为数据供给打造数据仓库) , 学习超3万亿专业医疗tokens(含19万篇论文、50万真实病例) , 在MedBench评测中多次登顶中文医疗AI榜首 。
燧原科技以国产算力为核心 , 联合腾讯专有云TCE打造以AI为核心的智算云数据中心 , 围绕GPU构建高性能网络、存储、云平台、算力与模型MaaS平台及安全平台 , 全面满足模型训练、推理等智算场景需求 。 燧原科技首创“互联网推理+城市推理”双算力池模式 , 成为全国首个获全满分认证的国产超大规模推理集群 。 其新一代推理加速卡性能较上一代提升2倍+ , 性价比超旗舰GPU1.5倍+ , 通过腾讯专有云实现异构算力统一纳管、租户隔离与弹性扩缩容——支持1200+算力节点分钟级扩缩容、业务迁移秒级完成 , 4天内即可完成万卡规模部署 。
Digital Realty以300+数据中心、覆盖6大洲50+城市的布局 , 构建全球最大智能基础设施网络 。 其亚太地区数据中心支持单机柜150kW高密度AI负载 , 通 ServiceFabric实现多云互联与端口级灵活连接 , 带宽按需调配 。 依托400G/800G光交换数据平面与智能工作流编排 , 支撑分布式AI训练/推理 , 满足低延迟、高吞吐量需求 , 为企业提供从数据湖到模型调优的全链路支撑 , 推动AI工作流在全球合规框架下高效落地 。
腾讯云通过AI Infra的技术革新 , 推动云计算从“资源时代”迈向“智能服务时代” 。 正如腾讯云副总裁沙开波所言:“未来的云计算基础设施将具备自感知、自决策、自优化的能力 , 而腾讯云愿与伙伴共同加速这一进程 。 ”
来源:北青网
推荐阅读
- 吴泳铭争当“云班长”
- 吴泳铭证实阿里在3800亿元基础上加大资本开支,加码云与AI基础设施建设
- 2025云栖大会直击:云深处科技机器人矩阵亮相
- 阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
- 深象智能亮相2025云栖大会 以行业AI解决方案助力线下数智化升级
- 《鲜Phone画报》vivo X300幸运彩:丝绒凝光 云握柔暖
- 稿定×华为云:开启AIGC时代设计新范式
- IDC:2025年上半年大模型公有云市场,火山引擎占比49.2%排名第一
- AI+数据库,腾讯云选了两个最痛的场景
- 英伟达在中国彻底凉了?华为公布AI芯片,阿里、腾讯转向国产
