
文章图片
快科技9月17日消息 , 今日凌晨 , 阿里开源旗下首个深度研究Agent模型——通义DeepResearch , 并登顶开源第一 。
该模型在HLE、BrowseComp-zh、GAIA等多个权威评测集上取得SOTA成绩(State-of-the-art) , 超越OpenAI Deep Research、DeepSeek-V3.1等Agent模型 。
目前 , 通义DeepResearch的模型、框架和方案均已全面开源 , 用户可在Github、Hugging Face和魔搭社区社区下载模型和代码 。
作为当前研究热点 , “深度研究”的现有方法通常是“单窗口、线性累加”的信息处理模式 , 所有中间思路和检索到的信息堆积在单一上下文中 。
【阿里开源通义DeepResearch:登顶开源Agent模型榜首】当处理长周期任务时 , Agent会面临“认知空间窒息”和“不可逆的噪声污染”的挑战 , 导致推理能力下降 , 最终难以完成真正长程、复杂的研究任务 。
为此 , 通义团队构建了一套以合成数据驱动、贯穿预训练与后训练的完整训练链路 。
该链路以Qwen3-30B-A3B模型为基座进行优化 , 团队创新性地设计了覆盖真实环境与虚拟环境的RL算法验证与真实训练模块 , 并结合高效异步强化学习算法及自动化数据策展(Data Curation)流程 , 显著提升了模型的迭代速度和泛化能力 。
在推理阶段 , 团队设计了ReAct和基于自研的IterResearch的Heavy两种模式 。
前者用于精准考察模型的基础内在能力 , 后者则通过test-time scaling策略 , 充分挖掘并展现了模型所能达到的性能上限 。
即使在长任务中 , 也能实现高质量的推理 。
目前 , 在Humanity's Last Exam(HLE)、BrowseComp、BrowseComp-ZH、GAIA、xbench-deepsearch、WebWalkerQA以及Frames等权威Agent评测集上 , 通义DeepResearch模型以3B激活参数 , 性能超越基于OpenAI o3、DeepSeek V3.1和Claude-4-Sonnet等旗舰模型的ReAct Agent 。
今年以来 , 阿里已连续开源WebWalker、WebDancer和WebSailor等多款检索和推理智能体 , 并全部斩获开源SOTA成绩 。
推荐阅读
- 阿里全新AI芯片曝光:重要参数与H20相当!
- 易用易学机器人学习系统: 华为诺亚面向机器人学习开源Python框架
- 阿里妈妈发布万相台AI无界:新流量新节奏之下的双11,AI是经营唯一解
- 国产AI算力崛起!消息称阿里百度使用自研芯片训练AI模型
- 基于通义万相 美图多款APP上线动漫特效、AI变身等视频生成功能
- 遭留学生 “围攻”后, 阿里夸克首次官方正面回应
- 永不商业化!阿里神秘项目揭晓:高德发布“高德扫街榜”
- ??B站开源IndexTTS-2.0:突破自回归TTS时长与情感控制瓶颈
- 阿里、京东、字节等争抢“新脑子”:人才背后的AI竞赛
- 高德地图做榜单:阿里到店业务再进一程,本地生活“背水一战”
