【DeepSeek新大招曝光:下一步智能体】
文章图片

文章图片

文章图片

文章图片
鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI
DeepSeek下一步 , 被曝剑指智能体 。
知情人士透露 , DeepSeek正在开发具有更强大AI Agent能力的新模型 , 预计在今年年底就会推出 。
△图片由AI生成
官方尚无回应 , 但这一爆料并非无迹可寻 。
在DeepSeek 8月的最近一次更新中 , DeepSeek-V3.1上线 。 官方发布的升级公告中就提到:
DeepSeek-V3.1具备更强的Agent能力 , 通过Post-Training优化 , 新模型在工具使用与智能体任务中的表现有较大提升 。
迈向Agent时代的第一步
“R2”将造更强智能体?彭博社援引知情人士消息 , 爆料DeepSeek的下一个模型 , 仅需少量提示 , 就能帮用户执行复杂操作 , 并且还能根据历史操作自我进化和学习 。
这一模型将在今年最后一个季度面世 。
此前 , 业内普遍推测 , 按照DeepSeek V3和DeepSeek R1的发布节奏 , 在被期待已久的“R2”之前 , DeepSeek应该会先一步推出新一代V系列的基础模型 。
而从去年12月到今年8月的近9个月时间里 , DeepSeek V系列的版本号只从V3来到了V3.1 。
看上去仅仅是小版本的改进 , 但从DeepSeek官方后来公布的测试结果来看 , 似乎又暗藏玄机 。
DeepSeek-V3.1的主要升级包括3点:
混合推理架构 , 就是把思考模式和非思考模式都集成到了一个模型里 。 更高的思考效率 , 比DeepSeek-R1想得更快 。 更强的Agent能力 , 新模型在工具使用与智能体任务中的表现有较大提升 。具体来看提升效果 。
编程智能体方面 , 在代码修复测评SWE和命令行终端环境下的复杂任务(Terminal-Bench)测试中 , DeepSeek-V3.1相较V3和R1有明显提高 。
而在搜索智能体测评中 , 相较于DeepSeek-R1-0528 , DeepSeek-V3.1也展现出了全面的性能提升 。
下一个DeepSeek时刻DeepSeek R1将推理模型推向发展新高潮 , 成了搅动全球大模型行业格局的一尾鲶鱼 。
Manus让智能体的概念火爆出圈 , 被称为“第二个DeepSeek时刻”——
来到2025年的下半年 , 几乎没有大模型产品不谈智能体 。 吴恩达也在最新Andrew’s Letters中提到:并行智能体正在成为提升AI能力的新方向 。
早早预定2025年年度热词的DeepSeek和智能体一叠加 , 立刻又触动了人们兴奋的神经 。
已经有人开始期待:如果是DeepSeek来做这件事 , 那智能体的价格门槛 , 真的要被打下来了 。
但也有人保持怀疑:这个时候入局智能体 , 还算好时机吗?
不管怎么说 , 可以确定的是 , 在2025年余下的最后1/3时间里 , 大模型领域的热闹依然将每天持续 。
最后的最后 , 小小One More Thing一下 , 信源来自官方 , 妥妥靠谱:
Qwen 3 max也要来了吗?
欢迎一起 , 见证下一个历史时刻 。
— 完 —
量子位 QbitAI · 头条号
关注我们 , 第一时间获知前沿科技动态签约
推荐阅读
- HarmonyOS 6再次发力:开发者版体验招募已来袭,有你的机型吗?
- 英伟达深夜突放大招,全新GPU为长上下文推理而生
- 荣耀MagicOS 10再次发力:Beta内测招募已开启,你的机型在内吗?
- 做完购物做招聘,OpenAI也开始搞“无边界扩张”
- 营业利润高出近8倍!三星也招架不住了?韩媒:中国芯开始反击了
- DeepSeek大招曝光?梁文锋督战超级智能体:能自主学习或年底发布
- OpenAI宣布推出AI在线招聘平台,和微软的领英打起来了
- 招聘最猛的不是OpenAI!这家陷入间谍案的HR初创,正在狂招工程师
- 无开机广告+Aura Mini LED 追觅电视首次亮相就放大招!
- 对话钉钉无招:用AI,打碎一个7亿用户的产品
