性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快

性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快

文章图片

性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快

文章图片

【性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快】性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快

文章图片

就在刚刚 , 深度求索宣布DeepSeek-V3.1正式发布 。 经查 , 目前新版模型已经默认同步上线官网、App , 面向C端用户完全免费 。


据介绍 , DeepSeek-V3.1具备128K超长上下文处理能力 , 支持混合推理架构(一个模型同时支持思考模式与非思考模式) 。
此外 , 新版模型拥有更高的思考效率 , 相比R1能在更短时间内给出答案 。
不仅如此 , DeepSeek-V3.1拥有更强的Agent(智能体)能力 , 通过Post-Training(后训练)优化 , 新模型在工具使用与智能体任务中的表现有较大提升 。


比如 , 在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中 , 以及在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上 , DeepSeek-V3.1均大幅领先DeepSeek-R1-0528 。
另外 , DeepSeek-V3.1思考效率提升有了巨幅提升 。 经过思维链压缩训练后 , V3.1-Think在输出token数减少20%-50%的情况下 , 各项任务的平均表现与R1-0528 持平 。

对于DeepSeek R2发布延迟的原因 , DeepSeek总结称 , 主要由于采用国产昇腾芯片进行训练时遇到技术挑战 , 以及公司对模型质量的高标准要求 。 虽然之前有8月发布的传闻 , 但已被官方否认 。 目前看来 , 我们可能需要再等待几周的时间 , 但具体日期还需以官方消息为准 。

    推荐阅读