
文章图片

文章图片

文章图片

文章图片
和上周不少朋友期待的一样 , 新一周第一天的北京时间 3 月 24 日晚 , DeepSeek 果然「突然」发布了模型更新 。
但暂时还不是 DeepSeek V4 或 R2 , 而是 DeepSeek V3 模型的一次更新 。 目前 , 其开源版本目前已经上架开源网站 。 其开源版本模型体积为 6850 亿参数 。
【DeepSeek 发布 V3 模型更新:除了编程能力大幅提升,还有更宽松的开源协议】深度求索微信官方公众号也确认 , 本次更新属于小版本升级 , 目前已经在官方网页、App 小程序等入口开放 。
初代 V3 模型最为人所熟知的 , 可能还是「557.6万美金比肩Claude 3.5效果」的超级性价比 。 而更新后的模型由其新的 32KGPU 集群上改进的后训练提供支持 。
截至目前 , 还没有任何关于新版 DeepSeek V3 的能力基准测试榜单出现 , 但有了 DeepSeek V3 发布即成为 Chatbot Arena 榜单前十中唯一一个开源模型的刷榜历史 , 还是在发布一小时后迅速吸引来全球用户对其测试体验 。
根据目前最新的用户上手测试 , 新版 V3 模型前端编码能力的提升 , 是目前「感知最强」的部分 。 根据专业用户对新版 V3 的综合体验判断 , V3-0324 的提升幅度大约相当于 Sonnet 3.5 到 Sonnet 3.6 的提升 。
用户按照下面的提示词 , 同时对新版 V3 与 R1 下达任务 , 实际产出的效果已经出现巨大差异 。
创建一个包含 CSS 和 JavaScript 的单个 HTML 文件 , 以生成一个动画天气卡片 。 卡片应通过不同的动画直观地表示以下天气条件:风:(例如 , 移动的云朵、摇曳的树木或风线)雨:(例如 , 落下的雨滴、形成的水坑)晴:(例如 , 闪耀的光线、明亮的背景)雪:(例如 , 落下的雪花、积雪)并排显示所有天气卡片 。 卡片应具有深色背景 。 在此单个文件中提供所有 HTML、CSS 和 JavaScript 代码 。 JavaScript 应包含一种在不同天气条件之间切换的方法(例如 , 一个函数或一组按钮) , 以演示每种天气的动画 。
左侧是 DeepSeek 新版 V3 模型的生成结果 , 右侧为 R1 的生成结果 。
除了对比 R1, 用户还用类似的提示词 , 对比了 Claude 系列 。 Claude 3.7 作为目前号称「编程能力最强模型」 , 实际编程能力使用体验也是多次被评为「已经达到专家级程序员水准」 。
同一提示词给到 Claude 3.5/3.7 后 , 模型生成的前端内容如下所示:
除了这个测试案例 , 根据更多用户对之前 prompt 测试的结果 , 普遍结论是当前新版 V3 在编码能力已经接近claude3.7, 同时也是目前第一时间上手中 , 大家觉得比之前的 v3 能力提升最大的部分 。
针对前端网站搭建测试 , 新版 V3 所生成的网站(上)在与 Claude 3.7 Sonnet 生成的结果(下)中 , 也快速「拉齐」了网站的构建效果
除了编程能力 , 在其他用户的测试中 , 新版 V3 在多轮对话中体现出了更强的上下文理解能力 。
当然 , 与往常一样 , DeepSeek 也没有同时公开表示 R2 或者 V4 模型会在何时发布 , 但不少用户在体验过新版 V3 后 , 都觉得似乎 R2 的到来 , 也已经不远了 。
还有一个普通用户「感知不强」 , 但让开源社区非常兴奋的改变 。 新版 V3 的开源许可与 R1 一样 , 也更新变成了 MIT 开源许可(MIT License) , 这意味着新版 V3 有着比初代 V3 更宽松的开源使用条件 。
并且 MIT 开源许可一向以商业友好而著称 , 使用MIT许可的项目可以与商业和专有软件集成 , 这或许对于希望在商业项目中使用新版 V3 模型的开发者来讲 , 是本次更新最重要的改变了 。
推荐阅读
- DeepSeek昨夜上新!新旧版V3对比实测,代码能力飙升,震惊海外用户
- 英媒:中国的AI大模型技术,撕下了美国用AI赚钱的最后一块遮羞布
- 小米AI眼镜即将发布 对标海外知名品牌
- 估计余承东也没想到!华为的发布会,带火的却是努比亚
- 李开复点名:中国AI大模型或只剩3家!DeepSeek能笑到最后?
- 腾讯混元自研「T1」正式发布,混合Mamba架构无损应用于推理模型
- 中国大模型终局:李开复断言只剩三家?DeepSeek重拳砸OpenAI命门
- TCL第四代液晶电视发布,蝶翼华曜屏成Mini LED顶配
- 浙江AI产业大会:杭州算力平台正式发布!
- 6.3英寸,刚发布小屏手机,有点好看
