
文章图片

文章图片

文章图片

文章图片

文章图片

文章图片
作者 | 陈骏达
编辑 | 漠影
智东西3月25日报道 , 昨日晚间 , DeepSeek在开源平台悄然上线了升级后的DeepSeek-V3模型 。 新模型的版本号为DeepSeek-V3-0324 , 模型参数为6850亿 , 较早期版本的6710亿有小幅增长 。 不过 , DeepSeek尚未放出新版模型的系统卡 , 我们暂时无法获取关于这款模型的更多信息 。
开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
同时 , DeepSeek也将DeepSeek-V3模型的开源协议更新为与DeepSeek-R1一致的MIT协议 , 这一协议更为宽松 , 允许模型蒸馏、商用等行为 , 给了开发者更多的自主权 。
新版DeepSeek-V3上线后 , 智东西第一时间进行了代码、数学和通用能力等多方面的测试 , 并关注到广大网友的测试结果 。 据众多已经体验上这款模型的网友分享 , 升级后的DeepSeek-V3在代码、数学等方面有明显的性能提升 。
一位海外AI博主称 , DeepSeek终于能在代码领域和Anthropic的Claude Sonnet 3.5一决高下了 。 而之前 , Claude Sonnet 3.5在程序员圈内拥有极高的声誉 , 无论诸多模型在代码上的成绩如何变化 , 程序员依旧更青睐使用Claude系列模型 。
在智东西的测试中 , 新版DeepSeek-V3在网站开发能力、UI设计方面展现出巨大的进步 , 在输入“设计一个美观的个人博客网站 , 带有科技感 , 直接开发成可用网页”的提示词之后 , 直接获得了如下的网页效果 。
新版DeepSeek-V3在2分钟的时间内交付了一个总计400多行代码、设计精良的网站 , 据其介绍 , 网站采用了粒子背景动画、赛博朋克UI(霓虹光效、悬浮动画和科技感配色)等设计元素 , 标题使用打字机动画 , 按钮具备光波扩散效果 。
这一网站还使用了响应式设计 , 能自动适配手机和桌面设备 。
而当旧版DeepSeek-V3获得相同的指令时 , 其解决方案仅有100多行代码 , 输出的结果在审美上也不如新版的DeepSeek-V3 。
有网友称 , 这次的“小更新”比预期中的更大 , 改进显著 , 尤其是在数学方面 。
智东西将之前实测中 , 曾难倒旧版DeepSeek-V3和DeepSeek-R1的一道数学题交给新版DeepSeek-V3 。 这次 , DeepSeek-V3输出的token与原版DeepSeek-V3总量明显更长 , 单次输出达到了输出上限 , 点击继续生成后 , DeepSeek-V3继续思考 , 但这次的答案依旧是错误的 。
不过 , 从错误的答案中 , 我们也能观察到一些新的变化 , 如今的DeepSeek-V3在给出最终答案后 , 会进行一定程度的反思 , 并修改自己的解题过程 。
而在智东西先前测试的文科类问题上 , 新版DeepSeek-V3的答案变得更为全面 。 智东西的测试问题为:“布须曼人喝不喝牛奶?”旧版DeepSeek-V3对这一问题的回答仅有三小段话 , 信息量不多 。
新版DeepSeek-V3采用了更为结构化的回答模式 , 分析的内容更为全面 , 补充了更多的背景信息 , 同时生成的速度依旧比较理想 。
这也印证了部分网友总结出来的特点:新版DeepSeek-V3像是V3与R1的结合体 , 更倾向用长输出解决问题 。
新版DeepSeek-V3的发布 , 也让诸多网友不禁遐想:新版V3都来了 , R2和V4还会远吗?
【DeepSeek昨夜上新!新旧版V3对比实测,代码能力飙升,震惊海外用户】
推荐阅读
- DeepSeek 发布 V3 模型更新:除了编程能力大幅提升,还有更宽松的开源协议
- 22000mAh+2TB,最近上架这国产机有点过分啊
- 李开复点名:中国AI大模型或只剩3家!DeepSeek能笑到最后?
- 中国大模型终局:李开复断言只剩三家?DeepSeek重拳砸OpenAI命门
- 鸿蒙生态软硬件双突破!再发重磅新机,鸿蒙版交管12123正式上线!
- 解封5.5G:iPhone16、15、14、13系列后来者居上
- 899元!华为憋了2年的新机,终于上架了
- 元宝土味刷墙广告爆火!狂砸3.8亿日活飙20倍,干翻DeepSeek?
- Meta的重大投资:650亿美元押在人形机器人上
- 全系标配华为高阶智驾,问界新M5 Ultra正式上市
