DeepSeek昨夜上新！新旧版V3对比实测，代码能力飙升，震惊海外用户deepseek

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

作者 | 陈骏达
编辑 | 漠影
智东西3月25日报道，昨日晚间， DeepSeek在开源平台悄然上线了升级后的DeepSeek-V3模型。新模型的版本号为DeepSeek-V3-0324 ，模型参数为6850亿，较早期版本的6710亿有小幅增长。不过， DeepSeek尚未放出新版模型的系统卡，我们暂时无法获取关于这款模型的更多信息。

开源地址：https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
同时， DeepSeek也将DeepSeek-V3模型的开源协议更新为与DeepSeek-R1一致的MIT协议，这一协议更为宽松，允许模型蒸馏、商用等行为，给了开发者更多的自主权。
新版DeepSeek-V3上线后，智东西第一时间进行了代码、数学和通用能力等多方面的测试，并关注到广大网友的测试结果。据众多已经体验上这款模型的网友分享，升级后的DeepSeek-V3在代码、数学等方面有明显的性能提升。
一位海外AI博主称， DeepSeek终于能在代码领域和Anthropic的Claude Sonnet 3.5一决高下了。而之前， Claude Sonnet 3.5在程序员圈内拥有极高的声誉，无论诸多模型在代码上的成绩如何变化，程序员依旧更青睐使用Claude系列模型。

在智东西的测试中，新版DeepSeek-V3在网站开发能力、UI设计方面展现出巨大的进步，在输入“设计一个美观的个人博客网站，带有科技感，直接开发成可用网页”的提示词之后，直接获得了如下的网页效果。
新版DeepSeek-V3在2分钟的时间内交付了一个总计400多行代码、设计精良的网站，据其介绍，网站采用了粒子背景动画、赛博朋克UI（霓虹光效、悬浮动画和科技感配色）等设计元素，标题使用打字机动画，按钮具备光波扩散效果。

这一网站还使用了响应式设计，能自动适配手机和桌面设备。

而当旧版DeepSeek-V3获得相同的指令时，其解决方案仅有100多行代码，输出的结果在审美上也不如新版的DeepSeek-V3 。

有网友称，这次的“小更新”比预期中的更大，改进显著，尤其是在数学方面。

智东西将之前实测中，曾难倒旧版DeepSeek-V3和DeepSeek-R1的一道数学题交给新版DeepSeek-V3 。这次， DeepSeek-V3输出的token与原版DeepSeek-V3总量明显更长，单次输出达到了输出上限，点击继续生成后， DeepSeek-V3继续思考，但这次的答案依旧是错误的。
不过，从错误的答案中，我们也能观察到一些新的变化，如今的DeepSeek-V3在给出最终答案后，会进行一定程度的反思，并修改自己的解题过程。

而在智东西先前测试的文科类问题上，新版DeepSeek-V3的答案变得更为全面。智东西的测试问题为：“布须曼人喝不喝牛奶？”旧版DeepSeek-V3对这一问题的回答仅有三小段话，信息量不多。

新版DeepSeek-V3采用了更为结构化的回答模式，分析的内容更为全面，补充了更多的背景信息，同时生成的速度依旧比较理想。

这也印证了部分网友总结出来的特点：新版DeepSeek-V3像是V3与R1的结合体，更倾向用长输出解决问题。

新版DeepSeek-V3的发布，也让诸多网友不禁遐想：新版V3都来了， R2和V4还会远吗？
【DeepSeek昨夜上新！新旧版V3对比实测，代码能力飙升，震惊海外用户】

DeepSeek昨夜上新！新旧版V3对比实测，代码能力飙升，震惊海外用户

推荐阅读

龙族幻想小城故事异闻怎么触发小城故事异闻攻略

2023开福区浏阳河街道社区卫生服务中心免费体检指南

伤情的句子伤情的句子范例

中山养老保险变更办理材料

泡发好海带能存几天

mit是什么意思

熊怎么读英语

谁清楚厨房地砖用仿古砖好吗

初三学生怎样戒掉玩游戏瘾初中生怎样戒掉游戏瘾

三星a9怎么截屏？三星a9截图方法教程

蓝牙 4.0

小户型|不怕宅基地小，150平也能建双拼别墅，两兄弟完全不用争吵

我来教你OS14.3支持双卡独立5G吗 IOS14.3有双卡独立5G功能吗。

怎样分辨狗狗的品种主人是如何认得出自己的狗狗,怎么区分小狗的品种

枣庄市中区2017房价,枣庄房价什么时候能跌

母仓鼠什么特征,仓鼠快生宝宝的特征是什么