DeepSeek低调发布V3新模型

DeepSeek低调发布V3新模型
据闪德资讯获悉 , 近日 , DeepSeek毫无预告的情况下 , 在Hugging Face上放出了最新的DeepSeek-V3-0324模型 。

DeepSeek-V3-0324模型参数达685B , 目前在官方网站、APP和小程序上已经可以体验 , 需关闭深度思考 。
本次更新为小版本更新 , 并非此前呼声较高的DeepSeek-R2 。
但依然有不少亮点 , 甚至在某些能力已经与Claude 3.7 Sonnet相当接近 。
【DeepSeek低调发布V3新模型】从网友反馈的实测效果来看 , V3-0324有这些提升:
编码能力已经接近Claude3.7了 , 比之前的老版本v3能力要强;
提升幅度大约与Sonnet 3.5到Sonnet 3.6 一样 , 甚至还要大一点;
与R1相比 , V3-0324在生成前端代码方面有了明显改进;
数学能力也有提升 , 能像推理模型一样能够解题 。
DeepSeek-V3-0324依旧免费、开源 , 权重文件已火速上线HuggingFace , 使用最宽松的MIT协议 。
所有权重文件加起来占硬盘空间约688GB , 与初代v3保持一致 。

    推荐阅读