
位于旧金山的AI研究初创公司Deep Cogito由前谷歌员工创立 , 近日发布了四款新的开源大语言模型 , 这些模型在一个关键方面与众不同:它们能够学会如何更有效地推理 , 并且能够自主改进 。
这四款模型属于Cogito v2系列 , 参数规模从700亿到6710亿不等 , 面向AI开发者和企业用户开放使用 。 具体包括:
- Cogito v2-70B(密集型)
- Cogito v2-109B(专家混合型)
- Cogito v2-405B(密集型)
- Cogito v2-671B(专家混合型)
密集型模型在每次前向传播中激活所有参数 , 更适合低延迟应用和GPU容量有限的环境 。 专家混合型(MoE)模型采用稀疏路由机制 , 每次只激活少数专业化的\"专家\"子网络 , 在不成比例增加计算成本的情况下实现更大的模型规模 。
所有四款Cogito v2模型都设计为混合推理系统:它们既可以立即响应查询 , 也可以在需要时进行内部反思后再回答 。 关键在于 , 这种反思不仅仅是运行时行为 , 而是融合到训练过程本身中 。
这些模型被训练来内化自己的推理过程 。 这意味着它们得出答案的路径——可以说是思维步骤——被提炼回模型的权重中 。 随着时间推移 , 它们学会识别哪些思路真正重要 , 哪些不重要 。
Deep Cogito的CEO兼联合创始人Drishan Arora此前是谷歌的首席大语言模型工程师 , 他将公司的长期目标描述为构建能够推理并在每次迭代中改进的模型 , 类似于AlphaGo通过自我对弈完善策略的方式 。
在推理任务中 , 旗舰版671B MoE模型超越了DeepSeek R1 , 在使用60%更短推理链的情况下达到或超过其最新0528模型的性能 。 在MMLU、GSM8K和MGSM等基准测试中 , Cogito 671B MoE的表现与Qwen1.5-72B和DeepSeek v3等顶级开源模型相当 , 接近Claude 4 Opus和o3等闭源模型的性能水平 。
尽管模型规模庞大 , Deep Cogito声称其训练所有八个Cogito模型(包括较小的v1检查点)的总成本不到350万美元 , 相比之下 , 据报道OpenAI一些领先模型的成本超过1亿美元 。
这些模型现已在Hugging Face上提供下载 , 企业用户可通过Together AI、Baseten和RunPod的API接口使用 。 对于开发者、研究人员和企业团队来说 , 这些模型提供了一种不同的构建智能的方法:不是更努力地思考 , 而是学习如何更好地思考 。
Q&A
Q1:Deep Cogito的混合推理模型有什么特别之处?
A:Deep Cogito的模型具备自我改进的\"直觉\"能力 , 它们将推理过程融合到训练中 , 能够学会哪些思路重要哪些不重要 , 从而实现更快、更高效的推理 , 即使在标准模式下也能提升性能 。
Q2:Cogito v2模型的性能表现如何?
A:旗舰版671B MoE模型在推理任务中超越DeepSeek R1 , 使用60%更短的推理链达到相同性能 。 在MMLU、GSM8K等基准测试中表现与顶级开源模型相当 , 接近闭源模型性能水平 。
Q3:如何使用这些Cogito v2模型?
【Deep Cogito发布四款开源混合推理大语言模型】A:开发者可以在Hugging Face上下载这些模型 , 通过Unsloth进行本地使用 , 或者通过Together AI、Baseten和RunPod的API接口使用 。 模型支持立即响应和内部反思两种模式 。
推荐阅读
- 曝百度最快8月底发布新版推理模型 部分能力将超越OpenAI o3满血版
- 全新360安全云重磅发布:AI智能体驱动「安全即服务」新未来
- 华为Mate 80将在10月发布 最强鸿蒙手机
- 华为Mate XTs硬刚iPhone17:同日发布,谁会更胜一筹?
- iPhone 17发布时间泄露!相机5大升级曝光 8倍光学变焦能拍更远
- 傅利叶发布全新人形机器人“Care-bot”GR-3,定义“有爱的”交互新范式
- DeepMind掌门告诫马斯克:如果AI出问题,去火星也没用
- 外媒:谷歌DeepMind宣布推出新一代世界模型Genie 3
- 刚刚,苹果发布会定档9月,iPhone 17终于不挤牙膏了?
- 就是阻击OpenAI,Claude抢先数十分钟发布Claude Opus 4.1
