
伯克利团队以30美元复制DeepSeek AI的核心功能 , 推出开源项目TinyZero , 证明AI研究不再是高成本领域 , 降低了进入门槛 , 推动了更广泛的技术应用 。
人工智能研究通常是巨头企业的专属游戏 , 这些公司拥有深厚的财力支持 。 然而 , 伯克利加州大学的一支研究团队却打破了这一局面 。 他们仅以30美元复制了DeepSeek R1-Zero的核心功能 。 他们的项目名为TinyZero , 证明先进的人工智能推理模型并不需要耗费巨额资金 。 更重要的是 , 人工智能研究比以往任何时候都更容易接近 。
在潘佳乂的带领下 , 该团队旨在通过强化学习(Reinforcement Learning , RL)重新构建DeepSeek的推理模型 。 与依赖昂贵的云服务或巨大的计算能力不同 , 他们使用了一个基本的语言模型、一个简单的提示和一个奖励系统来训练TinyZero 。
Jiayi Pan在X平台上分享了他的兴奋之情 , 表示:“你可以亲身经历那一刻 , 只需不到30美元 。 ”他还将TinyZero描述为第一个开源的推理模型复现项目 , 强调了它如何学会验证和完善自己的答案 。
如何开发TinyZero
【伯克利团队仅30美元复制DeepSeek AI】为了测试模型 , 研究人员选择了一个名为Countdown的游戏 , 玩家需要通过基本的数学运算来达到目标数字 。 尽管TinyZero最初是随机猜测 , 但随着时间的推移 , 它学会了验证自己的答案、寻找更好的解决方案并相应地进行调整 。
他们尝试了不同规模的模型 , 从50亿参数到700亿参数 。 结果是什么?参数规模较小的模型(50亿参数)只是随机猜测答案然后停止 。 而参数规模较大的模型(150亿参数及以上)则学会了自我验证、完善解决方案并显著提高了准确率 。
TinyZero真正引人注目的地方在于 , 与传统的人工智能模型相比 , 它的成本低得惊人 。 看看这些对比:
* OpenAI的API:每百万tokens收费15美元
* DeepSeek-R1:每百万tokens收费0.55美元
* TinyZero的总成本:一次性训练成本30美元
这意味着任何人(不仅仅是大型科技公司)都可以在无需烧钱到破产的情况下实验人工智能推理模型 。
可用性
TinyZero是开源的 , 并且可以在GitHub上找到 , 因此任何人都可以尝试改进它 。 尽管它目前仅在Countdown游戏中进行了测试 , 但潘佳乂希望这个项目能够使强化学习研究更加普及 。
当然 , 这仍然是一个早期阶段 。 “当然 , 其中一个缺点是 , 它仅在Countdown任务中得到了验证 , 但尚未在一般推理领域中得到验证 。 ”Pan承认 。 但即便如此 , 其影响仍然是显而易见的:人工智能的发展并不一定要昂贵 。 有了像TinyZero这样的项目 , 低成本、开源的人工智能或许将成为未来的趋势 。
本文译自 Gizmochina , 由BALI编辑发布 。
推荐阅读
- 仅630的百元神机!硬件护眼LCD屏+高通5G低功强U+双面玻璃机身
- 华为开启降价模式!256GB版仅2315元,麒麟8000+6000万像素自拍
- DeepSeek 团队神操作:用“汇编”取代CUDA 让性能狂飙
- 仅1699!天玑9300+顶级性能旗舰再创新低:最物美价廉游戏神机
- 国内智能手机畅销榜更新:红米K80仅排第四,第一名意料之中
- 仅需1658元!骁龙8Gen2+5000万主摄,荣耀90 GT性价比爆棚!
- 仅1998!颜值第一的骁龙8 Gen3旗舰:定制小屏+超声波指纹+2亿相机
- 中端机搅局者!仅2498元,骁龙8gen3+16GB大内存,让你秒变玩家!
- 仅2799的超廉价折叠屏手机!骁龙旗舰芯+内外双大屏,性价比太猛
- OPPO终于妥协,天玑9400+IP69防水,发布仅三个月售价一降再降
