伯克利团队仅30美元复制DeepSeek AI_Windows

伯克利团队以30美元复制DeepSeek AI的核心功能，推出开源项目TinyZero ，证明AI研究不再是高成本领域，降低了进入门槛，推动了更广泛的技术应用。
人工智能研究通常是巨头企业的专属游戏，这些公司拥有深厚的财力支持。然而，伯克利加州大学的一支研究团队却打破了这一局面。他们仅以30美元复制了DeepSeek R1-Zero的核心功能。他们的项目名为TinyZero ，证明先进的人工智能推理模型并不需要耗费巨额资金。更重要的是，人工智能研究比以往任何时候都更容易接近。
在潘佳乂的带领下，该团队旨在通过强化学习(Reinforcement Learning ， RL)重新构建DeepSeek的推理模型。与依赖昂贵的云服务或巨大的计算能力不同，他们使用了一个基本的语言模型、一个简单的提示和一个奖励系统来训练TinyZero 。
Jiayi Pan在X平台上分享了他的兴奋之情，表示：“你可以亲身经历那一刻，只需不到30美元。 ”他还将TinyZero描述为第一个开源的推理模型复现项目，强调了它如何学会验证和完善自己的答案。
如何开发TinyZero
【伯克利团队仅30美元复制DeepSeek AI】为了测试模型，研究人员选择了一个名为Countdown的游戏，玩家需要通过基本的数学运算来达到目标数字。尽管TinyZero最初是随机猜测，但随着时间的推移，它学会了验证自己的答案、寻找更好的解决方案并相应地进行调整。
他们尝试了不同规模的模型，从50亿参数到700亿参数。结果是什么？参数规模较小的模型(50亿参数)只是随机猜测答案然后停止。而参数规模较大的模型(150亿参数及以上)则学会了自我验证、完善解决方案并显著提高了准确率。
TinyZero真正引人注目的地方在于，与传统的人工智能模型相比，它的成本低得惊人。看看这些对比：
* OpenAI的API：每百万tokens收费15美元
* DeepSeek-R1：每百万tokens收费0.55美元
* TinyZero的总成本：一次性训练成本30美元
这意味着任何人(不仅仅是大型科技公司)都可以在无需烧钱到破产的情况下实验人工智能推理模型。
可用性
TinyZero是开源的，并且可以在GitHub上找到，因此任何人都可以尝试改进它。尽管它目前仅在Countdown游戏中进行了测试，但潘佳乂希望这个项目能够使强化学习研究更加普及。
当然，这仍然是一个早期阶段。 “当然，其中一个缺点是，它仅在Countdown任务中得到了验证，但尚未在一般推理领域中得到验证。 ”Pan承认。但即便如此，其影响仍然是显而易见的：人工智能的发展并不一定要昂贵。有了像TinyZero这样的项目，低成本、开源的人工智能或许将成为未来的趋势。
本文译自 Gizmochina ，由BALI编辑发布。

伯克利团队仅30美元复制DeepSeek AI

推荐阅读

割韭菜有讲究

华润燃气是国企吗

物权的效力是哪些

如何挑选N93水机

梦见自己弟弟订婚梦见自己弟弟订婚是什么意思

纸上得来终觉浅绝知此事要躬行是什么意思纸上得来终觉浅绝知此事要躬行出自哪里？

女生痛经怎么快速止痛 8个小妙招帮你缓解

南京线下办理医保余额直系亲属转移需要什么材料

意大利生菜冬天保存方法

男闺蜜是什么男闺蜜的意思

苹果x突然黑屏关机了怎么回事，三星平板突然黑屏开不了机怎么办

郭敬明回应爵迹3什么时候能见到爵迹冷血狂宴

小米手机2，小米2手机质量怎么样?值得买吗? -

章子怡汪峰视频，汪峰章子怡深夜现身酒吧

头皮痒需要注意些什么头皮发痒的原因

什么化妆品店好,估值50亿的化妆品店