DeepSeek研究员在线爆料:过年都没歇 还有大招!

互联网 来源:新浪证券 2025-02-05 12:01:36

大年初四Daya Guo发了一条推文,透露了春节期间让他最兴奋的事情,亲眼见证了R1-Zero模型性能曲线的 “持续增长”,并且直言感受到了 强化学习(RL)的强大力量。

Daya Guo回复了网友有关DeepSeek R1的一些问题,以及接下来的公司的计划,只能说DeepSeek的R1仅仅只是开始,内部研究还在快速推进,DeepSeek的研究员过年都没歇,一直在爆肝推进研究,接下来DeepSeek还有大招。

网友提问:“如果不是秘密的话:这次RL训练跑了多久?”对此,Daya Guo表示,660B参数的R1-Zero和R1是在V3发布之后才开始跑的,训练大约花了2-3周。

此外,他还表示在尝试将R1应用于形式化证明环境,希望尽快向社区发布更好的模型。听Daya Guo的意思,他们在这方面已经有进展,未来可能会有更重磅的模型发布!期待值拉满!

延伸阅读
  • 国家队正式下场!DeepSeek上线超算互联网平台

    日前,中国人工智能初创公司DeepSeek火了,不仅在美区下载榜上超越ChatGPT,还引发多个美国科技股的股价暴跌。为了让更多领域的用户切实便捷地开展体验,国家超算互联网平台宣布上线DeepSeek

  • DeepSeek浪潮下Meta股价狂飙!豪取12连涨创历史新高

    令人没想到的是,Meta竟然成为了中国AI新势力DeepSeek引发全球浪潮下美股市场上的“最大赢家”。数据显示,Meta股价在周二收盘再度上涨1%,收报704.19美元,史上首次收盘站上700美元大

  • 郭明錤:台积电将成DeepSeek爆火的最大赢家

    近日,DeepSeek震撼全球市场,天风国际分析师郭明錤对此表示,未来将会出现更多类似DeepSeek的开源模型。且DeepSeek爆红后,将加速端侧AI化,台积电会成为最大受益者。台积电和英伟达均预

关注公众号:拾黑(shiheibook)了解更多

友情链接:

关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接