曝DeepSeek跳出英伟达限制绕过CUDA 为适配中国国产GPU做准备

互联网 来源:快科技 2025-02-05 11:15:27

DeepSeek全球爆火,再一次引发外界对GPU算力限制话题的关注。

据报道,DeepSeek开发的大语言模型绕过了英伟达的CUDA框架,正为未来兼容国产GPU芯片做准备。

众所周知,英伟达的CUDA(Compute Unified Device Architecture,统一运算架构)能大幅降低研发大模型的难度,获全球开发商使用,一举将英伟达推上AI芯片领域的垄断地位。

但最新发现显示,DeepSeek使用英伟达的H800芯片训练时,使用英伟达底层硬件指令PTX(Parallel Thread Execution)语言,而非高级编程语言CUDA。

这样意味着DeepSeek绕过了CUDA,使用更底层的编程语言做优化。

对于程序开发人员来说,CUDA是一种更加友好的高级语言,开发者只需要专注于程序和算法最相关的运行逻辑,而不太需要考虑具体的程序是如何在GPU等硬件上具体如何执行计算的,从而能够降低开发难度。

而PTX在接近汇编语言的层级运行,允许进行细粒度的优化,如寄存器分配和Thread / Warp级别的调整。这种编程非常复杂且难以维护,所以行业通用的做法是使用CUDA这样的高级编程语言。

换句话说,DeepSeek把优化做到了极致。

北京航空航天大学副教授黄雷表示,绕过CUDA可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。

这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。假如它之后使用国产GPU,其在硬件适配方面将会更得心应手,其只要了解这些硬件驱动提供的一些基本函数接口,就可以仿照英伟达GPU硬件的编程接口去写相关的代码,从而让自家大模型更加容易适配国产硬件。

“这凸显了DeepSeek非凡的工程水平,并表明美国对华制裁加剧的“GPU短缺危机”激发了他们紧迫感和创造力。”韩国Mirae Asset Securities Research的一名分析师表示。

延伸阅读
  • 国家队正式下场!DeepSeek上线超算互联网平台

    日前,中国人工智能初创公司DeepSeek火了,不仅在美区下载榜上超越ChatGPT,还引发多个美国科技股的股价暴跌。为了让更多领域的用户切实便捷地开展体验,国家超算互联网平台宣布上线DeepSeek

  • DeepSeek浪潮下Meta股价狂飙!豪取12连涨创历史新高

    令人没想到的是,Meta竟然成为了中国AI新势力DeepSeek引发全球浪潮下美股市场上的“最大赢家”。数据显示,Meta股价在周二收盘再度上涨1%,收报704.19美元,史上首次收盘站上700美元大

  • 郭明錤:台积电将成DeepSeek爆火的最大赢家

    近日,DeepSeek震撼全球市场,天风国际分析师郭明錤对此表示,未来将会出现更多类似DeepSeek的开源模型。且DeepSeek爆红后,将加速端侧AI化,台积电会成为最大受益者。台积电和英伟达均预

关注公众号:拾黑(shiheibook)了解更多

友情链接:

关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接