DeepSeek致谢腾讯技术团队:这是一次“巨大的加速”代码贡献!
DeepSeek致谢腾讯技术团队,这是一次“巨大的加速”代码贡献。
据新浪报道,腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。

经测试,优化后的通信框架性能在RoCE网络环境提升100%,IB网络环境提升30%,为企业开展AI大模型训练提供更高效的解决方案。
该技术方案获得了DeepSeek公开致谢,称这是一次“huge speedup(巨大的加速)”代码贡献。
据了解,自今年2月DeepSeek开源包括DeepEP在内的五大代码库以来,该团队便向业界展示了如何利用有限的硬件资源实现接近万卡集群的性能。
在这些技术中,DeepEP凭借突破性的方法提升了300%的通信效率,成功解决了MoE架构大模型对英伟达NCCL的依赖问题。但该技术在成本较低、适用面更广的RoCE网络环境中表现不佳,限制了其在更广泛场景的应用。这一痛点引发了开源社区的持续讨论。
据悉,腾讯星脉网络团队在DeepEP开源后便展开技术攻关,发现两大关键瓶颈:一是对于双端口网卡带宽利用率不足,二是CPU控制面交互存在时延。
在腾讯的技术优化下,DeepEP不仅在RoCE网络实现性能翻倍,反哺到IB(InfiniBand)网络时更使原有通信效率再提升30%。
目前,该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练推理,在腾讯星脉与H20服务器构建的高性能环境中,这套方案展现出出色的通用性。
-
张雪峰复播戴上眼镜:宣布和过去划清界限 再说脏话加倍处罚
近日,不少网友发现,张雪峰在复播后戴上了眼镜,看着很斯文。张雪峰在复播后宣布彻底告别过去与过去的自己划清界限。他表示:“之前因为各种各样的事情被通报处罚,为了跟之前的自己划清界限,从今天开始直播戴眼镜
-
OpenAI正式发布GPT-5.2!更实用:做表格、写PPT、敲代码等生产力大增
今天凌晨,OpenAI正式推出新一代大模型GPT-5.2,付费用户端及API同步开放。此举距上一代GPT-5.1发布不足一月,背后是谷歌Gemini 3引发的“红色警报”竞争压力——OpenAI此前紧
-
1000万粉丝网红女装店突然关停:经营16年 年销量超40万
近日,经营16年的网红大店“黑牛奶heiniunai”发布闭店公告。店铺公告显示:“微薄的利润无法支撑团队运转,持续的亏损,迫使我们不得不停下脚步。做出这个决定,心中充满了不舍与无奈。”资料显示,这家
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/
关注网络尖刀微信公众号随时掌握互联网精彩







水牛影视
