华为正式开源UCM技术:最大提升22倍 AI推理性能跃升
近日,华为宣布针对AI推理加速的关键技术——UCM(Unified Cache Manager)推理记忆数据管理正式开源。
UCM以KV Cache多级缓存和推理记忆管理为中心,通过推理框架、算力、存储的三层协同,破解长序列推理效率低、成本高的难题,为企业提供更优的AI推理体验。

据介绍,UCM融合了多类型缓存加速算法工具,可分级管理在推理过程中产生的KV Cache记忆数据。
UCM具备四大关键能力:稀疏注意力、前缀缓存、预填充卸载、异构PD解耦。
它实现首Token时延最高降低90%,系统吞吐最大提升22倍,并达到10倍级上下文窗口扩展,显著提升了AI推理性能。
目前,UCM已在ModelEngine社区开放基础框架与工具链,开发者可通过社区获取UCM源代码与技术文档。

UCM产品架构
-
追觅年终全体员工每人发1克黄金 需要花费2600万元
南方都市报报道,有追觅科技内部人士透露,公司创始人兼CEO俞浩近日在内部宣布,今年春节将向每位员工额外发放1克黄金作为奖励。近期金价持续攀升,伦敦现货黄金及COMEX黄金期货在12月24日分别首次突破
-
NVIDIA花200亿美元收购Grop:补足GPU短板 未来市值看上7.5万亿
在成为AI最大赢家之后,NVIDIA近年来投资、收购了不少AI生态圈的企业,但金额都不大,前几天突然花了200亿美元收购Groq,震撼了业界。Groq公司9月份的融资中,估值不过69亿美元,NVIDA
-
小孩误触商场展车撞入手机店 车企:有人关闭了展车模式
据媒体报道,广东中山万象汇商场内近日发生一起意外。一辆参展汽车撞入一家手机店,造成店铺墙面受损,所幸未导致人员伤亡。事故发生在12月27日晚8时许,据车企工作人员解释,商场内的展车通常设有“展车模式”
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/
关注网络尖刀微信公众号随时掌握互联网精彩







lovesisi
