国产芯片迎来井喷?UE8M0 FP8技术到底有何不同?

2025-10-12 11:05:18 作者:Vali编辑部

DeepSeek V3.1发布后,一则官方留言让整个AI圈都轰动了:

新的架构、下一代国产芯片,总共短短不到20个字,却蕴含了巨大信息量。

国产芯片企业股价也跟风上涨,比如寒武纪今日早盘盘中大涨近14%,总市值跃居科创板头名。

半导体ETF,同样也是在半天的时间里大涨5.89%。(不知道作为放出消息的DeepSeek背后公司幻方量化,有没有趁机炒一波【手动狗头】)

这个UE8M0 FP8到底是个啥?下一代国产芯片,又是指什么?

接踵而来的疑问,挤爆了人们的大脑。

在知乎上,也有不少大神开始边科普边分析自己对这件事的理解。

咱抱着学习心态,不妨就从UE8M0 FP8的概念开始说起。

什么是UE8M0 FP8?

“UE8M0 FP8”这个概念,可以拆分成前后两个部分来解释,前面的UE8M0,是MXFP8路径里的“缩放因子”。

MXFP8是Open Compute Project在2023年发布的《Microscaling (MX) Formats Specification v1.0》里定义的8 bit微缩块格式。

Open Compute Project是2011年由Facebook(现Meta)联合英特尔、Rackspace等发起的开源硬件协作计划,目的是通过共享数据中心及服务器设计推动行业效率提升。

其成员阵容相当强大,国外还有微软、谷歌、亚马逊、AMD、英伟达等,而国内的阿里、腾讯、百度等也参与其中。

说回MXFP8,它以FP8为基础建立,FP8是把常规浮点格式压缩到8 bit的一种编码方式。

MXFP8的核心思想是先把张量切成固定长度的“块”,然后为每个块单独指定一个2的整数次幂作为“缩放因子”,把块内所有数一起除以这个系数后再写成FP8。

这种块级(而不是全张量级)的缩放,让MXFP8既保留了8 bit位宽,又把可用动态范围扩展了几十倍。

△来源:英伟达技术博客

而这里的“缩放因子”也是包含8个bit,其中包含符号位、指数位和尾数位,开发者可以自行将这8个bit分配给这三种不同的位。

其中符号位只区分有无,若有则占一个bit,无则不占用,而UE8M0中的U表示的就是无符号(有符号可表示为S或省略不写)。

E和M则分别表示指数位和尾数位分配到的bit数,E8M0指的就是8个bit全都分配给了指数位。

其他常用的格式还有E4M3、E5M2(缩放引子外的本体部分也常采用这两种)等,它们均包含符号位,其余7个bit在指数和尾数位之间分配。

DeepSeek之前开源的5.6k星标项目FP8 GEMM内核DeepGEMM就已经支持UE8M0,不过这个项目主要是适配英伟达芯片和CUDA生态。

那么,采用这种全指数表示缩放因子的方式,有什么好处呢?

首先,由于UE8M0不含尾数与符号位,处理器在根据缩放因子对数据进行复原时,只需要乘以对应的2的幂,也就是移动一下指数位,而不需要浮点乘法、规格化或舍入逻辑,缩短了时钟关键路径。

并且UE8M0的动态范围覆盖2^(−127)到2^128,其指数表可轻松容纳这一跨度,为后续块缩放提供充足空间。

另外UE8M0还能解决单尺度FP8无法同时顾及大/小值,导致溢出或被压缩的问题,这种分块处理方式让精度控制更灵活。

说到这儿,问题来了——为什么偏偏选择这种格式?

从性能角度看,UE8M0 FP8的带宽占用比传统FP8低30%以上,这对芯片厂商来说是个重大利好。

特别是当下国产芯片普遍面临算力瓶颈,这种格式恰好能帮助他们突破性能天花板。

现在回过头看,DeepSeek这次改动看似随意,实则暗藏玄机。

谁会是受益者?

寒武纪的旗舰产品,海光的深算三号DCU,沐曦的曦云C600,中昊芯英的“刹那”TPU,摩尔线程的MTT S5000,这些厂商都可能因此受益。

尤其是华为昇腾,虽然目前不支持原生FP8,但官方路线图已经明确表示2025Q4将推出原生FP8版本。

这意味着,这些厂商在未来两年内都有望赶上技术浪潮。

从市场反应来看,国产芯片概念集体高开,科创50指数大涨3%,芯片产业链全线走强。

这种集体狂欢背后,是市场对国产芯片前景的信心。

说到底,这代表了国产AI正走向软硬协同阶段。

DeepSeek通过改动精度格式,相当于主动贴合国产芯片的最佳性能点,这种软硬协同的模式无疑是把国产芯片们拉进了一个统一的生态坐标系。

就像当年的“Wintel联盟”一样——微软和英特尔通过深度技术绑定,筑起了个人计算机领域的生态护城河,只不过如今换成了DeepSeek和国产芯片厂商们。

One More Thing

事实上,官方在正文部分提到UE8M0 FP8的只有一句话:

需要注意的是,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。

而且位置相当“隐蔽”,藏在了一大段洋洋洒洒的功能更新介绍之后。

要不是官方特意在评论区补了一句,估计大家还没啥感觉。

所以你说它这个动作吧,不知道算无意还是刻意为之,总之是相当微妙了(手动狗头)。

参考链接:

[1]https://www.valimart.net/

[2]https://www.valimart.net/

[3]https://www.valimart.net/

[4]https://www.valimart.net/