全新AI芯片,性能提升几何级数?边缘计算,它背后的技术逻辑是什么?

2025-10-15 08:50:31 作者:Vali编辑部

两年时间,足以让一个技术团队完成从实验室到产业落地的蜕变。当后摩智能CEO吴强博士再次站上WAIC舞台时,他带来的不仅是新的技术成果,更是一份关于存算一体技术未来发展的答卷。

这场发布会的焦点,是后摩智能历时两年研发的M50芯片。这款芯片以10W的典型功耗实现了160TOPS@INT8的物理算力,其能效比在业界处于领先位置。更值得关注的是,这款芯片背后的第二代存算一体技术,正在重新定义AI芯片的性能边界。

在传统计算机架构中,计算单元和存储单元如同分离的工厂,数据需要在两者之间反复搬运。这种冯·诺依曼架构的弊端在大模型时代愈发明显,成为制约算力提升的"功耗墙"和"存储墙"。而存算一体技术的出现,就像在工厂内部直接建立存储单元,让数据在本地完成计算,大幅提升了效率。

M50芯片的性能表现令人印象深刻。其153.6GB/s的超高带宽和48GB内存,配合100TFLOPS@bFP16的浮点算力,为端边大模型计算提供了强大支撑。这种性能优势来源于第二代SRAM-CIM技术的深度应用,通过结构性改变实现"双端口加载与计算并行",让权重加载和矩阵计算同时进行。

在技术实现上,后摩智能团队攻克了多个关键难题。他们自主研发的MBIST和CBIST测试方案,解决了存算芯片量产的可靠性问题。这项技术突破让芯片在保持高性能的同时,实现了更长的使用寿命和更稳定的运行表现。

针对大模型计算特点,后摩智能还开发了全新的第二代IPU架构——天璇。这个架构的最大亮点在于弹性计算技术,它不像GPU的稀疏加速那样要求权重必须为0,而是允许在bit粒度进行优化。这种细粒度的调整让量化精度可以达到5bit甚至更低,同时保持模型性能。

在产品矩阵方面,后摩智能推出了覆盖终端和边缘的完整解决方案。力擎TM系列M.2卡以口香糖大小的体积,为AI PC和智能设备提供本地AI能力。而力谋®系列加速卡和计算盒子,则为工业质检、视频分析等场景提供了高算力支持。

从技术角度看,存算一体是差异化竞争的必然选择。面对英伟达、华为等巨头,后摩智能选择了一条技术创新的路线。这种选择也符合大模型时代的趋势,因为传统架构在算力和带宽需求面前已显疲态。

在产业应用层面,后摩智能的产品矩阵正在构建新的生态。从消费终端的AI PC到工业场景的产线质检,这些设备都具备了运行本地大模型的能力。这种低功耗、高安全的特性,让AI技术真正走进千家万户。

技术发展从来不是一蹴而就的过程。两年时间,后摩智能完成了从技术验证到产品落地的跨越。这种坚持不仅赢得了产业和资本的认可,也为AI芯片行业开辟了新的发展方向。

发布会最后透露的两个细节,展现了团队对未来的规划。跳过M40命名的"玄学",暗示着技术突破的必然性。而承诺明年推出新品,则预示着存算一体技术将进入加速发展阶段。