全新AI芯片，性能提升几何级数？边缘计算，它背后的技术逻辑是什么？

2025-10-15 08:50:31 作者：Vali编辑部

两年时间，足以让一个技术团队完成从实验室到产业落地的蜕变。当后摩智能CEO吴强博士再次站上WAIC舞台时，他带来的不仅是新的技术成果，更是一份关于存算一体技术未来发展的答卷。

这场发布会的焦点，是后摩智能历时两年研发的M50芯片。这款芯片以10W的典型功耗实现了160TOPS@INT8的物理算力，其能效比在业界处于领先位置。更值得关注的是，这款芯片背后的第二代存算一体技术，正在重新定义AI芯片的性能边界。

在传统计算机架构中，计算单元和存储单元如同分离的工厂，数据需要在两者之间反复搬运。这种冯·诺依曼架构的弊端在大模型时代愈发明显，成为制约算力提升的"功耗墙"和"存储墙"。而存算一体技术的出现，就像在工厂内部直接建立存储单元，让数据在本地完成计算，大幅提升了效率。

M50芯片的性能表现令人印象深刻。其153.6GB/s的超高带宽和48GB内存，配合100TFLOPS@bFP16的浮点算力，为端边大模型计算提供了强大支撑。这种性能优势来源于第二代SRAM-CIM技术的深度应用，通过结构性改变实现"双端口加载与计算并行"，让权重加载和矩阵计算同时进行。

在技术实现上，后摩智能团队攻克了多个关键难题。他们自主研发的MBIST和CBIST测试方案，解决了存算芯片量产的可靠性问题。这项技术突破让芯片在保持高性能的同时，实现了更长的使用寿命和更稳定的运行表现。

针对大模型计算特点，后摩智能还开发了全新的第二代IPU架构——天璇。这个架构的最大亮点在于弹性计算技术，它不像GPU的稀疏加速那样要求权重必须为0，而是允许在bit粒度进行优化。这种细粒度的调整让量化精度可以达到5bit甚至更低，同时保持模型性能。

在产品矩阵方面，后摩智能推出了覆盖终端和边缘的完整解决方案。力擎TM系列M.2卡以口香糖大小的体积，为AI PC和智能设备提供本地AI能力。而力谋®系列加速卡和计算盒子，则为工业质检、视频分析等场景提供了高算力支持。

从技术角度看，存算一体是差异化竞争的必然选择。面对英伟达、华为等巨头，后摩智能选择了一条技术创新的路线。这种选择也符合大模型时代的趋势，因为传统架构在算力和带宽需求面前已显疲态。

在产业应用层面，后摩智能的产品矩阵正在构建新的生态。从消费终端的AI PC到工业场景的产线质检，这些设备都具备了运行本地大模型的能力。这种低功耗、高安全的特性，让AI技术真正走进千家万户。

技术发展从来不是一蹴而就的过程。两年时间，后摩智能完成了从技术验证到产品落地的跨越。这种坚持不仅赢得了产业和资本的认可，也为AI芯片行业开辟了新的发展方向。

发布会最后透露的两个细节，展现了团队对未来的规划。跳过M40命名的"玄学"，暗示着技术突破的必然性。而承诺明年推出新品，则预示着存算一体技术将进入加速发展阶段。