AI浪潮下,想抓住机遇还来得及吗? 错过AI工具,你的生意还能撑多久?
如今AI行业的变化速度远超想象,就像韩国偶像团体一样,新人不断涌现,还没等粉丝认熟,就推出了新版本。这些新面孔总能制造话题,但实际效果往往跟不上热度。而那些十年前就出道的AI前辈们,如今处境更加艰难,技术路线选择失误、转型困难、资金支持减弱,导致整体实力被拉下几个梯队。
这类企业可以统称为"掉队的AI企业"。以商汤为例,2021年赴港上市时,曾是全球估值最高的AI独角兽,但自2022年起股价持续下跌。截至2024年,市值已蒸发超过3000亿港元。创始团队的变动更是引发关注,人脸识别技术先驱汤晓鸥在2023年突然离世,联合创始人徐冰也于端午节前宣布辞去执行董事职务,转任AI芯片业务负责人。
商汤在公告中解释,这次调整是公司整体人才布局和业务聚焦的举措。这说明AI 1.0时代的核心技术已经难以支撑2.0时代的产业需求。为了实现转型,商汤展现出再次创业的决心。像这样的AI前浪企业还有很多,其中也包括一些快速崛起的后浪。
在AI 1.0时代最出圈的事件是2016年AlphaGo击败李世石,但同期中国AI创业公司更关注计算机视觉技术。这个赛道诞生了商汤、云从、旷视、依图等"AI四小龙"。计算机视觉技术之所以成为AI 1.0时代最早突破的子赛道,是技术成熟度、应用场景明确性、数据与硬件支持、市场需求共同作用的结果。
这些企业的创始团队大多来自港中大、清华等顶尖学府,能够写出前沿学术论文。科学家创业者们的集中出现,让技术从实验室到产业化的转化周期大幅缩短。2014年旷视推出的Face++人脸识别系统,准确率达到99.5%,远超传统方法。这种技术突破直接推动了安防、金融等行业的付费意愿,形成了人工智能技术落地的商业基础。
中国庞大的应用场景,又为计算机视觉企业提供了独特数据优势。商汤通过政府合作获取交通监控数据,云从依托银行客户积累金融场景样本,进一步升级核心技术。AI四小龙在资本市场的表现非常亮眼,但这一切都建立在两个假设上:技术领先必然转化为商业优势,以及政府支持能持续创造需求。
2020年后,这两个假设被推翻。政策重心转向应用落地,导致依赖单一政策支持的商业模式难以为继。投资人不再给AI四小龙无限子弹,市场开始用放大镜检视他们的财务状况。以商汤为例,2024年营收37.72亿元虽实现10.8%同比增长,但较2021年历史峰值47亿元仍低19.7%。2024年净亏损42.78亿元,相当于每天烧掉1172万元。
财务压力下,人力资源成本成为AI四小龙无法避免的问题。商汤自2021年起员工总数从6113人缩减至4672人,非核心业务被裁撤;云从去年实施全员降薪,新增IoT类设备达1.6亿台。创业公司能取得这个成绩已属不易,但在思必驰第一次冲击IPO时,上交所审核委员会质疑其核心技术是否具备硬科技属性。
这个质疑也适用于所有只能在垂直场景中安身立命的AI创业公司。通用大模型一旦成功,垂直领域AI公司将面临技术壁垒崩塌、成长天花板压低的问题。2.0时代,资本市场给企业证明盈利能力和经营可持续的时间不会太多。
商汤清楚作为1.0时代的"遗老",需要向市场证明自己有进入多模态竞技场的能力。算力成为这一切的基础,商汤大装置构建了面向大模型训练和推理的AI原生云算力基础设施,旗下的上海临港AIDC是亚洲最大的人工智能算力中心之一。
同时,商汤持续迭代自己的大模型,"日日新大模型"自2023年4月发布1.0版本以来,已更新到第6版,并被权威机构认可为国内大模型第一梯队。不过对比榜单中的其他大厂,商汤要保持技术优势难度不小。
以腾讯为例,原本在自研大模型竞争中表现不突出,但抓住DeepSeek开源的技术红利,配合腾讯云和微信,实现商业化逆袭。接入DeepSeek让腾讯原有业务活跃用户增长,截至2025年3月,微信/WeChat月活跃账户数达14亿。
腾讯在2024年Q4及2025年Q1财报中多次强调,AI技术投入将带来长期增长动力。困扰商汤等创业公司的盈利问题,在腾讯等大厂面前远不算生死攸关。这些大厂凭借人力财力、流量入口、商业生态,加上AI技术开源东风,可以达到纯AI创业公司难以企及的高度。
这一点,AI 2.0时代的"前辈"月之暗面也深有体会。DeepSeek-R1等开源模型性能对标GPT-4,免费开放API,削弱了Kimi的长文本技术壁垒。大厂整合开源模型优化自身产品,包括月之暗面背后的"金主"阿里,都可以用更低成本实现高性能,导致Kimi的差异化优势丧失。
于是月之暗面也迎来市场对其投资回报率和未来盈利能力的拷问。与AI四小龙相比,月之暗面的窘境本质相似,因此也在努力证明自己在多模态领域的进展。创始人杨植麟近期表示,多模态是公司当前重点投入方向。看到OpenAI发布的GPT-4o多模态能力后,"可能探索一些不一样的路径去适配市场和用户的一些实践"。
所谓的多模态,是指人工智能系统通过整合多种感知模态(如文本、图像、音频、视频等)进行综合理解与生成的技术范式。正因为涉及多种感知模态,市场对谁能跑出来、以什么产品形态跑出来,依然充满迷茫和分歧。投入与产出都是难以预测的数字。
就像没能在1.0时代完成上市的旷视,一边推动多模态大模型与麒麟AI PC操作系统融合,响应国家信创政策,一边又与吉利合作在高阶智能驾驶上压下重注。说到底,都是因为摸不准商业化成功路径,只能尽量多去尝试。