Hugging Face榜单,中国AI模型为何能登顶? 这背后,哪些技术驱动了这场变革?
最近国产大模型的开源动作频频,简直像开了挂一样。
MiniMax、Kimi、Qwen、混元、智谱、昆仑万维这些名字,现在几乎成了开源界的常客。
最让人意外的是,国内模型开源的速度比海外还快。
这波操作,把整个AI世界都搅动起来了。
昨天我照例打开hugging Face网站,结果眼前一幕让我愣住了。
榜单前10名全是咱们的开源模型,连国外的都没挤进去。
智谱的GLM-4.5直接登顶,Air排第六,Qwen一口气占了五个位置,混元的3D世界模型也进了前三。
短短两年时间,国内大模型就完成了从跟跑到领跑的转变。
本来想整理一下这些模型的详细信息,结果发现最近国内开源的项目比想象中多。
于是决定做一个月的全面盘点,看看国产开源力量到底有多强。
找来了好朋友刘聪NLP,他可是AI圈里出了名的硬核技术博主。
没想到他居然整理了一份完整的榜单,这下可省了不少力气。
接下来要讲的这些模型,都是他亲自评测过的。
6月27号,腾讯混元A13B模型正式开源,80B参数量填补了70-80B尺寸的空白。
6月30日,百度ERNIE4.5开源,覆盖了纯LLM和多模态模型,参数规模选择也很全面。
7月1日,阿里通义开源了ThinkSound音频模型,这个模型能给视频配音,让每帧画面都有专属音效。
7月2号,智谱GLM-4.1V-Thinking模型惊艳登场,刘聪的评测说这个9B参数量的视觉理解模型表现太亮眼了。
7月4日,昆仑万维开源了Skywork-Reward-V2系列奖励模型,包含8个不同参数量的版本。
7月5号,邱锡鹏团队开源MOSS-TTSD,基于百万小时音频训练,不过已经很久没更新了。
7月8号,蚂蚁集团知识引擎团队推出KAG-Thinker模型,这是一个能处理复杂推理的交互式模型,不过文档说明不太详细。
7月9号,昆仑万维开源Skywork-R1V3多模态模型,基于InternVL-38B训练效果更优。
7月11号,Kimi开源K2模型,基础版和微调版下载量很快就突破了12k。
7月21号,阿里Qwen3-235B-A22B-Instruct-2507模型登榜第十位,之后连续推出多个版本。
7月22号,Qwen3-Coder-480B-A35B-Instruct模型排第二,7月25号Think版本排第五。
7月26号,上海人工智能实验室开源Intern-S1科学多模态模型,参数量达241B。
7月27号,腾讯混元1.0-HunyuanWorld-1模型开源,这是首个开源的3D世界生成模型,为游戏开发带来新可能。
7月28号,阿里通义万相团队推出Wan2.2视频生成模型,支持文生视频、图生视频和统一视频生成。
7月28号,智谱GLM-4.5系列模型登顶,社区反响热烈。
7月30号,Qwen3-30B-A3B-Instruct-2507模型开源,这是亲民版小参数模型,适合本地部署。
7月30号,昆仑万维推出Skywork-UniPic-1.5B多模态统一模型,具备图像理解、生成和编辑三大能力。
7月31号,Qwen继续开源Think版本模型,阶跃要Step3模型也准备上线。
整理过程中难免有遗漏,欢迎在评论区补充,但仅限最近一个月的国内开源项目。
现在回想两年前,中文世界只有GLM一个独苗,海外模型层出不穷,那时候用着国外的模型,还得自己改Prompt适配场景。
那时候我们顶着质疑,熬着通宵,也只能跟在别人后面跑。
现在短短两年,我们第一次站在世界开源舞台中央。
这条路走得很艰难,但好在没有停下脚步。
看到海外模型不断闭源涨价,连Anthropic都开始限制Claude访问量,而我们这边还在不断开源。
这波操作,让整个AI生态都受益。
如果非要问现在是什么年份,我觉得一定是国产大模型的元年。
也是中文世界开源的元年。