CMU华人设计的AI乐高,真的稳定吗? 靠AI设计的玩具,体验会更好吗?

2025-10-21 10:00:44 作者:Vali编辑部

输入一段文字,AI就能设计出能实际搭建的乐高模型?这项技术的出现让乐高迷们看到了新的可能。来自卡内基梅隆大学的研究团队开发的LegoGPT,让设计乐高不再是手工拼装的繁琐过程。只需输入"金属紫色电吉他"这样的描述,AI就能生成一个不仅外形逼真,还能在现实中稳稳站立的乐高模型。这种突破性技术正在重新定义玩具设计的边界。

传统3D建模工具生成的乐高设计往往存在稳定性不足的问题,而LegoGPT通过微调Meta的LLaMA模型,结合47000个稳定结构数据集,确保98.8%的设计符合物理定律。这项技术的核心价值在于,它让AI生成的乐高模型具备了实际搭建的可行性。无论是人类测试者手工拼装,还是借助机器人辅助构建,都能实现设计与现实的完美对接。

在实际测试中,LegoGPT展现出了惊人的设计能力。比如搭建高背椅子的乐高过程,通过带有力传感器的双臂机器人系统,根据AI生成的指令拾取和放置积木,最终组成完成的乐高成品。这种精确的搭建过程证明了AI生成设计的可靠性。更令人惊喜的是,LegoGPT生成的乐高组件不仅包含具体结构,还能按照提示词呈现喷漆机纹理图案,让设计细节更加丰富。

这项技术的关键在于物理稳定性的保障。传统3D生成模型虽然能创造出详细几何形状的物体,但往往无法物理实现。例如没有适当支撑的设计,可能会出现坍塌、漂浮或断开的情况。而LegoGPT通过构建名为StableText2Lego的新数据集,包含超过47000个稳定结构和28000个独特3D对象,确保每个设计都能在现实中搭建。这种数据集的构建方式,让AI在生成设计时具备了更强的物理感知能力。

研究团队创新性地使用了独立软件工具来增强积木预测模型。该工具通过模拟重力和结构力的数学模型,验证物理稳定性。这种物理模型的引入,让LegoGPT能够预测乐高组件拼接后的稳定性。在实际测试中,这种模型验证方法让设计成功率提升到98.8%,远超传统方法的24%。这种稳定性保障机制,成为LegoGPT区别于其他AI生成工具的核心优势。

从技术原理来看,LegoGPT的工作方式与传统大模型不同。它不是预测下一个词,而是逐步预测要添加的下一个积木,从而构建完整的乐高世界。这种逐步搭建的机制,让AI在设计过程中能实时调整结构。当发现部分组件倒塌时,系统会自动识别第一个不稳定积木并回溯,移除它及后续积木,尝试不同的搭建方法。这种物理感知的回滚机制,是LegoGPT实现高成功率的关键。

这项技术的突破性在于,它让AI设计的乐高模型具备了实际应用价值。从玩具设计到3D打印组件,再到机器人拼装工具,LegoGPT展示了广泛的潜力。比如设计出的稳定结构可以用于制造无人机、无人驾驶船只和模型车等现实工具。这种从玩具到实用工具的延伸,证明了AI生成设计的广阔前景。

尽管LegoGPT已经取得了显著进展,但仍有改进空间。当前版本仅在20×20×20的建筑空间内工作,且仅使用八种标准积木类型。研究团队计划未来扩展积木库,包含更广泛的尺寸和类型,如斜坡和地砖。同时,他们希望扩大训练数据集,涵盖比现有21个类别更多的对象。这些改进将让LegoGPT的应用场景更加丰富。

项目团队由两位博士生组成,Kangle Deng和Ruixuan Liu。Kangle Deng是卡内基梅隆大学机器人研究所的博士生,研究方向为计算机辅助创作。Ruixuan Liu则专注于机器人学习/控制、生成式制造和人机协作。两位研究者都具备扎实的学术背景,为LegoGPT的技术突破提供了坚实基础。

这项技术的出现,让乐高设计从手工创作转向智能化设计。它不仅提升了玩具设计的效率,更拓展了AI在制造业的应用边界。随着技术的不断发展,LegoGPT有望在更多领域发挥价值,为设计行业带来新的变革。这种从玩具到工具的技术延伸,正是AI创新最具代表性的体现。