LLM存在缺陷?为何杨立昆的AMI押注World Model路线


由图灵奖得主、前Meta 首席AI 科学家Yann LeCun(杨立昆) 创办的人工智能研究公司Advanced Machine Intelligence(AMI),近期完成约10.3 亿美元(约8.9 亿欧元) 的超大型种子轮融资。公司估值约35 亿美元,三个月便达到独角兽级别。显示资本市场正在押注一条不同于OpenAI、Anthropic 等公司主导的大型语言模型(LLM)路线。

近年AI 学界两位重量级人物杨立昆与被称为「AI 教母」的李飞飞(Fei-Fei Li)都选择押在被称为World Model(世界模型) 的新一代AI 架构。当前主流的LLM 依靠庞大的语料库与统计关系来理解上下文,并预测下一个词语。它可以知道「苹果掉下来」这几个字常一起出现,但并不真正理解重力或物理世界的因果关系。

这种模式在文本生成、程式辅助或问答任务上表现出色,但在需要理解现实世界结构、推理因果关系与长期规划的场景中,仍存在根本限制。更大的问题在于数据来源正在逐渐枯竭。 LLM 的训练高度依赖高品质人类资料,而近年业界已开始警告,可用的人类文本资料可能在未来几年内被消耗殆尽。届时就像近亲繁殖可能遗传缺陷,最终导致模型逐渐偏离现实并出现性能退化。

杨立昆AMI 完成10.3 亿美元种子轮,三个月即达独角兽估值

由图灵奖得主、前Meta 首席AI 科学家Yann LeCun 创办的人工智能研究公司Advanced Machine Intelligence(AMI),近期完成约10.3 亿美元(约8.9 亿欧元) 的超大型种子轮融资。本轮融资完成后,公司估值约35 亿美元,成立时间尚不到三个月便达到独角兽级别,也被多家媒体形容为欧洲史上最大规模的种子轮融资之一。

AMI 目标是打造下一代AI 系统,所谓的World models 是让AI 能够理解与推理真实世界,而非仅仅预测下一个token。

此次融资由多家创投机构共同领投,包括Cathay Innovation、Greycroft、Hiro Capital、HV Capital,同时也吸引多家大型科技与产业公司参与。战略投资者包括Nvidia、Toyota、Samsung 等大型企业。此外,Jeff Bezos 也透过其家族投资机构Bezos Expeditions 参与投资。

值得注意的是,如此规模的种子轮融资在AI 创业史上极为罕见,显示资本市场愿意为非LLM 技术路线的AI 研究支付高额溢价。

AMI 押注World Model,LLM 存在什么缺陷

AMI 的核心研究方向是world models(世界模型),这是一种让AI 学习物理世界结构与因果关系的模型架构。 World Models 跟现有LLM (Large Language Model) 的差别其实显而易见。大型语言模型顾名思义,倚靠庞大的资料库来理解前后文,再从资料库输出内容。它知道「苹果掉下来」这几个字常出现,但它并不理解重力。

更可怕的是,LLM 倚靠喂养数据来训练模型。但高品质人类数据快被喂光了。现在业界开始依赖合成数据(Synthetic Data),但如果AI 长期学习AI 生成的内容,会产生「哈布斯堡效应」。生成式模型反复使用自己产生的资料进行训练,就如同近亲繁殖容易将疾病遗传。即使在理想条件下,模型也会逐渐遗忘现实,最终陷入退化。

而AMI 正在开发的系统会建立抽象的世界表示(representation)、忽略不可预测的细节、在表示空间中进行预测与推理。他们开发新型人工智慧系统能够理解世界、拥有持久记忆、能够推理和规划,可控且安全。 AMI 的研究将延续LeCun 在Meta FAIR 时期提出的JEPA(Joint Embedding Predictive Architecture) 技术路线。

同为学术出身创业者,AMI 与World Labs 有何不同

图灵奖得主杨立昆主导的AMI Labs,其实与另一位学者出身,被称为AI 教母的李飞飞有相似之处。 2024 年,李飞飞创办AI 新创World Labs,并出任执行长。公司定位为前沿基础模型研发与产品公司,核心目标是打造大型世界模型(Large World Models, LWM)。让AI 不只会说话、看图,而是能理解、生成并在3D 世界中推理与互动。

World Labs强调的「空间智能」,让模型能够从影像或影片理解三维空间结构与物体关系、从文字或图片生成可自由移动视角的3D 场景,并在虚拟空间中进行推理与模拟,为机器人与实体AI 行为提供基础。

  AMI Labs World Labs
创办人 Yann LeCun (杨立昆) Fei-Fei Li (李飞飞)
技术主轴 JEPA、通用world model 空间智能与3D world models
产品阶段 研究导向,暂无成熟产品 已推出3D 生成工具Marble

延伸来看,当AI具备对3D环境的理解与物理预测能力后,这项技术将成为自主机器人、自动驾驶与智慧制造等「实体AI」(Physical AI)的数位大脑。因此,World Model 的路线主张,机器人将会是十分关键的载体。

本文链接地址:https://www.wwsww.cn/rgzn/37575.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。