谢晨 × AI 数据产业的脉络、金字塔与终局推演

0｜基本信息（Metadata）

受访者：谢晨（Steve），光轮智能（Guanglun Intelligence）创始人兼 CEO。北大物理本科 → 哥伦比亚大学量化金融博士 → Jet.com AI 负责人 → Cruise 仿真负责人 → NVIDIA 自动驾驶仿真负责人 → 蔚来仿真负责人 → 2023 年创立光轮智能
采访者 / 媒体：张小珺播客（商业访谈录），2026 年 3 月 31 日
采访背景：光轮智能定位为”机器人产业的数据基建”，为具身智能、世界模型、VLA 团队提供仿真环境和合成数据。这期节目是《商业访谈录》系列中对 AI 数据产业的系统性综述，聚焦数据金字塔结构、仿真 vs. 真机路线之争、以及机器人大脑竞赛的终局推演。

受访者的核心优势在于：同时经历过 Cruise（L4 自动驾驶仿真）、NVIDIA（供应商视角的仿真平台）、蔚来（主机厂视角的数据闭环）三方，是业内少数对仿真有”全视角”经验的创始人。

TL;DR｜核心结论速览

数据不是瓶颈，评测才是：AI 数据产业的 Scaling Law 已经出现，当前真正的卡口是”规模化评测”——模型迭代不能止步于生产数据，更需要一套系统化的能力来衡量智能是否真的在提升。
仿真 vs. 真机的路线之争，本质是商业模式之争：中国真机派机器人公司鼓吹”真机数据好泛化”，核心动机是卖本体（数采中心），而不是技术判断。仿真才是规模化数据的唯一通解。
机器人领域不会出现特斯拉：因为机器人需要的智能水平远高于自动驾驶，且本体相关的数据规模永远追不上需求。终局更可能是”大脑公司 + 本体公司”分离的生态——类似 DeepMind + xAI 为各种机器人提供大脑。

1｜核心观点（Core Views）

核心观点一：数据存在金字塔结构——最底层的真实数据量反而最小

支撑逻辑：谢晨提出四层数据金字塔——① 真实机器人操作数据（最贵、最难规模化）→ ② 真实世界重映射数据（人操作数据，量大一些）→ ③ 合成数据（仿真生成，可无限量规模化）→ ④ 预训练数据集（世界模型/基础模型的底座数据）。他的核心判断是：越底层越关键但量越小，真正支撑规模的必须是上面三层。[第一手]
可信度判断：强。这个框架来自谢晨在 Cruise、NVIDIA、蔚来三方验证的经验，且与 OpenAI 和 DeepMind 的数据策略一致。但金字塔比例的量化数据未公开，无法独立验证。

核心观点二：仿真不是真机的替代，而是智能学习的”前提条件”

支撑逻辑：谢晨区分了自动驾驶和机器人对仿真的需求本质差异——自动驾驶的数据来自路上跑的车的被动采集，仿真只是”加速器”（时间机器）。但机器人没有”路过场景”这个选项，必须靠仿真创造环境和方法来主动学习。”仿真之于机器人，相当于英伟达的卡之于 AI——没有它，AI 不会发展，而不只是发展得更慢。”[第一手]
可信度判断：强。逻辑自洽。自动驾驶的数据采集是被动的（买了车的用户开回来），但机器人需要主动设计任务、环境和交互，仿真在这里不是可选项而是必选项。

核心观点三：中国”真机派”公司的核心驱动是商业模式，不是技术判断

支撑逻辑：谢晨直言”屁股决定脑袋”——国内很多机器人公司的商业模式是卖本体（数采中心），因此必须推广”真机数据更好”的叙事才能说服客户购买硬件。他强调自己不否认真机数据的必要性，但认为量级上应该是最少的（金字塔尖），而不是最多的。[第一手]
可信度判断：中-高。这个判断带有一定立场（谢晨的仿真公司天然偏向仿真派），但逻辑有说服力——他在前面给出了仿真的严格定义（物理准确、可复现、可修正行为并观察结果），并指出许多真机数采中心实际上在用”假水果假道具”操作，本质是一种低配版仿真。

核心观点四：机器人大脑竞赛的五支队伍都已变得更激进

支撑逻辑：谢晨明确点名五家角逐机器人大脑的团队——字节跳动、阿里、OpenAI、DeepMind、NVIDIA，认为它们都比一年前更激进了。尤其是字节和阿里。他还补充 Physical Intelligence（PI）也应算入此类。[个人判断]
可信度判断：中。这是行业内部视角的观察，有参考价值但缺乏具体证据。值得注意的是他将 DeepMind 和 OpenAI 并列，暗示 Google 内部的机器人战略可能比公开信息显示的更激进。

核心观点五：评测（Evaluation）是当前机器人 AI 数据最关键的瓶颈

支撑逻辑：谢晨明确表示”本体无关数据的预训练通路和 Scaling Law 已经出现，评测才是真正的卡口”。他类比大语言模型的困境——模型能力越强，需要更难的考题，导致”魔高一尺、道高一丈”的持续升级。[推断]
可信度判断：强。逻辑清晰且与行业共识一致。Scale AI 的 RLinf 服务和光轮智能自己的业务布局都围绕这一判断展开（仿真→评测→反馈循环），说明这不是随口一提而是商业战略的判断依据。

2｜话题分析（Topic Breakdown）

话题一：仿真作为”时间机器”vs.”前提条件”的转变

核心信息：谢晨花了从 Cruise 到创业的完整职业历程才确信：对于自动驾驶，仿真是加速器（time machine）；对于机器人，仿真是先决条件（prerequisite）。这个认知转变是他决定出来创业的根本原因。
关键细节：
- Cruise 时期：仿真被 CEO 和团队视为演示工具（Demo Tool），算法团队用了反而降效果。他花三个月先建立评价体系，再用生成式 AI + 仿真结合，才真正验证仿真数据的有效性。
- NVIDIA 时期：与黄仁勋和 Omniverse 团队的深入交流让他确信英伟达”在下很大一盘棋”——将仿真作为机器人部署全球的唯一路径。
- 蔚来时期：从主机厂角度验证了自研自动驾驶的车企对仿真的真实需求强度和落地方式。
值得注意：谢晨在 Cruise 的突破点不是”做更好的仿真”，而是”先建立评价仿真的方法”——先问”我们怎么知道仿真是好的”，再问”怎么让它更好”。这个认知顺序可能比仿真技术本身更值得借鉴。

话题二：数据金字塔的详细构成

核心信息：谢晨提出四层数据金字塔模型，核心洞见是：从底层到上层，数据量递增、成本递减、但每层解决不同层面的问题。最高效的路径不是单一依赖任何一层，而是以仿真为中心的系统性协同。
- 第 1 层（塔尖）：真机数据 — 成本最高、最难规模化、不可替代（关键验证）
- 第 2 层：人操作数据 / 真实世界重映射 — 量大一些，但仍有限
- 第 3 层：合成数据 — 仿真生成，可无限量、可编程、可标注
- 第 4 层（基座）：预训练数据集 — 世界模型/基础模型的通用底座
关键细节：”最有效的数据是先失败再成功的数据”——这是一种 RL 导向的数据观，强调数据不仅要覆盖”正确行为”，更要覆盖”失败的尝试路径”。
值得注意：这个金字塔模型本质上是在挑战”更多真机数据 = 更好的机器人智能”的直觉。谢晨认为数据不是越多越好，而是结构正确——每层各司其职，而且越往塔尖数据量应该越小。

话题三：仿真的严格定义 vs. 视频生成/世界模型

核心信息：谢晨给出了一个非常严格的仿真定义，强调三个必要条件：① 物理准确（环境、物体参数与真实世界对标）② 可复现（相同输入得到相同结果，允许微小随机性）③ 可修正行动并观察结果。据此，当前大部分视频生成模型不能称为仿真。
关键细节：
- 视频模型只预测下一帧，缺乏可复现性和可干预性
- 世界模型未来有可能成为仿真的一种（底层是生成模型 + 物理 grounding）
- 仿真和世界模型的关系是共生而非替代——仿真提供物理 Grounding，世界模型提供生成泛化能力
值得注意：谢晨明确区分了”物理准确”和”看起来像”——这直指当前视频生成领域的一个核心争议：生成内容的视觉逼真度是否等同于物理正确性？他的答案是否定的。

话题四：机器人大脑的终局推演——三种模式

核心信息：谢晨认为机器人领域不会出现”特斯拉模式”（同一家公司做本体和大脑），因为机器人需要的智能水平远超自动驾驶，终局更可能是三种模式并存：Waymo 模式（轻本体，大脑公司主导）、特斯拉模式（垂直整合）、以及马斯克体系内的模式（xAI 做大脑、Tesla 做本体的公司内分离）。
关键细节：
- 创业公司做”统一大脑”基本不可能（卡数大几万张起步）
- 国内最有可能同时做本体和大脑的选手是小米
- 小鹏和理想当前的站位（智能驾驶车企）和智能驾驶的上限决定了它们走这条路的门槛很高
- 终局可能像”爱因斯坦在大脑里做思想实验”——智能自主在仿真环境中通过 RL 自我修炼
值得注意：谢晨暗示范曙在机器人战略上的一个关键选择——创业公司不应该做”大脑”而应该做”加速大脑训练的基础设施”（即仿真/数据/评测平台），这直接解释了他为什么做光轮智能而不是做具身大模型。

话题五：字节、阿里、OpenAI、DeepMind、NVIDIA——五家更激进的机器人大脑团队

核心信息：谢晨认为这五家公司过去几个月在机器人大脑上的投入和激进程度都在显著提升，字节和阿里变化最明显。
关键细节：
- 受访者的公司与几乎所有大模型团队、VLA 团队、世界模型团队都在合作（暗示在行业中具有横向视野）
- 世界模型团队和 VLA 团队是当前合作最多的两个方向
- 世界模型和 VLA 短期共生、长期可能合二为一
值得注意：谢晨没有提到 Google Brain/DeepMind 之外的任何 one 创业公司正在做”大脑”级别的工作，这暗示他认为机器人大脑的终局竞赛主要由大厂和技术巨头参与，创业公司更多是”工具供应商”。

3｜关键数据与预测（Key Data & Predictions）

内容	数值 / 时间节点	声明类型	来源可信度
Cruise 仿真验证周期	3 个月	[第一手]	高
NVIDIA 团队当时人数	~10,000 人（2021）	[第一手]	高
Orin 芯片最大客户（2021）	蔚小理（非 Waymo/Cruise）	[第一手]	高 — 有公开数据可核
国内真机数采中心使用假道具	当前普遍现象	[第一手]	中 — 来自客户观察
机器人大脑团队需卡数	大几万张	[推断]	中 — 来自客户观察
世界模型和 VLA 合并可能性	长期可能合二为一	[个人判断]	低 — 纯推演
最激进的五家机器人大脑团队	字节、阿里、OpenAI、DeepMind、NVIDIA	[个人判断]	中 — 缺乏量化证据
数据问题的终局形态	15-20 年后可能不再是瓶颈	[个人判断]	低 — 纯推测
数据金字塔层数	4 层	[第一手]	高 — 框架性知识

4｜逻辑与依据评估（Logic & Evidence）

内部一致性：强。谢晨的职业选择（Cruise → NVIDIA → 蔚来 → 创业）本身就是他认知轨迹的最好实证。每个阶段的经验（L4 仿真 → 平台仿真 → 主机厂仿真 → 跨行业数据基建）都在持续强化他的核心论点，不存在明显断裂或矛盾。
证据基础：以第一手经验为主（8 年仿真领域深耕，三家标杆企业，一个自己的公司），辅以客户观察和行业横向比较。作为”我们与几乎所有机器人大脑团队都在合作”的公开陈述，有一定权威性但缺乏交叉验证。金字塔框架的坚实度依赖后续是否有更多量化数据支撑。
值得注意的回避：光轮智能的具体业务数据（收入、客户数量、技术壁垒）完全没有提及，这符合早期创业公司的信息披露习惯但降低可验证性。

整体逻辑强度：强（作为行业综述访谈，有框架深度和一手经验，但不具备学术严谨性）。

5｜弦外之音（Reading Between the Lines）

观察	支撑证据	可能意味着	置信度
反复强调”仿真不是玩具”	6 次在不同上下文中以不同方式表述	面对投资人/客户时”仿真”仍然被习惯性低估，说明市场教育仍然是光轮智能的重要成本	高
将字节排在阿里之前列为”更激进”	原话”字节肯定是更激进了，阿里我觉得…”，字节在前且语气更确定	字节在机器人大脑上的实际投入和进展可能远超外界认知——可能建立了业内最大的机器人数据/训练团队之一	中
对”创业公司做大脑”的近乎否定态度	“创业公司我觉得很难去做大脑”、”我就不太合理去做大脑这件事”	这不是客观判断，也是商业定位声明——他在告诉听众和潜在合作者：不要和光轮智能竞争做大脑，应该和我们合作做基础设施	高
没有讨论开源机器人数据集的角色	整期节目未提及任何开源项目（如 Open X-Embodiment、DROID 等）	光轮智能的商业模式建立在数据稀缺性上，开源数据是这一模式的外部威胁。回避可能是策略性的	中
对”数据终局”的答案有明显转变	之前认为数据问题会消失（15-20 年），现在认为智能越强数据需求越大	这个转变与他创业后从客户需求中获得的反馈一致——但也是一个方便的叙事：让投资人相信数据公司的增长是有长期持续性的	中
提及 Stand Together 的 Phoenix 案例作为”自下而上改变社会”的范例	“Show, don’t tell”模式——资助已有实效的初创项目让成功案例自我传播	这一叙述的弦外之音是：Koch 不认为通过说教或政策辩论能够改变现状，他们已放弃说服体系	高

6｜可操作信息（Actionable Takeaways）

关注机器人数据领域的投资机会：谢晨对”机器人数据基础设施”赛道的判断值得重视——如果仿真确实是机器人的前提条件（而非加速器），仿真的需求将从可选变为必需。当前行业可能仍低估了这一转变的紧迫性。
评估中国企业时注意”真机 vs. 仿真”的立场偏差：谢晨关于”屁股决定脑袋”的提醒对中国机器人赛道的尽职调查（DD）非常实用——一家公司的技术路线选择可能更多由其商业模式（卖本体 vs. 卖数据）决定而非纯粹的技术判断。
评测作为新的稀缺能力：谢晨的判断”预训练的 Scaling Law 已出现，评测才是瓶颈”对 AI 数据公司有战略指导意义——在数据生产工具化的时代，差异化的竞争力不在数据量而在数据质量评估体系。
跟踪极少数能做”大脑”的创业公司：谢晨暗示机器人大脑创业的准入门槛极高（大几万张卡），这意味着能够在这一赛道生存的创业公司（如果有）将是极其稀缺的投资标的，值得专门跟踪。

7｜一句话总结（One-line Summary）

以仿真为基座的机器人数据金字塔正在重构 AI 数据产业，评测能力而非数据产量将成为下一阶段的竞争壁垒。