姚顺宇 × AI 集体主义时代

0｜基本信息

受访者：姚顺宇（Yao Shunyu），Google DeepMind（Gemini）研究员，前 Anthropic 研究员
采访者 / 媒体：小珺 / 语言即世界工作室（Language is the World Studio）
采访时间：2026年5月10日发布（录制时间约 2-3 个月前）
采访背景：姚顺宇是硅谷话题人物——与他同名的姚顺雨（前 OpenAI 现腾讯首席 AI 科学家）形成有趣的镜像。他从理论物理半路出家进入 AI，恰好踩在了 Anthropic 大尺度强化学习爆发的节点上，后在 Dario Amodei 的反华言论和文化冲突中选择离开，转投 Gemini。这次采访恰逢 Gemini 强势崛起、OpenClaw 被 OpenAI 收购、Anthropic 的 Claude 4.5/4.6 连续发布的时间窗口。

受访者身份定位：物理转行、在 Anthropic 和 Gemini 两个截然不同的组织均有核心产出的 AI 研究员。利益关系：持 Gemini 立场但评价相对客观。

1｜核心观点（Core Views）

观点一：AI 已是集体主义时代，个人英雄主义已过时

支撑逻辑：LLM 的大规模训练是一个巨系统，没有谁是不可替代的。”没有我，模型也一样会做出来。” 算法的微调、数据的制备、Infra 的稳定性，每一项都依赖多人协作。唯一称得上英雄的是 Transformer 论文的那八位作者和 Hinton。
可信度判断：高。这是亲历两家顶级 lab 后的一手判断，且有行业事实佐证（模型发布没有单一个人署名）。

观点二：Scaling Law 没到头，说它到头的人可能只是遇到了 bug

支撑逻辑：三种”到头”的可能——（1）规律本身有适用范围；（2）某一条件无法满足（如数据墙）；（3）代码或实验有 bug。他认为绝大多数撞墙的人是第三种情况，或者实验设计有缺陷。
可信度判断：中高。他是 Gemini 的预训练的观察者而非一线执行者，但这个判断与其他一线研究者（如 Ilya、Dario）的公开表态一致。

观点三：AI “本质上是简单的”，因为没有观测瓶颈

支撑逻辑：与高能理论物理（实验追不上理论）不同，AI 可以设计任意实验去验证假设，只要 Infrastructure 跟上。不是因为 AI 聪明得快，而是因为”边界条件”太好——你总能试。
可信度判断：高但需要限定。这个判断成立的前提是当前范式（Transformer + scaling）持续有效。如果不是，则可能需要新的英雄时刻。

观点四：Coding 是模型应用的最佳抽象，原因在 Reward Signal 极其清晰

支撑逻辑：Input-output 可测试、GitHub 上有大量优质数据、好的代码有客观标准。这使得强化学习可以稳定训练。相比之下，产品经理这类需要”品位”的岗位更难被 AI 替代。
可信度判断：高。他的整个职业轨迹就是这条线的实证——从 Anthropic 的 3.7 到 Gemini 的 ML Coding。

观点五：Anthropic 的 AI 安全观”非常幼稚”——核武器式的多极制衡才是出路

支撑逻辑：一家公司”拥有最好模型就有话语权”的想法不现实——大家都会有好模型，你阻止不了任何事。核武器的成功案例是多方威慑，而非一家垄断。
可信度判断：主观判断，但逻辑自洽。这直接挑战 Anthropic 的核心叙事。他承认这是个人观点。

2｜话题分析（Topic Breakdown）

话题一：中美 AI 差距正在缩小，但核心差异在产品和市场

核心信息：过去一年半，gap 从”很明显”缩小到”Benchmark 上几乎看不出”。中国在算力受限下被迫发展蒸馏技巧——包括”硬蒸”（直接抄 token）和”聪明地蒸”（多模型做评价器/数据混合）。
关键细节：点名了字节的蒸馏做得最少（模型有特色），另有两家”硬蒸”。指出字节的语音生成是”世界最好”。
值得注意：受访者刻意不点名字请求后期”哔掉”，说明行业内对此事敏感。同时指出字节和 Gemini 在多模态生成上领先，但”范式还没固定”。

话题二：Anthropic 的独特优势——技术一号位即公司决策人

核心信息：Anthropic 能做 top-down 决策（敢在 coding 上下重注），不是因为文化多好，而是因为技术一号位（Jared Kaplan, Sam McCandlish）同时也是公司创始人。技术 leader 有公信力 + CEO 不成为阻力。
关键细节：Ilya 在 OpenAI 时可能也可以，但后来”失去了做决策的能力”；Google 需要靠 Demis/Sundar 背后推动，实际一线技术 leader 是 Koray Kavukcuoglu。
值得注意：他指出 OpenAI 的组织结构”比较混沌”，后训练组和产品组职责不清，且”踏实做事的人没有 Gemini/Anthropic 多”——这在公开采访中是罕见的直言。

话题三：OpenClaw 和 Manus 本质是”壳”，目前逃不出模型公司的手掌心

核心信息：技术上 OpenClaw 不令人惊讶——这个能力去年就有。Manus 和 OpenClaw 都说明 Agentic coding 是趋势，但壳类公司逃逸只有两条路：（1）长得够快到模型公司来不及吃你（Cursor 的路径，但已进入与 Anthropic 的竞争关系）；（2）市场足够小到模型公司懒得管（Midjourney 的路径）。
关键细节：Cursor 和 Anthropic”已经进入了非常微妙的关系”——曾经亲密无间，现在互相做对方的事。
值得注意：他明确提出”不理解 Meta 为什么要买 Manus”——认为核心价值是获得了一个亚洲产品团队和人才锚点。

话题四：预训练没有死，但方向从”能不能做”变成了”该做什么”

核心信息：过去一年预训练进展没有放缓，Scaling Law 还在有效区间。现在的瓶颈不是模型能力，而是”人类作为老师，还不知道下一个该教模型什么”。后训练在 coding 等领域已经跑通，但其他应用场景的 Reward Signal 还不清晰。
关键细节：他个人 belief 在 3.7 时代摇摆过（也曾以为”预训练的 party is over”），后来随着深入了解改观。
值得注意：他说”未来 4 个月不会有到头迹象”——但承认无法预测 4 个月后的情况。这是一个诚实的约束声明。

话题五：从理论物理到 AI——半路出家的哲学

核心信息：做物理的训练是”想问题要想清楚、别太相信理论”——这段经历塑造了他系统性的做事方式。博士做高能理论的教训是”不要在一个没有客观评价标准的领域浪费青春”——这也是为什么他坚定选择 AI。
关键细节：本科在清华机科班做非厄米系统，发现布洛赫波假设在开放边界条件下失效，建立了新的描述体系。”范式级的工作”，但他选择不深耕，因为”后面再做就是发更多 paper 找教职，不令人激动了”。
值得注意：”老登”（laodeng）话题贯穿采访——他对没有客观标准时靠主观判断的体系有极强的愤怒。这可能是他离开学术界最深层的原因。

3｜关键数据与预测（Key Data & Predictions）

内容	数值 / 时间节点	来源可信度
Claude 3.7 训练到发布耗时	约 4-5 个月	高（亲历）
个人代码中模型生成占比	保守 90%，不保守 99-100%	高（自述）
工作效率提升	相较 1.5 年前 20-50 倍	中（主观估计）
AI 从业者的工作时间	9am-10/11pm（家人不在时）	高（自述）
Gemini 市占率估计	约 20%	中（未经核实数据）
预训练在未来 4 个月	仍有进展	高（一线判断）
AI 自主做完整实验链条	6-12 个月内会逐步实现	中（模糊预测）
“模型的进步速度放缓”	完全没有	高（明确表态）
机器人相当于 LLM 哪一年	还没到 GPT-1 的时刻	高

4｜逻辑与依据评估（Logic & Evidence）

整体逻辑强度：强

受访者的论证风格非常”物理系”——先陈述观点，再给出观察来源，最后承认局限性。在涉及自己亲身参与的话题（Anthropic 的 RL 训练、Gemini 的预训练组织方式、Claude 3.7 的开发过程），信息质量极高，细节丰富。在涉及其他公司（OpenAI、xAI、中国实验室）时，明确标注”我没在那干过”、”我的猜测”、”我看不懂”——边界感清晰。

内部一致性：极高。从”AI 本质是简单”到”个人英雄主义已过时”到”靠谱比聪明重要”，一以贯之。

主要弱项：

对 xAI、OpenAI 的评价缺乏一手信息，属于外部观察
“本人对模型不重要”的自谦可能被过度解读为 humility，但一致性上没有问题
对未来 6-12 个月的预测（AI 自主做实验）表述模糊且未提供具体指标

5｜弦外之音（Reading Between the Lines）

刻意回避了什么

关于 Anthropic 内部具体的 technical knowhow — 全程用”NDA”挡回。但这本身是一个信号：Anthropic 在 RL 算法和 Infra 上的具体做法，仍然是它当前的核心竞争力。
关于 Claude 3.5new 在 coding 上比 GPT-4 强的”纯技术原因”——他说”我不能说”，但暗示了是自下而上发现的。
关于为什么要离开 Anthropic，”反华占 40%”这个数字被特意提出，但语气上表明这更多是一个 public-facing 的解释。真正的主因可能更接近：他想学的东西在 Anthropic 学不到了（多模态生成、底层工程 Infra、更广泛的视角）。

措辞值得注意的地方

“AI 不太需要脑子”——这句话被重复了三遍。他不是在贬低行业，而是在压低个人的神话属性。他真正想说的是：如果你是一个聪明但不够靠谱的人，在这个行业反而可能很平庸。
“别相信老登”被他认真作为”一个少数人知道的知识点”来推荐——结合其博士经历，这直接指向他对高能理论领域权力结构的强烈反感。
“浪在推着人走，不是人在推着浪”——这是他一整场采访的 meta-narrative。他的世界观是强烈的结构/系统决定论：个体在 AI 浪潮中只是一个被裹挟的冲浪者。

未说出口的立场

他对 OpenAI 的评价（”踏实做事的人不多”）结合他对 xAI 的”看不懂”——他内心相信的赢家不会是纯营销驱动的公司，而是把事情做到极致的实干型组织。这也解释了他选择 Gemini 而非 OpenAI 的原因。
“我不理解”重复了四五次（Meta 买 Manus、xAI 的动荡、neo lab 的成立、国内争 super app）——这是一种知识分子式的傲慢，也是一种筛选标准：我不能投我不理解的东西。

与公开信息的出入

他对 Dario 反华的批评与录音时 Anthropic 的快速产品化形成了张力——这恰恰印证了他说的”我在离开时对 Anthropic 很悲观，后来证明我过于悲观了”。

6｜可操作信息（Actionable Takeaways）

Agentic Coding 是其来有自，不是 2026 年的新能力——去年就已有技术基础。这意味着今年开始的”代码 Agent”热潮不会持续很久，竞争焦点将从”能不能做”转向”做得有多稳”。
蒸馏是中美差距缩小的核心机制，但”聪明蒸馏”（多模型互评）可能是真正的技术资产——关注那些有”模型特色”的中国实验室（字节），而非纯 Benchmark 追平者。
长文本/长程任务（Long Horizon）是下一个关键突破口——姚顺宇认为这是”有限 context 做无限事”。这不只是 engineering 问题，也涉及科学方案的选择（sparse attention vs. post-training context management）。
AI 研究员招聘的选人标准正在变化——他个人面试方法是让候选人在 24 小时内从零训练一个 RL 模型，核心考察的是”与 AI 协作的能力”和”责任心”（能不能熬 24h）。传统的算法背诵题已不适用。
AI 产品经理可能是最难被 AI 替代的岗位——因为缺乏客观 Reward Signal。这对创业方向选择有参考价值：不要与 AI 竞争有清晰评价标准的工作（写代码、数学证明），要做那些评价标准模糊的事（产品决策、用户共情）。

7｜一句话总结

AI 的集体主义时代已经到来：让浪潮决定方向，让系统和细节决定胜负，个人英雄主义是上一个版本的故事。