0|基本信息
- 受访者:姚顺宇(Yao Shunyu),Google DeepMind(Gemini)研究员,前 Anthropic 研究员
- 采访者 / 媒体:小珺 / 语言即世界工作室(Language is the World Studio)
- 采访时间:2026年5月10日发布(录制时间约 2-3 个月前)
- 采访背景:姚顺宇是硅谷话题人物——与他同名的姚顺雨(前 OpenAI 现腾讯首席 AI 科学家)形成有趣的镜像。他从理论物理半路出家进入 AI,恰好踩在了 Anthropic 大尺度强化学习爆发的节点上,后在 Dario Amodei 的反华言论和文化冲突中选择离开,转投 Gemini。这次采访恰逢 Gemini 强势崛起、OpenClaw 被 OpenAI 收购、Anthropic 的 Claude 4.5/4.6 连续发布的时间窗口。
受访者身份定位:物理转行、在 Anthropic 和 Gemini 两个截然不同的组织均有核心产出的 AI 研究员。利益关系:持 Gemini 立场但评价相对客观。
1|核心观点(Core Views)
观点一:AI 已是集体主义时代,个人英雄主义已过时
- 支撑逻辑:LLM 的大规模训练是一个巨系统,没有谁是不可替代的。”没有我,模型也一样会做出来。” 算法的微调、数据的制备、Infra 的稳定性,每一项都依赖多人协作。唯一称得上英雄的是 Transformer 论文的那八位作者和 Hinton。
- 可信度判断:高。这是亲历两家顶级 lab 后的一手判断,且有行业事实佐证(模型发布没有单一个人署名)。
观点二:Scaling Law 没到头,说它到头的人可能只是遇到了 bug
- 支撑逻辑:三种”到头”的可能——(1)规律本身有适用范围;(2)某一条件无法满足(如数据墙);(3)代码或实验有 bug。他认为绝大多数撞墙的人是第三种情况,或者实验设计有缺陷。
- 可信度判断:中高。他是 Gemini 的预训练的观察者而非一线执行者,但这个判断与其他一线研究者(如 Ilya、Dario)的公开表态一致。
观点三:AI “本质上是简单的”,因为没有观测瓶颈
- 支撑逻辑:与高能理论物理(实验追不上理论)不同,AI 可以设计任意实验去验证假设,只要 Infrastructure 跟上。不是因为 AI 聪明得快,而是因为”边界条件”太好——你总能试。
- 可信度判断:高但需要限定。这个判断成立的前提是当前范式(Transformer + scaling)持续有效。如果不是,则可能需要新的英雄时刻。
观点四:Coding 是模型应用的最佳抽象,原因在 Reward Signal 极其清晰
- 支撑逻辑:Input-output 可测试、GitHub 上有大量优质数据、好的代码有客观标准。这使得强化学习可以稳定训练。相比之下,产品经理这类需要”品位”的岗位更难被 AI 替代。
- 可信度判断:高。他的整个职业轨迹就是这条线的实证——从 Anthropic 的 3.7 到 Gemini 的 ML Coding。
观点五:Anthropic 的 AI 安全观”非常幼稚”——核武器式的多极制衡才是出路
- 支撑逻辑:一家公司”拥有最好模型就有话语权”的想法不现实——大家都会有好模型,你阻止不了任何事。核武器的成功案例是多方威慑,而非一家垄断。
- 可信度判断:主观判断,但逻辑自洽。这直接挑战 Anthropic 的核心叙事。他承认这是个人观点。
2|话题分析(Topic Breakdown)
话题一:中美 AI 差距正在缩小,但核心差异在产品和市场
- 核心信息:过去一年半,gap 从”很明显”缩小到”Benchmark 上几乎看不出”。中国在算力受限下被迫发展蒸馏技巧——包括”硬蒸”(直接抄 token)和”聪明地蒸”(多模型做评价器/数据混合)。
- 关键细节:点名了字节的蒸馏做得最少(模型有特色),另有两家”硬蒸”。指出字节的语音生成是”世界最好”。
- 值得注意:受访者刻意不点名字请求后期”哔掉”,说明行业内对此事敏感。同时指出字节和 Gemini 在多模态生成上领先,但”范式还没固定”。
话题二:Anthropic 的独特优势——技术一号位即公司决策人
- 核心信息:Anthropic 能做 top-down 决策(敢在 coding 上下重注),不是因为文化多好,而是因为技术一号位(Jared Kaplan, Sam McCandlish)同时也是公司创始人。技术 leader 有公信力 + CEO 不成为阻力。
- 关键细节:Ilya 在 OpenAI 时可能也可以,但后来”失去了做决策的能力”;Google 需要靠 Demis/Sundar 背后推动,实际一线技术 leader 是 Koray Kavukcuoglu。
- 值得注意:他指出 OpenAI 的组织结构”比较混沌”,后训练组和产品组职责不清,且”踏实做事的人没有 Gemini/Anthropic 多”——这在公开采访中是罕见的直言。
话题三:OpenClaw 和 Manus 本质是”壳”,目前逃不出模型公司的手掌心
- 核心信息:技术上 OpenClaw 不令人惊讶——这个能力去年就有。Manus 和 OpenClaw 都说明 Agentic coding 是趋势,但壳类公司逃逸只有两条路:(1)长得够快到模型公司来不及吃你(Cursor 的路径,但已进入与 Anthropic 的竞争关系);(2)市场足够小到模型公司懒得管(Midjourney 的路径)。
- 关键细节:Cursor 和 Anthropic”已经进入了非常微妙的关系”——曾经亲密无间,现在互相做对方的事。
- 值得注意:他明确提出”不理解 Meta 为什么要买 Manus”——认为核心价值是获得了一个亚洲产品团队和人才锚点。
话题四:预训练没有死,但方向从”能不能做”变成了”该做什么”
- 核心信息:过去一年预训练进展没有放缓,Scaling Law 还在有效区间。现在的瓶颈不是模型能力,而是”人类作为老师,还不知道下一个该教模型什么”。后训练在 coding 等领域已经跑通,但其他应用场景的 Reward Signal 还不清晰。
- 关键细节:他个人 belief 在 3.7 时代摇摆过(也曾以为”预训练的 party is over”),后来随着深入了解改观。
- 值得注意:他说”未来 4 个月不会有到头迹象”——但承认无法预测 4 个月后的情况。这是一个诚实的约束声明。
话题五:从理论物理到 AI——半路出家的哲学
- 核心信息:做物理的训练是”想问题要想清楚、别太相信理论”——这段经历塑造了他系统性的做事方式。博士做高能理论的教训是”不要在一个没有客观评价标准的领域浪费青春”——这也是为什么他坚定选择 AI。
- 关键细节:本科在清华机科班做非厄米系统,发现布洛赫波假设在开放边界条件下失效,建立了新的描述体系。”范式级的工作”,但他选择不深耕,因为”后面再做就是发更多 paper 找教职,不令人激动了”。
- 值得注意:”老登”(laodeng)话题贯穿采访——他对没有客观标准时靠主观判断的体系有极强的愤怒。这可能是他离开学术界最深层的原因。
3|关键数据与预测(Key Data & Predictions)
| 内容 | 数值 / 时间节点 | 来源可信度 |
|---|---|---|
| Claude 3.7 训练到发布耗时 | 约 4-5 个月 | 高(亲历) |
| 个人代码中模型生成占比 | 保守 90%,不保守 99-100% | 高(自述) |
| 工作效率提升 | 相较 1.5 年前 20-50 倍 | 中(主观估计) |
| AI 从业者的工作时间 | 9am-10/11pm(家人不在时) | 高(自述) |
| Gemini 市占率估计 | 约 20% | 中(未经核实数据) |
| 预训练在未来 4 个月 | 仍有进展 | 高(一线判断) |
| AI 自主做完整实验链条 | 6-12 个月内会逐步实现 | 中(模糊预测) |
| “模型的进步速度放缓” | 完全没有 | 高(明确表态) |
| 机器人相当于 LLM 哪一年 | 还没到 GPT-1 的时刻 | 高 |
4|逻辑与依据评估(Logic & Evidence)
整体逻辑强度:强
受访者的论证风格非常”物理系”——先陈述观点,再给出观察来源,最后承认局限性。在涉及自己亲身参与的话题(Anthropic 的 RL 训练、Gemini 的预训练组织方式、Claude 3.7 的开发过程),信息质量极高,细节丰富。在涉及其他公司(OpenAI、xAI、中国实验室)时,明确标注”我没在那干过”、”我的猜测”、”我看不懂”——边界感清晰。
内部一致性:极高。从”AI 本质是简单”到”个人英雄主义已过时”到”靠谱比聪明重要”,一以贯之。
主要弱项:
- 对 xAI、OpenAI 的评价缺乏一手信息,属于外部观察
- “本人对模型不重要”的自谦可能被过度解读为 humility,但一致性上没有问题
- 对未来 6-12 个月的预测(AI 自主做实验)表述模糊且未提供具体指标
5|弦外之音(Reading Between the Lines)
刻意回避了什么
- 关于 Anthropic 内部具体的 technical knowhow — 全程用”NDA”挡回。但这本身是一个信号:Anthropic 在 RL 算法和 Infra 上的具体做法,仍然是它当前的核心竞争力。
- 关于 Claude 3.5new 在 coding 上比 GPT-4 强的”纯技术原因”——他说”我不能说”,但暗示了是自下而上发现的。
- 关于为什么要离开 Anthropic,”反华占 40%”这个数字被特意提出,但语气上表明这更多是一个 public-facing 的解释。真正的主因可能更接近:他想学的东西在 Anthropic 学不到了(多模态生成、底层工程 Infra、更广泛的视角)。
措辞值得注意的地方
- “AI 不太需要脑子”——这句话被重复了三遍。他不是在贬低行业,而是在压低个人的神话属性。他真正想说的是:如果你是一个聪明但不够靠谱的人,在这个行业反而可能很平庸。
- “别相信老登”被他认真作为”一个少数人知道的知识点”来推荐——结合其博士经历,这直接指向他对高能理论领域权力结构的强烈反感。
- “浪在推着人走,不是人在推着浪”——这是他一整场采访的 meta-narrative。他的世界观是强烈的结构/系统决定论:个体在 AI 浪潮中只是一个被裹挟的冲浪者。
未说出口的立场
- 他对 OpenAI 的评价(”踏实做事的人不多”)结合他对 xAI 的”看不懂”——他内心相信的赢家不会是纯营销驱动的公司,而是把事情做到极致的实干型组织。这也解释了他选择 Gemini 而非 OpenAI 的原因。
- “我不理解”重复了四五次(Meta 买 Manus、xAI 的动荡、neo lab 的成立、国内争 super app)——这是一种知识分子式的傲慢,也是一种筛选标准:我不能投我不理解的东西。
与公开信息的出入
- 他对 Dario 反华的批评与录音时 Anthropic 的快速产品化形成了张力——这恰恰印证了他说的”我在离开时对 Anthropic 很悲观,后来证明我过于悲观了”。
6|可操作信息(Actionable Takeaways)
-
Agentic Coding 是其来有自,不是 2026 年的新能力——去年就已有技术基础。这意味着今年开始的”代码 Agent”热潮不会持续很久,竞争焦点将从”能不能做”转向”做得有多稳”。
-
蒸馏是中美差距缩小的核心机制,但”聪明蒸馏”(多模型互评)可能是真正的技术资产——关注那些有”模型特色”的中国实验室(字节),而非纯 Benchmark 追平者。
-
长文本/长程任务(Long Horizon)是下一个关键突破口——姚顺宇认为这是”有限 context 做无限事”。这不只是 engineering 问题,也涉及科学方案的选择(sparse attention vs. post-training context management)。
-
AI 研究员招聘的选人标准正在变化——他个人面试方法是让候选人在 24 小时内从零训练一个 RL 模型,核心考察的是”与 AI 协作的能力”和”责任心”(能不能熬 24h)。传统的算法背诵题已不适用。
-
AI 产品经理可能是最难被 AI 替代的岗位——因为缺乏客观 Reward Signal。这对创业方向选择有参考价值:不要与 AI 竞争有清晰评价标准的工作(写代码、数学证明),要做那些评价标准模糊的事(产品决策、用户共情)。
7|一句话总结
AI 的集体主义时代已经到来:让浪潮决定方向,让系统和细节决定胜负,个人英雄主义是上一个版本的故事。