我自己断断续续听完了这一期访谈,接近 4 小时,真的很长。整体感受是,姚顺宇讲得非常真诚,作为 AI 领域的一线从业者,他提供了不少看问题的新视角。就因为长,估计很多人未必有时间完整听完,所以我结合 Bilibili AI 自动生成字幕(覆盖完整 3 小时 48 分钟,共 5623 个片段、67,519 字)整理了这份尽量全面的文字稿,方便大家查阅和回看。
B 站:https://www.bilibili.com/video/BV1YR5E6EE9o
小宇宙:https://www.xiaoyuzhoufm.com/episode/6a00aa051b7bd50295dfe41d
先说前面
如果把这场近 4 小时的访谈压缩一下,真正值得记住的,并不是哪一句“疯话”最出圈,也不是哪一个判断最容易被切成短视频,而是姚顺宇身上那种很稳定的东西:他对“什么是值得做的事”有一套自己的判断,而且这套判断从做物理到做 AI,前后是能对得上的。
他的很多表达听起来很猛,甚至有点刺,但往下听会发现,他真正关心的不是姿态,而是事情到底能不能落地,实验能不能验证,组织能不能把一件事长期往前推。也正因为如此,这场访谈里最有意思的部分,往往不是那些最响的句子,而是那些句子背后连着的一整套做事逻辑。
如果一定要先拎出几个总的判断,我会把它们概括成下面四点。这里说的不是“标准答案”,更像是我听完整场访谈之后,觉得最能把全文串起来的四条线。
一、AI 越往前走,越不是个人英雄主义,而是组织能力的竞争
姚顺宇反复讲“集体主义”,不是在喊口号,而是在描述一个他眼里的行业现实:至少在模型能力已经爬到今天这个阶段之后,很多事情未必神秘到只有极少数天才能碰,真正拉开差距的,往往是能不能把想法拆成一连串具体步骤,能不能持续试、持续改、持续把细节做对。
所以他一边反感“神话个体”,一边又格外看重执行力,因为在今天的 AI 研发里,决定胜负的很多时候不是谁第一个想到,而是谁能更快、更稳、更系统地做出来。
二、Coding 先爆发,不只是因为它火,而是因为它最好训
他对 Coding 的判断很清楚:这不是一个偶然跑出来的应用场景,而是一个特别适合训练、评估和持续迭代的场景。回馈信号清晰,数据底座又足够厚,这两个条件一叠上去,它自然比很多别的方向更容易先跑出来。
也正因为如此,他后面会把“长程任务”这个方向说得那么重。对他来说,真正值得下注的,不只是“模型能写几行代码”,而是它能不能把一件更长、更复杂的事接过去,自己管上下文、管检索、管纠错,最后把整条链路做完。
三、眼下更关键的问题,已经不是“模型行不行”,而是“谁来承接它”
在这场访谈里,他对“智能涌现”并不感兴趣,对“是不是黑盒”也没那么纠结。因为在他看来,技术还会继续往前推,这一点几乎已经是前提了。更麻烦、也更现实的问题是:谁能把它做成产品,做成组织能力,做成商业,以及谁都很难单方面把它叫停。
所以后面你会看到,他对 chatbot、对“壳”公司、对模型壁垒、对 AI 安全的看法其实是连着的:它们不是零散观点,而是同一套判断往不同问题上的延伸。
四、这场访谈真正好看的,是一个人的判断怎么长出来
从清华物理,到斯坦福高能物理,再到 Anthropic、Google DeepMind,姚顺宇的路径表面上看跳得很大,底层其实很一致:他更愿意做那些自己能验证、能继续学下去、也能说服自己的事情。
理解了这一点,再回头看他为什么离开高能物理,为什么转去做 AI,为什么讨厌空谈、偏爱“做事系统”,后面很多判断就不显得突兀了。
下面还是顺着访谈本身的展开,一段一段往下看。
人物素描:一个不愿伺候老登的物理学家
两条平行线:两个姚顺宇
硅谷 AI 圈里有两位 Yao Shunyu,而且偏偏还是清华同一届毕业生。姚顺宇在访谈开头先把这件事说清楚了:
“那个顺雨,一开始一直是做CS,计算机相关;我从某种意义上是半道出家,之前做理论物理为主。“
两人本科时就是朋友,但后来走了两条几乎相反的路:姚顺雨去了普林斯顿学计算机,姚顺宇去了斯坦福学物理。直到现在,两人也还常联系。被问到“他是不是多次想把你拉过去”时,姚顺宇笑着说:“可能有这个意思吧。但是,我觉得不关键。”
上海少年:胆子要大
姚顺宇的成长经历里,有一种很早就显出来的劲儿:想要的东西,要自己去争。在上海上初中时,他听说清华有物理夏令营,当天就做了决定:
“我当时满脑子想的都是现在就得争取,再不争取明天就争取不到。当天就发了短信,疯狂发给清华招生办的老师。“
他后来把这件事总结为自己很早就形成的一条人生原则:
“胆子要大。你不争取是永远得不到的,争取了也有可能得不到,但不争取就绝对得不到。“
考试时,他“有半道题没做出来”,走出考场时一度觉得自己考崩了,“但我后来发现别人没做出来更多”。最后,他拿到了清华自主招生资格,高考录取线可以降到一本线;而他高考本身也确实没有考到清华统招分数线,“但是除了清北之外的学校都能上”。
网上有人说他是保送的,他纠正道:
“大家不在那几年上过学的人,很难理解那几年到底发生了什么。在我两届之前还是拿了省一等奖就能保送。我们那时候拿了省一等奖进了省队,然后再代表省队去考国家比赛,进了国家集训队才能保送。我进了省队去考了国家比赛,但没考进国家集训队。所以我没有保送名额。“
他自评“挺菜的”:“难道不是没有干到最好就是很菜吗?我显然没有干到最好,所以就是很菜。”
谈到家庭教育,他讲的是一种很少见、但听上去又很有效的相处方式:
“我爸妈最好的一点就是他们不太管我。他们可能曾经也试图管过,后来发现管不住。我也不听他们的。我一般都是通知,不是商量。中高考填志愿也是,我爸妈甚至可能都没见过我志愿单。"
"当你没有办法理解别人在干什么的时候,别指手画脚就是最好的。我觉得我爸妈这个道理懂得很好。“
从量子物理到高能物理:本科一路高歌,博士慢慢失望
姚顺宇在清华物理系本科阶段的表现,几乎可以说是一路高歌。大二开始修博士生课程,与导师汪忠教授合作完成高维 Floquet 周期驱动系统的拓扑分类,首次在国际上给出非厄米系统的拓扑能带理论,预测 非厄米趋肤效应(Non-Hermitian Skin Effect),论文发在 Physical Review Letters,获编辑推荐,被引用近千次。2018 年,他拿到清华大学本科生 特等奖学金。
清华基科班的传统: 姚顺宇详细描述了当时清华物理系基科班的一个独特传统:
“首先基科班他虽然在物理系,但它不限制学生干什么。所以基科班实际上2/3的学生都不会做物理。“
另一个传统,是鼓励学生尽早进实验室,在做中学。他找到当时还很年轻的 汪忠 老师,开始做理论物理研究。后来回头看,他觉得拓扑绝缘体相关问题“很适合本科生上手”,门槛不算太高,但很考验理解是否真的到位。
他回顾本科科研时说了一个有趣的类比:
“从某种意义上来说,我觉得现在回头来看做那个工作,做那段时间的科研,其实和现在做AI特别特别像。“
高能物理的困境:骗不了自己
但到了博士阶段,转向高能物理之后,事情开始变了。他经历的是一种外面不太看得见、但自己心里很清楚的失望:
“高能理论这个方向,足够难,非常非常难。但它不好的在于,不是特别可以验证,没有什么客观评价标准。因为高能理论已经发展到了实验完全追不上的阶段。“
他描述了一个学科被”老登”主导的困境:
“这时候谁做的好、谁做的不好,就依赖于领域内一些老登的主观判断。” “人这一辈子也没多长,为什么要把自己的时间浪费在伺候老登身上?“
说到那段内心挣扎,他讲得很坦率:
“达到外界的标准,达到一个小的圈子的评价标准,像训练模型一样,一旦你知道他们的评价标准之后,做得好是很容易的。但是你还是知道你是不认可的。有时候你哪怕不认可,你达到了,也可以蒙蔽自己继续往前走。但我后来就发现我蒙蔽不了自己,骗不了自己。“
这种转折大约发生在博士最后两年。但那时他也没有立刻想清楚,如果不做这个,还能去做什么。于是他开始同时看量子计算和 AI,因为在他眼里,这两个方向都更像是“年轻人还有机会进去的地方”。
博士毕业后,他在伯克利的 postdoc 实际上只正式待了两个星期就离开了。他坦承,自己一开始就告诉对方:“我可能会去做 AI 了,要不就别入职了。”对方的回应也很宽容:没关系,能来多久就来多久。
他把博后描述为“有点像搞慈善”:国家或个人给学校捐一笔钱,学校用来招博士后,自己想干啥干啥。实际上,他在入职前就已经人在湾区,先去伯克利待了两三个月,但官方记录只有两个星期。
跨界的真正原因
在“为什么最终选了 AI 而不是量子计算”这个问题上,姚顺宇给出了一个颇为反直觉的理由:
“量子计算的主要瓶颈在实验上。不是怎么设计算法或者算子,更多是怎么在实验上实现它。那个事反而是我不擅长。跟我相关的反而是AI。更多是你有一个想法,可以用一些数值去验证。这个数值在AI里面,可能就是训练一个模型。这和做物理很像。“
他把当前 AI 研究比作 18 世纪的物理学,也就是理论和实验还没有彻底分家的时代:
“那个时代理论和实验不分家,没有什么理论物理学家、实验物理学家,你就是搞物理的。你自己可以做实验,也可以做理论推测。AI就有点像那个时代。“
但被问到物理对做AI有什么帮助时,他出人意料地说:
“硬实力上没什么帮助。纯工具性的技能上来说,从物理到AI的转化,是非常非常少的。但非要问的话,可能是性格吧。“
AI行业格局:chatbot、壁垒与 Cursor 之争
chatbot 是搜索的延伸
姚顺宇对当前 AI 产品格局有独到的分析。他认为 chatbot 并非全新的产品形态,而是搜索的延伸:
“大家和聊天机器人最多的交互,其实就是’我有一个问题想问它’。这本来就是搜索在干的事。但它比搜索强很多的一点,是它变得非常有交互性。你可以追问,它甚至可以帮你总结、浓缩成回答你问题的信息。这是以前搜索给不了你的。“
说到数据飞轮这个行业热词,他的判断反而很冷静:
“目前来说,我觉得没有哪一个场景真正形成了数据飞轮。甚至在纯 AI 原生的应用场景里,除了编程写代码之外,我还没有看到哪个场景真正做得非常成功。"
"壳”公司的宿命
聊到 Manus 和这类后来被模型公司收编的智能体产品团队时,姚顺宇的判断很直白:
“壳最后都卖给了模型。“
在他看来,这类“壳公司”如果想活下来,大概只有两条路。一条是“逃得足够快”,也就是增长速度快到模型公司反应过来时,你已经占住了用户心智;等对方开始追产品形态时,你又已经往前一步,开始自己做模型。Cursor 在他眼里,走的就是这条路:
“Cursor在AI原生场景下几乎是我能想到的创业公司里增长的最快的。就算这样的公司他现在也很有危机感。Cursor 和 Anthropic 现在已经进入了一个非常微妙的关系,曾经他们是亲密无间的合作伙伴,后来Anthropic自己有了Claude Code,Claude Code现在变得非常成功,然后 Cursor 又试图做自己的模型,Cursor在努力训练他的composer。“
这种竞争之所以残酷,核心就在于编程工具本身是一类效率工具:
“效率工具很容易出现赢家通吃。不管对 Cursor、Anthropic,还是对任何一个做编程工具的公司来说,这都是他们比较担心的事。“
创业公司与大公司:为什么这些产品先诞生在外部团队
一个更值得追问的问题是:为什么这一波最有话题度的 AI 应用产品,往往不是最先诞生在拥有最强模型的大公司内部?
“一个公司一旦变大了之后,他的负担也变大了。我作为一个研究员可以做一些看起来很有趣、很有特点的产品,但我一旦把这个产品公开给公众,要负责的事情是非常多的,法律上不能有风险,用户上不能损坏品牌,还要给它固定的资源去serve模型。这对大公司来说还是有挺多负担的。"
"但对于个人来说无所谓,我反正是一个开源的项目,代码垃圾又如何,你来帮我一起写吧。“
他举了一个例子:“Google不可能提供一个会把你系统搞崩的产品出去。”这种保守是大公司的天然劣势。
聊到 Meta 买 Manus 这件事时,他至少更看重背后的团队和人才,而不只是产品本身:
“我觉得对他们来说最大的用处就是获得了一批很好的在亚洲的产品团队。中国的AI人才储备还是很丰富的,虽然目前从纯技术上中国AI还没有真的追上美国,但中国的本质上人才是比美国要更好的。Manus成为了Meta在新加坡的一个锚点。“
换句话说,在他眼里,Meta 更像是借 Manus 拿到了一个团队入口,也拿到了一个在新加坡继续吸引东亚人才的落点。
技术洞察:黑盒、涌现与 Scaling Law(缩放定律)
“这世界上所有东西都是黑盒”
姚顺宇对”AI是黑盒”这个说法不以为然:
“这世界上所有东西都是黑盒。哪怕像物理这种,不管是量子力学,还是量子场论,本质上也只是在描述某个能标下的行为。这个系统最微观的动力学,我们其实并没有完全搞清楚。“
在完整访谈中,他进一步展开了这个论述:
“我们确实对语言模型没有理解到神经科学手术刀级别,不是说能理解到这个行为是由于哪一个人工神经元的哪一个激发产生的。没有。除非在一些很稀疏很小的网络里面。但在实际能够使用的语言模型里,都没有达到这样的理解。但也不代表我完全没有理解。“
他用 Scaling Law,也就是“缩放定律”,做了一个类比:
“如果连 Scaling Law 都不能算作一种理解的一部分,那是不是也可以反过来说,我们对这个世界本身也谈不上理解?因为从某种意义上说,这个世界同样是个黑盒。“
他进一步拿 Scaling Law 和热力学定律作比较。热力学定律最初也是经验规律,后来随着微观机制的发现,才逐渐变成科学规律:
“经验规律和科学规律的差别,更多在于我们对它背后机制理解得够不够深。但在理解还没完全到位之前,经验规律照样能指导你做很多事情。“
涌现:没那么神秘,但也不能说完全不重要
对于”emergence”这个经常被拿来制造神秘感的词,他的态度是:
“Emergence肯定有。我不想说它不重要,但我觉得很多时候大家把它说得太神秘了。“
在他看来,很多所谓的”涌现”,可能只是一些能力在尺度上跨过了可见阈值,而不是凭空跳出来的魔法。他更关心的是:这种现象能不能被稳定复现,能不能被工程上利用,而不是它听起来是不是足够玄。
为什么 coding 会先成
姚顺宇对 coding 场景的判断很清楚:它之所以先爆发,不只是因为开发者人群愿意尝鲜,还因为这是少数同时满足“数据足够多”和“反馈足够清晰”的任务。
他说得很直白:
“你做 coding,模型写得对不对,跑一下就知道了。它和很多别的任务不一样,很多任务你很难有这么明确的 reward signal。“
这也是为什么他会把编程工具看得那么重。对模型公司来说,coding 不只是一个好卖的产品方向,更像是一个天然适合训练、评估、收集反馈和持续改进的试验场。
ML Coding 与 Long Horizon:AI 自己训练自己,和更长程的任务处理
访谈里一个很关键的判断,是他把 ML Coding 和 Long Horizon 放在了一条连续的演进链上。
这里的 ML Coding,可以理解成“用 AI 来参与甚至加速 AI 自己的研发工作”;而 Long Horizon,指的是模型不只完成一个短动作,而是能处理跨越更长时间、更长上下文、更多步骤的复杂任务。
他提到,今天很多模型已经能在局部任务上表现不错,但真正难的是把这些能力连起来,让它在更长的任务链里少掉线、少跑偏,还能自己维持上下文、自己纠错。
也正因为如此,他认为更大的机会,不只在“让模型写一段代码”,而在“让模型能自己做完一件更长的事”。
关于 AI 安全:很难单方面叫停
谈到 AI 安全和治理时,他的一个核心判断是:这件事很难靠某一家公司、某一个国家单方面踩刹车。
他的理由并不复杂:只要大家都知道这件事继续做下去有巨大的价值,就很难指望所有参与者同时停下来。技术竞争、国家竞争、商业竞争会层层叠加,让“大家一起慢下来”变成一件极难实现的事。
他甚至用了一个很重的类比,意思是这种技术一旦进入国家层面的竞争逻辑,就会天然带上制衡色彩。未必每个人都喜欢这个局面,但它大概率就是现实。
在 Anthropic:为什么押注 coding,为什么反感空谈
Anthropic 为什么押注 coding
姚顺宇对 Anthropic 押注 coding 的理解,不是“大家都在做,所以我们也做”,而是它确实具备几个别的应用方向很难同时具备的条件:
- 数据足够多。
- 反馈足够清晰。
- 可以快速形成训练闭环。
这套逻辑和他前面对 coding 的判断是完全一致的。也就是说,Anthropic 之所以重视 Claude Code,不只是因为它有商业价值,更因为这本身就是一个最适合把模型能力继续往前推的方向。
反感空谈,重视能不能做出来
访谈里有一种很稳定的气质,就是他不太吃“概念领先”这一套。
不管是在学术阶段,还是转去做 AI 之后,他都更关心一件事:你说的这套东西,到底能不能被验证,能不能被持续迭代,能不能真正做出来。
这也是为什么他会对一些“讲得很玄”的方向天然保持距离,而对那些虽然不一定最浪漫、但可以快速试验、快速反馈、快速改进的方向更有偏好。
对前同事的判断:吴永辉与少见的 senior 技术人
谈到 Google 里的吴永辉时,姚顺宇先强调自己没有和对方直接共事过,所以不敢轻易下特别客观的判断。但他后面还是给了一个分量很重的评价。
在他看来,吴永辉属于那种级别已经很高、人也已经非常 senior,同时技术能力还很强的人。这种人本来就非常少见,而他的判断也不是凭空来的,而是因为他“偷偷看过”吴永辉以前写过的代码,也看过他带过的项目。
换句话说,这不是一种泛泛的同行客套,而是带着技术观察做出的评价。
在 Google DeepMind:组织、文化与人才
集体主义,不是口号
姚顺宇在访谈里多次提到“集体主义”,但他用这个词时,并不是在强调某种抽象立场,而是在讲一个非常现实的问题:今天做前沿 AI,越来越像是一种系统工程。
单个人当然仍然重要,但当很多核心路径已经被验证过一轮之后,真正决定上限的,往往不是某个天才灵光一现,而是团队能不能把大量细碎但关键的事情持续做好。
这也是为什么他会觉得,个人英雄主义在今天这个阶段已经越来越不够用了。
Google 的组织能力
从 Anthropic 到 Google DeepMind,这种“系统能力”的感受在他身上其实是连着的。
他并不是简单地把公司分成“谁更聪明、谁更不聪明”,而是更关心:一个组织能不能把资源、方向、执行、人才密度和长期目标拧在一起。如果可以,那它就能持续往前推;如果不行,再好的想法也容易散掉。
访谈里反复出现的几个人
| 人名 | 身份 | 姚顺宇的描述或评价 |
|---|---|---|
| 姚顺雨 | 清华同届、后去 OpenAI / 腾讯 | 本科朋友,路径和自己几乎相反,但一直有联系 |
| 汪忠 | 清华物理导师 | 很 sharp,很能看清问题,而且不爱过度干涉别人 |
| Douglas Stanford | Anthropic 同事 | “比我聪明太多了” |
| Anthropic 产品负责人(字幕中记作 Ori) | 产品负责人 | 被描述为“懂 AI 的产品经理”,但姓名未做独立外部核实 |
| 吴永辉 | Google 资深技术负责人 | 级别很高、人很 senior,同时技术又非常强,这样的人非常少见 |
这个表本身也能反过来说明一件事:姚顺宇虽然不爱讲空话,但他很在意“人”。只不过他在意的不是头衔本身,而是一个人到底怎么看问题、怎么做事、有没有真功夫。
中美 AI 产品差异:效率工具与日常陪伴
谈到中美 AI 产品差异时,姚顺宇的观察,不是简单的“谁强谁弱”,而是两边的产品重心本来就不太一样。
在他看来,美国用户更自然地把这类模型当成效率工具来用,首先看的是它能不能帮自己解决工作里的问题,尤其是技术问题。所以对他自己来说,因为生活里的很多困惑本来就是技术上的,他也会更自然地去问 Gemini 这类更聪明的模型。
但像豆包这样的产品,长处并不完全在这条线上。它更强的是日常场景里的表现,比如响应很快、语音做得更好、互动更自然,也更容易承接生活里那些不那么严肃、但随时会冒出来的小问题。从这个角度看,它对应的并不是同一类使用习惯。
姚顺宇也提到,自己用豆包其实只用过一两次。一方面,在美国使用国内模型本身就没那么方便;另一方面,他自己的使用需求本来就更偏技术向,所以最后自然还是更常用 Gemini、Claude 这一类工具。
对未来程序员的判断:人数更少,价值更集中
访谈里最容易被截成短视频的一句,可能就是他对未来程序员数量的判断。
他的说法大意是,以后的程序员可能只有现在的千分之一,但这些人拿到的回报,反而可能是今天的 100 倍。
这里最重要的不是“千分之一”这个数字本身,因为他自己也明确说这是个“虚数”,不是精确预测。真正关键的是他背后的判断:当 AI 大量接管那些更标准化、更理性、更容易被形式化描述的工作之后,留下来的人会更少,但也会更强,价值会更集中。
换句话说,未来不是“程序员彻底消失”,而是这个职业的门槛、角色和产出方式都会被重新定义。
最后:这不是一场靠狠话成立的访谈
这场访谈里当然有很多适合传播的句子,但如果只把它理解成“一个很敢说的人讲了很多狠话”,其实会错过真正有价值的部分。
更值得记住的是,姚顺宇怎么从物理走到 AI,怎么判断一件事值不值得做,怎么理解组织、技术、产品和人之间的关系。这些东西加在一起,才构成了这场 4 小时访谈真正的密度。