AI 27 Apr, 2026 Anthropic

Anthropic 产品团队为何快过所有人

Anthropic 是当前 AI 行业中产品迭代速度最快的公司之一,其背后有一套值得深究的产品方法论。这期访谈中 Cat Woo 系统性地分享了 Claude Code 团队的实战经验,信息密度极高,值得反复阅读。

阅读信息

共 8870 字 预计 30 分钟
Anthropic 产品团队为何快过所有人

背景介绍

Anthropic 是当前 AI 行业中产品迭代速度最快的公司之一,其背后有一套值得深究的产品方法论。这期访谈中 Cat Woo 系统性地分享了 Claude Code 团队的实战经验,信息密度极高,值得反复阅读。

播客来自 Lenny’s Podcast——由 Lenny Rachitsky 主持的科技产品类播客,聚焦产品管理、创业和增长话题,是科技行业最受欢迎的播客之一。

本期嘉宾 Cat Woo 是 Anthropic Claude Code 和 Co-work 的产品负责人 (Head of Product)。她曾是一名工程师,后短暂做过 VC,加入 Anthropic 后主导 Claude Code 的产品策略。她和 Boris(Claude Code 技术负责人)共同组成了这个团队的核心领导搭档。

这期对话(2026年4月23日)发生在 Anthropic 处于高速增长期——ARR 已突破 110 亿美元,Claude Code 正从开发者工具演变为 AI 原生的编程平台。访谈涵盖了一个核心命题:当模型能力每隔几个月就跃升一次,产品经理的角色该如何重新定义?

原文地址:https://www.youtube.com/watch?v=PplmzlgE0kg,时长 85 分钟。

核心概览

AI 原生产品的节奏革命

1.1 发布周期:从季度规划到每日交付

Cat 在面试了数百名 PM 后发现,大多数人仍在用过时的思维理解 AI 时代的产品工作。

在 AI 之前,技术变革节奏缓慢,PM 可以按 6-12 个月的时间线规划。代码编写成本高,需要大量跨团队协调来确保功能相互配合,重点在于多季度路线图的对齐。

但 AI 改变了一切:

“功能开发周期从 6 个月压缩到 1 个月,有时甚至 1 周或 1 天。PM 不应该再把时间花在跨季度路线图对齐上,而应该思考:怎样才能最快地把东西交付到用户手中?“

Claude Code 团队的核心机制是 Research Preview(研究预览) 模式——几乎所有功能都先以此模式发布,明确标注为早期实验性功能,降低发布承诺。这让团队能在一两周内就获得真实用户反馈,而不是等到产品打磨完美。

1.2 加速交付的三个关键实践

Cat 总结了让团队保持极速的三个要素:

1) 设定清晰目标 —— LLM 太通用,这反而制造了大量歧义。好的 PM 能明确回答:核心用户是谁?要解决什么问题?Cat 举例说,当目标是”帮助企业专业开发者安全地实现零权限提示”时,这就排除了大量可能的方案,让团队快速聚焦。

2) 建立可重复的发布流程 —— 工程师在”常青发布室 (Evergreen Launch Room)“发布就绪功能后,文档、市场、开发者关系团队第二天就能完成配套工作。这种紧密流程让任何工程师都能低摩擦地发布。

3) 创建跨职能协作框架 —— PM 的角色是搭建这个框架,让团队知道何时拉入跨职能伙伴、各方的期望是什么。

1.3 PRD 的演变

Cat 的团队仍然做 PRD,但用法发生了变化。核心实践有两项:

  • 严格的指标周会:每周与全团队做指标回顾,确保每个人都理解业务的方方面面
  • 团队原则清单:包括核心用户是谁、为什么选择这些用户——目的是让每个人都能自主决策,不被 PM 阻塞

对于特别模糊的功能,仍会写一页纸 PRD;对于需要大量基础设施的多月项目,PRD 依然必要。但整体趋势是:轻量、快速、可变

1.4 Mythos 模型与发布速度的真相

Lenny 注意到有人制作了 Anthropic 产品发布日历,几乎每天都有重大功能或产品上线。他问这是否与 Anthropic 内部使用的强大模型 Mythos 有关。

Cat 的回答很坦诚:

“我们已经连续好几个季度保持这个速度了,所以不能完全归功于 Mythos。Mythos 是一个极其强大的模型,我们在内部确实使用它,它可能在某种程度上提升了我们的发布速度,但我不认为它是主要原因。“

她认为真正的加速来自三个因素:流程极简化(移除所有发布障碍)、全员赋能(任何人都能在一周甚至一天内把想法变成上线产品)、以及对最新前沿模型的内部访问。最后一个优势被 Cat 形容为”非常幸运”——Anthropic 团队能在第一时间使用最新模型来加速自身开发。

1.5 快速发布的代价:产品一致性与用户认知负担

当被问及”在角色融合、快速发布的世界里,我们失去了什么”时,Cat 承认了明确的代价:

产品一致性被牺牲了。 在代码编写成本高的时代,团队会仔细规划整个产品矩阵——每个产品的定位、使用场景、集成方式,基本做到”一个场景一个产品”。但现在 AI 推进速度太快,需要测试的想法太多,导致有时会出现功能重叠的情况。

“很多时候是因为内部有两个方案我们都喜欢,想让外部用户告诉我们哪个更好。但这意味着新用户可能不知道完成某个任务的最佳路径是什么。“

用户跟上节奏的难度也在增加。 传统 PM 每月或每季度发布一个功能,用户每月看一眼就够了。但在 agentic 工具时代,用户感觉自己必须每天刷 Twitter 才能跟上最新动态——这是一种”越来越快的跑步机”效应。Cat 表示团队正在想办法让用户感觉”工具会教育你、带着你走”,而不是被迫追逐。

组织文化与 Anthropic 的成功密码

2.1 角色融合:工程师、PM、设计师的边界正在消失

Anthropic 约有 30-40 名 PM,分布在 Research PM、Claude 开发者平台、Claude Code、Enterprise 和 Growth 五个团队。

Cat 观察到一个明确趋势——所有角色都在合并:

“PM 在做工程工作,工程师在做 PM 工作,设计师也在写代码。你可以招聘大量有产品品味的工程师,也可以保持工程师编制不变,招聘更多 PM 来引导他们的工作。“

Claude Code 团队选择了前者——侧重招聘有 Product Taste 的工程师。团队中有许多工程师能端到端完成从 Twitter 上的用户反馈到一周内发布产品的全过程,几乎不需要 PM 参与。

Cat 本身就是这一趋势的缩影——她曾是多年工程师,后短暂做过 VC。Claude Code 团队几乎所有的 PM 都有工程背景或能写代码,设计师也都有前端工程经验。

2.2 什么技能最值钱?Product Taste

当被问及”工程、产品、设计,哪个背景的核心技能最有价值”时,Cat 的回答很明确:

“代码变得越来越便宜,更有价值的是决定写什么。我们收到数万个 GitHub Issues,要什么都有——需要非常仔细地判断哪些值得构建、正确的构建方式是什么。这就是 Product Taste。“

工程背景在短期内仍有额外优势——它能帮助判断功能实现难度,从而影响优先级。简单的事不用讨论直接做,复杂的事需要更多考量。但 Cat 也指出,模型编码能力每隔几个月就有大幅跃升,这种优势可能很快被重新定义。

2.3 Anthropic 成功的两大要素

Anthropic 从”最不被看好的 AI 公司”成长为 ARR 110 亿美元的行业巨头。Cat 总结了两个核心因素:

统一使命 (Unifying Mission) —— Anthropic 雇佣最关心”将安全 AGI 带给全人类”的人。这个使命在所有产品决策中被频繁引用,让团队能快速做出跨越整个组织的决策。

“如果 Claude Code 失败了但 Anthropic 成功了,我会非常高兴。整个团队非常愿意遵循这个思路做决策。“

极致专注 (Focus) —— 使命意味着团队愿意做出牺牲,为 Anthropic 的目标而牺牲自己团队的 KR。这解释了为什么 Anthropic 没有去做社交网络、不做信息流——不是这些方向不好,而是不符合核心使命。

2.4 近期事件:源码泄露与 Open Claude 决策

Cat 也回应了两个近期热点:

源码泄露:因人为错误——一名员工用 Claude 写 PR 时出错,尽管经过两层人工审查仍未发现。当事人仍在公司,这被视为流程失败。Anthropic 已加强流程防止再次发生。

OpenClaw 限制:Claude 订阅制不是为第三方产品的使用模式设计的。Anthropic 需要优先支持自家产品和 API 的增长,同时为订阅用户提供 API credits 作为过渡。这是为了可持续增长做出的艰难取舍。

2.5 /powerup:当功能太多时的折中方案

面对上述”功能太多、用户难以跟上”的问题,Claude Code 团队推出了 /powerup 命令——一个内置的 onboarding 引导流程,帮助用户了解 100 个功能中最值得使用的 10 个。

Cat 坦承这是对原始理念的偏离:

“过去我们一直不愿做这种教程,因为我们觉得产品应该足够直觉化,不需要任何引导流程。但随着功能越来越多,用户对内置 onboarding 的需求太强烈了,我们不得不做出妥协。“

这个细节折射出一个更大的趋势:AI 原生产品的复杂度正在超过人类自然学习的速度,即便是设计哲学最极致的团队也不得不做出实用性妥协。

产品哲学——模型越强,产品越简单

3.1 “模型会吃掉你的 Harness”

这是整场访谈中最有洞察力的观点之一。所谓 “harness” 指的是围绕模型构建的辅助系统——提示词、工具、流程——用来弥补模型能力的不足。

Todo List 的经典案例:

Claude Code 刚发布时,用户让 Claude 做大规模重构,它会列出 20 个需要修改的调用点,但只改了 5 个就停了。团队成员 Sid 的解决方案是给 Claude 加一个 Todo List——像人类一样列清单再逐一处理。

这确实奏效了。但早期的模型需要不断被提醒:“你完成清单上所有项目了吗?” 到了 Opus 4 和之后的模型,Claude 不需要任何提示就自然地完成所有任务。现在 Todo List 对用户来说仍是不错的可见性工具,但对模型已完全不是必需品。

每次新模型发布时的例行工作:

  1. 通读整个 system prompt
  2. 反思每个部分:“模型还需要这个提醒吗?“
  3. 如果不需要,就移除

Cat 认为,应该构建在当前模型下还不能完美工作的产品——这样你就知道缺什么。当新模型发布时,直接替换到已建好的原型中,看新模型是否弥补了差距。Code Review 功能就是这样的例子——之前尝试过几次都不够好,直到 Opus 4.5/4.6 和 Sonnet 4.6 才达到工程团队愿意依赖它合并 PR 的水平。

3.2 产品矩阵:Claude Code / Desktop / Co-work 的定位

Cat 清晰地区分了三个产品的使用场景:

产品核心场景适合人群
Claude Code (CLI)一次性编码任务,最新功能最先落地追求最强大功能的专业开发者
Claude Code Desktop前端开发 + 实时预览,全局任务管理需要可视化界面或非技术用户
Web / Mobile路上远程启动任务随时随地不想带电脑的场景
Co-work输出不是代码的任务(邮件、PPT、文档)所有知识工作者

Co-work 的实战案例: Cat 需要为 Code with Claude 大会准备演讲 PPT。她先连接了 Google Calendar、Slack、Gmail、Google Drive 作为数据源,然后告诉 Co-work 演讲主题、产品市场经理建议的要点、自己不满意的初稿。Co-work 自动爬取了 Twitter 发布记录、内部发布频道、设计系统,生成了 20 页 PPT——视觉效果如同 Anthropic 设计师制作。Cat 只需做文字密度的微调。

3.3 Cat 的 PM 技术栈与内部工具生态

Cat 的日常工作工具以 Claude Code + Co-work + Slack 为核心。Anthropic 整体以 Slack 为”公司操作系统”。Cat 大约 30% 的时间花在推动 Co-work 的能力边界上,目的是深入理解产品”哪里还做得不好”。

Claude Code 在 Anthropic 内部解锁了一个更广泛的现象——个性化内部工具的爆发。因为 Claude Code 极大降低了构建定制应用的成本,公司内部出现了大量针对特定场景的自建工具。

典型案例:销售团队的定制 PPT 生成器

Claude Code 销售团队的一名成员发现自己在反复为客户制作定制化的演示 PPT,于是用 Claude Code 构建了一个 Web 应用。这个应用:

  • 内置了经过验证的 101、201 和”精通 Claude Code”三套核心模板
  • 从 Salesforce、Gong 等系统自动拉取客户上下文(使用 Bedrock 还是 Vertex、是否需要 HIPAA 合规、关注哪些安全控制)
  • 自动增删特定功能幻灯片(如仅限 Claude for Enterprise 的功能)
  • 将原本 20-30 分钟的手动工作压缩到几秒钟

3.4 谁在用最多的 tokens?Applied AI 团队的故事

除了工程团队之外,Anthropic 内部使用 Claude Code 和 Co-work 最多的团队是 Applied AI(应用 AI 团队)

Applied AI 团队是一个”非常技术化的 go-to-market 角色”——他们帮助客户采用最新的 API 和模型功能,既为客户的产品赋能,也帮助客户内部加速。他们同时大量使用 Claude Code(为客户制作原型)和 Co-work(管理客户沟通和会议准备)。

Applied AI 的 Co-work 工作流:

  • 前一晚让 Co-work 汇总次日所有客户会议的背景:过往需求、待办事项、top of mind 问题
  • Co-work 自动在 Slack 中搜索最新信息,比如某个功能的最新 ETA
  • 生成完整的客户会议简报(dossier),确保 Applied AI 人员在通话中拥有最新信息
  • 这些工作流由个人构建后分享给团队成员复用

关于 token 成本,Cat 表示每次模型能力跃升或产品大幅改进时,每个知识工作者的 token 花费都会显著增加。但目前仍远低于工程师薪资——虽然比例在持续上升。有趣的是,Anthropic 内部并非无限量供应 tokens——存在限制,但团队信任每个人负责任地使用。

3.5 未来愿景:从单任务到大规模并行

Claude Code 和 Co-work 的演进路径清晰可见:

  1. 单个任务成功(当前基础)→ 确保每个任务都能产生可接受输出
  2. 多任务并行(Multi-coding,2025 年底趋势)→ 同时运行 6 个 Claude
  3. 大规模并行(未来)→ 同时运行 50-100 个 Claude,需远程基础设施
  4. 自改进系统(终极目标)→ 用户反馈一次,模型在所有未来运行中自动改进

关键挑战包括:人类如何知道哪些任务需要亲自查看?如何确保 Agent 完全验证了自己的工作?如何让人类快速信任并验证结果?

给 AI 时代从业者的行动指南

4.1 四条核心建议

Cat 为所有面临 AI 变革的从业者提供了具体可操作的建议:

1) 自动化你的重复工作

每当你意识到自己在手动重复做某件事时,想想如何用 AI 工具自动化。AI 的美妙之处在于它能从你每次手动操作中学习、泛化,然后自动运行——让你专注于真正有创造性的部分。

2) 追求 100% 而不是 95%

“95% 的自动化不是真正的自动化——它不能被信赖。很多人在自动化到 90-95% 准确率时就放弃了。把时间花在教 Claude 你的偏好、给反馈、让它提升到 100%。最后 5-10% 确实更耗时,但那才是从’辅助工具’到’真正自动化’的关键跨越。“

3) 构建你每天都在用的工具

不要只做原型玩玩——构建你每天实际使用的应用。只有通过持续使用才能真正获得 AI 带来的杠杆效应。一次性 shot 一个东西然后不再使用,你学不到多少。

4) 避免过度定制化陷阱

有些人花太多时间定制工作流、添加大量 Skills 和 MCP,反而分散了对核心目标的注意力。简单的设置实际上效果更好。

4.2 AI 时代 PM 的新兴技能:找到”正确程度的 AGI 乐观”

Cat 认为当前 AI 公司 PM 最难掌握的技能是:定义产品一个月后应该长什么样。这中间有巨大的模糊性——模型能力在变,用户行为也在变。

最好的 PM 能看到一种模式:观察用户如何”滥用”现有产品的极限。这些极限行为暗示了下一步产品应该走向哪里。好的 PM 能据此设定方向、稳步执行,并在模型能力超出或低于预期时灵活调整路径。

Cat 还提出了一个精辟的概念——“正确程度的 AGI 乐观 (being the right amount of AGI pilled)”

“每个人都能看到模型极其聪明、能做几乎一切的未来——在那个未来里,你其实不需要太复杂的产品,一个文本框就够了,模型自己会添加工具、集成,会在不确定时主动提问。为一个超级 AGI 模型做产品其实很容易。真正难的是:为当前模型设计产品,如何激发其最大能力?如何引导用户走上最佳路径?如何发挥模型的优势同时弥补它的弱点? 这个技能非常稀缺。“

Cat 建议培养这个技能的方法是花大量时间与模型对话和使用。她特别喜欢让模型反思自己的行为——当模型做了出乎意料的事时,问它为什么这么做。模型的回答通常会揭示 system prompt 中的误导信息,从而帮助改进 harness。

4.3 为什么构建 Eval 被严重低估

Cat 明确指出 Eval(评估工具)是一个被严重低估的实践,更多的 PM 和工程师应该投入其中:

“你不需要构建数百个 Eval 才能使其有用。构建 10 个优秀的 Eval 就够了——它能帮助团队量化目标是什么、当前进展如何、还缺什么。“

Eval 的重要性因功能而异。Cat 会在功能需要更多产品定义时亲自参与 Eval 构建——通常的产出是”这里有 5 个 Eval,这样运行,这几个成功、那几个不成功,这是我用来提高成功率的提示词”。像 Memory(记忆)这样的功能特别受益于严谨的 Eval。

团队中有一个专门的小组与 Research 团队紧密合作,精确量化 Claude Code 的行为模式和最大改进空间。Cat 自己则在新模型测试时依赖一种非正式但高效的评估方式——团队午餐时的”vibe check”:拿着新模型去问每一位同事感受如何,收集诸如”这个模型解释思考过程不够充分”、“太突兀了”、“疯狂写 memories 但质量存疑”之类的反馈,然后用这些假说去数据中验证。

4.4 Claude 的性格为什么如此重要

Lenny 提到 Anthropic 联合创始人 Ben Mann 曾在节目中讨论过 Claude 的”性格”(character/constitution)——很多人最初以为这只是个无关紧要的”锦上添花”功能,但后来意识到它其实是 Claude 成功的核心要素之一。

Cat 对此做了深入解释:

“回想一下你共事过的所有人——总有那么几个人你特别喜欢他们的能量、他们的氛围。人们对 Claude 和 Claude Code 的感受也是这样。“

Cat 总结了 Claude 性格中几个关键特质:

  • 轻松有趣 (lighthearted and fun) — 但在任务上极其称职
  • 低姿态 (low ego) — 你指出错误时,它会真诚道歉:“哎呀,谢谢你告诉我,让我修一下,我们一起解决。“
  • 积极正面 (positive) — 当你面对看似不可能的任务不知如何开始时,Claude 会说:“没关系,这些是我建议的步骤,要不要我先帮你开始?“
  • 真诚反馈 (earnest feedback) — 不是简单地附和你说的每一件事

”我们努力将这些品质注入 Claude,因为它让协作变得更加愉快。这也是为什么 Open Claude 受限后用户特别难过的原因之一——他们与 Claude 建立的关系有着真实的个性连接。“

负责塑造 Claude 性格的关键人物是 Amanda。Cat 形容这是一个极其困难的角色——因为任务本身就高度模糊。编码好不好可以验证,但塑造性格需要极强的个人信念:Claude 应该成为谁?Amanda 不仅拥有塑造性格的非凡能力,还能清晰表达目标是什么、什么算成功、什么不算。

4.5 AI 怀疑论者与支持者的认知鸿沟

Lenny 引用了 Karpathy 最近的一条推文,描述了一个越来越明显的认知鸿沟

  • 怀疑论者:早期用过 ChatGPT/Claude,觉得”还行但不够好”,就放弃了。现在对 AI 能力持严重怀疑态度。
  • 实践者(特别是用 AI 编程的人):看到了 AI 的全部实力,无法理解为什么有人还不信。

Cat 认为关键的转折点在于产品范式的变化:

“2024 一代的产品是基于聊天 (chat-based) 的,而 Claude Code 一代的产品是基于行动 (action-based) 的。真正的’啊哈’时刻是当你意识到 agent 能替你做事——不仅是告诉你怎么做,而是它自己就能做。当人们亲身体验到这一点时,认知会被彻底打开。“

4.6 如何面对持续变化的焦虑

Cat 坦言 Anthropic 内部的节奏也常常令人窒息——“周日晚上有个 P0,周一早上变成两个,到了下午又冒出一个 P0000”。

她的应对哲学是:

  • 拥抱混乱:团队里都是面对挑战能微笑应对的人
  • 好好睡觉:只有休息好才能做出好决策
  • 无情优先排序:知道什么最重要,接受其他事情的不完美
  • 接受不完美:发布一个有小 bug 的功能,以前会让她失眠,现在她知道会收到快速反馈、下个版本就能修

4.7 人类大脑的价值在哪里?

在 AI 时代,人类仍然有独特价值——常识和情商。模型不总是清楚所有利益相关者是谁、他们之间的关系、各自的偏好、用什么渠道沟通最合适。这种 tacit knowledge(隐性知识)仍然非常有价值。

此外,Product Taste——判断构建什么以及如何构建的能力——在代码成本趋近于零的世界里变得更加稀缺和重要。

快问快答

问题回答
推荐书籍How Asia Works(经济发展)、The Technology Trap(技术革命对工人的影响)、Paper Menagerie(关于成长的故事集)
最爱影视Drive to Survive(F1 纪录片)、Free Solo(徒手攀岩纪录片,并由此成为了一名攀岩者)
最爱产品Waymo(无人驾驶出租车服务) — “我愿意支付 2 倍溢价。它让我每天多出 30 分钟生产力”
人生座右铭”Just do things” — 第一性原理思考 + 行动导向 + 不等待许可
最爱 Thinking Word”manifesting”:显化,一种通过吸引力法则,将愿望、想法或目标转变为现实的过程(Claude Code 每次思考时会显示一个单词,这个叫做 thinking word)
AGI 到来后的计划攀岩、搬到枫丹白露(生活在巨石之中)、每周读 1-2 本书、学习物理/机器人/硬件/航空航天

Share