Anthropic 产品团队为何快过所有人

背景介绍

Anthropic 是当前 AI 行业中产品迭代速度最快的公司之一，其背后有一套值得深究的产品方法论。这期访谈中 Cat Woo 系统性地分享了 Claude Code 团队的实战经验，信息密度极高，值得反复阅读。

播客来自 Lenny’s Podcast——由 Lenny Rachitsky 主持的科技产品类播客，聚焦产品管理、创业和增长话题，是科技行业最受欢迎的播客之一。

本期嘉宾 Cat Woo 是 Anthropic Claude Code 和 Co-work 的产品负责人 (Head of Product)。她曾是一名工程师，后短暂做过 VC，加入 Anthropic 后主导 Claude Code 的产品策略。她和 Boris（Claude Code 技术负责人）共同组成了这个团队的核心领导搭档。

这期对话（2026年4月23日）发生在 Anthropic 处于高速增长期——ARR 已突破 110 亿美元，Claude Code 正从开发者工具演变为 AI 原生的编程平台。访谈涵盖了一个核心命题：当模型能力每隔几个月就跃升一次，产品经理的角色该如何重新定义？

原文地址：https://www.youtube.com/watch?v=PplmzlgE0kg，时长 85 分钟。

核心概览

AI 原生产品的节奏革命

1.1 发布周期：从季度规划到每日交付

Cat 在面试了数百名 PM 后发现，大多数人仍在用过时的思维理解 AI 时代的产品工作。

在 AI 之前，技术变革节奏缓慢，PM 可以按 6-12 个月的时间线规划。代码编写成本高，需要大量跨团队协调来确保功能相互配合，重点在于多季度路线图的对齐。

但 AI 改变了一切：

“功能开发周期从 6 个月压缩到 1 个月，有时甚至 1 周或 1 天。PM 不应该再把时间花在跨季度路线图对齐上，而应该思考：怎样才能最快地把东西交付到用户手中？“

Claude Code 团队的核心机制是 Research Preview（研究预览） 模式——几乎所有功能都先以此模式发布，明确标注为早期实验性功能，降低发布承诺。这让团队能在一两周内就获得真实用户反馈，而不是等到产品打磨完美。

1.2 加速交付的三个关键实践

Cat 总结了让团队保持极速的三个要素：

1) 设定清晰目标 —— LLM 太通用，这反而制造了大量歧义。好的 PM 能明确回答：核心用户是谁？要解决什么问题？Cat 举例说，当目标是”帮助企业专业开发者安全地实现零权限提示”时，这就排除了大量可能的方案，让团队快速聚焦。

2) 建立可重复的发布流程 —— 工程师在”常青发布室 (Evergreen Launch Room)“发布就绪功能后，文档、市场、开发者关系团队第二天就能完成配套工作。这种紧密流程让任何工程师都能低摩擦地发布。

3) 创建跨职能协作框架 —— PM 的角色是搭建这个框架，让团队知道何时拉入跨职能伙伴、各方的期望是什么。

1.3 PRD 的演变

Cat 的团队仍然做 PRD，但用法发生了变化。核心实践有两项：

严格的指标周会：每周与全团队做指标回顾，确保每个人都理解业务的方方面面
团队原则清单：包括核心用户是谁、为什么选择这些用户——目的是让每个人都能自主决策，不被 PM 阻塞

对于特别模糊的功能，仍会写一页纸 PRD；对于需要大量基础设施的多月项目，PRD 依然必要。但整体趋势是：轻量、快速、可变。

1.4 Mythos 模型与发布速度的真相

Lenny 注意到有人制作了 Anthropic 产品发布日历，几乎每天都有重大功能或产品上线。他问这是否与 Anthropic 内部使用的强大模型 Mythos 有关。

Cat 的回答很坦诚：

“我们已经连续好几个季度保持这个速度了，所以不能完全归功于 Mythos。Mythos 是一个极其强大的模型，我们在内部确实使用它，它可能在某种程度上提升了我们的发布速度，但我不认为它是主要原因。“

她认为真正的加速来自三个因素：流程极简化（移除所有发布障碍）、全员赋能（任何人都能在一周甚至一天内把想法变成上线产品）、以及对最新前沿模型的内部访问。最后一个优势被 Cat 形容为”非常幸运”——Anthropic 团队能在第一时间使用最新模型来加速自身开发。

1.5 快速发布的代价：产品一致性与用户认知负担

当被问及”在角色融合、快速发布的世界里，我们失去了什么”时，Cat 承认了明确的代价：

产品一致性被牺牲了。 在代码编写成本高的时代，团队会仔细规划整个产品矩阵——每个产品的定位、使用场景、集成方式，基本做到”一个场景一个产品”。但现在 AI 推进速度太快，需要测试的想法太多，导致有时会出现功能重叠的情况。

“很多时候是因为内部有两个方案我们都喜欢，想让外部用户告诉我们哪个更好。但这意味着新用户可能不知道完成某个任务的最佳路径是什么。“

用户跟上节奏的难度也在增加。 传统 PM 每月或每季度发布一个功能，用户每月看一眼就够了。但在 agentic 工具时代，用户感觉自己必须每天刷 Twitter 才能跟上最新动态——这是一种”越来越快的跑步机”效应。Cat 表示团队正在想办法让用户感觉”工具会教育你、带着你走”，而不是被迫追逐。

组织文化与 Anthropic 的成功密码

2.1 角色融合：工程师、PM、设计师的边界正在消失

Anthropic 约有 30-40 名 PM，分布在 Research PM、Claude 开发者平台、Claude Code、Enterprise 和 Growth 五个团队。

Cat 观察到一个明确趋势——所有角色都在合并：

“PM 在做工程工作，工程师在做 PM 工作，设计师也在写代码。你可以招聘大量有产品品味的工程师，也可以保持工程师编制不变，招聘更多 PM 来引导他们的工作。“

Claude Code 团队选择了前者——侧重招聘有 Product Taste 的工程师。团队中有许多工程师能端到端完成从 Twitter 上的用户反馈到一周内发布产品的全过程，几乎不需要 PM 参与。

Cat 本身就是这一趋势的缩影——她曾是多年工程师，后短暂做过 VC。Claude Code 团队几乎所有的 PM 都有工程背景或能写代码，设计师也都有前端工程经验。

2.2 什么技能最值钱？Product Taste

当被问及”工程、产品、设计，哪个背景的核心技能最有价值”时，Cat 的回答很明确：

“代码变得越来越便宜，更有价值的是决定写什么。我们收到数万个 GitHub Issues，要什么都有——需要非常仔细地判断哪些值得构建、正确的构建方式是什么。这就是 Product Taste。“

工程背景在短期内仍有额外优势——它能帮助判断功能实现难度，从而影响优先级。简单的事不用讨论直接做，复杂的事需要更多考量。但 Cat 也指出，模型编码能力每隔几个月就有大幅跃升，这种优势可能很快被重新定义。

2.3 Anthropic 成功的两大要素

Anthropic 从”最不被看好的 AI 公司”成长为 ARR 110 亿美元的行业巨头。Cat 总结了两个核心因素：

统一使命 (Unifying Mission) —— Anthropic 雇佣最关心”将安全 AGI 带给全人类”的人。这个使命在所有产品决策中被频繁引用，让团队能快速做出跨越整个组织的决策。

“如果 Claude Code 失败了但 Anthropic 成功了，我会非常高兴。整个团队非常愿意遵循这个思路做决策。“

极致专注 (Focus) —— 使命意味着团队愿意做出牺牲，为 Anthropic 的目标而牺牲自己团队的 KR。这解释了为什么 Anthropic 没有去做社交网络、不做信息流——不是这些方向不好，而是不符合核心使命。

2.4 近期事件：源码泄露与 Open Claude 决策

Cat 也回应了两个近期热点：

源码泄露：因人为错误——一名员工用 Claude 写 PR 时出错，尽管经过两层人工审查仍未发现。当事人仍在公司，这被视为流程失败。Anthropic 已加强流程防止再次发生。

OpenClaw 限制：Claude 订阅制不是为第三方产品的使用模式设计的。Anthropic 需要优先支持自家产品和 API 的增长，同时为订阅用户提供 API credits 作为过渡。这是为了可持续增长做出的艰难取舍。

2.5 /powerup：当功能太多时的折中方案

面对上述”功能太多、用户难以跟上”的问题，Claude Code 团队推出了 /powerup 命令——一个内置的 onboarding 引导流程，帮助用户了解 100 个功能中最值得使用的 10 个。

Cat 坦承这是对原始理念的偏离：

“过去我们一直不愿做这种教程，因为我们觉得产品应该足够直觉化，不需要任何引导流程。但随着功能越来越多，用户对内置 onboarding 的需求太强烈了，我们不得不做出妥协。“

这个细节折射出一个更大的趋势：AI 原生产品的复杂度正在超过人类自然学习的速度，即便是设计哲学最极致的团队也不得不做出实用性妥协。

产品哲学——模型越强，产品越简单

3.1 “模型会吃掉你的 Harness”

这是整场访谈中最有洞察力的观点之一。所谓 “harness” 指的是围绕模型构建的辅助系统——提示词、工具、流程——用来弥补模型能力的不足。

Todo List 的经典案例：

Claude Code 刚发布时，用户让 Claude 做大规模重构，它会列出 20 个需要修改的调用点，但只改了 5 个就停了。团队成员 Sid 的解决方案是给 Claude 加一个 Todo List——像人类一样列清单再逐一处理。

这确实奏效了。但早期的模型需要不断被提醒：“你完成清单上所有项目了吗？” 到了 Opus 4 和之后的模型，Claude 不需要任何提示就自然地完成所有任务。现在 Todo List 对用户来说仍是不错的可见性工具，但对模型已完全不是必需品。

每次新模型发布时的例行工作：

通读整个 system prompt
反思每个部分：“模型还需要这个提醒吗？“
如果不需要，就移除

Cat 认为，应该构建在当前模型下还不能完美工作的产品——这样你就知道缺什么。当新模型发布时，直接替换到已建好的原型中，看新模型是否弥补了差距。Code Review 功能就是这样的例子——之前尝试过几次都不够好，直到 Opus 4.5/4.6 和 Sonnet 4.6 才达到工程团队愿意依赖它合并 PR 的水平。

3.2 产品矩阵：Claude Code / Desktop / Co-work 的定位

Cat 清晰地区分了三个产品的使用场景：

产品	核心场景	适合人群
Claude Code (CLI)	一次性编码任务，最新功能最先落地	追求最强大功能的专业开发者
Claude Code Desktop	前端开发 + 实时预览，全局任务管理	需要可视化界面或非技术用户
Web / Mobile	路上远程启动任务	随时随地不想带电脑的场景
Co-work	输出不是代码的任务（邮件、PPT、文档）	所有知识工作者

Co-work 的实战案例： Cat 需要为 Code with Claude 大会准备演讲 PPT。她先连接了 Google Calendar、Slack、Gmail、Google Drive 作为数据源，然后告诉 Co-work 演讲主题、产品市场经理建议的要点、自己不满意的初稿。Co-work 自动爬取了 Twitter 发布记录、内部发布频道、设计系统，生成了 20 页 PPT——视觉效果如同 Anthropic 设计师制作。Cat 只需做文字密度的微调。

3.3 Cat 的 PM 技术栈与内部工具生态

Cat 的日常工作工具以 Claude Code + Co-work + Slack 为核心。Anthropic 整体以 Slack 为”公司操作系统”。Cat 大约 30% 的时间花在推动 Co-work 的能力边界上，目的是深入理解产品”哪里还做得不好”。

Claude Code 在 Anthropic 内部解锁了一个更广泛的现象——个性化内部工具的爆发。因为 Claude Code 极大降低了构建定制应用的成本，公司内部出现了大量针对特定场景的自建工具。

典型案例：销售团队的定制 PPT 生成器

Claude Code 销售团队的一名成员发现自己在反复为客户制作定制化的演示 PPT，于是用 Claude Code 构建了一个 Web 应用。这个应用：

内置了经过验证的 101、201 和”精通 Claude Code”三套核心模板
从 Salesforce、Gong 等系统自动拉取客户上下文（使用 Bedrock 还是 Vertex、是否需要 HIPAA 合规、关注哪些安全控制）
自动增删特定功能幻灯片（如仅限 Claude for Enterprise 的功能）
将原本 20-30 分钟的手动工作压缩到几秒钟

3.4 谁在用最多的 tokens？Applied AI 团队的故事

除了工程团队之外，Anthropic 内部使用 Claude Code 和 Co-work 最多的团队是 Applied AI（应用 AI 团队）。

Applied AI 团队是一个”非常技术化的 go-to-market 角色”——他们帮助客户采用最新的 API 和模型功能，既为客户的产品赋能，也帮助客户内部加速。他们同时大量使用 Claude Code（为客户制作原型）和 Co-work（管理客户沟通和会议准备）。

Applied AI 的 Co-work 工作流：

前一晚让 Co-work 汇总次日所有客户会议的背景：过往需求、待办事项、top of mind 问题
Co-work 自动在 Slack 中搜索最新信息，比如某个功能的最新 ETA
生成完整的客户会议简报（dossier），确保 Applied AI 人员在通话中拥有最新信息
这些工作流由个人构建后分享给团队成员复用

关于 token 成本，Cat 表示每次模型能力跃升或产品大幅改进时，每个知识工作者的 token 花费都会显著增加。但目前仍远低于工程师薪资——虽然比例在持续上升。有趣的是，Anthropic 内部并非无限量供应 tokens——存在限制，但团队信任每个人负责任地使用。

3.5 未来愿景：从单任务到大规模并行

Claude Code 和 Co-work 的演进路径清晰可见：

单个任务成功（当前基础）→ 确保每个任务都能产生可接受输出
多任务并行（Multi-coding，2025 年底趋势）→ 同时运行 6 个 Claude
大规模并行（未来）→ 同时运行 50-100 个 Claude，需远程基础设施
自改进系统（终极目标）→ 用户反馈一次，模型在所有未来运行中自动改进

关键挑战包括：人类如何知道哪些任务需要亲自查看？如何确保 Agent 完全验证了自己的工作？如何让人类快速信任并验证结果？

给 AI 时代从业者的行动指南

4.1 四条核心建议

Cat 为所有面临 AI 变革的从业者提供了具体可操作的建议：

1) 自动化你的重复工作

每当你意识到自己在手动重复做某件事时，想想如何用 AI 工具自动化。AI 的美妙之处在于它能从你每次手动操作中学习、泛化，然后自动运行——让你专注于真正有创造性的部分。

2) 追求 100% 而不是 95%

“95% 的自动化不是真正的自动化——它不能被信赖。很多人在自动化到 90-95% 准确率时就放弃了。把时间花在教 Claude 你的偏好、给反馈、让它提升到 100%。最后 5-10% 确实更耗时，但那才是从’辅助工具’到’真正自动化’的关键跨越。“

3) 构建你每天都在用的工具

不要只做原型玩玩——构建你每天实际使用的应用。只有通过持续使用才能真正获得 AI 带来的杠杆效应。一次性 shot 一个东西然后不再使用，你学不到多少。

4) 避免过度定制化陷阱

有些人花太多时间定制工作流、添加大量 Skills 和 MCP，反而分散了对核心目标的注意力。简单的设置实际上效果更好。

4.2 AI 时代 PM 的新兴技能：找到”正确程度的 AGI 乐观”

Cat 认为当前 AI 公司 PM 最难掌握的技能是：定义产品一个月后应该长什么样。这中间有巨大的模糊性——模型能力在变，用户行为也在变。

最好的 PM 能看到一种模式：观察用户如何”滥用”现有产品的极限。这些极限行为暗示了下一步产品应该走向哪里。好的 PM 能据此设定方向、稳步执行，并在模型能力超出或低于预期时灵活调整路径。

Cat 还提出了一个精辟的概念——“正确程度的 AGI 乐观 (being the right amount of AGI pilled)”：

“每个人都能看到模型极其聪明、能做几乎一切的未来——在那个未来里，你其实不需要太复杂的产品，一个文本框就够了，模型自己会添加工具、集成，会在不确定时主动提问。为一个超级 AGI 模型做产品其实很容易。真正难的是：为当前模型设计产品，如何激发其最大能力？如何引导用户走上最佳路径？如何发挥模型的优势同时弥补它的弱点？ 这个技能非常稀缺。“

Cat 建议培养这个技能的方法是花大量时间与模型对话和使用。她特别喜欢让模型反思自己的行为——当模型做了出乎意料的事时，问它为什么这么做。模型的回答通常会揭示 system prompt 中的误导信息，从而帮助改进 harness。

4.3 为什么构建 Eval 被严重低估

Cat 明确指出 Eval（评估工具）是一个被严重低估的实践，更多的 PM 和工程师应该投入其中：

“你不需要构建数百个 Eval 才能使其有用。构建 10 个优秀的 Eval 就够了——它能帮助团队量化目标是什么、当前进展如何、还缺什么。“

Eval 的重要性因功能而异。Cat 会在功能需要更多产品定义时亲自参与 Eval 构建——通常的产出是”这里有 5 个 Eval，这样运行，这几个成功、那几个不成功，这是我用来提高成功率的提示词”。像 Memory（记忆）这样的功能特别受益于严谨的 Eval。

团队中有一个专门的小组与 Research 团队紧密合作，精确量化 Claude Code 的行为模式和最大改进空间。Cat 自己则在新模型测试时依赖一种非正式但高效的评估方式——团队午餐时的”vibe check”：拿着新模型去问每一位同事感受如何，收集诸如”这个模型解释思考过程不够充分”、“太突兀了”、“疯狂写 memories 但质量存疑”之类的反馈，然后用这些假说去数据中验证。

4.4 Claude 的性格为什么如此重要

Lenny 提到 Anthropic 联合创始人 Ben Mann 曾在节目中讨论过 Claude 的”性格”（character/constitution）——很多人最初以为这只是个无关紧要的”锦上添花”功能，但后来意识到它其实是 Claude 成功的核心要素之一。

Cat 对此做了深入解释：

“回想一下你共事过的所有人——总有那么几个人你特别喜欢他们的能量、他们的氛围。人们对 Claude 和 Claude Code 的感受也是这样。“

Cat 总结了 Claude 性格中几个关键特质：

轻松有趣 (lighthearted and fun) — 但在任务上极其称职
低姿态 (low ego) — 你指出错误时，它会真诚道歉：“哎呀，谢谢你告诉我，让我修一下，我们一起解决。“
积极正面 (positive) — 当你面对看似不可能的任务不知如何开始时，Claude 会说：“没关系，这些是我建议的步骤，要不要我先帮你开始？“
真诚反馈 (earnest feedback) — 不是简单地附和你说的每一件事

”我们努力将这些品质注入 Claude，因为它让协作变得更加愉快。这也是为什么 Open Claude 受限后用户特别难过的原因之一——他们与 Claude 建立的关系有着真实的个性连接。“

负责塑造 Claude 性格的关键人物是 Amanda。Cat 形容这是一个极其困难的角色——因为任务本身就高度模糊。编码好不好可以验证，但塑造性格需要极强的个人信念：Claude 应该成为谁？Amanda 不仅拥有塑造性格的非凡能力，还能清晰表达目标是什么、什么算成功、什么不算。

4.5 AI 怀疑论者与支持者的认知鸿沟

Lenny 引用了 Karpathy 最近的一条推文，描述了一个越来越明显的认知鸿沟：

怀疑论者：早期用过 ChatGPT/Claude，觉得”还行但不够好”，就放弃了。现在对 AI 能力持严重怀疑态度。
实践者（特别是用 AI 编程的人）：看到了 AI 的全部实力，无法理解为什么有人还不信。

Cat 认为关键的转折点在于产品范式的变化：

“2024 一代的产品是基于聊天 (chat-based) 的，而 Claude Code 一代的产品是基于行动 (action-based) 的。真正的’啊哈’时刻是当你意识到 agent 能替你做事——不仅是告诉你怎么做，而是它自己就能做。当人们亲身体验到这一点时，认知会被彻底打开。“

4.6 如何面对持续变化的焦虑

Cat 坦言 Anthropic 内部的节奏也常常令人窒息——“周日晚上有个 P0，周一早上变成两个，到了下午又冒出一个 P0000”。

她的应对哲学是：

拥抱混乱：团队里都是面对挑战能微笑应对的人
好好睡觉：只有休息好才能做出好决策
无情优先排序：知道什么最重要，接受其他事情的不完美
接受不完美：发布一个有小 bug 的功能，以前会让她失眠，现在她知道会收到快速反馈、下个版本就能修

4.7 人类大脑的价值在哪里？

在 AI 时代，人类仍然有独特价值——常识和情商。模型不总是清楚所有利益相关者是谁、他们之间的关系、各自的偏好、用什么渠道沟通最合适。这种 tacit knowledge（隐性知识）仍然非常有价值。

此外，Product Taste——判断构建什么以及如何构建的能力——在代码成本趋近于零的世界里变得更加稀缺和重要。

快问快答

问题	回答
推荐书籍	How Asia Works（经济发展）、The Technology Trap（技术革命对工人的影响）、Paper Menagerie（关于成长的故事集）
最爱影视	Drive to Survive（F1 纪录片）、Free Solo（徒手攀岩纪录片，并由此成为了一名攀岩者）
最爱产品	Waymo（无人驾驶出租车服务） — “我愿意支付 2 倍溢价。它让我每天多出 30 分钟生产力”
人生座右铭	”Just do things” — 第一性原理思考 + 行动导向 + 不等待许可
最爱 Thinking Word	”manifesting”：显化，一种通过吸引力法则，将愿望、想法或目标转变为现实的过程（Claude Code 每次思考时会显示一个单词，这个叫做 thinking word）
AGI 到来后的计划	攀岩、搬到枫丹白露（生活在巨石之中）、每周读 1-2 本书、学习物理/机器人/硬件/航空航天