Anthropic SDE 岗的招聘流程很多人好奇。作为目前 AI 领域最火的公司之一,他们的面试风格确实和传统互联网公司很不一样。很多人原本以为就是常规刷题 + 系统设计,但真正走一遍流程之后会发现:他们更看重工程能力、代码质量,以及你对 AI 安全的理解。
整个流程不算特别长,但每一轮都非常有针对性。如果准备方向不对,很容易在中途被刷掉。下面把完整流程整理出来,给准备投 Claude 相关团队的同学做个参考。

Timeline
一般来说,从第一轮到最终结果大概需要2–4 周。
典型流程是:
- Initial Screening
- Technical Phone Screen
- Online Coding Challenge / OA
- Hiring Manager Interview
- Virtual Onsite(4 轮)
有些团队会把OA 放在 Phone Screen 之前,整体顺序会略有变化,但核心考察模块基本一致。
Initial Screening(30min)
背景和动机沟通
第一轮是 Recruiter Screening,整体氛围比较轻松。主要是了解候选人的背景以及申请动机。
通常会聊到:
- 过往的 SDE / Backend / Infrastructure 项目经验
- 是否有分布式系统或者服务开发相关经验
- Work authorization
- 长期职业规划
这一轮基本不会涉及技术问题,更像是一个背景匹配的确认过程。
Culture Fit 初步判断
Recruiter 通常也会介绍公司的使命,比如 Anthropic 在 AI 安全方面的研究方向。相比很多公司单纯追求模型能力,他们更强调 AI 的安全性和可解释性。
如果提前了解过Constitutional AI相关内容,在这一轮沟通的时候会明显更容易建立共识。
Technical Phone Screen(45min)
Coding:LLM 场景工程题
这一轮虽然是 Coding,但并不是传统算法题,而是更贴近大模型工程的场景题。
比较常见的题型是实现一个LLM 请求调度系统,例如设计一个高效的 token batching 机制。系统需要处理多个推理请求,将它们合理合并到同一个 batch 中,以提升 GPU 推理效率。
候选人需要完成:
- 数据结构设计
- batching 调度逻辑实现
- 时间复杂度与空间复杂度分析
这类题目更像是一个小型工程系统,而不是单纯的算法题。
基础问答:LLM 工程认知
Coding 之后通常会聊几个基础问题,用来确认候选人对大模型系统的理解。
例如:
- LLM inference 的主要性能瓶颈在哪里
- KV cache 在推理阶段的作用
- 如何提升推理吞吐量
问题深度不会特别极端,但如果完全没有接触过大模型系统,很容易被看出来。
Coding Challenge / OA(90min)
CodeSignal 系统模拟题
Anthropic 的 OA 通常是在 CodeSignal 上完成。和很多公司的在线笔试不太一样,它并不是典型的 LeetCode 算法题,而更像是一个完整的小型系统实现任务。
最常见的一类题目就是银行系统模拟。候选人需要从零实现一个简单的账户系统,并逐步扩展功能。题目通常会要求实现创建账户、存款和取款、账户之间转账、查询交易记录,以及实现一定规则下的 cashback 逻辑等功能。整体代码量会比普通算法题多很多。
难点:需求逐层递进
这类题真正的难点并不在算法,而在于需求是逐步增加的。题目一开始可能只要求实现最基础的账户系统,当你写完之后,下一问就会要求支持交易记录查询。再往后可能会加入 cashback 规则,甚至会要求实现 transaction rollback(撤销交易)等复杂功能。
如果一开始代码结构设计得不合理,比如类之间耦合太高或者状态管理混乱,后面每增加一个功能都会变得非常难改。这也是为什么很多平时只刷 LeetCode 的候选人在这类题上会比较不适应。
Anthropic 在这一轮更看重的是工程代码质量,比如类设计是否清晰、模块是否容易扩展、异常处理是否完整,以及代码整体的可读性。如果代码结构清晰,即使功能没有全部完成,通常也能获得不错的评价。
Hiring Manager Interview(1h)
Code Review 深挖
这一轮通常由 Hiring Manager 主导,形式和传统 coding 面试不同,更像一次真实的工程讨论。面试官通常会给出一段代码,让候选人进行 Code Review,并解释这段代码可能存在的问题。
常见的任务包括找出潜在的 Bug、识别并发相关问题、分析性能瓶颈,以及解释这段代码在实际系统中的用途。有些情况下,面试官还会继续追问,如果系统规模扩大十倍或者流量突然增长,你会如何优化这段代码或整体架构。
这一轮主要考察的其实是候选人的工程经验和系统思维能力。相比单纯写算法,面试官更关心你是否能读懂复杂代码、发现隐藏问题,以及提出合理的改进方案。
VO,四轮
最后一轮是 Virtual Onsite,一般会连续进行四轮面试,总时长大约四个小时。整体节奏比较紧凑,每一轮的考察重点也都不一样。
Coding Interview(1h)
这一轮依然是 coding,不过题目通常更接近真实业务逻辑,而不是特别刁钻的算法题。面试官更希望看到候选人如何组织代码、如何处理状态,以及如何考虑边界条件。
常见的考察内容包括数据结构设计、状态管理以及各种异常场景的处理。题目难度整体不会特别极端,但如果代码结构混乱或者没有考虑边界情况,评分通常不会太高。
System Design(1h)
System Design 这一轮通常会围绕 Claude 相关的业务场景展开。面试官可能会让你设计一个支持大规模用户对话的聊天系统,或者讨论如何实现 token 计数与计费逻辑,以及在高并发推理请求下如何保持系统稳定。
讨论内容通常会涉及 API 设计、数据存储方案、缓存策略、服务拆分以及系统扩展性等问题。这一轮更看重整体架构思维,而不是具体代码实现。
Second Coding(1h)
第三轮 coding 通常会根据候选人的岗位方向来设计题目。如果申请的是 Infrastructure 相关岗位,问题可能会偏向并发处理、任务调度或者资源管理。如果是 Fullstack 方向,则更可能涉及 API 逻辑实现或者数据处理流程。
整体思路和第一轮 coding 类似,但更贴合岗位实际工作内容。
Behavioral Interview(1h)
最后一轮是 Behavioral Interview,也是 Anthropic 面试中非常有特色的一部分。面试官通常不会只问传统的行为问题,而是会讨论一些与 AI 相关的社会议题。
例如 AI 伦理问题、数据隐私保护、AI 对就业市场的影响,以及 AI Safety 在未来技术发展中的重要性等。回答这些问题时,最好能够清晰表达自己的观点,并给出逻辑完整的 reasoning,而不是简单给出模糊的答案。
面试准备补充
像 Anthropic 这种 AI 公司面试,其实很多人卡的不是算法,而是工程型题目和时间压力。比如 OA 的系统模拟题、VO 的业务 coding,或者 HM 的 Code Review,如果之前没怎么做过类似题型,现场很容易突然卡住。
所以也有不少同学在准备的时候会提前了解一下面试辅助。简单说就是在 OA 或 VO 的过程中,有人帮忙做实时思路提醒,如果你最近也在准备 AI 公司或者大厂 SDE 面试,不管是 OA、VO都可以 联系我们 。