Intuit Data Scientist 面經覆盤：這不是刷題能過的 DS 面試，很多人都死在這裡

最近，我帶的一位學員成功走完了 Intuit Data Scientist崗位的面試流程。整體體驗下來，最大的感受是：Intuit的面試極度側重實戰能力，且貫穿強烈的產品導向思維，不是單純考察理論知識，更看重候選人解決實際業務問題的能力。下面就為大家詳細拆解面試全流程、核心考點及應對思路，供各位備考同學參考。

面試流程

整個流程持續了接近 6 周，節奏不算快，但每一輪都有明確篩選目的。

Recruiter 電話初篩
Take-home 作業
Technical Screen（Karat 平臺）
Virtual Onsite（5 輪）

SQL

涉及了視窗函式、CTE、TurboTax/QuickBooks 使用者 cohort 分析。

Question 1

計算報稅使用者的月度留存率給定一個包含 user_id、file_date、product（TurboTax 或 QuickBooks）的使用者報稅表。計算 1 月份使用者在後續每個月是否再次報稅的比例。

解題思路

先定義 cohort 月，把 1 月份首次報稅的使用者作為 cohort；然後生成從 1 月開始的連續月份序列，用來保證每個月都有觀測點；接著將 cohort 使用者與他們後續的報稅行為按使用者和月份做左連線，判斷使用者在每個月是否有報稅記錄；最後對每個月的活躍標記取平均值，從而得到 1 月 cohort 在後續各個月份的留存率。

Question 2

Session 化問題表結構：user_id, timestamp, page_view定義：30 分鐘內的連續行為算一個 session計算每個使用者的 session 數。

解題思路

先按使用者和時間排序每條行為記錄，對 timestamp 使用 LAG 計算與上一條行為的時間差，當時間差大於 30 分鐘時標記為一個新的 session；然後在使用者維度上對這個新 session 的標記做累積求和，為每條行為分配一個 session_id，最後按使用者統計不同 session_id 的數量，就可以得到每個使用者的 session 數。

Question 3

按客戶的收入累積和交易表：customer_id, date, amount展示每個客戶隨時間變化的累計收入。

解題思路

這類問題不需要做額外的分組或自連線，只要在客戶維度上把時間排好序即可。做法是按 customer_id 分割槽、按交易日期排序，然後使用視窗函式對當前行之前的所有交易金額做累加。視窗從第一筆交易開始（unbounded preceding），一直累加到當前行，這樣每一行就表示該客戶在該時間點為止的累計收入。

參考 SQL

SELECT
  customer_id,
  date,
  amount,
  SUM(amount) OVER (
    PARTITION BY customer_id
    ORDER BY date
    ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW
  ) AS cumulative_revenue
FROM transactions
ORDER BY customer_id, date;

Python

重點考察 Pandas，而不是 LeetCode 風格演算法。

核心程式碼：

合併多個來源的使用者資料（ID 不一致）：使用 pd.merge(how=outer)，處理缺失值

時間序列重取樣：設定 datetime index, resample(D).mean()

GroupBy + 自定義聚合：每月消費最高的前 N 位使用者

向量化特徵工程：連續變數分箱

統計 & 實驗設計問題

Intuit 非常重視 A/B 測試，因為他們一直在 TurboTax 中執行相當多的統計實驗。

Question 1：設計一個新的結賬功能 A/B 測試，定義成功指標，樣本量，如何防止提前窺視結果

參考回答：

先明確成功指標，主指標通常選擇結賬轉化率，並在實驗開始前就鎖定這一主指標，避免在實驗過程中反覆嘗試不同指標帶來的多重檢驗問題。樣本量會基於歷史轉化率和期望檢測的最小效果大小來估算，確保實驗有足夠的統計功效。為了防止提前窺視結果，提前設定好實驗週期和停止規則，只在達到預設樣本量或週期結束後再統一分析結果，必要時採用順序檢驗或相應的校正方法來控制整體的錯誤率。

Question 2：如何解讀 p 值和置信區間如果 p = 0.06，你如何結論？

參考回答

如果 p = 0.06，在常用的 0.05 顯著性水平下結果並不具有統計顯著性，因此不能拒絕原假設。但我不會只基於這一點就簡單下結論，而是會結合置信區間來看效果的方向和幅度是否具有業務意義，同時評估實驗的統計功效是否足夠。如果置信區間仍然覆蓋了具有實際價值的效果範圍，且實驗的 power 偏低，那麼更可能是樣本量不足導致未達到顯著性；反之，如果效果本身很小，即使增加樣本也未必有業務價值。

追問

如何處理新鮮感效應
如何平衡季節性的影響
SRM（樣本比例不一致）怎麼處理
t-test 和 z-test 的區別

產品思維 & 案例分析問題

TurboTax 轉化率下降 5%，如何診斷？

解題思路：

從整體漏斗入手，將 TurboTax 的報稅流程拆分為關鍵步驟，定位轉化率下降主要發生在哪一環節；再對使用者進行分群分析，如新老使用者、不同報稅複雜度、裝置或渠道來源，判斷下降是否集中在特定人群或場景；在此基礎上結合近期可能的 UI、流程或定價改動提出假設，最後透過設計實驗或對照驗證，確認哪些因素真正導致了轉化率下滑。

行為面試

你推動過最大業務影響的專案
出現問題時你如何承擔責任
如何從挫折中調整
如何在沒有管理權的情況下影響他人

我建議大家一次性準備 5-7 個故事，覆蓋多個主題，比如合作，韌性等。最好輔以錄音練習，避免聽起來背稿。

給正在準備 DS 面試的同學

如果你正在準備偏產品、偏業務決策的 Data Scientist 面試，難點往往不在刷題，而在於是否有人幫你把分析思路對齊到面試官的預期。我這邊長期做一對一實時面試輔助，一些合作過的同學也順利推進到了 Intuit、Meta、Amazon 等相關崗位。如果你在這些環節反覆受阻，歡迎聯絡交流，看看是否適合一起針對性準備。

Jory Wang Amazon資深軟體開發工程師

Amazon 資深工程師，專注基礎設施核心系統研發，在系統可擴充套件性、可靠性及成本最佳化方面具備豐富實戰經驗。目前聚焦 FAANG SDE 面試輔導，一年內助力 30+ 位候選人成功斬獲 L5 / L6 Offer。

See Full Bio

Intuit Data Scientist 面經覆盤：這不是刷題能過的 DS 面試，很多人都死在這裡

面試流程

SQL

Question 1

Question 2

Question 3

Python

統計 & 實驗設計問題

追問

產品思維 & 案例分析問題

TurboTax 轉化率下降 5%，如何診斷？

行為面試

給正在準備 DS 面試的同學

聯絡我