Intuit Data Scientist 面經覆盤:這不是刷題能過的 DS 面試,很多人都死在這裡

最近,我帶的一位學員成功走完了 Intuit Data Scientist崗位的面試流程。整體體驗下來,最大的感受是:Intuit的面試極度側重實戰能力,且貫穿強烈的產品導向思維,不是單純考察理論知識,更看重候選人解決實際業務問題的能力。下面就為大家詳細拆解面試全流程、核心考點及應對思路,供各位備考同學參考。

面試流程

整個流程持續了接近 6 周,節奏不算快,但每一輪都有明確篩選目的。

  1. Recruiter 電話初篩
  2. Take-home 作業
  3. Technical Screen(Karat 平臺)
  4. Virtual Onsite(5 輪)

SQL

涉及了視窗函式、CTE、TurboTax/QuickBooks 使用者 cohort 分析。

Question 1

計算報稅使用者的月度留存率給定一個包含 user_id、file_date、product(TurboTax 或 QuickBooks)的使用者報稅表。計算 1 月份使用者在後續每個月是否再次報稅的比例。

解題思路

先定義 cohort 月,把 1 月份首次報稅的使用者作為 cohort;然後生成從 1 月開始的連續月份序列,用來保證每個月都有觀測點;接著將 cohort 使用者與他們後續的報稅行為按使用者和月份做左連線,判斷使用者在每個月是否有報稅記錄;最後對每個月的活躍標記取平均值,從而得到 1 月 cohort 在後續各個月份的留存率。

Question 2

Session 化問題表結構:user_id, timestamp, page_view定義:30 分鐘內的連續行為算一個 session計算每個使用者的 session 數。

解題思路

先按使用者和時間排序每條行為記錄,對 timestamp 使用 LAG 計算與上一條行為的時間差,當時間差大於 30 分鐘時標記為一個新的 session;然後在使用者維度上對這個新 session 的標記做累積求和,為每條行為分配一個 session_id,最後按使用者統計不同 session_id 的數量,就可以得到每個使用者的 session 數。

Question 3

按客戶的收入累積和交易表:customer_id, date, amount展示每個客戶隨時間變化的累計收入。

解題思路

這類問題不需要做額外的分組或自連線,只要在客戶維度上把時間排好序即可。做法是按 customer_id 分割槽、按交易日期排序,然後使用視窗函式對當前行之前的所有交易金額做累加。視窗從第一筆交易開始(unbounded preceding),一直累加到當前行,這樣每一行就表示該客戶在該時間點為止的累計收入。

參考 SQL

SELECT
  customer_id,
  date,
  amount,
  SUM(amount) OVER (
    PARTITION BY customer_id
    ORDER BY date
    ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW
  ) AS cumulative_revenue
FROM transactions
ORDER BY customer_id, date;

Python

重點考察 Pandas,而不是 LeetCode 風格演算法。

核心程式碼:

合併多個來源的使用者資料(ID 不一致):使用 pd.merge(how=outer),處理缺失值

時間序列重取樣:設定 datetime index, resample(D).mean()

GroupBy + 自定義聚合:每月消費最高的前 N 位使用者

向量化特徵工程:連續變數分箱

統計 & 實驗設計問題

Intuit 非常重視 A/B 測試,因為他們一直在 TurboTax 中執行相當多的統計實驗。

Question 1:設計一個新的結賬功能 A/B 測試,定義成功指標,樣本量,如何防止提前窺視結果

參考回答:

先明確成功指標,主指標通常選擇結賬轉化率,並在實驗開始前就鎖定這一主指標,避免在實驗過程中反覆嘗試不同指標帶來的多重檢驗問題。樣本量會基於歷史轉化率和期望檢測的最小效果大小來估算,確保實驗有足夠的統計功效。為了防止提前窺視結果,提前設定好實驗週期和停止規則,只在達到預設樣本量或週期結束後再統一分析結果,必要時採用順序檢驗或相應的校正方法來控制整體的錯誤率。

Question 2:如何解讀 p 值和置信區間如果 p = 0.06,你如何結論?

參考回答

如果 p = 0.06,在常用的 0.05 顯著性水平下結果並不具有統計顯著性,因此不能拒絕原假設。但我不會只基於這一點就簡單下結論,而是會結合置信區間來看效果的方向和幅度是否具有業務意義,同時評估實驗的統計功效是否足夠。如果置信區間仍然覆蓋了具有實際價值的效果範圍,且實驗的 power 偏低,那麼更可能是樣本量不足導致未達到顯著性;反之,如果效果本身很小,即使增加樣本也未必有業務價值。

追問

  • 如何處理新鮮感效應
  • 如何平衡季節性的影響
  • SRM(樣本比例不一致)怎麼處理
  • t-test 和 z-test 的區別

產品思維 & 案例分析問題

TurboTax 轉化率下降 5%,如何診斷?

解題思路:

從整體漏斗入手,將 TurboTax 的報稅流程拆分為關鍵步驟,定位轉化率下降主要發生在哪一環節;再對使用者進行分群分析,如新老使用者、不同報稅複雜度、裝置或渠道來源,判斷下降是否集中在特定人群或場景;在此基礎上結合近期可能的 UI、流程或定價改動提出假設,最後透過設計實驗或對照驗證,確認哪些因素真正導致了轉化率下滑。

行為面試

  • 你推動過最大業務影響的專案
  • 出現問題時你如何承擔責任
  • 如何從挫折中調整
  • 如何在沒有管理權的情況下影響他人

我建議大家一次性準備 5-7 個故事,覆蓋多個主題,比如合作,韌性等。最好輔以錄音練習,避免聽起來背稿。

給正在準備 DS 面試的同學

如果你正在準備偏產品、偏業務決策的 Data Scientist 面試,難點往往不在刷題,而在於是否有人幫你把分析思路對齊到面試官的預期。我這邊長期做一對一 實時面試輔助 ,一些合作過的同學也順利推進到了 Intuit、Meta、Amazon 等相關崗位。如果你在這些環節反覆受阻,歡迎聯絡交流,看看是否適合一起針對性準備。

author avatar
Jory Wang Amazon資深軟體開發工程師
Amazon 資深工程師,專注 基礎設施核心系統研發,在系統可擴充套件性、可靠性及成本最佳化方面具備豐富實戰經驗。 目前聚焦 FAANG SDE 面試輔導,一年內助力 30+ 位候選人成功斬獲 L5 / L6 Offer。
END
 0