BCGX DS OA 26 Summer 最新题库拆解|四题主观题完整解析

北美这边的 BCGX 已经开始陆续发 DS OA 了。这次的版本是四道主观题,加一套三题的 multiple choice。整体感受比欧洲那边稍微“工程化”一点,更强调数据清洗、字段命名统一、日期处理是否规范。我之前做了不少 EU/UK 的 BCGX 题库,这次拿到北美版本之后基本一路顺滑,一次过,顺便把关键点整理给你们。

整体节奏还是大家熟悉的 Pandas 实战路线:读数据、清洗、过滤、合并、聚合。90 分钟时间给得很足,只要别被 bug 卡死,稳过。

Q1:Calculate the average property price, the proportion of waterfront properties, and the 30-day average page views.

这一题是最典型的 BCGX 风格:

要求本身就三部分:

  1. 平均房价
  2. 水景房比例
  3. 最近 30 天的浏览均值

逻辑都是老朋友:

  • 平均价直接对 price 求 mean,同时注意过滤掉明显异常值(负数、空值等)。
  • 水景比例,waterfront 通常是 0/1,直接 sum / count。
  • 30 天浏览量需要先把 date parse 成 datetime,然后找 max(date),向前过滤 30 天,只对 views 求平均。

这一题容易扣分的地方几乎都是格式问题:日期没转换、waterfront 不是 int 导致 sum 错、过滤没加上 dropna(),导致最终答案偏差。

Q2:Standardize inconsistent column names, perform time-based filtering, and merge the cleaned datasets.

第二题就是北美版 BCGX 的特色:把脏列名统一成标准格式,然后再做日期过滤和 merge。

通常你会看到:

  • "Page Views"
  • "page-views"
  • " pageviews "

全都得在读文件时变成规范命名,例如统一成小写、下划线分隔、去空格、去特殊字符。只要你开局写一段:

df.columns = (
    df.columns
      .str.lower()
      .str.strip()
      .str.replace(" ", "_")
      .str.replace(r"[^a-z0-9_]", "", regex=True)
)

后面所有 merge、filter 都顺到没脾气。
这一题真正的难点不是逻辑,而是你能不能意识到:字段名不对,后面所有 groupby / join / filter 都是错的。

而北美这版比欧洲那版更强调“列名严谨性”。有的学员逻辑写得很好,但因为 join key 名不一致直接挂掉,这也是我们平时提醒最多的坑点。

Q3 / Q4

后两题内容类型都属于 BCGX 的老传统:

  • 多条件数据过滤
  • 对多个指标做 groupby 聚合
  • 两个数据集的 multi-key merge
  • 构造一些衍生特征(rolling、lag、ratio)
  • 做一点轻量质量检查(duplicates、missing pattern)

基本都是中等难度,熟悉 Pandas 的话是能快写出来的;不熟的话会被 merge、日期、衍生列卡住。

整体上,经验能提供明显优势:你知道他们爱怎么考、爱在什么地方给小坑,就不会在 debug 上浪费时间。

Multiple Choice(3 题)

三题全是基本功:

  • 统计学判断(variance、sampling、correlation)
  • 实验逻辑(A/B 对照、偏差来源)
  • SQL / Python 判断题

难度适中,只要你平时稍有接触数据工作,基本不会费力。

OA 实际难点总结

BCGX 北美 OA 的难点从来不是“逻辑很难”,而是:

  • 列名、日期、数据类型必须极度干净
  • merge key 一旦写错,整题报废
  • 要有良好习惯:先 clean,再计算
  • 代码不能乱,读者必须能看懂你的思路

时间其实很够,但细节一旦漏掉,结果就偏了。做多了你会发现他们的考点非常统一:
真实世界数据会脏,而你能不能在短时间里快速把它变成“可分析格式”。

ProgramHelp | 让你在 BCGX OA 里不再被小 bug 送走

BCGX 这种实战型 OA,最怕的是“逻辑对,但输出错”,而这些错误几乎都是小细节,比如字段名不一致、日期 parse 写漏、merge 顺序反了。我们这边的 VO 协助是全程语音提示,不动你的环境、不干预你的代码,完全无痕,只在关键步骤提醒你别踩坑,让整个 OA 写得更稳、更快。

有同学从 80 分钟写完、bug 一堆,被我们调整成 40 分钟完成+满分 AC。OA 这类考试,本质就是手稳和细节稳。

author avatar
jor jor
正文完
 0