Skip to content

🎮 Insight Hunter — Tìm Insight Ẩn Trong Chart!

Bạn vừa được thăng chức Junior Data Analyst tại DataCorp — công ty tư vấn phân tích dữ liệu hàng đầu Việt Nam. Ngày đầu tiên, Team Lead giao cho bạn 7 charts từ dự án EDA đang chạy. Nhiệm vụ: đọc chart và tìm ra insight ẩn mà client cần. Insight phải actionable — không phải mô tả lại những gì chart đã hiển thị! 🔍


🎯 Mục tiêu học tập

Sau khi hoàn thành game, bạn sẽ:

  1. Đọc histogram — nhận diện distribution shape (normal, skewed, bimodal)
  2. Phân tích scatter plot — phát hiện correlation, clusters, outliers
  3. Giải mã box plot — so sánh central tendency & spread giữa nhóm
  4. Đọc heatmap — tìm correlation mạnh/yếu, multicollinearity
  5. Phát hiện trend trong line chart — seasonality, anomaly, breakpoint
  6. So sánh bar chart — ranking, gap analysis, Pareto insight
  7. Tổng hợp multi-chart — kết nối insights từ nhiều chart thành story

📜 Luật chơi

┌──────────────────────────────────────────────────────┐
│  BẠN = Insight Hunter 🔍📊                           │
│  DATA = 7 charts từ dự án EDA thực tế                 │
│  MỖI VÒNG = 1 chart + 3 insight options               │
│  CHỌN insight đúng nhất — actionable, không mô tả lại │
│  MỤC TIÊU = Thu thập ≥ 85 XP để đạt hạng Gold 🥇    │
└──────────────────────────────────────────────────────┘

Cách tính điểm mỗi vòng:

Thành phầnXP
Trả lời đúng+10 XP (Vòng 1–2), +12 XP (Vòng 3–4), +15 XP (Vòng 5–6), +18 XP (Vòng 7)
Trả lời sai+0 XP
Không dùng hint+2 XP bonus ⚡
Giải thích đúng lý do+3 XP bonus 🧠

Tổng XP tối đa: 10+10+12+12+15+15+18 = 92 XP (chưa tính bonus)

Nguyên tắc quan trọng:

  • 🔒 Insight phải actionable — "doanh thu giảm 20% ở Q4 → cần review chiến lược marketing" ✅, "biểu đồ cho thấy cột Q4 thấp hơn Q3" ❌
  • ⚖️ Không phải mô tả lại chart — insight phải đi xa hơn những gì mắt thường nhìn thấy

🏆 Bảng xếp hạng & Huy hiệu

Ranks

HạngXPMô tả
🥇 Gold — Insight Master≥ 85 XPBạn đọc chart như detective! Sẵn sàng EDA thực chiến
🥈 Silver — Pattern Finder≥ 60 XPTốt! Cần luyện thêm đọc heatmap & multi-chart
🥉 Bronze — Chart Reader≥ 40 XPỔn cho ngày đầu — ôn lại chart types
💀 Game Over< 40 XPInsight vẫn ẩn — quay lại đọc Buổi 9 nhé!

Huy hiệu đặc biệt

BadgeĐiều kiệnMô tả
🎯 Sharp EyeĐúng 1 vòng + không dùng hintMắt tinh như eagle!
🔥 Insight Streak3 vòng liên tiếp đúngChuỗi insight liên hoàn!
🧠 Deep ThinkerGiải thích đúng lý do ≥ 5 vòngHiểu sâu từng chart!
Speed AnalystHoàn thành 7 vòng trong < 10 phútNhanh như sns.histplot()!
🏆 Full InsightĐúng tất cả 7 vòngInsight Hunter huyền thoại!
📊 First ChartĐúng vòng đầu tiênBước đầu sáng suốt!
💡 No Hints HeroKhông dùng hint cả gameTự phát hiện insight!
🛡️ Comeback AnalystSai 2 vòng đầu, đúng 5 vòng sauKhông bao giờ bỏ cuộc!
🔗 Heatmap HeroĐúng vòng heatmap (Vòng 4)Master of Correlations!

🎲 Chỉ số theo dõi

Chỉ sốIconMô tảMục tiêu
Insight Quality🎯Chọn đúng insight actionable / tổng 7 vòng≥ 6/7
Pattern Detection🔍Khả năng nhận diện pattern ẩn (anomaly, trend)Đúng ≥ 5/7
Speed⏱️Tổng thời gian hoàn thành game< 15 phút

📋 Kịch bản chi tiết


🔍 Vòng 1: Histogram — "Phân phối lương nhân viên" ⭐ Dễ

Team Lead gửi histogram phân phối lương. Client muốn insight để quyết định chính sách lương mới.

💬 Slack từ Team Lead:

"Em xem chart này và cho anh insight. HR Director hỏi: lương công ty mình có vấn đề gì không?"

Chart mô tả:

📊 Histogram: Salary Distribution (1,200 nhân viên)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

  700 ┤ ██
  600 ┤ ████
  500 ┤ ██████           ← Đỉnh chính: 8-12M VND
  400 ┤ ████████
  300 ┤ ██████████
  200 ┤ ████████████
  100 ┤ ██████████████     █
   50 ┤ ████████████████   ██    ← Đuôi dài bên phải
    0 ┼──────────────────────────────
      5M  10M  15M  20M  25M  30M  40M  60M  (VND)

  Mean = 14.5M  |  Median = 11.2M  |  Std = 8.3M
  Skewness = 1.85 (positive/right-skewed)

Seaborn code tạo chart tương tự:

python
sns.histplot(df["salary"], bins=30, kde=True, color="steelblue")
plt.axvline(df["salary"].median(), color="red", linestyle="--", label="Median")
plt.axvline(df["salary"].mean(), color="orange", linestyle="--", label="Mean")
plt.legend()
plt.title("Salary Distribution")

Lựa chọn:

Insight
A"Biểu đồ cho thấy đa số nhân viên có lương từ 8-12 triệu, và lương cao nhất là 60 triệu"
B"Phân phối lệch phải (right-skewed) với mean > median — nhóm nhỏ lương rất cao kéo mean lên → nên dùng median khi report 'lương trung bình' cho HR, và cần review xem nhóm 30M+ có phải ngoại lệ hay phù hợp vai trò"
C"Std = 8.3M cho thấy lương phân tán nhiều, nên phải giảm lương nhóm cao để cân bằng"
💡 Hint (−2 XP)

Keyword: skewness, mean vs median gap. Insight actionable = đề xuất hành động cụ thể (dùng metric nào? review nhóm nào?), không phải mô tả lại histogram hay đề xuất hành động thiếu cơ sở (giảm lương).

Đáp án & Giải thích

✅ Đáp án đúng: B

Lý do:

  • A sai vì chỉ mô tả lại chart (descriptive) — không có insight hay recommendation. Bất kỳ ai nhìn chart cũng thấy "đa số 8-12M, cao nhất 60M"
  • C sai vì kết luận "giảm lương nhóm cao để cân bằng" thiếu cơ sở — std cao có thể hợp lý nếu có nhiều cấp bậc (intern → director). Đây là suy luận vội (jumping to conclusion)
  • B đúng vì: (1) nhận diện right-skewed → mean bị kéo lên, (2) đề xuất dùng median thay vì mean khi report — actionable, (3) đề xuất review nhóm 30M+ — hành động cụ thể mà HR có thể thực hiện

XP: +10 | Bonus: +2 (no hint), +3 (đúng lý do)


🔍 Vòng 2: Bar Chart — "Doanh thu theo khu vực" ⭐ Dễ

Chart doanh thu Q4/2025 theo khu vực — Marketing cần biết nên phân bổ budget ra sao.

💬 Slack từ Marketing Manager:

"Budget Q1/2026 sắp confirm. Xem chart này cho tao insight: đổ tiền vào đâu?"

Chart mô tả:

📊 Bar Chart: Revenue by Region — Q4/2025
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

  Hồ Chí Minh   ████████████████████████████  45.2B  (38%)
  Hà Nội        ██████████████████████         33.8B  (28%)
  Đà Nẵng       ████████████                   18.5B  (15%)
  Cần Thơ       █████████                      13.2B  (11%)
  Hải Phòng     █████                           9.5B  (8%)
                ────────────────────────────
                0     10B    20B    30B    40B    50B

  Top 2 chiếm: 66% tổng doanh thu
  Growth vs Q3: HCM +5%, HN +3%, ĐN +12%, CT +8%, HP +2%

Lựa chọn:

Insight
A"HCM doanh thu cao nhất (45.2B), Hải Phòng thấp nhất (9.5B)"
B"Top 2 (HCM + HN) chiếm 66% — nhưng Đà Nẵng tăng trưởng 12% (cao nhất) → tiềm năng mở rộng. Recommend: giữ budget HCM/HN, tăng đầu tư Đà Nẵng để tận dụng momentum tăng trưởng"
C"5 khu vực có doanh thu giảm dần từ HCM đến HP, nên tập trung 100% budget vào HCM"
💡 Hint (−2 XP)

Đừng chỉ nhìn absolute value (ai to nhất). Hãy kết hợp growth rate — khu vực nhỏ nhưng tăng trưởng nhanh có thể là "ngôi sao đang lên". Insight = tìm ra cơ hội, không phải lặp lại ranking.

Đáp án & Giải thích

✅ Đáp án đúng: B

Lý do:

  • A sai vì chỉ đọc lại bar chart — mô tả cao nhất/thấp nhất, không có insight
  • C sai vì "100% budget vào HCM" là kết luận vội và rủi ro — bỏ qua growth của các khu vực khác, vi phạm nguyên tắc đa dạng hóa
  • B đúng vì: (1) kết hợp absolute + growth — HCM lớn nhất nhưng chỉ tăng 5%, trong khi Đà Nẵng tăng 12%, (2) recommendation cụ thể: giữ nguyên + tăng đầu tư Đà Nẵng — actionable, (3) giải thích lý do: "tận dụng momentum"

XP: +10 | Bonus: +2 (no hint), +3 (đúng lý do)


🔍 Vòng 3: Scatter Plot — "Salary vs Experience" ⭐⭐ Trung bình

HR đang xây dựng salary band mới. Scatter plot cho thấy mối quan hệ lương — kinh nghiệm.

💬 Slack từ HR Director:

"Tôi nghi ngờ có nhóm nhân viên bị underpaid so với kinh nghiệm. Xem chart và confirm giúp."

Chart mô tả:

📊 Scatter Plot: Salary vs Experience (800 nhân viên)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

  Salary (M)
  60 ┤                              ◆    ← Outlier: 3 người
  50 ┤                           ◆◆
  40 ┤                     ◆◆◆◆◆
  30 ┤               ●●●●●●●●●
  25 ┤          ●●●●●●●●●●●●●●●
  20 ┤     ●●●●●●●●●●●●●●
  15 ┤  ●●●●●●●●●●●●                     ← Cluster chính
  10 ┤  ●●●●●●●    ○○○○○                 ← ○ = nhóm bất thường
   8 ┤  ●●●●●       ○○○                    (experience 8-12 năm,
   5 ┤  ●●                                  salary chỉ 8-10M)
     ┼────────────────────────────────
     0    2    4    6    8   10   12   15   20  (năm)

  Correlation: r = 0.72 (strong positive)
  ○ = ~40 nhân viên: experience 8-12 năm nhưng salary 8-10M
  ◆ = 3 nhân viên: salary > 50M (C-level executives)
  Trend line: salary ≈ 5M + 2.1M × experience

Lựa chọn:

Insight
A"Correlation r = 0.72 cho thấy kinh nghiệm và lương có mối quan hệ dương mạnh"
B"Phát hiện ~40 nhân viên (○) có experience 8-12 năm nhưng salary chỉ 8-10M — thấp hơn đáng kể so với trend line (kỳ vọng ~22-30M). Đây có thể là nhóm underpaid → recommend HR review trường hợp cụ thể, cross-check với department & performance score"
C"3 người lương > 50M là outlier, nên loại khỏi phân tích"
💡 Hint (−2 XP)

Scatter plot không chỉ cho thấy correlation — hãy tìm deviation from trend. Nhóm nào nằm xa trend line một cách bất thường? Đó là nơi insight ẩn. Outliers ở trên (C-level) giải thích được, nhưng outliers ở dưới (lương thấp bất thường) mới là vấn đề cần hành động.

Đáp án & Giải thích

✅ Đáp án đúng: B

Lý do:

  • A sai vì chỉ báo cáo r = 0.72 — ai chạy df.corr() cũng biết. Không có insight về anomaly hay recommendation
  • C sai vì xóa C-level executives thiếu cơ sở — họ có lương cao hợp lý theo vị trí. Outlier không phải lúc nào cũng xóa
  • B đúng vì: (1) phát hiện nhóm underpaid — insight mà HR Director cần, (2) so sánh với trend line đưa ra cơ sở định lượng (kỳ vọng 22-30M vs thực tế 8-10M), (3) recommendation cụ thể: review từng trường hợp, cross-check context

XP: +12 | Bonus: +2 (no hint), +3 (đúng lý do)


🔍 Vòng 4: Heatmap — "Correlation Matrix" ⭐⭐ Trung bình

Data Science team đang chọn features cho attrition prediction model. Correlation heatmap cần insight.

💬 Slack từ DS Lead:

"Cho tao insight từ correlation matrix này — đặc biệt: biến nào nên đưa vào model, biến nào cần cẩn thận?"

Chart mô tả:

📊 Heatmap: Correlation Matrix (6 biến numeric)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

              salary   age   exp   tenure  perf  satisfaction
  salary       1.00   0.45  0.72   0.38   0.55     -0.12
  age          0.45   1.00  0.89   0.62   0.15      0.08
  exp          0.72   0.89  1.00   0.58   0.20     -0.05
  tenure       0.38   0.62  0.58   1.00   0.10      0.35
  perf         0.55   0.15  0.20   0.10   1.00     -0.42
  satisfaction -0.12   0.08 -0.05   0.35  -0.42      1.00

  Color scale: 🔴 -1.0 ←──── 0 ────→ +1.0 🔵
  ⚠️ age ↔ exp: r = 0.89 (rất cao)
  ⚠️ perf ↔ satisfaction: r = -0.42 (negative)

Lựa chọn:

Insight
A"salary và experience có correlation cao nhất (0.72), salary và satisfaction thấp nhất (-0.12)"
B"Tất cả correlation đều < 1.0, nên không có biến nào hoàn toàn liên quan"
C"Multicollinearity warning: age ↔ exp = 0.89 → nếu đưa cả 2 vào model, model bị redundant (chọn 1). Surprise finding: perf ↔ satisfaction = -0.42 → performance cao nhưng satisfaction thấp → potential burnout risk. Recommend: dùng exp (không dùng age), và HR nên investigate nhóm high-perf + low-satisfaction"
💡 Hint (−2 XP)

Heatmap insight ≠ đọc giá trị cao nhất/thấp nhất. Tìm: (1) multicollinearity — 2 biến correlation > 0.8 → vấn đề cho model, (2) unexpected relationship — 2 biến lẽ ra nên positive lại negative (hoặc ngược lại). Kết hợp thống kê + nghiệp vụ!

Đáp án & Giải thích

✅ Đáp án đúng: C

Lý do:

  • A sai vì chỉ đọc số cao nhất/thấp nhất — mô tả, không phải insight. DS Lead đã biết đọc heatmap
  • B sai vì tất nhiên correlation < 1.0 (chỉ = 1.0 khi biến so với chính nó) — statement vô nghĩa
  • C đúng vì: (1) phát hiện multicollinearity age ↔ exp = 0.89 → recommendation rõ: chọn 1 biến, (2) phát hiện negative correlation bất ngờ perf ↔ satisfaction = -0.42 → insight nghiệp vụ: burnout risk, (3) recommendation cụ thể cho cả DS (feature selection) và HR (investigate)

XP: +12 | Bonus: +2 (no hint), +3 (đúng lý do)


🔍 Vòng 5: Box Plot — "Lương theo phòng ban" ⭐⭐⭐ Khó

CFO muốn biết phòng ban nào có vấn đề bất bình đẳng lương nghiêm trọng nhất.

💬 Slack từ CFO:

"Board meeting tuần sau cần report pay equity. Phòng ban nào cần attention nhất?"

Chart mô tả:

📊 Box Plot: Salary by Department (5 phòng ban)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

  Engineering   ├──────[====|========]──────────┤  ◆ ◆
                       Q1=18  Med=25  Q3=35         Outliers: 55M, 58M
                       IQR = 17M

  Marketing     ├───[==|=====]──┤
                    Q1=10 Med=13 Q3=18
                    IQR = 8M

  Sales         ├──[=|===]─────────────────────┤  ◆ ◆ ◆ ◆
                   Q1=8 Med=10 Q3=15                Outliers: 35M, 38M, 42M, 45M
                   IQR = 7M  |  Whisker rất dài!

  HR            ├──[==|==]──┤
                   Q1=9 Med=12 Q3=14
                   IQR = 5M

  Finance       ├───[===|===]───┤
                    Q1=15 Med=20 Q3=25
                    IQR = 10M

  ──────────────────────────────────────────
  0    5M   10M   15M   20M   25M   30M   40M   50M   60M

Lựa chọn:

Insight
A"Engineering có median cao nhất (25M), Sales có median thấp nhất (10M)"
B"Sales có vấn đề pay equity nghiêm trọng nhất: median thấp (10M) nhưng có 4 outliers 35-45M → khoảng cách giữa đa số NV (8-15M) và top earners (35-45M) là 4-5 lần — lớn hơn mọi phòng ban khác. Engineering có outliers nhưng gap chỉ ~2x (25M → 55M). Recommend: audit Sales compensation — kiểm tra top earners có phải commission-based hay structural inequality"
C"HR có IQR nhỏ nhất (5M) nên lương công bằng nhất, công ty nên áp dụng mô hình HR cho tất cả phòng ban"
💡 Hint (−2 XP)

Box plot cho thấy spread (IQR) + outliers. Pay equity ≠ chỉ nhìn median. Phòng ban nào có gap lớn nhất giữa majority và outliers? Outlier nhiều + IQR nhỏ = đa số lương thấp nhưng vài người lương rất cao → bất bình đẳng.

Đáp án & Giải thích

✅ Đáp án đúng: B

Lý do:

  • A sai vì chỉ so sánh median — pay equity không phải ai cao nhất/thấp nhất, mà là spread & gap
  • C sai vì IQR nhỏ chưa chắc "công bằng" — nếu tất cả đều lương thấp thì IQR cũng nhỏ. Và "áp dụng mô hình HR cho Sales" vô lý vì 2 phòng ban có cơ cấu khác nhau
  • B đúng vì: (1) phát hiện gap 4-5x ở Sales (majority 8-15M vs outliers 35-45M), (2) so sánh cross-department (Engineering gap chỉ ~2x), (3) recommendation actionable: audit Sales, (4) đề xuất investigation hướng thay vì kết luận vội (commission-based?)

XP: +15 | Bonus: +2 (no hint), +3 (đúng lý do)


🔍 Vòng 6: Line Chart — "Monthly Revenue Trend" ⭐⭐⭐ Khó

CEO cần biết doanh thu tháng gần đây có bình thường không — hay có dấu hiệu bất thường.

💬 Slack từ CEO:

"Tôi thấy doanh thu tháng 11 hơi lạ. Confirm giúp — có nên lo không?"

Chart mô tả:

📊 Line Chart: Monthly Revenue 2025 (12 tháng)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

  Revenue (B)
  60 ┤                                          ╱── Dec: 58B
  55 ┤                                    ╱────╱
  50 ┤                              ╱────╱
  45 ┤                        ╱────╱
  40 ┤                  ╱────╱
  35 ┤            ╱────╱
  30 ┤      ╱────╱          ↑ Upward trend Q1-Q4
  25 ┤ ╱───╱
  20 ┤╱
     ┼────┬────┬────┬────┬────┬────┬────┬────┬────┬────┬────┬────
     Jan  Feb  Mar  Apr  May  Jun  Jul  Aug  Sep  Oct  Nov  Dec

  ⚠️ Tháng 11: Revenue = 38B (giảm 18% vs tháng 10 = 46B)
  Tháng 12: Revenue = 58B (tăng 53% vs tháng 11)
  YoY Growth: +22%
  Avg monthly growth (loại T11): ~6%

Lựa chọn:

Insight
A"Doanh thu tăng đều từ Jan đến Dec, tổng cả năm rất tốt, YoY +22%"
B"Tháng 11 giảm 18% — đây là dấu hiệu khủng hoảng, cần cắt giảm chi phí ngay"
C"Anomaly tháng 11: giảm 18% phá vỡ upward trend (avg growth ~6%/tháng). Nhưng tháng 12 recover mạnh +53% → có thể tháng 11 là seasonal dip (pre-holiday slowdown trước mùa mua sắm Dec) hoặc one-time event (system outage, campaign gap). Recommend: (1) cross-check T11 năm trước xem có pattern tương tự, (2) kiểm tra operational log T11 tìm root cause"
💡 Hint (−2 XP)

Line chart anomaly: 1 điểm giảm trong upward trend. Đừng kết luận vội "khủng hoảng" hay bỏ qua "không sao đâu". Insight tốt = phát hiện anomaly + đề xuất cách investigate (compare YoY, check operational data). Tháng 12 recover = manh mối quan trọng.

Đáp án & Giải thích

✅ Đáp án đúng: C

Lý do:

  • A sai vì bỏ qua anomaly tháng 11 — CEO đã hỏi cụ thể vì thấy "hơi lạ". Phân tích mà miss câu hỏi chính = fail
  • B sai vì phản ứng quá mức — 1 tháng giảm chưa phải "khủng hoảng", đặc biệt khi tháng 12 recover mạnh. "Cắt giảm chi phí ngay" thiếu cơ sở
  • C đúng vì: (1) confirm anomaly + đo lường (18% drop vs avg 6% growth), (2) đưa ra 2 giả thuyết hợp lý (seasonal dip, one-time event), (3) recommend investigate thay vì kết luận vội — so YoY và check ops log

XP: +15 | Bonus: +2 (no hint), +3 (đúng lý do)


🔍 Vòng 7: Multi-Chart Combo — "EDA Summary Dashboard" ⭐⭐⭐⭐ Khó

Vòng cuối! Bạn nhận 3 charts cùng lúc từ EDA dự án e-commerce. Cần kết nối insights thành 1 story cho client.

💬 Slack từ Team Lead:

"Client presentation ngày mai. Em tổng hợp 3 charts này thành 1 key insight — câu quan trọng nhất mà client cần biết."

Charts mô tả:

Chart A — Histogram: Order Value Distribution

Phân phối order value: right-skewed
Mean = 850K  |  Median = 520K
Top 5% orders > 3M VND (high-value orders)
Bottom 50% orders < 520K VND

Chart B — Scatter: Order Value vs Customer Lifetime (ngày)

r = 0.35 (weak-moderate positive)
Cluster 1: lifetime < 90 ngày, order value < 500K (65% customers)
Cluster 2: lifetime > 365 ngày, order value 1-5M (15% customers)
Outlier cluster: lifetime > 500 ngày, order value > 5M (3% customers — VIP)

Chart C — Bar: Revenue Contribution by Customer Segment

VIP (3%):        ████████████████████  35% total revenue
Loyal (15%):     ██████████████████    30% total revenue
Regular (82%):   █████████████████████ 35% total revenue

Lựa chọn:

Insight
A"Order value lệch phải, correlation với lifetime yếu (0.35), và VIP chiếm 3% nhưng đóng góp 35% doanh thu"
B"Pareto Pattern rõ rệt: 18% khách hàng (VIP + Loyal) tạo ra 65% doanh thu — gần đúng quy tắc 80/20. Key insight: mỗi VIP customer đáng giá ~12x regular customer. Recommend: (1) retention program cho VIP/Loyal — chi phí giữ chân rẻ hơn nhiều so với acquire new, (2) conversion program từ Regular → Loyal: target nhóm lifetime 60-90 ngày có order value > median (520K) — họ là 'future loyal' tiềm năng"
C"Regular chiếm 82% khách hàng và 35% doanh thu, nên đây là nhóm quan trọng nhất cần tập trung"
💡 Hint (−2 XP)

Multi-chart insight = kết nối data points từ 3 charts thành 1 story. Chart A cho shape, Chart B cho segments, Chart C cho business impact. Hãy tìm Pareto pattern (80/20 rule) và actionable recommendation dựa trên segment value. Đâu là nhóm "đáng đầu tư" nhất?

Đáp án & Giải thích

✅ Đáp án đúng: B

Lý do:

  • A sai vì liệt kê 3 insights riêng lẻ — không kết nối thành story. Client không cần nghe 3 bullet points tách rời
  • C sai vì kết luận ngược: Regular chiếm 82% headcount nhưng chỉ 35% revenue → mỗi regular customer tạo rất ít giá trị. Đổ resource vào nhóm này không hiệu quả bằng giữ chân VIP
  • B đúng vì: (1) kết nối 3 charts: distribution → segmentation → business impact → Pareto pattern, (2) tính toán giá trị cụ thể: VIP ~12x regular (35%/3% vs 35%/82%), (3) 2 recommendations rõ ràng: retention cho VIP + conversion cho potential-loyal, (4) target group cụ thể dựa trên data (lifetime 60-90 ngày + order > median)

XP: +18 | Bonus: +2 (no hint), +3 (đúng lý do)


🏁 Tổng kết

Bảng tổng hợp kỹ năng đọc chart

Chart TypeĐừng làm (mô tả)Hãy làm (insight)
Histogram"Đa số nằm ở khoảng X-Y"Nhận diện skewness, mean vs median gap, actionable metric
Bar Chart"A cao nhất, B thấp nhất"Kết hợp absolute + growth, tìm cơ hội
Scatter Plot"Correlation = 0.72"Tìm deviation from trend, clusters bất thường
Heatmap"X và Y correlation cao nhất"Multicollinearity warning, unexpected relationships
Box Plot"Median A > Median B"So sánh spread + outliers, phát hiện inequality
Line Chart"Tăng đều / Giảm"Phát hiện anomaly, đề xuất investigate
Multi-ChartLiệt kê findings riêng lẻKết nối thành story, Pareto pattern, segment strategy

Tiếp theo

Bạn đã biết đọc chart và tìm insight actionable. Giờ hãy tự tay thực hiện EDA hoàn chỉnh trong Workshop — EDA Pipeline — từ load data đến viết EDA report với 5 key findings! 🚀

💡 Sau game này

  • ✅ Bạn biết phân biệt mô tả chart vs insight actionable
  • ✅ Bạn biết đọc 7 loại chart phổ biến nhất trong EDA
  • ✅ Bạn hiểu: insight tốt = phát hiện + giải thích + recommendation
  • → Sẵn sàng cho Workshop: tự vẽ chart và viết insight từ real dataset!