Appearance
🎮 Insight Hunter — Tìm Insight Ẩn Trong Chart!
Bạn vừa được thăng chức Junior Data Analyst tại DataCorp — công ty tư vấn phân tích dữ liệu hàng đầu Việt Nam. Ngày đầu tiên, Team Lead giao cho bạn 7 charts từ dự án EDA đang chạy. Nhiệm vụ: đọc chart và tìm ra insight ẩn mà client cần. Insight phải actionable — không phải mô tả lại những gì chart đã hiển thị! 🔍
🎯 Mục tiêu học tập
Sau khi hoàn thành game, bạn sẽ:
- Đọc histogram — nhận diện distribution shape (normal, skewed, bimodal)
- Phân tích scatter plot — phát hiện correlation, clusters, outliers
- Giải mã box plot — so sánh central tendency & spread giữa nhóm
- Đọc heatmap — tìm correlation mạnh/yếu, multicollinearity
- Phát hiện trend trong line chart — seasonality, anomaly, breakpoint
- So sánh bar chart — ranking, gap analysis, Pareto insight
- Tổng hợp multi-chart — kết nối insights từ nhiều chart thành story
📜 Luật chơi
┌──────────────────────────────────────────────────────┐
│ BẠN = Insight Hunter 🔍📊 │
│ DATA = 7 charts từ dự án EDA thực tế │
│ MỖI VÒNG = 1 chart + 3 insight options │
│ CHỌN insight đúng nhất — actionable, không mô tả lại │
│ MỤC TIÊU = Thu thập ≥ 85 XP để đạt hạng Gold 🥇 │
└──────────────────────────────────────────────────────┘Cách tính điểm mỗi vòng:
| Thành phần | XP |
|---|---|
| Trả lời đúng | +10 XP (Vòng 1–2), +12 XP (Vòng 3–4), +15 XP (Vòng 5–6), +18 XP (Vòng 7) |
| Trả lời sai | +0 XP |
| Không dùng hint | +2 XP bonus ⚡ |
| Giải thích đúng lý do | +3 XP bonus 🧠 |
Tổng XP tối đa: 10+10+12+12+15+15+18 = 92 XP (chưa tính bonus)
Nguyên tắc quan trọng:
- 🔒 Insight phải actionable — "doanh thu giảm 20% ở Q4 → cần review chiến lược marketing" ✅, "biểu đồ cho thấy cột Q4 thấp hơn Q3" ❌
- ⚖️ Không phải mô tả lại chart — insight phải đi xa hơn những gì mắt thường nhìn thấy
🏆 Bảng xếp hạng & Huy hiệu
Ranks
| Hạng | XP | Mô tả |
|---|---|---|
| 🥇 Gold — Insight Master | ≥ 85 XP | Bạn đọc chart như detective! Sẵn sàng EDA thực chiến |
| 🥈 Silver — Pattern Finder | ≥ 60 XP | Tốt! Cần luyện thêm đọc heatmap & multi-chart |
| 🥉 Bronze — Chart Reader | ≥ 40 XP | Ổn cho ngày đầu — ôn lại chart types |
| 💀 Game Over | < 40 XP | Insight vẫn ẩn — quay lại đọc Buổi 9 nhé! |
Huy hiệu đặc biệt
| Badge | Điều kiện | Mô tả |
|---|---|---|
| 🎯 Sharp Eye | Đúng 1 vòng + không dùng hint | Mắt tinh như eagle! |
| 🔥 Insight Streak | 3 vòng liên tiếp đúng | Chuỗi insight liên hoàn! |
| 🧠 Deep Thinker | Giải thích đúng lý do ≥ 5 vòng | Hiểu sâu từng chart! |
| ⚡ Speed Analyst | Hoàn thành 7 vòng trong < 10 phút | Nhanh như sns.histplot()! |
| 🏆 Full Insight | Đúng tất cả 7 vòng | Insight Hunter huyền thoại! |
| 📊 First Chart | Đúng vòng đầu tiên | Bước đầu sáng suốt! |
| 💡 No Hints Hero | Không dùng hint cả game | Tự phát hiện insight! |
| 🛡️ Comeback Analyst | Sai 2 vòng đầu, đúng 5 vòng sau | Không bao giờ bỏ cuộc! |
| 🔗 Heatmap Hero | Đúng vòng heatmap (Vòng 4) | Master of Correlations! |
🎲 Chỉ số theo dõi
| Chỉ số | Icon | Mô tả | Mục tiêu |
|---|---|---|---|
| Insight Quality | 🎯 | Chọn đúng insight actionable / tổng 7 vòng | ≥ 6/7 |
| Pattern Detection | 🔍 | Khả năng nhận diện pattern ẩn (anomaly, trend) | Đúng ≥ 5/7 |
| Speed | ⏱️ | Tổng thời gian hoàn thành game | < 15 phút |
📋 Kịch bản chi tiết
🔍 Vòng 1: Histogram — "Phân phối lương nhân viên" ⭐ Dễ
Team Lead gửi histogram phân phối lương. Client muốn insight để quyết định chính sách lương mới.
💬 Slack từ Team Lead:
"Em xem chart này và cho anh insight. HR Director hỏi: lương công ty mình có vấn đề gì không?"
Chart mô tả:
📊 Histogram: Salary Distribution (1,200 nhân viên)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
700 ┤ ██
600 ┤ ████
500 ┤ ██████ ← Đỉnh chính: 8-12M VND
400 ┤ ████████
300 ┤ ██████████
200 ┤ ████████████
100 ┤ ██████████████ █
50 ┤ ████████████████ ██ ← Đuôi dài bên phải
0 ┼──────────────────────────────
5M 10M 15M 20M 25M 30M 40M 60M (VND)
Mean = 14.5M | Median = 11.2M | Std = 8.3M
Skewness = 1.85 (positive/right-skewed)Seaborn code tạo chart tương tự:
python
sns.histplot(df["salary"], bins=30, kde=True, color="steelblue")
plt.axvline(df["salary"].median(), color="red", linestyle="--", label="Median")
plt.axvline(df["salary"].mean(), color="orange", linestyle="--", label="Mean")
plt.legend()
plt.title("Salary Distribution")Lựa chọn:
| Insight | |
|---|---|
| A | "Biểu đồ cho thấy đa số nhân viên có lương từ 8-12 triệu, và lương cao nhất là 60 triệu" |
| B | "Phân phối lệch phải (right-skewed) với mean > median — nhóm nhỏ lương rất cao kéo mean lên → nên dùng median khi report 'lương trung bình' cho HR, và cần review xem nhóm 30M+ có phải ngoại lệ hay phù hợp vai trò" |
| C | "Std = 8.3M cho thấy lương phân tán nhiều, nên phải giảm lương nhóm cao để cân bằng" |
💡 Hint (−2 XP)
Keyword: skewness, mean vs median gap. Insight actionable = đề xuất hành động cụ thể (dùng metric nào? review nhóm nào?), không phải mô tả lại histogram hay đề xuất hành động thiếu cơ sở (giảm lương).
Đáp án & Giải thích
✅ Đáp án đúng: B
Lý do:
- A sai vì chỉ mô tả lại chart (descriptive) — không có insight hay recommendation. Bất kỳ ai nhìn chart cũng thấy "đa số 8-12M, cao nhất 60M"
- C sai vì kết luận "giảm lương nhóm cao để cân bằng" thiếu cơ sở — std cao có thể hợp lý nếu có nhiều cấp bậc (intern → director). Đây là suy luận vội (jumping to conclusion)
- B đúng vì: (1) nhận diện right-skewed → mean bị kéo lên, (2) đề xuất dùng median thay vì mean khi report — actionable, (3) đề xuất review nhóm 30M+ — hành động cụ thể mà HR có thể thực hiện
XP: +10 | Bonus: +2 (no hint), +3 (đúng lý do)
🔍 Vòng 2: Bar Chart — "Doanh thu theo khu vực" ⭐ Dễ
Chart doanh thu Q4/2025 theo khu vực — Marketing cần biết nên phân bổ budget ra sao.
💬 Slack từ Marketing Manager:
"Budget Q1/2026 sắp confirm. Xem chart này cho tao insight: đổ tiền vào đâu?"
Chart mô tả:
📊 Bar Chart: Revenue by Region — Q4/2025
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
Hồ Chí Minh ████████████████████████████ 45.2B (38%)
Hà Nội ██████████████████████ 33.8B (28%)
Đà Nẵng ████████████ 18.5B (15%)
Cần Thơ █████████ 13.2B (11%)
Hải Phòng █████ 9.5B (8%)
────────────────────────────
0 10B 20B 30B 40B 50B
Top 2 chiếm: 66% tổng doanh thu
Growth vs Q3: HCM +5%, HN +3%, ĐN +12%, CT +8%, HP +2%Lựa chọn:
| Insight | |
|---|---|
| A | "HCM doanh thu cao nhất (45.2B), Hải Phòng thấp nhất (9.5B)" |
| B | "Top 2 (HCM + HN) chiếm 66% — nhưng Đà Nẵng tăng trưởng 12% (cao nhất) → tiềm năng mở rộng. Recommend: giữ budget HCM/HN, tăng đầu tư Đà Nẵng để tận dụng momentum tăng trưởng" |
| C | "5 khu vực có doanh thu giảm dần từ HCM đến HP, nên tập trung 100% budget vào HCM" |
💡 Hint (−2 XP)
Đừng chỉ nhìn absolute value (ai to nhất). Hãy kết hợp growth rate — khu vực nhỏ nhưng tăng trưởng nhanh có thể là "ngôi sao đang lên". Insight = tìm ra cơ hội, không phải lặp lại ranking.
Đáp án & Giải thích
✅ Đáp án đúng: B
Lý do:
- A sai vì chỉ đọc lại bar chart — mô tả cao nhất/thấp nhất, không có insight
- C sai vì "100% budget vào HCM" là kết luận vội và rủi ro — bỏ qua growth của các khu vực khác, vi phạm nguyên tắc đa dạng hóa
- B đúng vì: (1) kết hợp absolute + growth — HCM lớn nhất nhưng chỉ tăng 5%, trong khi Đà Nẵng tăng 12%, (2) recommendation cụ thể: giữ nguyên + tăng đầu tư Đà Nẵng — actionable, (3) giải thích lý do: "tận dụng momentum"
XP: +10 | Bonus: +2 (no hint), +3 (đúng lý do)
🔍 Vòng 3: Scatter Plot — "Salary vs Experience" ⭐⭐ Trung bình
HR đang xây dựng salary band mới. Scatter plot cho thấy mối quan hệ lương — kinh nghiệm.
💬 Slack từ HR Director:
"Tôi nghi ngờ có nhóm nhân viên bị underpaid so với kinh nghiệm. Xem chart và confirm giúp."
Chart mô tả:
📊 Scatter Plot: Salary vs Experience (800 nhân viên)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
Salary (M)
60 ┤ ◆ ← Outlier: 3 người
50 ┤ ◆◆
40 ┤ ◆◆◆◆◆
30 ┤ ●●●●●●●●●
25 ┤ ●●●●●●●●●●●●●●●
20 ┤ ●●●●●●●●●●●●●●
15 ┤ ●●●●●●●●●●●● ← Cluster chính
10 ┤ ●●●●●●● ○○○○○ ← ○ = nhóm bất thường
8 ┤ ●●●●● ○○○ (experience 8-12 năm,
5 ┤ ●● salary chỉ 8-10M)
┼────────────────────────────────
0 2 4 6 8 10 12 15 20 (năm)
Correlation: r = 0.72 (strong positive)
○ = ~40 nhân viên: experience 8-12 năm nhưng salary 8-10M
◆ = 3 nhân viên: salary > 50M (C-level executives)
Trend line: salary ≈ 5M + 2.1M × experienceLựa chọn:
| Insight | |
|---|---|
| A | "Correlation r = 0.72 cho thấy kinh nghiệm và lương có mối quan hệ dương mạnh" |
| B | "Phát hiện ~40 nhân viên (○) có experience 8-12 năm nhưng salary chỉ 8-10M — thấp hơn đáng kể so với trend line (kỳ vọng ~22-30M). Đây có thể là nhóm underpaid → recommend HR review trường hợp cụ thể, cross-check với department & performance score" |
| C | "3 người lương > 50M là outlier, nên loại khỏi phân tích" |
💡 Hint (−2 XP)
Scatter plot không chỉ cho thấy correlation — hãy tìm deviation from trend. Nhóm nào nằm xa trend line một cách bất thường? Đó là nơi insight ẩn. Outliers ở trên (C-level) giải thích được, nhưng outliers ở dưới (lương thấp bất thường) mới là vấn đề cần hành động.
Đáp án & Giải thích
✅ Đáp án đúng: B
Lý do:
- A sai vì chỉ báo cáo r = 0.72 — ai chạy
df.corr()cũng biết. Không có insight về anomaly hay recommendation - C sai vì xóa C-level executives thiếu cơ sở — họ có lương cao hợp lý theo vị trí. Outlier không phải lúc nào cũng xóa
- B đúng vì: (1) phát hiện nhóm underpaid — insight mà HR Director cần, (2) so sánh với trend line đưa ra cơ sở định lượng (kỳ vọng 22-30M vs thực tế 8-10M), (3) recommendation cụ thể: review từng trường hợp, cross-check context
XP: +12 | Bonus: +2 (no hint), +3 (đúng lý do)
🔍 Vòng 4: Heatmap — "Correlation Matrix" ⭐⭐ Trung bình
Data Science team đang chọn features cho attrition prediction model. Correlation heatmap cần insight.
💬 Slack từ DS Lead:
"Cho tao insight từ correlation matrix này — đặc biệt: biến nào nên đưa vào model, biến nào cần cẩn thận?"
Chart mô tả:
📊 Heatmap: Correlation Matrix (6 biến numeric)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
salary age exp tenure perf satisfaction
salary 1.00 0.45 0.72 0.38 0.55 -0.12
age 0.45 1.00 0.89 0.62 0.15 0.08
exp 0.72 0.89 1.00 0.58 0.20 -0.05
tenure 0.38 0.62 0.58 1.00 0.10 0.35
perf 0.55 0.15 0.20 0.10 1.00 -0.42
satisfaction -0.12 0.08 -0.05 0.35 -0.42 1.00
Color scale: 🔴 -1.0 ←──── 0 ────→ +1.0 🔵
⚠️ age ↔ exp: r = 0.89 (rất cao)
⚠️ perf ↔ satisfaction: r = -0.42 (negative)Lựa chọn:
| Insight | |
|---|---|
| A | "salary và experience có correlation cao nhất (0.72), salary và satisfaction thấp nhất (-0.12)" |
| B | "Tất cả correlation đều < 1.0, nên không có biến nào hoàn toàn liên quan" |
| C | "Multicollinearity warning: age ↔ exp = 0.89 → nếu đưa cả 2 vào model, model bị redundant (chọn 1). Surprise finding: perf ↔ satisfaction = -0.42 → performance cao nhưng satisfaction thấp → potential burnout risk. Recommend: dùng exp (không dùng age), và HR nên investigate nhóm high-perf + low-satisfaction" |
💡 Hint (−2 XP)
Heatmap insight ≠ đọc giá trị cao nhất/thấp nhất. Tìm: (1) multicollinearity — 2 biến correlation > 0.8 → vấn đề cho model, (2) unexpected relationship — 2 biến lẽ ra nên positive lại negative (hoặc ngược lại). Kết hợp thống kê + nghiệp vụ!
Đáp án & Giải thích
✅ Đáp án đúng: C
Lý do:
- A sai vì chỉ đọc số cao nhất/thấp nhất — mô tả, không phải insight. DS Lead đã biết đọc heatmap
- B sai vì tất nhiên correlation < 1.0 (chỉ = 1.0 khi biến so với chính nó) — statement vô nghĩa
- C đúng vì: (1) phát hiện multicollinearity age ↔ exp = 0.89 → recommendation rõ: chọn 1 biến, (2) phát hiện negative correlation bất ngờ perf ↔ satisfaction = -0.42 → insight nghiệp vụ: burnout risk, (3) recommendation cụ thể cho cả DS (feature selection) và HR (investigate)
XP: +12 | Bonus: +2 (no hint), +3 (đúng lý do)
🔍 Vòng 5: Box Plot — "Lương theo phòng ban" ⭐⭐⭐ Khó
CFO muốn biết phòng ban nào có vấn đề bất bình đẳng lương nghiêm trọng nhất.
💬 Slack từ CFO:
"Board meeting tuần sau cần report pay equity. Phòng ban nào cần attention nhất?"
Chart mô tả:
📊 Box Plot: Salary by Department (5 phòng ban)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
Engineering ├──────[====|========]──────────┤ ◆ ◆
Q1=18 Med=25 Q3=35 Outliers: 55M, 58M
IQR = 17M
Marketing ├───[==|=====]──┤
Q1=10 Med=13 Q3=18
IQR = 8M
Sales ├──[=|===]─────────────────────┤ ◆ ◆ ◆ ◆
Q1=8 Med=10 Q3=15 Outliers: 35M, 38M, 42M, 45M
IQR = 7M | Whisker rất dài!
HR ├──[==|==]──┤
Q1=9 Med=12 Q3=14
IQR = 5M
Finance ├───[===|===]───┤
Q1=15 Med=20 Q3=25
IQR = 10M
──────────────────────────────────────────
0 5M 10M 15M 20M 25M 30M 40M 50M 60MLựa chọn:
| Insight | |
|---|---|
| A | "Engineering có median cao nhất (25M), Sales có median thấp nhất (10M)" |
| B | "Sales có vấn đề pay equity nghiêm trọng nhất: median thấp (10M) nhưng có 4 outliers 35-45M → khoảng cách giữa đa số NV (8-15M) và top earners (35-45M) là 4-5 lần — lớn hơn mọi phòng ban khác. Engineering có outliers nhưng gap chỉ ~2x (25M → 55M). Recommend: audit Sales compensation — kiểm tra top earners có phải commission-based hay structural inequality" |
| C | "HR có IQR nhỏ nhất (5M) nên lương công bằng nhất, công ty nên áp dụng mô hình HR cho tất cả phòng ban" |
💡 Hint (−2 XP)
Box plot cho thấy spread (IQR) + outliers. Pay equity ≠ chỉ nhìn median. Phòng ban nào có gap lớn nhất giữa majority và outliers? Outlier nhiều + IQR nhỏ = đa số lương thấp nhưng vài người lương rất cao → bất bình đẳng.
Đáp án & Giải thích
✅ Đáp án đúng: B
Lý do:
- A sai vì chỉ so sánh median — pay equity không phải ai cao nhất/thấp nhất, mà là spread & gap
- C sai vì IQR nhỏ chưa chắc "công bằng" — nếu tất cả đều lương thấp thì IQR cũng nhỏ. Và "áp dụng mô hình HR cho Sales" vô lý vì 2 phòng ban có cơ cấu khác nhau
- B đúng vì: (1) phát hiện gap 4-5x ở Sales (majority 8-15M vs outliers 35-45M), (2) so sánh cross-department (Engineering gap chỉ ~2x), (3) recommendation actionable: audit Sales, (4) đề xuất investigation hướng thay vì kết luận vội (commission-based?)
XP: +15 | Bonus: +2 (no hint), +3 (đúng lý do)
🔍 Vòng 6: Line Chart — "Monthly Revenue Trend" ⭐⭐⭐ Khó
CEO cần biết doanh thu tháng gần đây có bình thường không — hay có dấu hiệu bất thường.
💬 Slack từ CEO:
"Tôi thấy doanh thu tháng 11 hơi lạ. Confirm giúp — có nên lo không?"
Chart mô tả:
📊 Line Chart: Monthly Revenue 2025 (12 tháng)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
Revenue (B)
60 ┤ ╱── Dec: 58B
55 ┤ ╱────╱
50 ┤ ╱────╱
45 ┤ ╱────╱
40 ┤ ╱────╱
35 ┤ ╱────╱
30 ┤ ╱────╱ ↑ Upward trend Q1-Q4
25 ┤ ╱───╱
20 ┤╱
┼────┬────┬────┬────┬────┬────┬────┬────┬────┬────┬────┬────
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
⚠️ Tháng 11: Revenue = 38B (giảm 18% vs tháng 10 = 46B)
Tháng 12: Revenue = 58B (tăng 53% vs tháng 11)
YoY Growth: +22%
Avg monthly growth (loại T11): ~6%Lựa chọn:
| Insight | |
|---|---|
| A | "Doanh thu tăng đều từ Jan đến Dec, tổng cả năm rất tốt, YoY +22%" |
| B | "Tháng 11 giảm 18% — đây là dấu hiệu khủng hoảng, cần cắt giảm chi phí ngay" |
| C | "Anomaly tháng 11: giảm 18% phá vỡ upward trend (avg growth ~6%/tháng). Nhưng tháng 12 recover mạnh +53% → có thể tháng 11 là seasonal dip (pre-holiday slowdown trước mùa mua sắm Dec) hoặc one-time event (system outage, campaign gap). Recommend: (1) cross-check T11 năm trước xem có pattern tương tự, (2) kiểm tra operational log T11 tìm root cause" |
💡 Hint (−2 XP)
Line chart anomaly: 1 điểm giảm trong upward trend. Đừng kết luận vội "khủng hoảng" hay bỏ qua "không sao đâu". Insight tốt = phát hiện anomaly + đề xuất cách investigate (compare YoY, check operational data). Tháng 12 recover = manh mối quan trọng.
Đáp án & Giải thích
✅ Đáp án đúng: C
Lý do:
- A sai vì bỏ qua anomaly tháng 11 — CEO đã hỏi cụ thể vì thấy "hơi lạ". Phân tích mà miss câu hỏi chính = fail
- B sai vì phản ứng quá mức — 1 tháng giảm chưa phải "khủng hoảng", đặc biệt khi tháng 12 recover mạnh. "Cắt giảm chi phí ngay" thiếu cơ sở
- C đúng vì: (1) confirm anomaly + đo lường (18% drop vs avg 6% growth), (2) đưa ra 2 giả thuyết hợp lý (seasonal dip, one-time event), (3) recommend investigate thay vì kết luận vội — so YoY và check ops log
XP: +15 | Bonus: +2 (no hint), +3 (đúng lý do)
🔍 Vòng 7: Multi-Chart Combo — "EDA Summary Dashboard" ⭐⭐⭐⭐ Khó
Vòng cuối! Bạn nhận 3 charts cùng lúc từ EDA dự án e-commerce. Cần kết nối insights thành 1 story cho client.
💬 Slack từ Team Lead:
"Client presentation ngày mai. Em tổng hợp 3 charts này thành 1 key insight — câu quan trọng nhất mà client cần biết."
Charts mô tả:
Chart A — Histogram: Order Value Distribution
Phân phối order value: right-skewed
Mean = 850K | Median = 520K
Top 5% orders > 3M VND (high-value orders)
Bottom 50% orders < 520K VNDChart B — Scatter: Order Value vs Customer Lifetime (ngày)
r = 0.35 (weak-moderate positive)
Cluster 1: lifetime < 90 ngày, order value < 500K (65% customers)
Cluster 2: lifetime > 365 ngày, order value 1-5M (15% customers)
Outlier cluster: lifetime > 500 ngày, order value > 5M (3% customers — VIP)Chart C — Bar: Revenue Contribution by Customer Segment
VIP (3%): ████████████████████ 35% total revenue
Loyal (15%): ██████████████████ 30% total revenue
Regular (82%): █████████████████████ 35% total revenueLựa chọn:
| Insight | |
|---|---|
| A | "Order value lệch phải, correlation với lifetime yếu (0.35), và VIP chiếm 3% nhưng đóng góp 35% doanh thu" |
| B | "Pareto Pattern rõ rệt: 18% khách hàng (VIP + Loyal) tạo ra 65% doanh thu — gần đúng quy tắc 80/20. Key insight: mỗi VIP customer đáng giá ~12x regular customer. Recommend: (1) retention program cho VIP/Loyal — chi phí giữ chân rẻ hơn nhiều so với acquire new, (2) conversion program từ Regular → Loyal: target nhóm lifetime 60-90 ngày có order value > median (520K) — họ là 'future loyal' tiềm năng" |
| C | "Regular chiếm 82% khách hàng và 35% doanh thu, nên đây là nhóm quan trọng nhất cần tập trung" |
💡 Hint (−2 XP)
Multi-chart insight = kết nối data points từ 3 charts thành 1 story. Chart A cho shape, Chart B cho segments, Chart C cho business impact. Hãy tìm Pareto pattern (80/20 rule) và actionable recommendation dựa trên segment value. Đâu là nhóm "đáng đầu tư" nhất?
Đáp án & Giải thích
✅ Đáp án đúng: B
Lý do:
- A sai vì liệt kê 3 insights riêng lẻ — không kết nối thành story. Client không cần nghe 3 bullet points tách rời
- C sai vì kết luận ngược: Regular chiếm 82% headcount nhưng chỉ 35% revenue → mỗi regular customer tạo rất ít giá trị. Đổ resource vào nhóm này không hiệu quả bằng giữ chân VIP
- B đúng vì: (1) kết nối 3 charts: distribution → segmentation → business impact → Pareto pattern, (2) tính toán giá trị cụ thể: VIP ~12x regular (35%/3% vs 35%/82%), (3) 2 recommendations rõ ràng: retention cho VIP + conversion cho potential-loyal, (4) target group cụ thể dựa trên data (lifetime 60-90 ngày + order > median)
XP: +18 | Bonus: +2 (no hint), +3 (đúng lý do)
🏁 Tổng kết
Bảng tổng hợp kỹ năng đọc chart
| Chart Type | Đừng làm (mô tả) | Hãy làm (insight) |
|---|---|---|
| Histogram | "Đa số nằm ở khoảng X-Y" | Nhận diện skewness, mean vs median gap, actionable metric |
| Bar Chart | "A cao nhất, B thấp nhất" | Kết hợp absolute + growth, tìm cơ hội |
| Scatter Plot | "Correlation = 0.72" | Tìm deviation from trend, clusters bất thường |
| Heatmap | "X và Y correlation cao nhất" | Multicollinearity warning, unexpected relationships |
| Box Plot | "Median A > Median B" | So sánh spread + outliers, phát hiện inequality |
| Line Chart | "Tăng đều / Giảm" | Phát hiện anomaly, đề xuất investigate |
| Multi-Chart | Liệt kê findings riêng lẻ | Kết nối thành story, Pareto pattern, segment strategy |
Tiếp theo
Bạn đã biết đọc chart và tìm insight actionable. Giờ hãy tự tay thực hiện EDA hoàn chỉnh trong Workshop — EDA Pipeline — từ load data đến viết EDA report với 5 key findings! 🚀
💡 Sau game này
- ✅ Bạn biết phân biệt mô tả chart vs insight actionable
- ✅ Bạn biết đọc 7 loại chart phổ biến nhất trong EDA
- ✅ Bạn hiểu: insight tốt = phát hiện + giải thích + recommendation
- → Sẵn sàng cho Workshop: tự vẽ chart và viết insight từ real dataset!