Appearance
🏆 Tiêu chuẩn Buổi 1: Tổng quan Data Analytics
Các tiêu chuẩn và framework quốc tế cần nắm cho Data Analyst
Tổng quan
Trong lĩnh vực Data Analytics, việc tuân thủ các tiêu chuẩn và framework quốc tế không chỉ giúp Data Analyst làm việc có hệ thống mà còn đảm bảo chất lượng và tính nhất quán trong mọi dự án phân tích dữ liệu. Các tiêu chuẩn cung cấp:
- Quy trình chuẩn hóa: Mỗi bước phân tích đều có hướng dẫn rõ ràng, giảm thiểu sai sót
- Ngôn ngữ chung: Giúp các thành viên trong team và stakeholder hiểu nhau
- Benchmark năng lực: Đánh giá và phát triển kỹ năng cá nhân theo chuẩn quốc tế
- Uy tín nghề nghiệp: Chứng chỉ quốc tế tăng giá trị trên thị trường lao động
Buổi 1 tập trung vào 3 tiêu chuẩn/framework nền tảng mà mọi Data Analyst cần biết ngay từ đầu.
📋 Danh sách tiêu chuẩn liên quan
| # | Tiêu chuẩn | Xuất xứ | Áp dụng cho DA |
|---|---|---|---|
| 1 | Google Data Analytics Framework | Quy trình phân tích 6 bước: Ask → Prepare → Process → Analyze → Share → Act | |
| 2 | CRISP-DM | IBM / NCR / SPSS (1996) | Quy trình data mining chuẩn công nghiệp gồm 6 phases |
| 3 | Data Literacy Framework | Data Literacy Project / Qlik | Đánh giá và phát triển năng lực data cá nhân |
| 4 | DAMA DMBOK | DAMA International | Quản lý dữ liệu toàn diện — nền tảng cho mọi công việc DA |
1️⃣ Google Data Analytics Framework
Giới thiệu
Google Data Analytics Framework là quy trình phân tích dữ liệu 6 bước được Google phát triển và giảng dạy trong chương trình Google Data Analytics Professional Certificate trên Coursera. Đây là framework phổ biến nhất cho người mới bắt đầu vì tính đơn giản, thực tiễn và dễ áp dụng ngay vào công việc.
Framework này đi theo triết lý: bắt đầu bằng câu hỏi đúng, kết thúc bằng hành động cụ thể.
Nội dung chính — 6 bước phân tích
| Bước | Tên | Mô tả chi tiết | Công cụ thường dùng |
|---|---|---|---|
| 1 | Ask (Hỏi) | Xác định vấn đề kinh doanh, đặt câu hỏi SMART, xác định stakeholder và kỳ vọng | Stakeholder interviews, Problem statement template |
| 2 | Prepare (Chuẩn bị) | Thu thập dữ liệu, đánh giá nguồn data, xác định bias, đảm bảo data ethics | SQL, API, Web scraping, Data catalog |
| 3 | Process (Xử lý) | Làm sạch dữ liệu, xử lý missing values, loại bỏ duplicates, chuẩn hóa format | Excel, SQL, Python (Pandas), OpenRefine |
| 4 | Analyze (Phân tích) | Phân tích thống kê, tìm patterns, trends, tính toán metrics | SQL, R, Python, Pivot Tables |
| 5 | Share (Chia sẻ) | Tạo visualization, dashboard, trình bày insights cho stakeholder | Tableau, Power BI, Google Data Studio |
| 6 | Act (Hành động) | Đưa ra recommendations, theo dõi kết quả, lặp lại quy trình | A/B Testing, KPI tracking |
Áp dụng cho Data Analyst
- Junior DA: Sử dụng framework này như checklist cho mọi task phân tích, đảm bảo không bỏ sót bước nào
- Mid-level DA: Customize từng bước theo domain cụ thể (marketing, finance, ops)
- Senior DA: Dùng framework để mentor junior và chuẩn hóa quy trình trong team
Lưu ý thực tế: Trong thực tế, quy trình không phải lúc nào cũng tuyến tính. Data Analyst thường quay lại bước trước khi phát hiện vấn đề — ví dụ, khi Analyze phát hiện data thiếu, quay về Prepare để thu thập thêm.
Ví dụ thực tế
Tình huống: Một công ty e-commerce nhận thấy doanh thu giảm 15% trong Q4/2025.
| Bước | Hành động cụ thể |
|---|---|
| Ask | "Nguyên nhân nào khiến doanh thu giảm 15%? Giảm ở segment nào? So với cùng kỳ năm trước thế nào?" |
| Prepare | Thu thập data: transactions, traffic logs, campaign data, competitor pricing từ 12 tháng gần nhất |
| Process | Loại bỏ test orders, xử lý refund records, chuẩn hóa product categories |
| Analyze | Phát hiện: traffic giảm 25% từ organic search, conversion rate giảm ở mobile users |
| Share | Tạo dashboard Tableau với breakdown theo channel, device, và product category |
| Act | Recommend: tối ưu SEO, cải thiện mobile UX, tăng budget cho paid channels hiệu quả |
2️⃣ CRISP-DM
Giới thiệu
CRISP-DM (Cross-Industry Standard Process for Data Mining) là quy trình chuẩn công nghiệp cho data mining và analytics, được phát triển năm 1996 bởi consortium gồm IBM, NCR, SPSS và DaimlerChrysler. Theo khảo sát của KDnuggets, CRISP-DM là methodology được sử dụng nhiều nhất trong data science/analytics (>40% respondents).
Điểm khác biệt với Google Framework: CRISP-DM nhấn mạnh Business Understanding và tính lặp lại (iterative) của quy trình.
Nội dung chính — 6 phases
┌─────────────────────┐
│ Business Understanding│
└──────────┬──────────┘
↓
┌──────────┴──────────┐
│ Data Understanding │
└──────────┬──────────┘
↓
┌──────────┴──────────┐
│ Data Preparation │
└──────────┬──────────┘
↓
┌──────────┴──────────┐
│ Modeling │
└──────────┬──────────┘
↓
┌──────────┴──────────┐
│ Evaluation │
└──────────┬──────────┘
↓
┌──────────┴──────────┐
│ Deployment │
└─────────────────────┘| Phase | Tên | Mô tả | Deliverables |
|---|---|---|---|
| 1 | Business Understanding | Hiểu mục tiêu kinh doanh, chuyển thành bài toán data, xác định success criteria | Project plan, Business objectives document |
| 2 | Data Understanding | Khám phá data, đánh giá chất lượng, phát hiện insights sơ bộ | Data description report, Data quality report |
| 3 | Data Preparation | Chọn data, làm sạch, tạo features mới, tích hợp nhiều nguồn | Clean dataset, Data transformation docs |
| 4 | Modeling | Chọn kỹ thuật phân tích, xây dựng model, tuning parameters | Model descriptions, Parameter settings |
| 5 | Evaluation | Đánh giá model theo business criteria, review toàn bộ quy trình | Evaluation results, Approved models |
| 6 | Deployment | Triển khai vào production, monitoring, maintenance plan | Deployment plan, Final report |
Áp dụng cho Data Analyst
Mặc dù CRISP-DM ban đầu thiết kế cho data mining, Data Analyst áp dụng rất hiệu quả:
- Business Understanding: DA dùng để align phân tích với business goals — tránh tình trạng "phân tích xong không ai dùng"
- Data Understanding: EDA (Exploratory Data Analysis) — kỹ năng core của DA
- Data Preparation: Chiếm 60-80% thời gian của DA, CRISP-DM chuẩn hóa bước này
- Evaluation: Đánh giá insight có actionable không, trước khi trình bày stakeholder
Tip: Với DA, phase "Modeling" có thể hiểu rộng hơn — không chỉ ML models mà còn statistical analysis, segmentation, forecasting.
Ví dụ thực tế
Tình huống: Ngân hàng muốn giảm tỷ lệ khách hàng rời bỏ (churn rate).
| Phase | Hành động |
|---|---|
| Business Understanding | Mục tiêu: giảm churn rate từ 12% xuống 8% trong 6 tháng. KPI: retention rate, CLV (Customer Lifetime Value) |
| Data Understanding | Khám phá data 50K khách hàng: demographics, transaction history, complaint logs, product usage. Phát hiện: 30% records thiếu income data |
| Data Preparation | Impute missing values, tạo features mới (transaction frequency, recency, monetary value — RFM), merge data từ 4 sources |
| Modeling | Phân tích: cohort analysis, churn segmentation theo RFM, correlation analysis giữa churn và các factors |
| Evaluation | Top 3 churn factors: inactive >90 ngày, chỉ dùng 1 sản phẩm, có complaint chưa resolve. Validate với business team |
| Deployment | Dashboard real-time churn prediction, weekly alert cho relationship managers, monthly report cho management |
3️⃣ Data Literacy Framework
Giới thiệu
Data Literacy Framework là bộ khung đánh giá và phát triển năng lực làm việc với dữ liệu, được phát triển bởi Data Literacy Project (sáng lập bởi Qlik) và được nhiều tổ chức như MIT, Harvard Business Review, World Economic Forum công nhận.
Theo nghiên cứu của Qlik & Accenture (2020): chỉ 21% workforce toàn cầu tự tin với data skills. Data literacy được World Economic Forum xếp vào nhóm top 10 kỹ năng cần thiết cho tương lai.
Nội dung chính
Data Literacy bao gồm 4 trụ cột năng lực:
| Trụ cột | Năng lực | Mô tả | Cấp độ |
|---|---|---|---|
| Read (Đọc) | Đọc hiểu dữ liệu | Hiểu data sources, data types, đọc charts/tables chính xác | Beginner → Advanced |
| Work (Làm việc) | Thao tác với dữ liệu | Cleaning, transforming, querying, joining data | Beginner → Advanced |
| Analyze (Phân tích) | Phân tích dữ liệu | Statistical thinking, critical analysis, tìm insights | Intermediate → Expert |
| Communicate (Truyền đạt) | Truyền đạt bằng dữ liệu | Data storytelling, visualization, presenting to stakeholders | Intermediate → Expert |
Mức độ Data Literacy (tự đánh giá):
| Level | Tên | Đặc điểm | % Workforce (ước tính) |
|---|---|---|---|
| 1 | Data Aware | Biết data quan trọng, đọc được chart cơ bản | ~40% |
| 2 | Data Literate | Dùng data trong công việc hàng ngày, dùng Excel/BI tools | ~25% |
| 3 | Data Proficient | Phân tích data độc lập, viết SQL, tạo dashboard | ~10% |
| 4 | Data Fluent | Data storytelling, mentoring, thiết kế analytics strategy | ~4% |
| 5 | Data Leader | Dẫn dắt data culture, thiết kế data strategy cho tổ chức | ~1% |
Áp dụng cho Data Analyst
Data Analyst nên ở Level 3-4 và hướng tới Level 5:
- Self-assessment: Đánh giá bản thân theo 4 trụ cột, xác định gaps
- Career development: Tạo learning plan cá nhân dựa trên framework
- Team building: Đánh giá data literacy của team/stakeholders để adjust communication style
- Organization: Đề xuất data literacy programs cho công ty
Framework ứng dụng hàng ngày:
Nhận task → Read (hiểu data) → Work (xử lý data) → Analyze (tìm insights) → Communicate (trình bày)Ví dụ thực tế
Tình huống: Data Analyst mới join team Marketing tại một startup.
| Tuần | Trụ cột | Hành động |
|---|---|---|
| Tuần 1-2 | Read | Đọc hiểu data dictionary, làm quen data warehouse, hiểu KPIs của Marketing (CAC, ROAS, LTV) |
| Tuần 3-4 | Work | Viết SQL queries cho daily/weekly reports, clean campaign data, automate data pipeline cơ bản |
| Tuần 5-6 | Analyze | Phân tích campaign performance, A/B test results, customer segmentation |
| Tuần 7-8 | Communicate | Tạo Marketing dashboard, present monthly insights cho CMO, viết data-driven recommendations |
🎓 Chứng chỉ liên quan
| Chứng chỉ | Tổ chức | Yêu cầu | Thời gian | Chi phí | Phù hợp cho |
|---|---|---|---|---|---|
| Google Data Analytics Professional Certificate | Google / Coursera | Không yêu cầu kinh nghiệm, hoàn thành 8 courses + capstone project | 3-6 tháng (10h/tuần) | ~$49/tháng (Coursera Plus) hoặc Financial Aid miễn phí | Người mới bắt đầu, career switchers |
| IBM Data Analyst Professional Certificate | IBM / Coursera | Không yêu cầu kinh nghiệm, hoàn thành 11 courses | 4-6 tháng (10h/tuần) | ~$49/tháng (Coursera Plus) | Người muốn focus vào Python & IBM tools |
| DAMA CDMP (Certified Data Management Professional) | DAMA International | Thi trắc nghiệm, cần kinh nghiệm data management | Tự học, thi khi sẵn sàng | ~$300-$400 (phí thi) | Mid-Senior DA, Data Engineers |
So sánh chi tiết
| Tiêu chí | Google DA | IBM DA | DAMA CDMP |
|---|---|---|---|
| Ngôn ngữ lập trình | SQL, R | SQL, Python | Không focus coding |
| Tools | Spreadsheets, Tableau, R Studio | Excel, Cognos, Jupyter, Python libs | Conceptual / vendor-neutral |
| Hands-on projects | 1 capstone + practice | Multiple labs + capstone | Không có |
| Được công nhận bởi | Google, nhiều companies | IBM, enterprise companies | DAMA International (global) |
| Phù hợp nhất | Entry-level DA | Entry-level DA (Python track) | Data governance & management |
🔗 Ma trận tiêu chuẩn × Chủ đề buổi học
| Chủ đề Buổi 1 | Google DA Framework | CRISP-DM | Data Literacy | DAMA DMBOK |
|---|---|---|---|---|
| Data Analyst role & responsibilities | ⭐⭐⭐ Định nghĩa rõ vai trò qua 6 bước | ⭐⭐ Vai trò trong từng phase | ⭐⭐⭐ 4 trụ cột năng lực | ⭐⭐ Data Governance roles |
| Google DA Framework (Ask → Act) | ⭐⭐⭐ Core content | ⭐⭐ So sánh tương đồng | ⭐⭐ Read-Work-Analyze-Communicate map | ⭐ High-level alignment |
| Data-Driven Decision Making | ⭐⭐⭐ Act phase = data-driven actions | ⭐⭐⭐ Business Understanding = DDDM foundation | ⭐⭐⭐ Communicate = truyền đạt cho decision makers | ⭐⭐ Data quality → better decisions |
| 4 types of analytics (Desc → Presc) | ⭐⭐ Analyze phase covers all 4 | ⭐⭐ Modeling phase = Predictive & Prescriptive | ⭐⭐ Analyze pillar = all 4 types | ⭐ Metadata & data quality support |
Chú thích: ⭐ = Liên quan gián tiếp | ⭐⭐ = Liên quan trực tiếp | ⭐⭐⭐ = Core/trọng tâm
📝 Checklist áp dụng cho Data Analyst
Kiến thức nền tảng
- [ ] Hiểu và giải thích được 6 bước của Google Data Analytics Framework
- [ ] Hiểu và so sánh được Google DA Framework với CRISP-DM
- [ ] Tự đánh giá Data Literacy level của bản thân (Level 1-5)
- [ ] Biết sự khác biệt giữa 4 loại analytics: Descriptive, Diagnostic, Predictive, Prescriptive
- [ ] Hiểu Data-Driven Decision Making và phân biệt với gut-feeling decisions
Kỹ năng thực hành
- [ ] Áp dụng được 6 bước Google DA Framework cho một bài toán cụ thể
- [ ] Viết được Problem Statement theo chuẩn (bước Ask)
- [ ] Xác định được data sources cần thiết cho một bài toán (bước Prepare)
- [ ] Tạo được Data Literacy self-assessment cho bản thân
- [ ] Map được business problem vào CRISP-DM phases
Phát triển nghề nghiệp
- [ ] Đăng ký ít nhất 1 chứng chỉ: Google DA hoặc IBM DA
- [ ] Tạo learning roadmap cá nhân dựa trên Data Literacy gaps
- [ ] Follow ít nhất 3 Data Analytics communities/blogs
- [ ] Đọc DAMA DMBOK overview để hiểu big picture của data management
📚 Tài liệu tham khảo
Tài liệu chính thức
- Google Data Analytics Certificate — Coursera
- CRISP-DM 1.0 — Step-by-step data mining guide — Chapman et al. (2000), IBM SPSS
- DAMA DMBOK 2nd Edition — DAMA International (2017)
- The Data Literacy Project — dataliteracy.com
Sách tham khảo
- Data Literacy: A User's Guide — David Herzog (2015), SAGE Publications
- Be Data Literate — Jordan Morrow (2021), Kogan Page — Tác giả là "Godfather of Data Literacy"
- Storytelling with Data — Cole Nussbaumer Knaflic (2015), Wiley — Data communication best practices
Bài viết & Nghiên cứu
- "The Human Impact of Data Literacy" — Qlik & Accenture (2020) — Nghiên cứu 9,000+ workers toàn cầu
- "Top 10 Data and Analytics Trends" — Gartner (2025)
- "KDnuggets Methodology Poll" — KDnuggets — CRISP-DM usage statistics
Video & Courses
- Google Data Analytics Course 1: Foundations — Coursera (miễn phí audit)
- IBM Data Analyst Course 1: Introduction — Coursera (miễn phí audit)
🔗 Xem thêm Buổi 1
→ 📘 Nội dung chính → 📝 Blog → 🧠 Case Study → 🛠 Workshop → 🎮 Mini Game