Skip to content

🏆 Tiêu chuẩn Buổi 1: Tổng quan Data Analytics

Các tiêu chuẩn và framework quốc tế cần nắm cho Data Analyst

Tổng quan

Trong lĩnh vực Data Analytics, việc tuân thủ các tiêu chuẩn và framework quốc tế không chỉ giúp Data Analyst làm việc có hệ thống mà còn đảm bảo chất lượngtính nhất quán trong mọi dự án phân tích dữ liệu. Các tiêu chuẩn cung cấp:

  • Quy trình chuẩn hóa: Mỗi bước phân tích đều có hướng dẫn rõ ràng, giảm thiểu sai sót
  • Ngôn ngữ chung: Giúp các thành viên trong team và stakeholder hiểu nhau
  • Benchmark năng lực: Đánh giá và phát triển kỹ năng cá nhân theo chuẩn quốc tế
  • Uy tín nghề nghiệp: Chứng chỉ quốc tế tăng giá trị trên thị trường lao động

Buổi 1 tập trung vào 3 tiêu chuẩn/framework nền tảng mà mọi Data Analyst cần biết ngay từ đầu.

📋 Danh sách tiêu chuẩn liên quan

#Tiêu chuẩnXuất xứÁp dụng cho DA
1Google Data Analytics FrameworkGoogleQuy trình phân tích 6 bước: Ask → Prepare → Process → Analyze → Share → Act
2CRISP-DMIBM / NCR / SPSS (1996)Quy trình data mining chuẩn công nghiệp gồm 6 phases
3Data Literacy FrameworkData Literacy Project / QlikĐánh giá và phát triển năng lực data cá nhân
4DAMA DMBOKDAMA InternationalQuản lý dữ liệu toàn diện — nền tảng cho mọi công việc DA

1️⃣ Google Data Analytics Framework

Giới thiệu

Google Data Analytics Framework là quy trình phân tích dữ liệu 6 bước được Google phát triển và giảng dạy trong chương trình Google Data Analytics Professional Certificate trên Coursera. Đây là framework phổ biến nhất cho người mới bắt đầu vì tính đơn giản, thực tiễn và dễ áp dụng ngay vào công việc.

Framework này đi theo triết lý: bắt đầu bằng câu hỏi đúng, kết thúc bằng hành động cụ thể.

Nội dung chính — 6 bước phân tích

BướcTênMô tả chi tiếtCông cụ thường dùng
1Ask (Hỏi)Xác định vấn đề kinh doanh, đặt câu hỏi SMART, xác định stakeholder và kỳ vọngStakeholder interviews, Problem statement template
2Prepare (Chuẩn bị)Thu thập dữ liệu, đánh giá nguồn data, xác định bias, đảm bảo data ethicsSQL, API, Web scraping, Data catalog
3Process (Xử lý)Làm sạch dữ liệu, xử lý missing values, loại bỏ duplicates, chuẩn hóa formatExcel, SQL, Python (Pandas), OpenRefine
4Analyze (Phân tích)Phân tích thống kê, tìm patterns, trends, tính toán metricsSQL, R, Python, Pivot Tables
5Share (Chia sẻ)Tạo visualization, dashboard, trình bày insights cho stakeholderTableau, Power BI, Google Data Studio
6Act (Hành động)Đưa ra recommendations, theo dõi kết quả, lặp lại quy trìnhA/B Testing, KPI tracking

Áp dụng cho Data Analyst

  • Junior DA: Sử dụng framework này như checklist cho mọi task phân tích, đảm bảo không bỏ sót bước nào
  • Mid-level DA: Customize từng bước theo domain cụ thể (marketing, finance, ops)
  • Senior DA: Dùng framework để mentor junior và chuẩn hóa quy trình trong team

Lưu ý thực tế: Trong thực tế, quy trình không phải lúc nào cũng tuyến tính. Data Analyst thường quay lại bước trước khi phát hiện vấn đề — ví dụ, khi Analyze phát hiện data thiếu, quay về Prepare để thu thập thêm.

Ví dụ thực tế

Tình huống: Một công ty e-commerce nhận thấy doanh thu giảm 15% trong Q4/2025.

BướcHành động cụ thể
Ask"Nguyên nhân nào khiến doanh thu giảm 15%? Giảm ở segment nào? So với cùng kỳ năm trước thế nào?"
PrepareThu thập data: transactions, traffic logs, campaign data, competitor pricing từ 12 tháng gần nhất
ProcessLoại bỏ test orders, xử lý refund records, chuẩn hóa product categories
AnalyzePhát hiện: traffic giảm 25% từ organic search, conversion rate giảm ở mobile users
ShareTạo dashboard Tableau với breakdown theo channel, device, và product category
ActRecommend: tối ưu SEO, cải thiện mobile UX, tăng budget cho paid channels hiệu quả

2️⃣ CRISP-DM

Giới thiệu

CRISP-DM (Cross-Industry Standard Process for Data Mining) là quy trình chuẩn công nghiệp cho data mining và analytics, được phát triển năm 1996 bởi consortium gồm IBM, NCR, SPSS và DaimlerChrysler. Theo khảo sát của KDnuggets, CRISP-DM là methodology được sử dụng nhiều nhất trong data science/analytics (>40% respondents).

Điểm khác biệt với Google Framework: CRISP-DM nhấn mạnh Business Understanding và tính lặp lại (iterative) của quy trình.

Nội dung chính — 6 phases

    ┌─────────────────────┐
    │ Business Understanding│
    └──────────┬──────────┘

    ┌──────────┴──────────┐
    │  Data Understanding  │
    └──────────┬──────────┘

    ┌──────────┴──────────┐
    │  Data Preparation    │
    └──────────┬──────────┘

    ┌──────────┴──────────┐
    │     Modeling         │
    └──────────┬──────────┘

    ┌──────────┴──────────┐
    │    Evaluation        │
    └──────────┬──────────┘

    ┌──────────┴──────────┐
    │    Deployment        │
    └─────────────────────┘
PhaseTênMô tảDeliverables
1Business UnderstandingHiểu mục tiêu kinh doanh, chuyển thành bài toán data, xác định success criteriaProject plan, Business objectives document
2Data UnderstandingKhám phá data, đánh giá chất lượng, phát hiện insights sơ bộData description report, Data quality report
3Data PreparationChọn data, làm sạch, tạo features mới, tích hợp nhiều nguồnClean dataset, Data transformation docs
4ModelingChọn kỹ thuật phân tích, xây dựng model, tuning parametersModel descriptions, Parameter settings
5EvaluationĐánh giá model theo business criteria, review toàn bộ quy trìnhEvaluation results, Approved models
6DeploymentTriển khai vào production, monitoring, maintenance planDeployment plan, Final report

Áp dụng cho Data Analyst

Mặc dù CRISP-DM ban đầu thiết kế cho data mining, Data Analyst áp dụng rất hiệu quả:

  • Business Understanding: DA dùng để align phân tích với business goals — tránh tình trạng "phân tích xong không ai dùng"
  • Data Understanding: EDA (Exploratory Data Analysis) — kỹ năng core của DA
  • Data Preparation: Chiếm 60-80% thời gian của DA, CRISP-DM chuẩn hóa bước này
  • Evaluation: Đánh giá insight có actionable không, trước khi trình bày stakeholder

Tip: Với DA, phase "Modeling" có thể hiểu rộng hơn — không chỉ ML models mà còn statistical analysis, segmentation, forecasting.

Ví dụ thực tế

Tình huống: Ngân hàng muốn giảm tỷ lệ khách hàng rời bỏ (churn rate).

PhaseHành động
Business UnderstandingMục tiêu: giảm churn rate từ 12% xuống 8% trong 6 tháng. KPI: retention rate, CLV (Customer Lifetime Value)
Data UnderstandingKhám phá data 50K khách hàng: demographics, transaction history, complaint logs, product usage. Phát hiện: 30% records thiếu income data
Data PreparationImpute missing values, tạo features mới (transaction frequency, recency, monetary value — RFM), merge data từ 4 sources
ModelingPhân tích: cohort analysis, churn segmentation theo RFM, correlation analysis giữa churn và các factors
EvaluationTop 3 churn factors: inactive >90 ngày, chỉ dùng 1 sản phẩm, có complaint chưa resolve. Validate với business team
DeploymentDashboard real-time churn prediction, weekly alert cho relationship managers, monthly report cho management

3️⃣ Data Literacy Framework

Giới thiệu

Data Literacy Framework là bộ khung đánh giá và phát triển năng lực làm việc với dữ liệu, được phát triển bởi Data Literacy Project (sáng lập bởi Qlik) và được nhiều tổ chức như MIT, Harvard Business Review, World Economic Forum công nhận.

Theo nghiên cứu của Qlik & Accenture (2020): chỉ 21% workforce toàn cầu tự tin với data skills. Data literacy được World Economic Forum xếp vào nhóm top 10 kỹ năng cần thiết cho tương lai.

Nội dung chính

Data Literacy bao gồm 4 trụ cột năng lực:

Trụ cộtNăng lựcMô tảCấp độ
Read (Đọc)Đọc hiểu dữ liệuHiểu data sources, data types, đọc charts/tables chính xácBeginner → Advanced
Work (Làm việc)Thao tác với dữ liệuCleaning, transforming, querying, joining dataBeginner → Advanced
Analyze (Phân tích)Phân tích dữ liệuStatistical thinking, critical analysis, tìm insightsIntermediate → Expert
Communicate (Truyền đạt)Truyền đạt bằng dữ liệuData storytelling, visualization, presenting to stakeholdersIntermediate → Expert

Mức độ Data Literacy (tự đánh giá):

LevelTênĐặc điểm% Workforce (ước tính)
1Data AwareBiết data quan trọng, đọc được chart cơ bản~40%
2Data LiterateDùng data trong công việc hàng ngày, dùng Excel/BI tools~25%
3Data ProficientPhân tích data độc lập, viết SQL, tạo dashboard~10%
4Data FluentData storytelling, mentoring, thiết kế analytics strategy~4%
5Data LeaderDẫn dắt data culture, thiết kế data strategy cho tổ chức~1%

Áp dụng cho Data Analyst

Data Analyst nên ở Level 3-4 và hướng tới Level 5:

  • Self-assessment: Đánh giá bản thân theo 4 trụ cột, xác định gaps
  • Career development: Tạo learning plan cá nhân dựa trên framework
  • Team building: Đánh giá data literacy của team/stakeholders để adjust communication style
  • Organization: Đề xuất data literacy programs cho công ty

Framework ứng dụng hàng ngày:

Nhận task → Read (hiểu data) → Work (xử lý data) → Analyze (tìm insights) → Communicate (trình bày)

Ví dụ thực tế

Tình huống: Data Analyst mới join team Marketing tại một startup.

TuầnTrụ cộtHành động
Tuần 1-2ReadĐọc hiểu data dictionary, làm quen data warehouse, hiểu KPIs của Marketing (CAC, ROAS, LTV)
Tuần 3-4WorkViết SQL queries cho daily/weekly reports, clean campaign data, automate data pipeline cơ bản
Tuần 5-6AnalyzePhân tích campaign performance, A/B test results, customer segmentation
Tuần 7-8CommunicateTạo Marketing dashboard, present monthly insights cho CMO, viết data-driven recommendations

🎓 Chứng chỉ liên quan

Chứng chỉTổ chứcYêu cầuThời gianChi phíPhù hợp cho
Google Data Analytics Professional CertificateGoogle / CourseraKhông yêu cầu kinh nghiệm, hoàn thành 8 courses + capstone project3-6 tháng (10h/tuần)~$49/tháng (Coursera Plus) hoặc Financial Aid miễn phíNgười mới bắt đầu, career switchers
IBM Data Analyst Professional CertificateIBM / CourseraKhông yêu cầu kinh nghiệm, hoàn thành 11 courses4-6 tháng (10h/tuần)~$49/tháng (Coursera Plus)Người muốn focus vào Python & IBM tools
DAMA CDMP (Certified Data Management Professional)DAMA InternationalThi trắc nghiệm, cần kinh nghiệm data managementTự học, thi khi sẵn sàng~$300-$400 (phí thi)Mid-Senior DA, Data Engineers

So sánh chi tiết

Tiêu chíGoogle DAIBM DADAMA CDMP
Ngôn ngữ lập trìnhSQL, RSQL, PythonKhông focus coding
ToolsSpreadsheets, Tableau, R StudioExcel, Cognos, Jupyter, Python libsConceptual / vendor-neutral
Hands-on projects1 capstone + practiceMultiple labs + capstoneKhông có
Được công nhận bởiGoogle, nhiều companiesIBM, enterprise companiesDAMA International (global)
Phù hợp nhấtEntry-level DAEntry-level DA (Python track)Data governance & management

🔗 Ma trận tiêu chuẩn × Chủ đề buổi học

Chủ đề Buổi 1Google DA FrameworkCRISP-DMData LiteracyDAMA DMBOK
Data Analyst role & responsibilities⭐⭐⭐ Định nghĩa rõ vai trò qua 6 bước⭐⭐ Vai trò trong từng phase⭐⭐⭐ 4 trụ cột năng lực⭐⭐ Data Governance roles
Google DA Framework (Ask → Act)⭐⭐⭐ Core content⭐⭐ So sánh tương đồng⭐⭐ Read-Work-Analyze-Communicate map⭐ High-level alignment
Data-Driven Decision Making⭐⭐⭐ Act phase = data-driven actions⭐⭐⭐ Business Understanding = DDDM foundation⭐⭐⭐ Communicate = truyền đạt cho decision makers⭐⭐ Data quality → better decisions
4 types of analytics (Desc → Presc)⭐⭐ Analyze phase covers all 4⭐⭐ Modeling phase = Predictive & Prescriptive⭐⭐ Analyze pillar = all 4 types⭐ Metadata & data quality support

Chú thích: ⭐ = Liên quan gián tiếp | ⭐⭐ = Liên quan trực tiếp | ⭐⭐⭐ = Core/trọng tâm


📝 Checklist áp dụng cho Data Analyst

Kiến thức nền tảng

  • [ ] Hiểu và giải thích được 6 bước của Google Data Analytics Framework
  • [ ] Hiểu và so sánh được Google DA Framework với CRISP-DM
  • [ ] Tự đánh giá Data Literacy level của bản thân (Level 1-5)
  • [ ] Biết sự khác biệt giữa 4 loại analytics: Descriptive, Diagnostic, Predictive, Prescriptive
  • [ ] Hiểu Data-Driven Decision Making và phân biệt với gut-feeling decisions

Kỹ năng thực hành

  • [ ] Áp dụng được 6 bước Google DA Framework cho một bài toán cụ thể
  • [ ] Viết được Problem Statement theo chuẩn (bước Ask)
  • [ ] Xác định được data sources cần thiết cho một bài toán (bước Prepare)
  • [ ] Tạo được Data Literacy self-assessment cho bản thân
  • [ ] Map được business problem vào CRISP-DM phases

Phát triển nghề nghiệp

  • [ ] Đăng ký ít nhất 1 chứng chỉ: Google DA hoặc IBM DA
  • [ ] Tạo learning roadmap cá nhân dựa trên Data Literacy gaps
  • [ ] Follow ít nhất 3 Data Analytics communities/blogs
  • [ ] Đọc DAMA DMBOK overview để hiểu big picture của data management

📚 Tài liệu tham khảo

Tài liệu chính thức

  1. Google Data Analytics CertificateCoursera
  2. CRISP-DM 1.0 — Step-by-step data mining guide — Chapman et al. (2000), IBM SPSS
  3. DAMA DMBOK 2nd Edition — DAMA International (2017)
  4. The Data Literacy Projectdataliteracy.com

Sách tham khảo

  1. Data Literacy: A User's Guide — David Herzog (2015), SAGE Publications
  2. Be Data Literate — Jordan Morrow (2021), Kogan Page — Tác giả là "Godfather of Data Literacy"
  3. Storytelling with Data — Cole Nussbaumer Knaflic (2015), Wiley — Data communication best practices

Bài viết & Nghiên cứu

  1. "The Human Impact of Data Literacy" — Qlik & Accenture (2020) — Nghiên cứu 9,000+ workers toàn cầu
  2. "Top 10 Data and Analytics Trends" — Gartner (2025)
  3. "KDnuggets Methodology Poll" — KDnuggets — CRISP-DM usage statistics

Video & Courses

  1. Google Data Analytics Course 1: Foundations — Coursera (miễn phí audit)
  2. IBM Data Analyst Course 1: Introduction — Coursera (miễn phí audit)

🔗 Xem thêm Buổi 1

📘 Nội dung chính📝 Blog🧠 Case Study🛠 Workshop🎮 Mini Game