Lộ trình Xác suất & Thống kê

Từ lý thuyết toán học đến phân tích dữ liệu thực tế cho Khoa học dữ liệu và Học máy.

Trở về lộ trình
Giai đoạn Chủ đề chính Nội dung & Hoạt động học tập Mục tiêu & Sản phẩm
1. Nền tảng Nền tảng Toán học & Lý thuyết Tập hợp
  • Kiến thức cơ bản về Giải tích & Đại số tuyến tính.
  • Lý thuyết tập hợp & Biểu đồ Venn.
  • Phép đếm: Hoán vị, Chỉnh hợp, Tổ hợp.
  • Xây dựng kiến thức toán học cần thiết.
  • Giải các bài toán đếm cơ bản.
2. Cốt lõi Xác suất Các khái niệm cơ bản về Xác suất
  • Không gian mẫu, Biến cố.
  • Các định nghĩa về xác suất: Cổ điển, Thống kê.
  • Xác suất có điều kiện, Định lý Bayes.
  • Đi sâu vào các nguyên tắc đầu tiên của lý thuyết xác suất.
  • Áp dụng định lý Bayes để giải quyết vấn đề.
3. Phân phối Biến ngẫu nhiên & Phân phối xác suất
  • Biến ngẫu nhiên rời rạc & liên tục.
  • Hàm mật độ xác suất (PDF) & Hàm phân phối tích lũy (CDF).
  • Kỳ vọng, Phương sai, Độ lệch chuẩn.
  • Các phân phối phổ biến: Nhị thức, Poisson, Chuẩn.
  • Mô hình hóa các kết quả ngẫu nhiên của một thử nghiệm.
  • Tính toán các chỉ số chính của các phân phối.
4. Nhiều biến Phân phối xác suất đồng thời
  • Phân phối đồng thời & biên.
  • Hiệp phương sai, Hệ số tương quan.
  • Định lý Giới hạn Trung tâm (CLT).
  • Nghiên cứu mối quan hệ giữa nhiều biến ngẫu nhiên.
  • Hiểu tầm quan trọng của CLT.
5. Nhập môn Thống kê Giới thiệu về Thống kê
  • Thống kê mô tả: Trung bình, Trung vị, Phương sai...
  • Trực quan hóa dữ liệu: Biểu đồ tần suất, Biểu đồ hộp.
  • Thống kê suy luận: Tổng thể & Mẫu.
  • Bắt đầu hành trình từ lý thuyết đến phân tích dữ liệu thực tế.
  • Tóm tắt và trực quan hóa các tập dữ liệu.
6. Suy luận Ước lượng tham số & Kiểm định giả thuyết
  • Ước lượng điểm: Phương pháp MLE.
  • Khoảng tin cậy cho Trung bình & Tỷ lệ.
  • Kiểm định giả thuyết: Giả thuyết không (H₀) & Giả thuyết thay thế (Hₐ), giá trị p.
  • Các kiểm định phổ biến: Z-test, t-test, Chi-squared.
  • Ước tính các đặc điểm của tổng thể từ dữ liệu mẫu.
  • Sử dụng dữ liệu để đưa ra quyết định về các khẳng định.
7. Mô hình hóa Hồi quy tuyến tính
  • Hồi quy tuyến tính đơn & bội.
  • Bình phương tối thiểu thông thường (OLS).
  • Đánh giá mô hình: Hệ số R-squared.
  • Mô hình hóa mối quan hệ giữa các biến.
  • Xây dựng và đánh giá các mô hình dự đoán đơn giản.
8. Nâng cao & Ứng dụng Chủ đề nâng cao & Công cụ
  • Phân tích phương sai (ANOVA).
  • Thống kê Bayes.
  • Chuỗi Markov & Mô phỏng Monte Carlo.
  • Ứng dụng trong Khoa học dữ liệu, Học máy, Tài chính.
  • Công cụ: Python (NumPy, Pandas, SciPy) & R.
  • Khám phá các lĩnh vực chuyên sâu hơn.
  • Áp dụng kiến thức vào thực tế với các bộ dữ liệu thực.