📊 統計學習入門

基於 An Introduction to Statistical Learning (ISLP)
James, Witten, Hastie, Tibshirani · Springer 2023 · 全繁體中文筆記
📖

An Introduction to Statistical Learning with Applications in Python

Stanford 經典教材 · 官方網站 · 下載課本 PDF

第 2 章:統計學習

§2.1

什麼是統計學習?

Y=f(X)+ε、預測 vs 推論、參數化 vs 非參數化、監督 vs 非監督

§2.2

評估模型準確度

Bias-Variance Tradeoff、Bayes Classifier、KNN、訓練 vs 測試誤差

§2.3

Lab: Python 入門

NumPy、pandas、matplotlib 基礎操作

第 3 章:線性迴歸

§3.1

簡單線性迴歸

最小平方法、係數估計、信賴區間、假說檢定

§3.2

多元線性迴歸

F 檢定、變數選擇、R²、預測區間

§3.3

迴歸模型的其他考量

虛擬變數、交互作用、多項式迴歸、殘差診斷、共線性與 VIF

§3.4

行銷計畫

迴歸模型在行銷策略中的應用案例

§3.5

線性迴歸 vs KNN

參數化 vs 非參數化方法的比較、維度詛咒

§3.6

Lab: 線性迴歸

Boston 房價資料集實作:簡單/多元迴歸、交互作用、殘差分析

第 4 章:分類

§4.3

邏輯回歸:從線性到機率

Logistic function、勝算比、最大概似估計、混淆因子

§4.4

線性判別分析 (LDA)

貝氏定理、常態假設、判別函數、LDA vs QDA vs Logistic

§4.4.5

生成模型對分類的啟發

Naive Bayes、生成 vs 判別模型

§4.5

分類方法比較

Logistic · LDA · QDA · KNN · Naive Bayes 全比較

§4.6

廣義線性模型 (GLM)

Poisson 迴歸、計數資料、連結函數、GLM 統一框架

§5.2

Bootstrap 自助抽樣法

有放回抽樣估計標準誤差、Portfolio 資產配置、信賴區間、Bagging 基礎

第 5 章:重抽樣方法

§5.1

交叉驗證 (Cross-Validation)

Validation Set、LOOCV、k-Fold CV、Bias-Variance Tradeoff

§5.2

Bootstrap 自助抽樣法

有放回抽樣估計標準誤差、Portfolio 資產配置、信賴區間、Bagging 基礎

第 6 章:線性模型選擇與正則化

§6.1

子集選擇法(Subset Selection)

最佳子集、向前逐步、向後逐步、Cp/AIC/BIC/Adj-R² 選擇指標