sklearn
scikit-learn(簡稱 sklearn)是 Python 中最常用的機器學習套件之一,提供分類、迴歸、分群、降維、模型選擇與資料前處理等功能。
一、安裝
pip install scikit-learn二、主要功能模組
類別
說明
sklearn.datasets
提供內建資料集(如 iris、digits)
sklearn.model_selection
訓練/測試切分、交叉驗證、超參數搜尋
sklearn.preprocessing
特徵標準化、編碼、縮放
sklearn.linear_model
線性與羅吉斯迴歸等模型
sklearn.tree
決策樹與隨機森林
sklearn.svm
支援向量機
sklearn.neighbors
KNN 與最近鄰搜尋
sklearn.naive_bayes
樸素貝氏分類器
sklearn.cluster
分群(KMeans、DBSCAN 等)
sklearn.decomposition
降維(PCA、NMF 等)
sklearn.metrics
評估指標(accuracy、f1、confusion matrix)
三、典型工作流程
四、常用前處理工具
五、交叉驗證與模型選擇
六、應用場景
分類任務(疾病預測、影像辨識)
迴歸任務(價格預測、風險評估)
分群任務(顧客群分析)
降維與視覺化(PCA, t-SNE)
scikit-learn 提供一致的 API 與高效能實作,適合快速原型開發與教學使用,是進入機器學習實作的首選套件。
Last updated