模塊 | 內容 | |
第一單元 | 概率論與 數理統計基礎 |
數據分析方法概述:數據分析過程、數據分析的商業驅動 概率論基礎:集合、概率、隨機變量、概率密度、公理化 變換和期望:隨機變量函數分布、矩、矩列唯一性 常見分布族:離散分布、連續分布、指數分布、中心極限定理、概率不等式 多維隨機變量:聯合分布與邊緣分布、多層模型與混合分布、二維變化、協方差與相關系數 隨機樣本的性質:抽樣、樣本分布 數據簡化原理:似然函數、輔助函數 參數估計:點估計、區間估計、矩估計、貝葉斯估計、EM 算法 假設檢驗:似然比檢驗、貝葉斯檢驗、最大功效檢驗、置信區間、P 值、損失函數 漸進評價:相合性、有效性、標準誤差、穩健性、LTR 的漸進分布、近似極大似然區間 方差分析和回歸分析:ANOVA 假設、簡單線性回歸與最小二乘 回歸模型:變量有誤差時的線性回歸、Logistic 回歸、穩健回歸 |
第二單元 | PYTHON 基礎 |
基礎知識:安裝配置、基礎語法等 數據可視化:數據可視化包介紹及圖像繪制 數據整理和數據清洗:Numpy 數組基礎;Pandas 對象基礎 |
第三單元 | 機器學習算法 | scikit-learn 入門:Scikit-Learn 庫簡介 KNN-最近鄰分類算法:原理、實現、示例講解 決策樹算法:原理、實現、示例講解 隨機森林算法:原理、實現、示例講解 K-Means 聚類算法:原理、實現、示例講解 關聯規則算法:原理、實現、示例講解 線性回歸:原理、實現、示例講解 邏輯回歸:原理、實現、示例講解 SVM 支持向量機:原理、實現、示例講解 樸素貝葉斯算法:原理、實現、示例講解 |
第四單元 | 客戶生命周期案例 | 結合客戶生命周期案例,講解精準營銷、銀行反欺詐、信用評分等內容。 |