CDA認證在數(shù)據(jù)分析方面是較為權威的,CDA LEVEL1業(yè)務數(shù)據(jù)分析師認證考試主要涵蓋業(yè)務數(shù)據(jù)分析的基礎知識和技能。以下是為大家整理的備考建議。
CDA LEVEL1業(yè)務數(shù)據(jù)分析師備考首先需要熟悉考試內(nèi)容和結構:在考試之前,應該詳細了解考試的內(nèi)容和結構,包括考試題型、考試時間限制、考試重點和難點等。CDA理事會官方網(wǎng)站提供了詳細的考試指南和信息。
其次就是學習業(yè)務數(shù)據(jù)分析基礎知識:了解業(yè)務數(shù)據(jù)分析的基本概念、方法和工具,例如數(shù)據(jù)收集、數(shù)據(jù)預處理、數(shù)據(jù)分析、數(shù)據(jù)可視化等。您可以參考相關的教材、課程。
CDA LEVEL1業(yè)務數(shù)據(jù)分析師認證課程,按照【領會】【熟知】【應用】三個級別學習,高效備考。
PART 1 數(shù)據(jù)分析概念與統(tǒng)計學基礎
1、數(shù)據(jù)分析概述
【領會】
數(shù)據(jù)分析和數(shù)據(jù)挖掘的概念
強調(diào)商業(yè)數(shù)據(jù)分析中對業(yè)務的理解
商業(yè)數(shù)據(jù)分析和預測的本質(zhì)
數(shù)據(jù)分析的8個層次
大數(shù)據(jù)對傳統(tǒng)小數(shù)據(jù)分析的拓展
【熟知】
明確數(shù)據(jù)分析目標及意義
數(shù)據(jù)分析的過程
數(shù)據(jù)分析與數(shù)據(jù)挖掘的常用方法
CRISP-DM、SEMMA 方法論
數(shù)據(jù)分析中不同人員的角色與職責
2、描述性統(tǒng)計分析
【領會】
數(shù)據(jù)的計量尺度
數(shù)據(jù)的集中趨勢、離中趨勢和數(shù)據(jù)分布的概念
統(tǒng)計圖的概念
各種統(tǒng)計圖的含義和畫法
【熟知】
衡量數(shù)據(jù)集中趨勢、離中趨勢和數(shù)據(jù)分布的常用指標及計算方法統(tǒng)計圖形的繪制、圖形元素的調(diào)整、可視化效果,主要涉及條形圖、線圖、直方圖、盒須圖、散點圖、氣泡圖、馬賽克圖、玫瑰圖及其多種圖形整合。明確統(tǒng)計圖形對統(tǒng)計指標表達上的對應關系
【應用】
根據(jù)不同數(shù)據(jù)類型選用不同的統(tǒng)計指標來進行數(shù)據(jù)的集中趨勢、離中趨勢和數(shù)據(jù)分布的衡量,不同統(tǒng)計圖的使用場景。會寫數(shù)據(jù)分析報告和結合業(yè)務需求對報告進行合理解釋,對業(yè)務?出建設性意見建議。
3、抽樣估計
【領會】
隨機試驗、隨機事件、隨機變量的概念
總體與樣本的概念
抽樣估計的理論基礎
正態(tài)分布及三大分布的函數(shù)形式和圖像形式
抽樣的多種組織形式
確定必要樣本容量的原因
【熟知】
隨機事件的概率
抽樣平均誤差的概念與數(shù)學性質(zhì)
點估計與區(qū)間估計方法的特點與優(yōu)缺點
全體總體與樣本總體
參數(shù)和統(tǒng)計量
重復抽樣與不重復抽樣
抽樣誤差的概念對總體平均數(shù)和總體成數(shù)的區(qū)間估計方法
必要樣本容量的影響因素
中心極限定理的意義與應用
【應用】
隨機變量及其概率分布
全部可能的樣本單位數(shù)目的概念及其在不同抽樣方法下的確定
抽樣平均誤差在實際數(shù)據(jù)分析中的計算方法
4、假設檢驗
【領會】
假設檢驗的基本概念
其基本思想在數(shù)據(jù)分析中的作用
假設檢驗的基本步驟
假設檢驗與區(qū)間估計的聯(lián)系
假設檢驗中的兩類錯誤
【熟知】
P值的含義及計算
如何利用P值進行檢驗
z檢驗統(tǒng)計量
t檢驗統(tǒng)計量
F檢驗統(tǒng)計量
c2檢驗統(tǒng)計量的函數(shù)形式和檢驗步驟
【應用】
實現(xiàn)單樣本t檢驗
兩獨立樣本t檢驗的步驟和檢驗中使用的統(tǒng)計量與原假設
兩種檢驗應用的數(shù)據(jù)分析場景。
5、方差分析
【領會】
方差分析的相關概念
單因素方差分析的原理
統(tǒng)計量構造過程
【熟知】
單因素方差分析的基本步驟
總離差平方和(SST)的含義及計算
組間離差平方和(SSA)的含義及計算
組內(nèi)離差平方和(SSE)的含義及計算
單因素方差分析的原假設
【應用】
實現(xiàn)單因素方差分析的步驟
對方差分析表的分析以及多重比較表的分析
6、簡單線性回歸分析
【領會】
相關圖的繪制與作用
相關表的編制與作用
相關系數(shù)定義公式的字母含義
估計標準誤差與相關系數(shù)的關系
【熟知】
相關關系的概念與特點
相關關系與函數(shù)關系的區(qū)別與聯(lián)系
相關關系的種類
相關系數(shù)的意義以及利用相關系數(shù)的具體數(shù)值對現(xiàn)象相關等級的劃分
回歸分析的概念
回歸分析的主要內(nèi)容和特點
建立一元線性回歸方程的條件
應用回歸分析應注意的問題
估計標準誤差的意義及計算
【應用】
運用簡捷法公式計算相關系數(shù)
相關分析分析中應注意的問題
回歸分析與相關分析的區(qū)別與聯(lián)系
PART 2 SQL數(shù)據(jù)庫基礎
1、SQL基礎概念
【領會】
關系型數(shù)據(jù)庫基本概念、屬性
主鍵
外鍵
E-R 圖
ANSI-SQL 以及不同的數(shù)據(jù)庫實現(xiàn)的關系
【熟知】
邏輯運算符
比較運算符
算術運算符
通配符
2、SQL查詢語句
【應用】
select 語句
包括查詢單列
多列,去重,前 N 列
from 語句、where 語句、group by 語句、having 語句、order by 語句、子查詢
SQL 聚合函數(shù),包括 count、sum、avg、max、min 等
3、SQL連接語句
【領會】
表的連接類型,包括內(nèi)連接(等值、不等值)、外連接(左、右、全)、交叉連接(笛卡爾連接)查詢的集合操作,只包括并集操作
【應用】
inner join 的用法
left/right/full join 的用法
cross join 的用法
union 的用法
4、其他SQL語句
【領會】
表的創(chuàng)建
視圖及索引的概念及創(chuàng)建
數(shù)據(jù)插入、更新、刪除
【領會】
高級函數(shù),如 Oracle 或 Hive 中的 row number over partition by、正則匹配等
PART 3數(shù)據(jù)采集與處理
1、數(shù)據(jù)采集方法
【領會】
一手數(shù)據(jù)與二手數(shù)據(jù)來源渠道
優(yōu)劣勢分析
使用注意事項
【熟知】
一手數(shù)據(jù)采集中的概率抽樣與非概率抽樣的區(qū)別與優(yōu)缺點
【運用】
概率抽樣方法,包括簡單隨機抽樣、分層抽樣、系統(tǒng)抽樣、分段抽樣
明確每種抽樣的優(yōu)缺點
根據(jù)給定條件選擇最可行的抽樣方式
計算簡單隨機抽樣所需的樣本量
Ø 市場調(diào)研
【熟知】
市場調(diào)研的基本步驟(?出問題、調(diào)查收集材料、分析預測問題)
單選題及多項選擇題的設置
數(shù)據(jù)編碼及錄入
Ø 數(shù)據(jù)預處理方法
【熟知】
數(shù)據(jù)預處理的基本步驟,包括數(shù)據(jù)集成(不同數(shù)據(jù)源的整合)、數(shù)據(jù)探索、數(shù)據(jù)變換(標 準化)、數(shù)據(jù)歸約(維度歸約技術、數(shù)值歸約技術),這部分內(nèi)容不需要涉及計算,只需要根 據(jù)需求明確可選的處理技術即可。
【應用】
數(shù)據(jù)清洗,包括填補遺漏的數(shù)據(jù)值(根據(jù)業(yè)務場景使用常數(shù)、中位數(shù)、眾數(shù)等方法,不 涉及多重查補的方法)、平滑有噪聲數(shù)據(jù)(移動平均)、識別或除去異常值(單變量根據(jù)中心 標準化值,多變量使用快速聚類),以及解決不一致問題(熟知概念即可),查重(只考核 SQL 的語句,不涉及 R、SAS 等其它語言)。