數(shù)據(jù)模型將復雜的數(shù)據(jù)以結(jié)構(gòu)化的形式有序的組織起來。我們之前談到的指標,都可以作為維度使用。下面是范例:
·將用戶類型、活躍度、時間三個維度組合,觀察不同用戶群體在產(chǎn)品上的使用情況,是否A群體使用的時長更明顯?
·將商品類型、訂單金額、地區(qū)三個維度組合,觀察不同地區(qū)的不同商品是否存在銷量差異?
數(shù)據(jù)模型可以從不同的角度和層面來觀察數(shù)據(jù),這樣提高了分析的靈活性,滿足不同的分析需求、這個過程叫做OLAP(聯(lián)機分析處理)。當然它涉及到更復雜的數(shù)據(jù)建模和數(shù)據(jù)倉庫等,我們不用詳細知道。
數(shù)據(jù)模型還有幾種常見的技巧,叫做鉆取、上卷、切片。
選取就是將維度繼續(xù)細分。比如浙江省細分成杭州市、溫州市、寧波市等,2010年一季度變成1月、2月、3月。上卷則是鉆取的相反概念,將維度聚合,比如浙江、上海、江蘇聚合成浙江滬維度。切片是選中特定的維度,比如只選上海維度、或者只選2010年一季度維度。因為數(shù)據(jù)立方體是多維的,但我們觀察和比較數(shù)據(jù)只能在二維、即表格中進行。
上圖的樹狀結(jié)構(gòu)代表鉆取(source和time的細分),然后通過對Route的air切片獲得具體數(shù)據(jù)。