▌問題描述
與數(shù)據(jù)打交道時,通常面臨諸多挑戰(zhàn):
數(shù)據(jù)無法解釋自身含義。必須有人對數(shù)據(jù)進(jìn)行解釋,包括數(shù)據(jù)的含義,如何正確使用數(shù)據(jù),以及如何評估數(shù)據(jù)的質(zhì)量好壞。
數(shù)據(jù)通常是共享的,數(shù)據(jù)會被多個部門人員會用于多種目的。那么數(shù)據(jù)所有權(quán)歸誰?誰對數(shù)據(jù)的處理進(jìn)行決策?誰對“出錯”的數(shù)據(jù)承擔(dān)責(zé)任?
許多使用數(shù)據(jù)的業(yè)務(wù)流程依靠流程的上游工作人員“確保數(shù)據(jù)準(zhǔn)確”。但是,誰來判定數(shù)據(jù)的“準(zhǔn)確性”呢?數(shù)據(jù)“出錯”時又是誰來判定呢?
軟件開發(fā)生命周期需要頻繁對數(shù)據(jù)進(jìn)行規(guī)范、分析、設(shè)計、組建、及使用操作。很多情況下,這些操作有可能破壞數(shù)據(jù),威脅到數(shù)據(jù)質(zhì)量。
負(fù)擔(dān)數(shù)據(jù)實施工作的技術(shù)人員往往對數(shù)據(jù)的含義及其使用方式不熟悉。
數(shù)據(jù)處理領(lǐng)域存在對數(shù)據(jù)的含義和內(nèi)容描述不夠嚴(yán)格的問題,而且對這一問題長期以來一直采取容忍態(tài)度。
以上這些因素會導(dǎo)致無法區(qū)分到底是對數(shù)據(jù)的理解不到位,還是數(shù)據(jù)質(zhì)量不高。這種困局需要通過對數(shù)據(jù)的積極、高效管理得以解決。另外,許多公司所采用整理元數(shù)據(jù)(Metadata)方法是一種不太嚴(yán)格的“方法論”,這種方法并不等于真實、有效的數(shù)據(jù)管理。元數(shù)據(jù)在實踐中常見的失誤包括以下幾個方面:
數(shù)據(jù)定義:這些信息通常由項目成員較為草率地起草,數(shù)據(jù)的定義也沒有在企業(yè)范圍內(nèi)標(biāo)準(zhǔn)化,造成同一術(shù)語的多次定義,而且通常是以不同的數(shù)據(jù)信息項(Data Element)名稱出現(xiàn)的。
數(shù)據(jù)質(zhì)量:如果數(shù)據(jù)質(zhì)量規(guī)則沒有明確定義,那么質(zhì)量本身就無從談起。甚至有時即便規(guī)則定義了,但是質(zhì)量規(guī)則的文本內(nèi)容卻被忽視了。這樣會導(dǎo)致對所要求的數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)模糊,無法確保數(shù)據(jù)質(zhì)量水平。
數(shù)據(jù)文檔:元數(shù)據(jù)的有關(guān)文檔很少公開,甚至有時會被束之高閣。有關(guān)文檔不能被輕松讀取或者查詢到有關(guān)內(nèi)容。
產(chǎn)生及使用數(shù)據(jù)的業(yè)務(wù)規(guī)則:經(jīng)常遇到這種問題:在什么條件下應(yīng)該產(chǎn)生針對某個實體(比如客戶或者產(chǎn)品)的數(shù)據(jù),以及這個數(shù)據(jù)的操作方法是什么?理解上的偏差會導(dǎo)致針對目標(biāo)實體信息搜集的不完整或者不準(zhǔn)確,并且容易造成數(shù)據(jù)被用于無關(guān)的用途。最終的后果是基于這種數(shù)據(jù)的業(yè)務(wù)決策不是最優(yōu)結(jié)果。
正規(guī)的企業(yè)級數(shù)據(jù)管控是數(shù)據(jù)治理的一部分,對于被管理的數(shù)據(jù),以及對解決前面所述的各種問題至關(guān)重要。通過數(shù)據(jù)管控,企事業(yè)單位才能開始將數(shù)據(jù)作為資產(chǎn)看待。類似其他資產(chǎn),數(shù)據(jù)需要有庫存管理、所有權(quán)界定、使用規(guī)則定義、以及準(zhǔn)確描述。數(shù)據(jù)需要有別于物理資產(chǎn)的管理技術(shù),但需求是相同的。對于數(shù)據(jù)資產(chǎn),庫存管理和準(zhǔn)確描述可以通過正式公布業(yè)務(wù)術(shù)語表完成,可以和元數(shù)據(jù)表一同發(fā)布。所有權(quán)界定需要知道數(shù)據(jù)的收集方式,以及誰在使用數(shù)據(jù),然后才能判斷誰更適合對數(shù)據(jù)內(nèi)容以及數(shù)據(jù)信息項質(zhì)量負(fù)責(zé)。最后,使用規(guī)則包括理解和管理數(shù)據(jù)的產(chǎn)生過程、產(chǎn)生原因、以及在新的條件下是否還適合使用。
▌什么是數(shù)據(jù)治理
數(shù)據(jù)治理存在多種定義,美國數(shù)據(jù)治理協(xié)會(DGI)對其定義如下:
數(shù)據(jù)治理是針對數(shù)據(jù)相關(guān)事項行使督導(dǎo)決策權(quán)。數(shù)據(jù)治理是針對信息相關(guān)流程的決策權(quán)和審查權(quán)系統(tǒng),所行使的權(quán)力是依據(jù)事先達(dá)成的模型,該模型描述了根據(jù)不同信息可以采取的處理行為,其中包括何時、在何種情況下、可以使用何種處理方法。
以上定義的關(guān)鍵信息是數(shù)據(jù)治理實踐更多地是指管理人員如何管理數(shù)據(jù),是對管理人員職責(zé)的定義,而不是對數(shù)據(jù)本身的定義。也就是說,數(shù)據(jù)治理,包括數(shù)據(jù)管控,都是關(guān)于如何有效組織管理人員按照正確的流程確保數(shù)據(jù)被理解、被信任、具備高質(zhì)量,并且最終能使數(shù)據(jù)適用于企事業(yè)單位的使用目的。
▌什么是數(shù)據(jù)管控
數(shù)據(jù)管控是數(shù)據(jù)治理的執(zhí)行層面,即日常的數(shù)據(jù)治理工作如何開展,可以定義為:
數(shù)據(jù)管控是指數(shù)據(jù)治理的一種具體方式,是規(guī)范如何作為代理人管理信息資源的問責(zé)制度,從而為機(jī)構(gòu)獲取最佳利益。
數(shù)據(jù)管控定義中所指的“代理”是指代表所在機(jī)構(gòu)的數(shù)據(jù)治理委員會(Data Governance Board)行使職權(quán),而數(shù)據(jù)治理委員會代表了數(shù)據(jù)所有權(quán)方(即所在機(jī)構(gòu))的業(yè)務(wù)職能。換句話說,數(shù)據(jù)管控包括了管理人員、機(jī)構(gòu)和流程,它確保所安排的數(shù)據(jù)管控人員對所治理數(shù)據(jù)的職責(zé)。
數(shù)據(jù)管控對數(shù)據(jù)治理的成功非常重要。因為通過數(shù)據(jù)管控機(jī)制,所有的元數(shù)據(jù)(包括定義、業(yè)務(wù)規(guī)則等信息)能夠得到有效整理和文檔化。而且,通過設(shè)置對特定數(shù)據(jù)負(fù)責(zé)的數(shù)據(jù)管控人員,以及頒布所管控數(shù)據(jù)的處理流程,可以確保所有有關(guān)的決定都是基于了解的基礎(chǔ)上作出的,同時也能為使用數(shù)據(jù)的人員保證最佳效果。通過有機(jī)結(jié)合專門的數(shù)據(jù)管控人員、流程、以及為全體人員利益著眼的數(shù)據(jù)管理目標(biāo),數(shù)據(jù)資產(chǎn)的質(zhì)量才能得到有效提高,并且這種高質(zhì)量數(shù)據(jù)才能驅(qū)動機(jī)構(gòu)的競爭優(yōu)勢并確保業(yè)務(wù)的合規(guī)性。
▌數(shù)據(jù)管控的總體目標(biāo)
一套“好的”數(shù)據(jù)管控系統(tǒng)具備哪些特征?即數(shù)據(jù)管控體系所肩負(fù)的目標(biāo)是什么?以下列出主要特征:
設(shè)立數(shù)據(jù)管控咨詢委員會
建立政策和流程,并融入企業(yè)文化
設(shè)立業(yè)務(wù)數(shù)據(jù)管控崗,所有擁有數(shù)據(jù)的業(yè)務(wù)部門必須參與。不擁有數(shù)據(jù)的業(yè)務(wù)部門不參與。數(shù)據(jù)治理和數(shù)據(jù)管控應(yīng)包括外部業(yè)務(wù)協(xié)作單位。
設(shè)立技術(shù)數(shù)據(jù)管控崗,涉及所有的企業(yè)應(yīng)用、數(shù)據(jù)倉庫和ETL流程。
數(shù)據(jù)管控需要參與到企業(yè)項目管理、系統(tǒng)開發(fā)中。數(shù)據(jù)管控需要被看待成數(shù)據(jù)管理的有機(jī)組成部分。
所有的數(shù)據(jù)管理崗職責(zé)需要明確定義,相應(yīng)的效績考核措施也需要建立。
全員參與的數(shù)據(jù)管理需要成為企業(yè)文化的一部分。
公司管理層的支持。領(lǐng)導(dǎo)層需要在公開場合支持并推廣有關(guān)數(shù)據(jù)管控條例。
數(shù)據(jù)管控的效績需要明確并認(rèn)可。
關(guān)鍵的業(yè)務(wù)數(shù)據(jù)信息項需要整理、定義并明確業(yè)務(wù)規(guī)則。條件允許,數(shù)據(jù)需要規(guī)范化以提高數(shù)據(jù)質(zhì)量。
數(shù)據(jù)管控決策需要明確地文檔化,并通知給相關(guān)方。
所有數(shù)據(jù)相關(guān)方(包括數(shù)據(jù)管控人員、項目經(jīng)理、開發(fā)人員)需要接受定期培訓(xùn)。
配備相關(guān)的數(shù)據(jù)管理工具(例如元數(shù)據(jù)庫、業(yè)務(wù)術(shù)語表、問題日志、數(shù)據(jù)規(guī)范化工具),并且經(jīng)常使用。
鼓勵在數(shù)據(jù)質(zhì)量維護(hù)和修復(fù)數(shù)據(jù)故障中的創(chuàng)新措施,以及創(chuàng)新地使用高質(zhì)量數(shù)據(jù)提高企業(yè)競爭力。
有關(guān)人員跟蹤重要的數(shù)據(jù)管理技術(shù)創(chuàng)新能力,包括相應(yīng)的適應(yīng)能力。
通過并頒布相關(guān)的數(shù)據(jù)管控流程,包括:
鑒別關(guān)鍵業(yè)務(wù)數(shù)據(jù)信息項
搜集、整理、通過有關(guān)的業(yè)務(wù)元數(shù)據(jù)
記錄、分析、修復(fù)數(shù)據(jù)及數(shù)據(jù)質(zhì)量問題
對項目的支撐保障
管理數(shù)據(jù)域
必要時調(diào)整數(shù)據(jù)管控崗
討論分析數(shù)據(jù)質(zhì)量提高方案
公布數(shù)據(jù)管控的工作業(yè)績和方法
▌結(jié)束語
數(shù)據(jù)治理的成敗關(guān)鍵在于建立有關(guān)機(jī)構(gòu)和有關(guān)人員的構(gòu)成。其中最重要的一環(huán)是數(shù)據(jù)管控人員的配備和組織工作,他們必須協(xié)同工作確定有關(guān)數(shù)據(jù)的所有權(quán)、含義以及質(zhì)量標(biāo)準(zhǔn)。如果沒有數(shù)據(jù)管控委員會的正常運(yùn)轉(zhuǎn),數(shù)據(jù)治理工作就無法取得預(yù)期效果。
想了解更多IT資訊,請訪問中培偉業(yè)官網(wǎng):中培偉業(yè)