數據治理是企業對數據資產管理行使權力和控制的活動集合(包括計劃、監督和執行 ),它是管理企業數據資源的一種方式、方法,旨在確保數據的質量、安全、合規和有效性。數據治理是企業實現數據戰略的基礎,是一個管理體系,包括組織、制度、流程和工具。
數據的生命周期包含了源頭、處理和消費這三個階段,數據的問題也可能會出現在這三個環節中。例如在數據源頭環節,用戶錄入數據的規范性存在問題,導致了最終數據消費環節的數據質量低。數據表象問題的根源,可能來自于業務系統用戶交互設計,乃至是底層數據庫表結構設計上的缺陷。
而要想解決這些表象的數據問題,就必須解決深層次的信息化業務系統開發以及數據庫表約束設計等問題。例如為了保證用戶錄入數據的準確性,有三種方式去設計業務系統:其一是設計前端的檢驗驗證,避免用戶做出相同的選擇;其二是通過程序編寫過濾判斷的邏輯,篩除掉前端誤入的數據,作為第二層驗證;其三是通過建立約束條件,例如唯一性約束、檢測約束等等來控制數據錄入準確性。
因此,企業的數據治理遠非使用一款單一的工具或產品就可以實現的,它是需要回到源頭,對企業的組織、流程制度、業務系統、底層架構等多個方面進行排查和重構的,它是一套復雜的管理體系。