12. 2.1 結構化數據處理系統
當前銀行業數據處理與應用主要針對結構化數據,其過程就是數據倉庫的發展過程。數據倉庫的概念大約在20世紀70年代到80年代形成,在理論層面上基本認同了以下觀點:
應當把那些新出現的、不可以預測的、大量存在的分析型負載從業務處理系統中剝離出來,采用專門的體系架構和設計來進行處理。數據分析和業務處理存在相當大的差異,以至于需要用具有不同體系結構的系統來分別處理它們,這就導致了數據倉庫的出現。一個典型的數據倉庫服務體系如圖12-2所示。
數據倉庫平臺的建設實現了企業異構數據的集成,企業按照分析主題重組數據,建立了面向整個企業的一致的信息視圖。在此基礎上,結合數據挖掘、聯機分析等技術,為實施精準化營銷、有效控制企業風險。實現經營資源的優化配置等提供了數據基礎,全面提升了數據的共享水平,深入挖掘了數據的業務價值,大大增強了決策的科學性。數據倉庫中存儲的數據,需要進一步轉化為能實際應用的知識,用于指導后續工作,這樣才能充分發揮其數據的價值。數據挖掘利用了來自統計學的抽樣、估計和假設檢驗,人工智能、模式識別、機器學習的搜索算法、建模技術和學習理論,通過數理模式來分析企業內儲存的大量資料,以找出不同的客戶或市場劃分,分析出消費者的喜好和行為。數據挖掘需要數據庫系統提供有效的存儲、索引和查詢處理支持,源于高性能(并行)計算的技術在處理海量數據方面常常是重要的。因此,數據倉庫往往和數據挖掘技術密不可分,而數據挖掘技術在數據倉庫海量數據的支撐下,更能發揮其重要作用。通過數據倉庫中的海量數據,建立一定的數據挖掘模型,用于預測客戶的產品需求和行為特征,作為后續營銷、決策的依據,這將是數據倉庫后續主要的發展方向之一。