因?yàn)楝F(xiàn)有企業(yè)IT的應(yīng)用和架構(gòu)是從過去垂直型組織結(jié)構(gòu)發(fā)展而來,應(yīng)用和數(shù)據(jù)條塊分割是不可避免的,但也都或多或少地進(jìn)行過一些數(shù)據(jù)集成。在我們接觸的客戶中,根據(jù)數(shù)據(jù)集成的成熟度,大概就兩類:典型傳統(tǒng)的垂直型應(yīng)用,核心應(yīng)用間幾乎都存在大量的數(shù)據(jù)兀余,數(shù)據(jù)通過上報(bào)的形式以日/周/月周期集成,由于元數(shù)據(jù)不一致和數(shù)據(jù)采集分析過程的不同,不同應(yīng)用的數(shù)據(jù)口徑不一致現(xiàn)象經(jīng)常發(fā)生,需要大量人工完成數(shù)據(jù)核對和清洗。顯而易見,這種情況下減少數(shù)據(jù)周轉(zhuǎn)周期,提供高質(zhì)量的企業(yè)運(yùn)營數(shù)據(jù)是很困難的,而這恰恰又是敏捷企業(yè)所需要的。
企業(yè)架構(gòu)以運(yùn)營數(shù)據(jù)庫為基礎(chǔ),主要應(yīng)用都維護(hù)一個運(yùn)營數(shù)據(jù)庫的副本,并定期和運(yùn)營數(shù)據(jù)庫同步。這種情況下數(shù)據(jù)周轉(zhuǎn)周期和數(shù)據(jù)的質(zhì)量都是比較好的,但是由于應(yīng)用和數(shù)據(jù)的禍合度太高,每個應(yīng)用都存在對信息訪問的冗余邏輯,當(dāng)某些應(yīng)用,特別是運(yùn)營數(shù)據(jù)庫的升級時,相關(guān)的應(yīng)用都需要被改造,這是對業(yè)務(wù)變化快速響應(yīng)的一大障礙。為了適應(yīng)敏捷企業(yè)對于數(shù)據(jù)實(shí)時性、數(shù)據(jù)質(zhì)量和數(shù)據(jù)訪問的靈活性的要求,這兩種類型的信息架構(gòu)都需要進(jìn)行改造。這種改造包括信息的虛擬化,這一點(diǎn)第二種類型的信息架構(gòu)已經(jīng)有了很好的基礎(chǔ),但是需要加強(qiáng)元數(shù)據(jù)的管理,以提高信息、集成架構(gòu)的靈活性;其次,開發(fā)和維護(hù)統(tǒng)一的對信息訪問的邏輯,并將其暴露為服務(wù)。
信息架構(gòu)的第一個層次是現(xiàn)在已經(jīng)存在的各種數(shù)據(jù)源,它們包括關(guān)系數(shù)據(jù)庫、數(shù)據(jù)文件、多媒體內(nèi)容管理系統(tǒng)以及各種應(yīng)用等。數(shù)據(jù)庫,但是對他們的直接訪問,信息架構(gòu)的第二個層次是通過多種手段完成信息的虛擬化,經(jīng)過虛擬化后的信息模型應(yīng)該和業(yè)務(wù)架構(gòu)中的企業(yè)信息模型相匹配。虛擬化的過程主要是信息的物理集中或虛擬集中,物理集中需要創(chuàng)建中心數(shù)據(jù)庫,其數(shù)據(jù)模型和企業(yè)信息模型相匹配,然后通過ETL或EI(I企業(yè)信息集成)中間件的集中(consolidation)方式將數(shù)據(jù)復(fù)制到中心數(shù)據(jù)庫,因?yàn)閿?shù)據(jù)層面上的不一致性對數(shù)據(jù)進(jìn)行清洗是可避免的。