2.?dāng)?shù)據(jù)生命周期管理模型
前文已經(jīng)劃分了生命周期的各個階段,并明確了相關(guān)的注意事項,下面將介紹數(shù)據(jù)生命周期的具體管理模型。
(1)數(shù)據(jù)在線度 隨著時間的推移,新數(shù)據(jù)不斷產(chǎn)生,歷史數(shù)據(jù)使用頻率不斷下降,使用價值也相應(yīng)衰減到較低水平,但這個階段的劃分是相對的,在線的定義也是定性的。為了更好地體現(xiàn)數(shù)據(jù)的生命周期,需要定量描述數(shù)據(jù)所處的各階段,使用數(shù)據(jù)在線度( DataOn-line Level,DOL)y準確反應(yīng)數(shù)據(jù)的在線程度和使用衰減情況。數(shù)據(jù)在線度與用戶對數(shù)據(jù)的訪問頻度口相關(guān)。口為單位時間內(nèi)的訪問次數(shù),與數(shù)據(jù)的遷移安全性、代價、必要性有關(guān)。假設(shè)遷移因子為m,則關(guān)聯(lián)函數(shù)為y。=,(a。,m。),其中£為時間。
在新生數(shù)據(jù)被頻繁訪問期間,即在線階段,此時y=l。隨著時間的推移,訪問頻率發(fā)生變化,數(shù)據(jù)在線度隨之加以修正,直至達到某閾值,數(shù)據(jù)即處于歸檔階段(包括在線歸檔和離線歸檔)。此后受資源所限或其他因素所致,可考慮進行數(shù)據(jù)銷毀。當(dāng)y趨近于0或達到某閾值時,可對數(shù)據(jù)進行離線歸檔處理。當(dāng)數(shù)據(jù)生命周期進入歸檔階段時,需要對數(shù)據(jù)進行遷移或從系統(tǒng)中將數(shù)據(jù)分離出來。但也有部分業(yè)務(wù)系統(tǒng),因設(shè)備老化、技術(shù)限制或遷移難度大等原因,無法實現(xiàn)對訪問頻率下降的數(shù)據(jù)進行遷移。同時也存在一些數(shù)據(jù)雖然訪問頻率下降,但是在一段時間內(nèi)仍需維持在線或在線歸檔狀態(tài),或者借助新技術(shù)在滿足業(yè)務(wù)系統(tǒng)正常運轉(zhuǎn)的前提下提前對數(shù)據(jù)進行遷移的情況。遷移因子影響了數(shù)據(jù)在線度,對數(shù)據(jù)生命周期階段劃分具有阻礙或促進作用。綜上所述,在線度關(guān)聯(lián)函數(shù)如下:
其中,ao為初始上線頻繁訪問時平均訪問次數(shù),且0≤m。≤l,f為時間,可根據(jù)數(shù)據(jù)及系統(tǒng)需求,將單位設(shè)為年(或月、日)等。圖8-3反映了數(shù)據(jù)在線度與數(shù)據(jù)生命周期之間的關(guān)系。