7.非結構化數據的生命周期管理
對于結構化數據,主要是針對表中的記錄進行清理、歸檔或者銷毀,即每條數據記錄都有一定的生命周期。而非結構化數據則類似于影像、文檔等,均是一個個獨立對象,因此其生命周期相比于結構化數據存在較大的差異。一般來說,商業銀行會根據數據的類別、特點、屬性等相關信息來確定其生命周期。例如,商業銀行將數據進行分類,不同類型的數據根據版本號、狀態、訪問時間來確定不同類型數據的生命周期管理策略。商業銀行可以將數據分成資訊數據、規章制度、辦公文檔、培訓視頻、宣傳影像、論壇數據等各種類型,然后根據不同類型的數據特性,例如規章制度的版本、論壇帖子的最后訪問日期等進行生命周期的制定。
舉個例子,表8-3為某商業銀行非結構化數據的數據類型與保存期限。
1)對于規章制度等具有版本屬性的非結構化數據,當前版本一直保留,上一版本超過保存期限后需要歸檔并清理。
2)對于具有狀態屬性的非結構化數據,無效或超過保存期限后需要歸檔并清理。
3)對于具有最后訪問日期屬性的非結構化數據,超過保存期限無訪問的數據需要歸檔并清理。
4)無以上屬性的非結構化數據,從數據生成之日起開始計算保留時間,超過保存期限后需要歸檔并清理。
當然,這里僅僅是舉例說明,對于不同的商業銀行,其做法可能稍有差異,具體的非結構化數據的數據生命周期管理策略還應綜合考慮業務對非結構化數據的在線時間需求、應用服務器的存儲壓力、業務系統的活動情況等來綜合制定。