【中培課堂】海量涌現的數據處理工具和強大的功能保障了大數據分析可能性。然而,這個大數據領域往往伴隨著的是數據隱私方面的問題。在這龐大的信息庫中,個人身份信息,如姓名、地址和社保號碼可能存在,也可能從這.....
Dataguise,數據安全情報和保護解決方案的領先廠商,最近發布了在Hadoop中保護敏感數據安全的十種最佳實踐。專業人員可以通過遵循這些規則,為企業數據管理和安全管理保駕護航。
海量涌現的數據處理工具和強大的功能保障了大數據分析可能性。然而,這個大數據領域往往伴隨著的是數據隱私方面的問題。在這龐大的信息庫中,個人身份信息,如姓名、地址和社保號碼可能存在,也可能從這些數據中發現大量的財務數據,如信用卡和帳戶號碼,只有通過精心策劃、測試及使用前的準備工作,并適當使用技術,才可緩解這些擔憂。
以下是在Hadoop中保護敏感數據安全的十種最佳實踐,這在早期規劃階段尤其重要。
1.在規劃階段確定數據的隱私保護策略,最好是在將數據遷移到Hadoop之前。這可以防止破壞數據的合規性,并避免了計劃的不可預測性。
2.確定哪些數據元素的定義在組織內是敏感的。考慮公司的隱私保護政策,相關的行業法規和政府規章。
3.瀏覽敏感的數據是否被嵌入到環境中,收集了或將被收集到Hadoop。
4.在收集的基礎數據中判斷數據的合規風險。
5.確定商業分析是否需要訪問真實數據,或者是否可以使用脫敏數據(去掉敏感數據的數據),然后,選擇合適的修復技術(掩蔽或加密)。如有疑問,請記住,從長遠看,掩蔽提供了最安全的數據修復方式,加密賦予了數據最大的靈活性。
6.如果需要分區存儲正常數據和脫敏數據,需要考慮支持相應功能的數據保護解決方案。
7.確保掩蔽措施所做的數據保護技術實現跨越所有的數據文件,保護數據分析的準備性。
8.確定是否需要為特定的數據集量身定制保護措施,并考慮將Hadoop拆分成小的管理單元,數據安全的保護也落實到各管理單元。
9.確保選擇的加密解決方案可與公司的訪問控制技術對接,允許用戶使用不同的id有選擇性的在Hadoop集群中的數據訪問。
10.確保需要加密時,適當的技術(JAVA,豬等)部署為允許無縫解密,并確保數據的快速訪問。