4.5 知識子域:大數據安全
4.5.1 大數據基本概念
1.大數據的定義
對于大數據的概念,業界尚未給出統一的定義。201 1年,美國著名的咨詢公司麥肯錫( Mckin。ey)在研究報告《大數據的下一個前沿:創新、競爭和生產力》中給出了大數據的定義:大數據是指大小超出常規數據庫軟件工具收集、存儲、管理和分析臺旨力的數據集。根據Gartner的定義,大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
美國國家標準技術研究所( National Institute of Standards and Technology,NIST)的大數據工作組在《大數據:定義和分類》中指出:大數據是指傳統數據架構無法有效處理的新數據集。針對這些數據集,需要采用新的架構來高效率地完成數據處理。
維基百科( Wikipedia)中,大數據則被定義為巨量數據,也稱海量數據或大資料,是指所涉及的數據量規模巨大到無法人為的在合理時間內達到截取、管理、處理、并整理成為人類所能解讀的信息。
全球最大電子商務公司亞馬遜的大數據科學家John Rauser給出了一個簡單的定義:大數據是指任何超過了一臺計算機處理臺旨力的數據量。
而EMC公司給出的定義為數據集或信息,其中它的規模、發布、位置在不同的孤島上,或它的時間線要求客戶部署新的架構來捕捉、存儲、整合、管理和分析,以便實現企業價值。
目前國內普遍將大數據解釋為具有數量巨大、來源多樣、生成極快、且多變等特征并且難以用傳統數據體系結構有效處理的包含大量數據集的數據。