大數據分析及挖掘技術是一種處理和分析海量數據的技術。
首先,大數據分析是指對規模巨大的數據進行分析,這些大數據具有數據量大、速度快、類型多、價值高和真實性強的特點。大數據分析的過程包括可視化分析、數據挖掘算法、預測性分析能力、語義引擎、數據質量和數據管理等方面。
具體來說,可視化分析可以直觀地展示數據,讓數據自己說話;數據挖掘算法則深入數據內部,挖掘價值;預測性分析基于可視化分析和數據挖掘的結果做出預測性判斷;語義引擎從“文檔”中智能提取信息;數據質量和數據管理保證高質量的分析結果。
數據挖掘(Data Mining)則是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數據挖掘的過程包括定義問題、數據準備、數據挖掘和結果分析。數據挖掘的對象可以是關系數據庫、面向對象數據庫、數據倉庫、文本數據源、多媒體數據庫等。
總之,大數據分析及挖掘技術是通過各種技術和方法處理和分析海量數據,提取有用信息和知識,為企業決策提供支持的過程。