都說如今是互聯(lián)網(wǎng)大數(shù)據(jù)時代,但是對于到底什么是大數(shù)據(jù),以及研究大數(shù)據(jù)有什么意義卻很少有人回答出來。大數(shù)據(jù)的核心特征是價值。實際上,值密度與數(shù)據(jù)總量成反比。提取任何有價值的信息都依賴于大量的基本數(shù)據(jù)。當然,在大數(shù)據(jù)環(huán)境中存在一個未解決的問題。如何使用功能強大的機器算法,快速從大量數(shù)據(jù)中提取數(shù)據(jù)的價值。
什么是大數(shù)據(jù)?
如果從字面意思來看,大數(shù)據(jù)指的是巨量數(shù)據(jù)。那么可能有人會問,多大量級的數(shù)據(jù)才叫大數(shù)據(jù)?不同的機構(gòu)或?qū)W者有不同的理解,難以有一個非常定量的定義,只能說,大數(shù)據(jù)的計量單位已經(jīng)越過TB級別發(fā)展到PB、EB、ZB、YB甚至BB來衡量。
最早提出“大數(shù)據(jù)”這一概念的是全球知名咨詢公司麥肯錫,他是這樣定義大數(shù)據(jù)的:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型以及價值密度四大特征。
研究機構(gòu)是這樣定義大數(shù)據(jù)的:“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流轉(zhuǎn)優(yōu)化能力來適應海量、高增長率和多樣化的信息資產(chǎn)。
若從技術(shù)角度來看,大數(shù)據(jù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù),而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理,換言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)盈利的關鍵在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”。
研究大數(shù)據(jù)有什么意義?
研究大數(shù)據(jù),最重要的意義是預測。因為數(shù)據(jù)從根本上講,是對過去和現(xiàn)在的歸納和總結(jié),其本身不具備趨勢和方向性的特征,但是我們可以應用大數(shù)據(jù)去了解事物發(fā)展的客觀規(guī)律、了解人類行為,并且能夠幫助我們改變過去的思維方式,建立新的數(shù)據(jù)思維模型,從而對未來進行預測和推測。比如,商業(yè)公司對消費者日常的購買行為和使用商品習慣進行匯總和分析,了解到消費者的需求,從而改進已有商品并適時推出新的商品,消費者的購買欲將會提高。知名互聯(lián)網(wǎng)公司谷歌對其用戶每天頻繁搜索的詞匯進行數(shù)據(jù)挖掘,從而進行相關的廣告推廣和商業(yè)研究。
大數(shù)據(jù)的處理技術(shù)迫在眉睫,近年來各國政府和全球?qū)W術(shù)界都掀起了一場大數(shù)據(jù)技術(shù)的革命,眾人紛紛積極研究大數(shù)據(jù)的相關技術(shù)。很多國家都把大數(shù)據(jù)技術(shù)研究上升到了國家戰(zhàn)略高度,提出了一系列的大數(shù)據(jù)技術(shù)研發(fā)計劃,從而推動政府機構(gòu)、學術(shù)界、相關行業(yè)和各類企業(yè)對大數(shù)據(jù)技術(shù)進行探索和研究。
可以說大數(shù)據(jù)是一種寶貴的戰(zhàn)略資源,其潛在價值和增長速度正在改變著人類的工作、生活和思維方式。可以想象,在未來,各行各業(yè)都會積極擁抱大數(shù)據(jù),積極探索數(shù)據(jù)挖掘和分析的新技術(shù)、新方法,從而更好地利用大數(shù)據(jù)。當然,大數(shù)據(jù)并不能主宰一切。大數(shù)據(jù)雖然能夠發(fā)現(xiàn)“是什么”,卻不能說明“為什么”;大數(shù)據(jù)提供的是一些描述性的信息,而創(chuàng)新還是需要人類自己來實現(xiàn)。
上述就是關于什么是大數(shù)據(jù),以及研究大數(shù)據(jù)有什么意義的全部內(nèi)容介紹,想了解更多關于大數(shù)據(jù)的信息,請繼續(xù)關注大數(shù)據(jù)的信息,請繼續(xù)關注中培偉業(yè)。