互聯網的快速發展,尤其是存儲技術和設備的發展,讓傳統統計學上的數據和信息成長為今天的大數據。對很多人來說,大數據是新奇而陌生的。有人盲目排斥,有人則盲目崇拜。對于當前的大數據的發展狀態或者其發展特性,中培偉業專家對此發飆了自己的看法。
他表示,目前我們要正確認識大數據,首先就應該認清以下事實:
基本事實1:人才是最重要的
大數據雖然帶來很多變革,影響深遠,但這并非全是數據的功勞。大數據只是個賓語,如果缺少主語,則構不成一個完整的句子,而人就是主語。任何大數據項目都是由人提出、由人審核、由人實施、由人完善、由人監督甚至由人結束的。可以說,大數據完全是由人推動的。
數據本身確實存在價值,大數據技術也很重要,計算機處理能力也重要,但這些都不是關鍵要素,重要的是人,尤其是那些面對繁瑣雜亂的數據仍有清醒頭腦,能提出明確需求和目標之人。在未來,首席信息官(CIO)可能比首席CEO更重要,決策也可能由CIO在進行數據分析的基礎上進行,而且這些人還可能決定著未來大數據的發展方向。
對企業來說,收集數據很重要,但更重要的是培養大數據人才,尤其是CIO,數據人才將是企業未來競爭中的利器。
基本事實2:目前收集到的大數據只是很少的一部分
信息處理能力有限時期,人們普遍采用采樣方式來收集數據,這種方式難免會忽略掉很多數據,而隨著計算機技術發展和云計算的興起,信息處理能力大幅提升,采樣獲得的少量數據已經沒多大作用,因為人們可以采集到海量的數據。在海量數據基礎上進行分析,所得出的結論準確度更高,因而這種方式漸漸成為主流。不過很顯然,人們處理數據的方法并未跟上時代進步,在處理數據時難免會忽略掉很多數據。
根據某家大數據研究公司的調查:大多數企業在進行數據分析時,其分析數據量只占據他們所擁有的總體數據量的12%。被忽視掉的數據量占比近九成。企業之所以這么做原因可能是避免被“煮沸海洋”戰略拖累,減少數據分析成本,也可能缺少相關專業的數據分析工具。可以說這種方式好處是成本低,但其風險很高,被忽視掉的數據里可能隱藏著對企業發展至關重要的信息。
基本事實 3:大數據的發展離不開技術人員的推動
數據分析有數據、數據分析、數據分析結果三部分,數據是本來就存在的,關鍵是如何對其進行整理、分析,然后找出關聯性,將數據轉化為有價值的信息。而這一切都離不開數據人才。根據麥肯錫預測,2019年,全球將缺少至少19萬能對大數據進行分析的科學家。
目前大數據領域對數據專家的需求量猛增,而且隨著大數據越來越普及,數據專家的需求量必然會更多。與大數據相關的崗位也會興起,如未來建設智能社會的人才等。而且根據目前數據專家的薪酬來看,在美國,基礎類的薪酬為12萬美元/每年,那些更為高級的崗位其薪酬更高。薪酬高,需求量大,將來必然會吸引眾多人。
基本事實 4:大數據涉及到多種技術
數據處理是個相當復雜的過程,需要有各種不同的技能,雖說借助工具(如Hadoop)的幫助,能大大簡化數據處理過程,減輕人們的負擔,但就拿常用的Hadoop工具來說,人們需要掌握Java 編程技能、理解MapReduce、linux系統等,而且還需將數據轉化為有價值的信息,還可能需要了解統計知識、業務流程、圖表設計、SQL技能等。
因此,要成為一個大數據人才并不容易,至少得深入鉆研,懂得各種必備的技能,同時也要靈活運用,還要善于發現數據的關聯性等。
基本事實 5:每個人都與大數據密切相關
目前,很多政府都使用大數據進行管理,傳統的管理在面對海量數據時顯得很笨拙且臃腫,而使用大數據管理則做到有得放矢,能輕松處理各種數據,理清思路,讓管理變得輕松且高效。
企業使用大數據尋找潛在客戶,對客戶全方位定位、分析,找出客戶喜好,以及最近的購買傾向。如企業生產了某種新型設備,而又通過大數據得知某客戶正打算擴大生產,急需設備,因而企業就可以用電子郵件通知客戶;或者某酒商剛從外國運回了一批質量高等的葡萄酒,那么,則可以運用大數據挖掘出潛在客戶,并對他們予以提醒;又或者某家化妝品通過數據分析顯示,上次某客戶在店內購買的口紅快用完了,則可以通過電子郵件向該客戶推薦口紅。
大數據對個人的影響更是深遠,事實上,不管政府、企業還是機構使用大數據,最終都會落實到個人上。所以大數據涉及所有人。
當然,關于大數據的事實還有很多,而且隨著人們對大數據的認識加深,也會有更多的大數據事實暴露出來。