大數據無疑是目前互聯網行業乃至全社會的一個熱門詞匯,中培偉業《大數據Hadoop與Spark架構應用實戰》培訓專家鐘老師指出,正如許多顛覆性技術一樣,經歷了被“神化”、“妖魔化”的過程后,大數據已經開始被人們理智的看待。它既不神秘莫測,也不虛無飄渺。
隨著數據體量的不斷增長,數據存儲、計算和數據應用表現出了明顯的變化。底層的存儲和計算架構越來越趨于分布式;中間層的數據分析的方式正從BI向以人工智能為代表的技術發展;而最上面的應用層則更加垂直于某些行業或應用場景。另外,為了使結果和規律以更好的方式呈現出來,對于數據可視化技術的研究也快速得到業界關注,以期獲得對于海量數據分析結果更加直觀、精準展現的解決方案。
鐘老師認為,大數據技術的發展是信息化發展的自然延伸,是由應用驅動的信息化產品發展的必然產物。“最早是谷歌在做搜索的時候,由于以前有的網頁非常非常大,沒有辦法進行存儲,也沒有辦法在這上面進行搜索,所以它衍生出自己的一套分布式存儲與分布式計算這樣一整套的架構來,這一整套架構就變成了現在大家知道的Hadoop生態。”
鐘老師進一步支持,通過近幾年百分點與客戶接觸的過程中,他非常直觀地感受到了企業對待大數據態度的變化。“IT圈里也沒幾個人真正知道Hadoop是什么,然而現在,Hadoop集群已經被部署在幾乎所有大型企業的IT系統中,成為企業數據平臺的新常態。”但是,現在的企業已經不再認為一套Hadoop就能夠解決所有問題,而是評估哪種產品或者解決方案能夠真正與自身具體的業務需求相結合,通過數據分析產生價值。大數據不過是解決問題的一種正常的IT手段。
然而從基因圖譜到太空探索,人類不斷產生著越來越大的數據集,對于數據處理、管理和理解的極限能力無時無刻不在遭遇挑戰。談及未來將對大數據起到推動作用的關鍵技術及發展方向時,鐘老師重申了“大數據只是信息化的自然延伸”這個觀點。他認為,信息化新技術的發展,一定會為整個大數據領域帶來變革,并對以下三類技術表示重點關注:
量子計算機
鐘老師表示,“經典計算機正遇到摩爾定律的極限,而頂破天花板的正是量子計算。”量子計算機最大的優勢在于大幅縮短提取用戶所需信息的時間,它可以在幾天內解決傳統計算機會花費數百萬年才能處理的數據。
相對于將0和1組成的比特流轉換成其他比特流的傳統計算操作,量子計算是一種截然不同的計算方式。它的神奇之處在于,它可以做到真正的并行計算與存儲。例如,一個數位的經典存儲器可以存儲兩個數字0或者1,但在某一時刻這個數字要么是0要么是 1;而對于量子比特存儲器來說,在同一時刻,它可以同時存儲0和1,其存儲和運行能力都成指數上升。而且數據量越大,量子算法在時間復雜度上的優勢就越明顯。
大約三年前,中國科學技術大學量子光學和量子信息團隊在國際上首次成功實現了用量子計算機求解線性方程組的實驗,首次從原理上證明了這一算法的可行性。“像IBM,谷歌,也都在探索和研究量子計算機技術。一旦投入實際應用成為可能,相地這會對大數據,乃至整個信息產業帶來一個巨大的變化”,鐘老師表示。
可見光通信
對大量數據傳輸的巨大需求使當前現有的通信技術面臨嚴峻挑戰。相關調查報告顯示,按著現在移動設備呈指數級發展的趨勢,預計2019年超過100億部移動設備每月將會交換超過35萬兆(10^18)比特的信息,然而這還僅僅是來自移動端的數據。
鐘老師對此評價道: “可見光通信技術將極大的改變整個信息傳輸、存儲和計算的方式。大家可以想象,未來我們的手機都可以僅靠一束光就實現通話和數據傳輸,大大提升了傳輸速度和效率,整個存儲和計算的規模也將不可估量。”
高速率性是可見光通信的最大優勢,也是業界普遍看好其前景的主要原因。除此之外,高密度、低成本、高保密性都是其主要的技術優勢。隨著市場對數據、物聯網和移動的偏愛程度與日俱增,人們需要找到一些更快傳輸更多數據的方法。一旦可見光通信技術走向成熟,將會對現有基礎設施無法處理這樣的數據傳輸需求提供解決方案。
區塊鏈
對于最近大熱的區塊鏈技術,鐘老師同樣非常關注,他認為區塊鏈技術是利用一種純粹的去中心化方式,實現整個數據的存儲,計算,校驗,這在給數據應用帶來更大變化的同時,也對底層的分布式計算模型,數據存儲模型等技術帶來巨大影響。
“在我的理解中,區塊鏈通過數據分布式的存儲計算這樣的一種方式來實現。其中有一個核心點叫做基于計算的證明。這個證明的過程實際是一種驗證,所以個人無法偽造這些資源。如果想偽造的話,計算量會非常大。由于它是基于純粹分布式的存儲和計算資源,每個節點共享出來的資源即使非常少,當時整個這個網絡里邊,計算量也已經可以達到了非常大的程度。”鐘老師這樣認為。
在2016年我們將看到,不同行業的多個應用程序使用區塊鏈。基本上任何存在數字化交易的行業都將會受益于區塊鏈技術,這些數據全都可以用來進行分析。但是區塊鏈技術并不能提供數據分析的功能,這時候就需要推動大數據和其分析工具的發展進行介入。
最后鐘老師總結認為,其實一些所謂的新技術,它的理念一點都不新。早在一九六幾年,關于Hadoop中核心的分布式理念就已經被提出,量子機計算的概念更是在上世紀八十年代就有人做出設想。只是受限于當時的科學和技術水平,這些理念沒辦法得到實現。但是一旦實現成為可能,整個應用將呈現出指數級增長的發展趨勢,就像當年的摩爾定律一樣。