1、統計學目前有一種趨勢是越來越精確。當然,這本身并不是壞事,只有越精確才能避免錯誤,發現真理。
統計學在采用一個方法之前先要證明,而不是像計算機科學和機器學習那樣注重經驗。有時候同一問題的其它領域的研究者提出一個很明顯有用的方法,但它卻不能被統計學家證明(或者現在還沒有證明)。
統計學更傾向于經過數學證明的方法而不是一些特殊方法。但統計學的核心問題就是在觀察了樣本的情況下如何去推斷總體。當然這也常常是大數據挖掘所關注的。
2、大數據技術作為幾門學科的綜合,已經從機器學習那里繼承了實驗的態度。這并不意味著大數據工作者不注重精確,而只是說明如果方法不能產生結果的話就會被放棄
數據挖掘的一個特定屬性就是要處理的是一個大數據集。這就意味著,傳統統計學由于可行性的原因,我們常常得到的只是一個樣本,但是需要描述樣本取自的那個大數據集。然而,數據挖掘問題常常可以得到數據總體,例如關于一個公司的所有職工數據,數據庫中的所有客戶資料,去年的所有業務。在這種情形下,統計學的推斷就沒有價值了。
想要了解更多關于大數據資訊信息,請關注中培偉業李老師二維碼: