2003年,DARPA啟動PAL計劃,將機器學(xué)習(xí)的重要性上升到美國國家安全的高度來考慮,眾所周知,美國最尖端科技的研究通常是由NASA和DARPA推進(jìn)的,而這兩大機構(gòu)不約而同地強調(diào)機器學(xué)習(xí)的重要性,其意義不言而喻.2006年,卡耐基梅隆大學(xué)宣告成立世界上第一個“機器學(xué)習(xí)系”,機器學(xué)習(xí)領(lǐng)域奠基人之-T.Mitchell教授出任首任系主任.2012年3月,美國奧巴馬政府啟動“大數(shù)據(jù)研究與發(fā)展計劃”,美國國家科學(xué)基金會旋即在加州大學(xué)伯克利分校啟動加強計劃,強調(diào)要深入研究和整合大數(shù)據(jù)時代的三大關(guān)鍵技術(shù):
機器學(xué)習(xí)、云計算、眾包(crowdsourcing).顯然,機器學(xué)習(xí)在大數(shù)據(jù)時代是必不可少的核心技術(shù),道理很簡單:收集、存儲、傳輸、管理大數(shù)據(jù)的目的,是為了“利用”大數(shù)據(jù),而如果沒有機器學(xué)習(xí)技術(shù)分析數(shù)據(jù),則“利用”無從談起.談到對數(shù)據(jù)進(jìn)行分析利用,很多人會想到“數(shù)據(jù)挖掘”(data mining),這里簡單探討一下數(shù)據(jù)挖掘與機器學(xué)習(xí)的聯(lián)系.?dāng)?shù)據(jù)挖掘領(lǐng)域在二十世紀(jì)九十年代形成,它受到很多學(xué)科領(lǐng)域的影響,其中數(shù)據(jù)庫、機器學(xué)習(xí)、統(tǒng)計學(xué)無疑影響最大[Zhou,2003].數(shù)據(jù)挖掘是從海量數(shù)據(jù)中發(fā)掘知識,這就必然涉及對“海量數(shù)據(jù)”的管理和分析.大體來說,數(shù)據(jù)庫領(lǐng)域的研究為數(shù)據(jù)挖掘提供數(shù)據(jù)管理技術(shù),而機器學(xué)習(xí)和統(tǒng)計學(xué)的研究為數(shù)據(jù)挖掘提供數(shù)據(jù)分析技術(shù).由于統(tǒng)計學(xué)界的研究成果通常需要經(jīng)由機器學(xué)習(xí)研究來形成有效的學(xué)習(xí)算法,之后再進(jìn)入數(shù)據(jù)挖掘領(lǐng)域,因此從這個意義上說,統(tǒng)計學(xué)主要是通過機器學(xué)習(xí)對數(shù)據(jù)挖掘發(fā)揮影響,而機器學(xué)習(xí)領(lǐng)域和數(shù)據(jù)庫領(lǐng)域則是數(shù)據(jù)挖掘的兩大支撐.今天,機器學(xué)習(xí)已經(jīng)與普通人的生活密切相關(guān),例如在天氣預(yù)報、能源勘探、環(huán)境監(jiān)測等方面,有效地利用機器學(xué)習(xí)技術(shù)對衛(wèi)星和傳感器發(fā)回的數(shù)據(jù)進(jìn)行分析,是提高預(yù)報和檢測準(zhǔn)確性的重要途徑;在商業(yè)營銷中,有效地利用機器學(xué)習(xí)技術(shù)對銷售數(shù)據(jù)、客戶信息進(jìn)行分析,不僅可幫助商家優(yōu)化庫存降低成本,還有助于針對用戶群設(shè)計特殊營銷策略:……下面再舉幾例: