近年來,人工智能領域的發展越來越好,希望轉業投身到這個領域的人也越來越多,但想要搭上這波AI紅利不是那么容易的。
NLP自然語言處理是人工智能的一個子領域,它指的是機器能夠理解并解釋人的寫作或說話方式的能力。但眾所周知,人工智能對人類影響最大的就是自然語言方面,就連微軟創始人比爾蓋茨也曾說過,語言理解就是人工智能領域皇冠上的明珠。那么,為何如今NLP領域的技術落地這么難呢?
NLP的落地場景并不是那么直接,往往需要結合客戶或者產品設計。之前微軟亞洲研究院副院長周明在接受采訪時說過,“目前自然語言處理產品出現的問題,很多時候無關技術,而是在產品設計和UI方面做得不夠好”。如果產品設計或UI方面做得不好,用戶體驗感就會很差,對產品落地也會造成很大的影響。
就目前的市場來看,NLP領域的創業大公司很少,究其原因,還是因為技術難度太大,應用場景太復雜。就連現在NLP領域的創業公司都會面臨一個落地難的狀況。對于特別純粹的自然語言應用(不涵蓋搜索),主要就是機器翻譯。而今的機器翻譯水平還是達不到高標準。對于有背景的復雜句子,機器依然很難翻譯。若翻譯付費形成一種商業模式,從研究到技術到落地再到商業化,這將會面臨一個很大的挑戰。
運用周明的話來講,現在的自然語言處理面臨著如下問題:第一,自然語言是多輪的;第二,自然語言除了多輪特征之外,它還涉及到了背景知識和常識知識;第三,自然語言處理要面對個性化問題。
那么,如何才能解決這些問題呢?
周明表示,在技術的改進上雖然我們不能保證,但有三個值得嘗試的方向:
第一,上下文的建模需要建立大規模的數據集。比如多輪對話和上下文理解。數據標注的時候要注意前后文。沒有這樣的數據,很難取得突破。
第二,強化學習很重要。我們需要根據用戶的反饋倒推模型并做參數修正,使模型更加優化。現在強化學習剛剛開始用在自然語言領域,性能并不穩定,但在未來很有機會。
第三,要引入常識和專業知識,并把這些知識構建好。這樣就能更加精準地回答問題。沒有人能證明現在常識知識用在語言問答和搜索中的作用有多大。所以,我們需要一個測試集來檢驗結果。這個測試集要專門測上下文和常識,可以讓我們要不停用新模型(比如強化學習或者知識圖譜)去試錯,來看系統性能能不能提升。
自然語言可以說是人類智慧的結晶,雖然說仍有很多問題亟待解決,但這不會難倒聰明的人類。我們相信,憑著我們迎難而上的勇氣,終有一天,人工智能會更好的服務于人類。
想了解更多IT資訊,請訪問中培偉業官網:中培偉業