2.3.2 查準(zhǔn)率、查全率與Fl
錯誤率和精度雖常用,但并不能滿足所有任務(wù)需求.以西瓜問題為例,假定瓜農(nóng)拉來一車西瓜,我們用訓(xùn)練好的模型對這些西瓜進行判別,顯然,錯誤率衡量了有多少比例的瓜被判別錯誤.但是若我們關(guān)心的是“挑出的西瓜中有多少比例是好瓜”,或者“所有好瓜中有多少比例被挑了出來”,那么錯誤率顯然就不夠用了,這時需要使用其他的性能度量,類似的需求在信息檢索、Web搜索等應(yīng)用中經(jīng)常出現(xiàn),例如在信息檢索中,我們經(jīng)常會關(guān)心“檢索出的信息中有多少比例是用戶感興趣的”“用戶感興趣的信息中有多少被檢索出來了”,“查準(zhǔn)率”(precision)與“查全查準(zhǔn)率亦稱“準(zhǔn)確率”率”(recall)是更為適用于此類需求的性能度量,查全率亦稱“召回率”.對于二分類問題,可將樣例根據(jù)其真實類別與學(xué)習(xí)器預(yù)測類別的組合劃分為真正例(true positive)、假正例(false positive)、真反例(true negative)、假反例(false negative)四種情形,令TP、FP、TN、FN分別表示其對應(yīng)的樣例數(shù),則顯然有TP+FP+TN+FN=樣例總數(shù).