現(xiàn)在社會對于電腦手機(jī)等電子設(shè)備運(yùn)用已經(jīng)非常廣泛,我們早已離不開電子產(chǎn)品。因此系統(tǒng)也一直在人們的工作和生活中起著至關(guān)重要的作用,生活中推薦系統(tǒng)也是無處不在的。平時(shí)工作、訂餐等都會推送給我們不同的系統(tǒng),那么辨別系統(tǒng)好壞就成了我們的日常必修課,如何量化評價(jià)這種差異,多元化評估,如何根據(jù)不同的場景環(huán)境在內(nèi)容和用戶之間進(jìn)行適當(dāng)?shù)钠ヅ涠夹枰覀冹`活考量。能夠自我辨別系統(tǒng)的好壞就可以讓我們少走彎路,獲得更直接信息。
辨別系統(tǒng)好壞的方法是什么呢?如何根據(jù)不同的場景環(huán)境在內(nèi)容和用戶之間進(jìn)行適當(dāng)?shù)钠ヅ?即推薦系統(tǒng)的核心任務(wù)。在推薦系統(tǒng)流行的背后,在信息過載的情況下,人們需要通過算法幫助自己找到合適的內(nèi)容。每個(gè)人的興趣和需求不同,每個(gè)內(nèi)容的特點(diǎn)也不同。如何根據(jù)不同的場景環(huán)境在內(nèi)容和用戶之間進(jìn)行適當(dāng)?shù)钠ヅ?,即推薦系統(tǒng)的核心任務(wù)。
舉例來說,你通常在點(diǎn)外賣,它推薦的可能都是你經(jīng)常吃的附近的美食,如果你去了一個(gè)新的旅游目的地,它會為你推薦當(dāng)?shù)氐臒衢T特色餐飲。準(zhǔn)確識別和滿足用戶不同需求的能力,構(gòu)成了推薦系如何根據(jù)不同的場景環(huán)境在內(nèi)容和用戶之間進(jìn)行適當(dāng)?shù)钠ヅ?,即推薦系統(tǒng)的核心任務(wù)。
多元化評估方法,推薦系統(tǒng)通常服務(wù)于特定的業(yè)務(wù),業(yè)務(wù)在不同的時(shí)間階段、場景和用戶群下有不同的目標(biāo),需要靈活考慮。考慮到各種需求,我們的評估方法應(yīng)該靈活改變。對于不同的場景和用戶模型,設(shè)置單獨(dú)的測量標(biāo)準(zhǔn)。對于不同的業(yè)務(wù)指標(biāo),分解推薦系統(tǒng)的在線和評估標(biāo)準(zhǔn)。所謂拆解,其實(shí)就是用高頻變化的指標(biāo)來近似代表我們追求的長期業(yè)務(wù)指標(biāo)。
如何量化評價(jià)這種差異呢?沒有單一的測量標(biāo)準(zhǔn)。推薦好不好,最容易想到的指標(biāo)是點(diǎn)擊率。如果我推薦的內(nèi)容是你滿意的,你一定會點(diǎn)擊使用。理論上,完美的推薦系統(tǒng)似乎應(yīng)該達(dá)到100%的點(diǎn)擊率。就拿信息產(chǎn)品來說,你每次刷新,刷出的10個(gè)內(nèi)容你都很喜歡,全部點(diǎn)開看,這說明我們的推薦很準(zhǔn)。但是,這將帶來明顯的問題,因?yàn)槲覀冏非蟾唿c(diǎn)擊率,所以我們將減少冒險(xiǎn)嘗試。我們不敢把任何不確定的內(nèi)容推給用戶。因此,我們只能將用戶點(diǎn)擊的類別反復(fù)推給他,形成信息繭房,造成用戶審美疲勞,然后離開。顯然,單一的測量標(biāo)準(zhǔn)不能保證推薦系統(tǒng)滿足我們的需求。
綜上所述,我們了解了辨別系統(tǒng)好壞的方法,當(dāng)然除了業(yè)務(wù)指標(biāo),還需要考慮算法本身的評價(jià)方法。畢竟推薦系統(tǒng)的主體是算法模型。其評估方法也是很直接,就是預(yù)測的準(zhǔn)確性。如果您想了解更多關(guān)于系統(tǒng)的相關(guān)知識,請您繼續(xù)關(guān)注中培偉業(yè)。