真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

elasticsearch智能推薦系統(tǒng)用到的二分類模型是怎樣的

本篇內(nèi)容主要講解“elasticsearch智能推薦系統(tǒng)用到的二分類模型是怎樣的”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“elasticsearch智能推薦系統(tǒng)用到的二分類模型是怎樣的”吧!

在邕寧等地區(qū),都構(gòu)建了全面的區(qū)域性戰(zhàn)略布局,加強(qiáng)發(fā)展的系統(tǒng)性、市場前瞻性、產(chǎn)品創(chuàng)新能力,以專注、極致的服務(wù)理念,為客戶提供網(wǎng)站設(shè)計(jì)制作、成都網(wǎng)站設(shè)計(jì) 網(wǎng)站設(shè)計(jì)制作定制網(wǎng)站,公司網(wǎng)站建設(shè),企業(yè)網(wǎng)站建設(shè),成都品牌網(wǎng)站建設(shè),網(wǎng)絡(luò)營銷推廣,成都外貿(mào)網(wǎng)站建設(shè)公司,邕寧網(wǎng)站建設(shè)費(fèi)用合理。

1. 算法設(shè)計(jì)概覽

算法方案的設(shè)計(jì),在整體思路的指導(dǎo)下,先從數(shù)據(jù)調(diào)研入手,明確模型開發(fā)應(yīng)用過程中需要著重關(guān)注的問題。在算法方案設(shè)計(jì)中,加入對問題的考量,以期得到優(yōu)化的模型結(jié)果。

整體算法方案如下圖所示:

2. 樣本構(gòu)造

樣本構(gòu)造對于任意數(shù)據(jù)挖掘場景都至關(guān)重要,推薦系統(tǒng)也不例外。

一般而言,用戶的購買是偏少的,所以單單使用用戶購買作為正樣本,會(huì)導(dǎo)致樣本量很少。為了解決這個(gè)問題,將用戶有行為的課程定義為正樣本,其他的定義為負(fù)樣本。這些行為包括:點(diǎn)擊、收藏、分享、加購物車、購買等,由于各種行為代表的用戶對課程的偏好度是不同的,所以在后續(xù)建模中會(huì)通過樣本權(quán)重的方式體現(xiàn)出來。

用戶產(chǎn)生過行為的課程,只是所有課程中很小的一部分,所以如果直接把用戶沒有產(chǎn)生過行為的課程作為負(fù)樣本,會(huì)導(dǎo)致正負(fù)樣本比例嚴(yán)重失衡。所以在實(shí)際建模過程中,會(huì)對負(fù)樣本進(jìn)行抽樣,根據(jù)以往的經(jīng)驗(yàn),抽樣后正負(fù)樣本比例可以設(shè)置為1:80。

3. 特征工程

本節(jié)將對特征工程的開展思路進(jìn)行描述,最終采用的特征,還需要根據(jù)數(shù)據(jù)情況進(jìn)行調(diào)整。以下僅供參考,具體情況可詳見《標(biāo)簽/篩選體系》。

l 短期用戶行為的特征加工

類目下課程被點(diǎn)擊、收藏、分享、加購物車、購買等的次數(shù)

不同標(biāo)簽下課程被點(diǎn)擊、收藏、分享、購買等的次數(shù)

用戶近期是否點(diǎn)擊、收藏該課程

l 課程屬性特征

課程所屬類目

課程所屬標(biāo)簽

課程銷量和相似課程銷量均值的比值

課程價(jià)格和相似課程價(jià)格均值的比值

近期被點(diǎn)擊次、分享、收藏、加購物車的次數(shù)

課程標(biāo)題詞的個(gè)數(shù)、圖片個(gè)數(shù)、以及和相似課程的均值的比值

上架天數(shù)

l 用戶屬性特征

性別、年齡、職業(yè)、地域、app使用天數(shù)

l 用戶長期偏好

矩陣分解得到的用戶標(biāo)簽偏好

用戶價(jià)格偏好

4. 模型訓(xùn)練

模型訓(xùn)練主要考慮PLM、LightGBM、FM等模型,各模型各有優(yōu)劣:

l PLM 在線性模型的基礎(chǔ)上加入分塊,可以實(shí)現(xiàn)非線性的效果。訓(xùn)練和預(yù)測速度快,適應(yīng)大規(guī)模稀疏特征。

l LightGBM 基于決策樹的迭代式模型。適合于稠密特征,模型精度高。但訓(xùn)練、預(yù)測速度不高,不適用于大規(guī)模稀疏特征。

l FM 自動(dòng)進(jìn)行特征之間的交叉,能發(fā)現(xiàn)有用的特征交叉。訓(xùn)練和預(yù)測速度快,但本質(zhì)上是線性模型,可能效果不能得到保證。

在評價(jià)指標(biāo)的選擇上,主要關(guān)注準(zhǔn)確率,兼顧覆蓋率,準(zhǔn)確率考慮采用MAP@k,DDCG@k等評價(jià)指標(biāo)。

在項(xiàng)目開展過程中對各模型進(jìn)行分別調(diào)優(yōu),并根據(jù)評價(jià)指標(biāo)迭代式地優(yōu)化特征和模型,不斷提升離線評估效果。

5. 評價(jià)指標(biāo)

在評價(jià)指標(biāo)的選擇上,主要從用戶滿意度、預(yù)測準(zhǔn)確度以及覆蓋率3個(gè)方面考慮:

l 用戶的滿意度是評測推薦系統(tǒng)最重要的指標(biāo),但是用戶滿意度無法通過離線計(jì)算,一般通過用戶調(diào)查、在線實(shí)驗(yàn)獲取?;蛘呖梢酝ㄟ^分析用戶行為日志計(jì)算用戶滿意度,大致的計(jì)算方式為:計(jì)算推薦的課程中,用戶購買并且評分較高的課程的占比。

l 預(yù)測準(zhǔn)確度是最重要的推薦系統(tǒng)離線評測指標(biāo),包含評分預(yù)測和TopN推薦兩個(gè)方面。評分預(yù)測的預(yù)測準(zhǔn)確度通過均方根誤差(RMSE)和平均絕對誤差(MAE)度量;TopN推薦的預(yù)測準(zhǔn)確度通過準(zhǔn)確度(Precision)和召回率(Recall)度量。

l 覆蓋率(Coverage)描述的是一個(gè)推薦系統(tǒng)對物品長尾的發(fā)掘能力,其定義指標(biāo)有2種。第一種是信息熵,計(jì)算公式如下:

這里p(i)是物品i的流行度除以所有物品流行度之和。

第二種是基尼指數(shù),計(jì)算公式如下:

這里ij是按照物品流行度p(i)從小到大排序的物品列表中第j個(gè)物品。

另外mAP@k,DDCG@k等也是模型評測的重要指標(biāo)。

在項(xiàng)目開展過程中對各模型進(jìn)行分別調(diào)優(yōu),并權(quán)衡各項(xiàng)評價(jià)指標(biāo)迭代式地優(yōu)化特征和模型,不斷提升離線評估效果。

6. 模型應(yīng)用

在模型實(shí)際應(yīng)用中,需要關(guān)注模型的運(yùn)行效率,更新頻率等方面,下面對這兩個(gè)方面進(jìn)行展開。

1) 預(yù)測效率

對全量的用戶和課程組合進(jìn)行預(yù)測的話,需要進(jìn)行n*m條記錄進(jìn)行預(yù)測,其中n為用戶數(shù),m為課程數(shù),非常消耗資源。所以對于單個(gè)用戶,需要篩選一部分課程,只預(yù)測用戶對這些課程的偏好評分。目前考慮將以下幾部分課程納入預(yù)測范圍:

l 運(yùn)營課程

l 熱門課程

主要針對新用戶,用于給他們推薦人們課程

l 用戶近期常點(diǎn)擊類目下的課程、近期常點(diǎn)擊標(biāo)簽下的課程

用戶近期常點(diǎn)擊的課程,某種程度上代表了用戶近期的需求

而近期常點(diǎn)標(biāo)簽,具有某種程度的發(fā)散性,比如關(guān)于品牌的標(biāo)簽會(huì)發(fā)散到同品牌課程,關(guān)于功用的標(biāo)簽會(huì)發(fā)散到同功用課程

有助于新上架課程的發(fā)現(xiàn)

l 基于協(xié)同過濾算法給出的推薦課程

用標(biāo)簽代替課程,進(jìn)行基于用戶的協(xié)同過濾和基于課程的協(xié)同過濾,對于推薦課程的新穎性會(huì)帶來提升

2) 更新頻率

目前的算法設(shè)計(jì)為一天更新一次。在每天夜里,會(huì)將今天的新數(shù)據(jù)納入模型訓(xùn)練、預(yù)測的范圍,包括新產(chǎn)生的用戶行為,新課程信息,新用戶數(shù)據(jù)。

因?yàn)槟壳澳P褪请x線模型,用戶當(dāng)前新產(chǎn)生的行為并不會(huì)影響推薦結(jié)果,要等到第二天模型更新完成后才會(huì)產(chǎn)生新的推薦。

3) 場景結(jié)合

模型對商品作出預(yù)測后,會(huì)生成用戶對商品的偏好得分。下面對于三個(gè)不同的場景分開進(jìn)行設(shè)計(jì)。

1. 對運(yùn)營商品進(jìn)行推薦

首先從運(yùn)營表中獲取運(yùn)營商品的id,接著關(guān)聯(lián)用戶商品評分表,獲取用戶對商品的偏好度,按偏好度控制app上商品的顯示順序

2. 對指定類目下商品進(jìn)行推薦

首先獲取指定類目下商品的id,接著關(guān)聯(lián)用戶商品評分表,獲取用戶對商品的偏好度,按偏好度控制app上商品的顯示順序。

3. 搜索推薦

通過ElasticSearch獲取商品搜索相關(guān)度后,關(guān)聯(lián)用戶商品評分表,將用戶對商品的偏好度乘以搜索相關(guān)度,得到綜合評分,按該評分控制app上搜索商品的顯示順序。

到此,相信大家對“elasticsearch智能推薦系統(tǒng)用到的二分類模型是怎樣的”有了更深的了解,不妨來實(shí)際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!


網(wǎng)站名稱:elasticsearch智能推薦系統(tǒng)用到的二分類模型是怎樣的
網(wǎng)站路徑:http://weahome.cn/article/psghsd.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部