中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

搜索廣告點(diǎn)擊率預(yù)測(cè)算法研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2020-09-08 15:50
   互聯(lián)網(wǎng)廣告主要分為搜索廣告、展示廣告等形式,而在這其中,搜索廣告是規(guī)模最大,增長(zhǎng)最快的廣告投放方式。搜索廣告是依據(jù)用戶提供的查詢關(guān)鍵字對(duì)廣告進(jìn)行投放,是最了解用戶搜索意圖的廣告投放形式。搜索廣告最關(guān)鍵的技術(shù)是廣告點(diǎn)擊率的預(yù)測(cè),廣告點(diǎn)擊率預(yù)測(cè)就是預(yù)測(cè)分析用戶行為對(duì)投放的廣告的點(diǎn)擊率,廣告點(diǎn)擊率關(guān)系著廣告投放的排序和廣告點(diǎn)擊收費(fèi)等因素,因此研究廣告點(diǎn)擊率對(duì)整個(gè)搜索廣告收入提高有著至關(guān)重要的意義。搜索廣告利用搜索引擎的技術(shù),分析用戶輸入的查詢意圖,提取相應(yīng)的關(guān)鍵詞,根據(jù)提取到的關(guān)鍵詞,進(jìn)行語(yǔ)義相關(guān)度計(jì)算,從廣告庫(kù)中進(jìn)行索引,給出相應(yīng)符合用戶需求的廣告檢索結(jié)果。當(dāng)搜索引擎等平臺(tái)提供的檢索排序候選結(jié)果中的廣告,與用戶輸入的關(guān)鍵詞等相關(guān)性越高,用戶越感興趣,點(diǎn)擊的行為可能性越高,相應(yīng)的廣告點(diǎn)擊率越高,廣告收入越高。本文的主要研究和實(shí)現(xiàn)內(nèi)容安排如下:(1)首先對(duì)數(shù)據(jù)集進(jìn)行清洗和預(yù)處理,統(tǒng)計(jì)數(shù)據(jù)信息,提取淺層的特征,并采用常見的機(jī)器學(xué)習(xí)方法進(jìn)行特征工程。邏輯斯蒂回歸模型作為基線方法,將預(yù)測(cè)的點(diǎn)擊率問題作為分類問題,在采用傳統(tǒng)機(jī)器學(xué)習(xí)方法中,使用GBDT模型與邏輯斯蒂回歸模型融合的方案,對(duì)特征組合,進(jìn)一步深入挖掘影響點(diǎn)擊率的因素,提高模型的非線性學(xué)習(xí)能力。對(duì)于數(shù)據(jù)集中出現(xiàn)的數(shù)據(jù)稀疏和缺失問題,采用近幾年在各種比賽中效果比較好的因子分解機(jī)FM算法,與基線方法比較優(yōu)化結(jié)果。(2)搜索廣告中的用戶查詢請(qǐng)求與廣告標(biāo)題之間的相似度對(duì)點(diǎn)擊率有至關(guān)重要的作用,本文首先采用卷積神經(jīng)網(wǎng)絡(luò)模型來(lái)提取深層次的相似度特征,并將其與人工挖掘到的特征相結(jié)合,共同輸入到點(diǎn)擊率的預(yù)測(cè)模型中,得到實(shí)驗(yàn)結(jié)果,實(shí)現(xiàn)效果提升。(3)循環(huán)神經(jīng)網(wǎng)絡(luò)更適合處理序列數(shù)據(jù),因此本文也研究了基于循環(huán)神經(jīng)網(wǎng)絡(luò)的相似度的特征提取。實(shí)驗(yàn)分析對(duì)比不同類型循環(huán)神經(jīng)網(wǎng)絡(luò)模型的實(shí)驗(yàn)結(jié)果,如長(zhǎng)短期記憶單元網(wǎng)絡(luò),門控循環(huán)單元網(wǎng)絡(luò),及相應(yīng)的雙向網(wǎng)絡(luò)形式等,并結(jié)合靜態(tài)注意力和動(dòng)態(tài)注意力機(jī)制比較實(shí)驗(yàn)結(jié)果,提取最好的相似度特征,從而優(yōu)化最終的點(diǎn)擊率預(yù)測(cè)結(jié)果。
【學(xué)位單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP391.3
【部分圖文】:

廣告,關(guān)鍵詞,用戶輸入,廣告主


的廣告的鏈接,最終被用戶發(fā)現(xiàn),消費(fèi)和分散了用戶如今互聯(lián)網(wǎng)中,最稀缺的資源就是用戶的注意力,就給廣告主等需求方提供一種購(gòu)買用戶注意力(流量)的告抵達(dá)用戶。在搜索引擎中,用戶輸入關(guān)鍵詞來(lái)進(jìn)了一定比例的流量。廣告主買斷一些關(guān)鍵詞,當(dāng)用有購(gòu)買該關(guān)鍵詞的廣告主進(jìn)行實(shí)時(shí)競(jìng)價(jià),從而獲得的核心關(guān)鍵技術(shù)之一就是廣告點(diǎn)擊率預(yù)測(cè),廣告點(diǎn)TR)的定義是用戶點(diǎn)擊該廣告的次數(shù) num_click 與用impression 的比值。公式如 2-1 下: 影響著投放廣告的順序,同時(shí)也影響著廣告的出價(jià)策詞“手機(jī)”時(shí),廣告主通過(guò)競(jìng)價(jià)買斷了關(guān)鍵詞“手機(jī)”,主投放的有關(guān)“手機(jī)”的廣告,平臺(tái)就會(huì)按照一定的廣告,如圖 2-1 所示:

函數(shù)曲線圖,凸函數(shù),極大似然估計(jì)方法,邊際分布


圖 3- 1 Sigmoid 函數(shù)曲線圖數(shù)的輸出結(jié)果是介于(0,1)之間,中間值 c 是 0.5,則出 h(x)代表數(shù)據(jù)屬于某一類別的概率,對(duì)于輸入 x 率分別為 ( ) ( ), ( ) 中的極大似然估計(jì)方法去求損失函數(shù),概率函數(shù)如 ( ) ( ( ) ( ( ) 據(jù)獨(dú)立分布,聯(lián)合分布可表示為各個(gè)邊際分布的乘積 ( ) ∏ ( ( )| ( ) ( ) ∏ ( ( ) ( ) ( ( ) ( )凸函數(shù),由于凸函數(shù)的局部最小值等同于全局最小得到 3-6 式:

點(diǎn)擊率,長(zhǎng)尾分布,廣告,特征提取


哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文Fm 1(x) 為當(dāng)前的模型,模型通過(guò)經(jīng)驗(yàn)風(fēng)險(xiǎn)極小化來(lái)確定下一個(gè)弱分類器參數(shù)。具體到損失函數(shù)本身的選擇也就是 L 的選擇,有平方損失函數(shù),0-1 損函數(shù),對(duì)數(shù)損失函數(shù)等等。當(dāng)選擇平方損失函數(shù)時(shí),這個(gè)差值就是殘差。GBDT 幾乎適用于所有線性和非線性的回歸問題,同時(shí)也可以設(shè)置閾值解二分類問題,應(yīng)用范圍比較廣。GBDT 可以給邏輯斯蒂回歸模型訓(xùn)練,提高告點(diǎn)擊率。如圖 3-2 所示,輸入樣本 x,GBDT 模型得到兩顆樹 tree1 和 tree2,兩棵樹個(gè)葉子節(jié)點(diǎn)都是 LR 模型的一個(gè)維度特征,在求和每個(gè)葉子權(quán)重及時(shí) LR 模型分類結(jié)果。

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張明紅;佘廉;耿波;;基于情景的結(jié)構(gòu)化突發(fā)事件相似度研究[J];中國(guó)管理科學(xué);2017年01期

2 陳葉斐;張學(xué)軍;黃衛(wèi)東;;基于干擾相似度的多話題演化模型[J];電信科學(xué);2017年09期

3 任雪利;代余彪;;軟件相似度在成本估算中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用與軟件;2015年06期

4 譚明超;刁興春;曹建軍;馮徑;;一種基于函數(shù)依賴的屬性相似度調(diào)整算法[J];上海交通大學(xué)學(xué)報(bào);2015年08期

5 陳立鳳;;河馬找親戚[J];學(xué)生之友(童花果);2016年12期

6 周嫻莉;;十個(gè)中文流行語(yǔ)翻譯[J];初中生輔導(dǎo);2016年36期

7 杜碧涵;;母愛[J];少年月刊;2017年05期

8 張呈宇;;熱點(diǎn)話題相似度常用算法比較[J];好家長(zhǎng);2017年12期

9 仇麗青;陳卓艷;;基于共同鄰居相似度的社區(qū)發(fā)現(xiàn)算法[J];信息系統(tǒng)工程;2014年05期

10 詹雪艷;林兆洲;段天璇;李磊;喬延江;;色譜指紋圖譜相似度方法的適應(yīng)性研究[J];中國(guó)中醫(yī)藥信息雜志;2012年05期

相關(guān)會(huì)議論文 前10條

1 張乃岳;張學(xué)燕;;基于個(gè)體詞語(yǔ)相似度的定制化動(dòng)態(tài)信息檢索[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

2 李紅蓮;潘建軍;范京;;音節(jié)相似度及其在語(yǔ)音識(shí)別中的應(yīng)用[A];第十四屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2009)論文集[C];2009年

3 丁維龍;吳水生;陳琦;程志君;;基于樹形結(jié)構(gòu)相似度的植物種類識(shí)別系統(tǒng)[A];2013年中國(guó)智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第五分冊(cè))[C];2013年

4 董刊生;方金云;;基于向量距離的詞序相似度算法[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

5 郭瑛媚;史曉東;陳毅東;高燕;;基于詞的話題分布相似度的無(wú)監(jiān)督日文旅游意見詞翻譯[A];機(jī)器翻譯研究進(jìn)展——第七屆全國(guó)機(jī)器翻譯研討會(huì)論文集[C];2011年

6 王茜;張衛(wèi)星;;基于分類樹相似度加權(quán)的協(xié)同過(guò)濾算法[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年

7 Peng Ding;Xin Yan;Zhihong Liu;Jiewen Du;Yuehua Xu;Qiong Gu;Jun Xu;;TarExplorer:基于三維相似度的活性小分子尋靶平臺(tái)(英文)[A];中國(guó)化學(xué)會(huì)第30屆學(xué)術(shù)年會(huì)摘要集-第二十五分會(huì):化學(xué)信息學(xué)與化學(xué)計(jì)量學(xué)[C];2016年

8 劉曉平;陸勁挺;;任意功能樹的物元相似度求解方法[A];全國(guó)第21屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2010)暨全國(guó)第2屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2010年

9 劉海波;鄭德權(quán);趙鐵軍;;基于相似度線性加權(quán)方法的檢索結(jié)果聚類研究[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

10 羅辛;歐陽(yáng)元新;熊璋;袁滿;;通過(guò)相似度支持度優(yōu)化基于K近鄰的協(xié)同過(guò)濾算法[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯一[C];2010年

相關(guān)重要報(bào)紙文章 前10條

1 楊林;住宿按“相似度”分 體現(xiàn)學(xué)生視角[N];北京日?qǐng)?bào);2017年

2 證券時(shí)報(bào)記者  韓如冰;基金投資相似度趨高[N];證券時(shí)報(bào);2006年

3 本報(bào)記者 王斌 本報(bào)實(shí)習(xí)生 蒲曉磊;版權(quán)局官員:相似度極高的不受保護(hù)[N];法制日?qǐng)?bào);2012年

4 記者 李學(xué)梅;研究證實(shí):父親“偏愛”與自己相像的孩子[N];新華每日電訊;2009年

5 天相投資顧問公司 張新文;風(fēng)格穩(wěn)定基金業(yè)績(jī)更勝一籌[N];證券時(shí)報(bào);2007年

6 記者 劉妮;曾維會(huì)見日本新任駐沈總領(lǐng)事[N];沈陽(yáng)日?qǐng)?bào);2012年

7 小新;妊娠中毒癥與夫婦HLA基因相似度有關(guān)[N];中國(guó)醫(yī)藥報(bào);2007年

8 海潮;俄研究發(fā)現(xiàn)妊娠中毒癥疑與夫婦HLA基因相似度有關(guān)[N];中國(guó)醫(yī)藥報(bào);2007年

9 欒海;妊娠中毒癥可能與夫婦 HLA基因相似度有關(guān)[N];醫(yī)藥經(jīng)濟(jì)報(bào);2007年

10 海納;“娛樂”模仿的憂慮[N];河北日?qǐng)?bào);2013年

相關(guān)博士學(xué)位論文 前10條

1 王玉標(biāo);基于動(dòng)態(tài)信任建模的云服務(wù)可信性評(píng)估與選擇研究[D];重慶大學(xué);2018年

2 高欣健;多模態(tài)相似度學(xué)習(xí)方法研究[D];合肥工業(yè)大學(xué);2017年

3 夏云慶;IHSMTS系統(tǒng)中啟發(fā)式類比翻譯處理機(jī)制(HATM)的設(shè)計(jì)與實(shí)現(xiàn)[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2001年

4 武威;異質(zhì)數(shù)據(jù)相似度學(xué)習(xí)及其在網(wǎng)絡(luò)搜索中的應(yīng)用[D];北京大學(xué);2012年

5 張明西;信息網(wǎng)絡(luò)中的相似度搜索問題研究[D];復(fù)旦大學(xué);2013年

6 朱娜斐;基于RTT相似度的網(wǎng)絡(luò)延遲估測(cè)理論和方法[D];北京工業(yè)大學(xué);2012年

7 錢鵬飛;基于模糊相似度的異構(gòu)本體映射、合并及校驗(yàn)方法的研究[D];上海交通大學(xué);2008年

8 朱笑塵;異質(zhì)過(guò)程數(shù)據(jù)集成與修復(fù)[D];清華大學(xué);2015年

9 賈連印;內(nèi)存數(shù)據(jù)庫(kù)中集合相似度及集合包含問題的研究[D];華南理工大學(xué);2012年

10 崔曉蘭;面向在線抱怨自動(dòng)處理的推薦方法研究[D];華中科技大學(xué);2017年

相關(guān)碩士學(xué)位論文 前10條

1 呂如州;基于結(jié)構(gòu)元理論的模糊數(shù)相似度及應(yīng)用研究[D];遼寧工程技術(shù)大學(xué);2016年

2 夏雨;在線評(píng)論中產(chǎn)品特征提取與意見挖掘研究[D];武漢理工大學(xué);2016年

3 方敏;基于節(jié)點(diǎn)相似度的線要素匹配方法設(shè)計(jì)[D];北京建筑大學(xué);2018年

4 張學(xué)理;基于多因子標(biāo)簽相似度的標(biāo)簽聚類算法的研究[D];遼寧大學(xué);2018年

5 李凱翔;產(chǎn)科知識(shí)圖譜的構(gòu)建與研究[D];鄭州大學(xué);2018年

6 李超男;基于節(jié)點(diǎn)相似度的社會(huì)網(wǎng)絡(luò)社團(tuán)發(fā)現(xiàn)的算法研究[D];重慶師范大學(xué);2018年

7 花凌鋒;面向位置的移動(dòng)新聞推薦研究[D];安徽理工大學(xué);2018年

8 丁明珠;基于混合相似度指標(biāo)的社團(tuán)劃分算法研究[D];山東師范大學(xué);2018年

9 楊飛;基于LSTM的文本相似度識(shí)別方法研究[D];吉林大學(xué);2018年

10 常明;搜索廣告點(diǎn)擊率預(yù)測(cè)算法研究與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2018年



本文編號(hào):2814354

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/wenyilunwen/guanggaoshejilunwen/2814354.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d5f52***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com