搜索廣告點(diǎn)擊率預(yù)測(cè)算法研究與實(shí)現(xiàn)
【學(xué)位單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP391.3
【部分圖文】:
的廣告的鏈接,最終被用戶發(fā)現(xiàn),消費(fèi)和分散了用戶如今互聯(lián)網(wǎng)中,最稀缺的資源就是用戶的注意力,就給廣告主等需求方提供一種購(gòu)買用戶注意力(流量)的告抵達(dá)用戶。在搜索引擎中,用戶輸入關(guān)鍵詞來(lái)進(jìn)了一定比例的流量。廣告主買斷一些關(guān)鍵詞,當(dāng)用有購(gòu)買該關(guān)鍵詞的廣告主進(jìn)行實(shí)時(shí)競(jìng)價(jià),從而獲得的核心關(guān)鍵技術(shù)之一就是廣告點(diǎn)擊率預(yù)測(cè),廣告點(diǎn)TR)的定義是用戶點(diǎn)擊該廣告的次數(shù) num_click 與用impression 的比值。公式如 2-1 下: 影響著投放廣告的順序,同時(shí)也影響著廣告的出價(jià)策詞“手機(jī)”時(shí),廣告主通過(guò)競(jìng)價(jià)買斷了關(guān)鍵詞“手機(jī)”,主投放的有關(guān)“手機(jī)”的廣告,平臺(tái)就會(huì)按照一定的廣告,如圖 2-1 所示:
圖 3- 1 Sigmoid 函數(shù)曲線圖數(shù)的輸出結(jié)果是介于(0,1)之間,中間值 c 是 0.5,則出 h(x)代表數(shù)據(jù)屬于某一類別的概率,對(duì)于輸入 x 率分別為 ( ) ( ), ( ) 中的極大似然估計(jì)方法去求損失函數(shù),概率函數(shù)如 ( ) ( ( ) ( ( ) 據(jù)獨(dú)立分布,聯(lián)合分布可表示為各個(gè)邊際分布的乘積 ( ) ∏ ( ( )| ( ) ( ) ∏ ( ( ) ( ) ( ( ) ( )凸函數(shù),由于凸函數(shù)的局部最小值等同于全局最小得到 3-6 式:
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文Fm 1(x) 為當(dāng)前的模型,模型通過(guò)經(jīng)驗(yàn)風(fēng)險(xiǎn)極小化來(lái)確定下一個(gè)弱分類器參數(shù)。具體到損失函數(shù)本身的選擇也就是 L 的選擇,有平方損失函數(shù),0-1 損函數(shù),對(duì)數(shù)損失函數(shù)等等。當(dāng)選擇平方損失函數(shù)時(shí),這個(gè)差值就是殘差。GBDT 幾乎適用于所有線性和非線性的回歸問題,同時(shí)也可以設(shè)置閾值解二分類問題,應(yīng)用范圍比較廣。GBDT 可以給邏輯斯蒂回歸模型訓(xùn)練,提高告點(diǎn)擊率。如圖 3-2 所示,輸入樣本 x,GBDT 模型得到兩顆樹 tree1 和 tree2,兩棵樹個(gè)葉子節(jié)點(diǎn)都是 LR 模型的一個(gè)維度特征,在求和每個(gè)葉子權(quán)重及時(shí) LR 模型分類結(jié)果。
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張明紅;佘廉;耿波;;基于情景的結(jié)構(gòu)化突發(fā)事件相似度研究[J];中國(guó)管理科學(xué);2017年01期
2 陳葉斐;張學(xué)軍;黃衛(wèi)東;;基于干擾相似度的多話題演化模型[J];電信科學(xué);2017年09期
3 任雪利;代余彪;;軟件相似度在成本估算中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用與軟件;2015年06期
4 譚明超;刁興春;曹建軍;馮徑;;一種基于函數(shù)依賴的屬性相似度調(diào)整算法[J];上海交通大學(xué)學(xué)報(bào);2015年08期
5 陳立鳳;;河馬找親戚[J];學(xué)生之友(童花果);2016年12期
6 周嫻莉;;十個(gè)中文流行語(yǔ)翻譯[J];初中生輔導(dǎo);2016年36期
7 杜碧涵;;母愛[J];少年月刊;2017年05期
8 張呈宇;;熱點(diǎn)話題相似度常用算法比較[J];好家長(zhǎng);2017年12期
9 仇麗青;陳卓艷;;基于共同鄰居相似度的社區(qū)發(fā)現(xiàn)算法[J];信息系統(tǒng)工程;2014年05期
10 詹雪艷;林兆洲;段天璇;李磊;喬延江;;色譜指紋圖譜相似度方法的適應(yīng)性研究[J];中國(guó)中醫(yī)藥信息雜志;2012年05期
相關(guān)會(huì)議論文 前10條
1 張乃岳;張學(xué)燕;;基于個(gè)體詞語(yǔ)相似度的定制化動(dòng)態(tài)信息檢索[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
2 李紅蓮;潘建軍;范京;;音節(jié)相似度及其在語(yǔ)音識(shí)別中的應(yīng)用[A];第十四屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2009)論文集[C];2009年
3 丁維龍;吳水生;陳琦;程志君;;基于樹形結(jié)構(gòu)相似度的植物種類識(shí)別系統(tǒng)[A];2013年中國(guó)智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第五分冊(cè))[C];2013年
4 董刊生;方金云;;基于向量距離的詞序相似度算法[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
5 郭瑛媚;史曉東;陳毅東;高燕;;基于詞的話題分布相似度的無(wú)監(jiān)督日文旅游意見詞翻譯[A];機(jī)器翻譯研究進(jìn)展——第七屆全國(guó)機(jī)器翻譯研討會(huì)論文集[C];2011年
6 王茜;張衛(wèi)星;;基于分類樹相似度加權(quán)的協(xié)同過(guò)濾算法[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年
7 Peng Ding;Xin Yan;Zhihong Liu;Jiewen Du;Yuehua Xu;Qiong Gu;Jun Xu;;TarExplorer:基于三維相似度的活性小分子尋靶平臺(tái)(英文)[A];中國(guó)化學(xué)會(huì)第30屆學(xué)術(shù)年會(huì)摘要集-第二十五分會(huì):化學(xué)信息學(xué)與化學(xué)計(jì)量學(xué)[C];2016年
8 劉曉平;陸勁挺;;任意功能樹的物元相似度求解方法[A];全國(guó)第21屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2010)暨全國(guó)第2屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2010年
9 劉海波;鄭德權(quán);趙鐵軍;;基于相似度線性加權(quán)方法的檢索結(jié)果聚類研究[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
10 羅辛;歐陽(yáng)元新;熊璋;袁滿;;通過(guò)相似度支持度優(yōu)化基于K近鄰的協(xié)同過(guò)濾算法[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯一[C];2010年
相關(guān)重要報(bào)紙文章 前10條
1 楊林;住宿按“相似度”分 體現(xiàn)學(xué)生視角[N];北京日?qǐng)?bào);2017年
2 證券時(shí)報(bào)記者 韓如冰;基金投資相似度趨高[N];證券時(shí)報(bào);2006年
3 本報(bào)記者 王斌 本報(bào)實(shí)習(xí)生 蒲曉磊;版權(quán)局官員:相似度極高的不受保護(hù)[N];法制日?qǐng)?bào);2012年
4 記者 李學(xué)梅;研究證實(shí):父親“偏愛”與自己相像的孩子[N];新華每日電訊;2009年
5 天相投資顧問公司 張新文;風(fēng)格穩(wěn)定基金業(yè)績(jī)更勝一籌[N];證券時(shí)報(bào);2007年
6 記者 劉妮;曾維會(huì)見日本新任駐沈總領(lǐng)事[N];沈陽(yáng)日?qǐng)?bào);2012年
7 小新;妊娠中毒癥與夫婦HLA基因相似度有關(guān)[N];中國(guó)醫(yī)藥報(bào);2007年
8 海潮;俄研究發(fā)現(xiàn)妊娠中毒癥疑與夫婦HLA基因相似度有關(guān)[N];中國(guó)醫(yī)藥報(bào);2007年
9 欒海;妊娠中毒癥可能與夫婦 HLA基因相似度有關(guān)[N];醫(yī)藥經(jīng)濟(jì)報(bào);2007年
10 海納;“娛樂”模仿的憂慮[N];河北日?qǐng)?bào);2013年
相關(guān)博士學(xué)位論文 前10條
1 王玉標(biāo);基于動(dòng)態(tài)信任建模的云服務(wù)可信性評(píng)估與選擇研究[D];重慶大學(xué);2018年
2 高欣健;多模態(tài)相似度學(xué)習(xí)方法研究[D];合肥工業(yè)大學(xué);2017年
3 夏云慶;IHSMTS系統(tǒng)中啟發(fā)式類比翻譯處理機(jī)制(HATM)的設(shè)計(jì)與實(shí)現(xiàn)[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2001年
4 武威;異質(zhì)數(shù)據(jù)相似度學(xué)習(xí)及其在網(wǎng)絡(luò)搜索中的應(yīng)用[D];北京大學(xué);2012年
5 張明西;信息網(wǎng)絡(luò)中的相似度搜索問題研究[D];復(fù)旦大學(xué);2013年
6 朱娜斐;基于RTT相似度的網(wǎng)絡(luò)延遲估測(cè)理論和方法[D];北京工業(yè)大學(xué);2012年
7 錢鵬飛;基于模糊相似度的異構(gòu)本體映射、合并及校驗(yàn)方法的研究[D];上海交通大學(xué);2008年
8 朱笑塵;異質(zhì)過(guò)程數(shù)據(jù)集成與修復(fù)[D];清華大學(xué);2015年
9 賈連印;內(nèi)存數(shù)據(jù)庫(kù)中集合相似度及集合包含問題的研究[D];華南理工大學(xué);2012年
10 崔曉蘭;面向在線抱怨自動(dòng)處理的推薦方法研究[D];華中科技大學(xué);2017年
相關(guān)碩士學(xué)位論文 前10條
1 呂如州;基于結(jié)構(gòu)元理論的模糊數(shù)相似度及應(yīng)用研究[D];遼寧工程技術(shù)大學(xué);2016年
2 夏雨;在線評(píng)論中產(chǎn)品特征提取與意見挖掘研究[D];武漢理工大學(xué);2016年
3 方敏;基于節(jié)點(diǎn)相似度的線要素匹配方法設(shè)計(jì)[D];北京建筑大學(xué);2018年
4 張學(xué)理;基于多因子標(biāo)簽相似度的標(biāo)簽聚類算法的研究[D];遼寧大學(xué);2018年
5 李凱翔;產(chǎn)科知識(shí)圖譜的構(gòu)建與研究[D];鄭州大學(xué);2018年
6 李超男;基于節(jié)點(diǎn)相似度的社會(huì)網(wǎng)絡(luò)社團(tuán)發(fā)現(xiàn)的算法研究[D];重慶師范大學(xué);2018年
7 花凌鋒;面向位置的移動(dòng)新聞推薦研究[D];安徽理工大學(xué);2018年
8 丁明珠;基于混合相似度指標(biāo)的社團(tuán)劃分算法研究[D];山東師范大學(xué);2018年
9 楊飛;基于LSTM的文本相似度識(shí)別方法研究[D];吉林大學(xué);2018年
10 常明;搜索廣告點(diǎn)擊率預(yù)測(cè)算法研究與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2018年
本文編號(hào):2814354
本文鏈接:http://www.lk138.cn/wenyilunwen/guanggaoshejilunwen/2814354.html