中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

搜索廣告點擊率預測算法研究與實現(xiàn)

發(fā)布時間:2020-09-08 15:50
   互聯(lián)網(wǎng)廣告主要分為搜索廣告、展示廣告等形式,而在這其中,搜索廣告是規(guī)模最大,增長最快的廣告投放方式。搜索廣告是依據(jù)用戶提供的查詢關鍵字對廣告進行投放,是最了解用戶搜索意圖的廣告投放形式。搜索廣告最關鍵的技術(shù)是廣告點擊率的預測,廣告點擊率預測就是預測分析用戶行為對投放的廣告的點擊率,廣告點擊率關系著廣告投放的排序和廣告點擊收費等因素,因此研究廣告點擊率對整個搜索廣告收入提高有著至關重要的意義。搜索廣告利用搜索引擎的技術(shù),分析用戶輸入的查詢意圖,提取相應的關鍵詞,根據(jù)提取到的關鍵詞,進行語義相關度計算,從廣告庫中進行索引,給出相應符合用戶需求的廣告檢索結(jié)果。當搜索引擎等平臺提供的檢索排序候選結(jié)果中的廣告,與用戶輸入的關鍵詞等相關性越高,用戶越感興趣,點擊的行為可能性越高,相應的廣告點擊率越高,廣告收入越高。本文的主要研究和實現(xiàn)內(nèi)容安排如下:(1)首先對數(shù)據(jù)集進行清洗和預處理,統(tǒng)計數(shù)據(jù)信息,提取淺層的特征,并采用常見的機器學習方法進行特征工程。邏輯斯蒂回歸模型作為基線方法,將預測的點擊率問題作為分類問題,在采用傳統(tǒng)機器學習方法中,使用GBDT模型與邏輯斯蒂回歸模型融合的方案,對特征組合,進一步深入挖掘影響點擊率的因素,提高模型的非線性學習能力。對于數(shù)據(jù)集中出現(xiàn)的數(shù)據(jù)稀疏和缺失問題,采用近幾年在各種比賽中效果比較好的因子分解機FM算法,與基線方法比較優(yōu)化結(jié)果。(2)搜索廣告中的用戶查詢請求與廣告標題之間的相似度對點擊率有至關重要的作用,本文首先采用卷積神經(jīng)網(wǎng)絡模型來提取深層次的相似度特征,并將其與人工挖掘到的特征相結(jié)合,共同輸入到點擊率的預測模型中,得到實驗結(jié)果,實現(xiàn)效果提升。(3)循環(huán)神經(jīng)網(wǎng)絡更適合處理序列數(shù)據(jù),因此本文也研究了基于循環(huán)神經(jīng)網(wǎng)絡的相似度的特征提取。實驗分析對比不同類型循環(huán)神經(jīng)網(wǎng)絡模型的實驗結(jié)果,如長短期記憶單元網(wǎng)絡,門控循環(huán)單元網(wǎng)絡,及相應的雙向網(wǎng)絡形式等,并結(jié)合靜態(tài)注意力和動態(tài)注意力機制比較實驗結(jié)果,提取最好的相似度特征,從而優(yōu)化最終的點擊率預測結(jié)果。
【學位單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:TP391.3
【部分圖文】:

廣告,關鍵詞,用戶輸入,廣告主


的廣告的鏈接,最終被用戶發(fā)現(xiàn),消費和分散了用戶如今互聯(lián)網(wǎng)中,最稀缺的資源就是用戶的注意力,就給廣告主等需求方提供一種購買用戶注意力(流量)的告抵達用戶。在搜索引擎中,用戶輸入關鍵詞來進了一定比例的流量。廣告主買斷一些關鍵詞,當用有購買該關鍵詞的廣告主進行實時競價,從而獲得的核心關鍵技術(shù)之一就是廣告點擊率預測,廣告點TR)的定義是用戶點擊該廣告的次數(shù) num_click 與用impression 的比值。公式如 2-1 下: 影響著投放廣告的順序,同時也影響著廣告的出價策詞“手機”時,廣告主通過競價買斷了關鍵詞“手機”,主投放的有關“手機”的廣告,平臺就會按照一定的廣告,如圖 2-1 所示:

函數(shù)曲線圖,凸函數(shù),極大似然估計方法,邊際分布


圖 3- 1 Sigmoid 函數(shù)曲線圖數(shù)的輸出結(jié)果是介于(0,1)之間,中間值 c 是 0.5,則出 h(x)代表數(shù)據(jù)屬于某一類別的概率,對于輸入 x 率分別為 ( ) ( ), ( ) 中的極大似然估計方法去求損失函數(shù),概率函數(shù)如 ( ) ( ( ) ( ( ) 據(jù)獨立分布,聯(lián)合分布可表示為各個邊際分布的乘積 ( ) ∏ ( ( )| ( ) ( ) ∏ ( ( ) ( ) ( ( ) ( )凸函數(shù),由于凸函數(shù)的局部最小值等同于全局最小得到 3-6 式:

點擊率,長尾分布,廣告,特征提取


哈爾濱工業(yè)大學工程碩士學位論文Fm 1(x) 為當前的模型,模型通過經(jīng)驗風險極小化來確定下一個弱分類器參數(shù)。具體到損失函數(shù)本身的選擇也就是 L 的選擇,有平方損失函數(shù),0-1 損函數(shù),對數(shù)損失函數(shù)等等。當選擇平方損失函數(shù)時,這個差值就是殘差。GBDT 幾乎適用于所有線性和非線性的回歸問題,同時也可以設置閾值解二分類問題,應用范圍比較廣。GBDT 可以給邏輯斯蒂回歸模型訓練,提高告點擊率。如圖 3-2 所示,輸入樣本 x,GBDT 模型得到兩顆樹 tree1 和 tree2,兩棵樹個葉子節(jié)點都是 LR 模型的一個維度特征,在求和每個葉子權(quán)重及時 LR 模型分類結(jié)果。

【相似文獻】

相關期刊論文 前10條

1 張明紅;佘廉;耿波;;基于情景的結(jié)構(gòu)化突發(fā)事件相似度研究[J];中國管理科學;2017年01期

2 陳葉斐;張學軍;黃衛(wèi)東;;基于干擾相似度的多話題演化模型[J];電信科學;2017年09期

3 任雪利;代余彪;;軟件相似度在成本估算中的應用[J];計算機應用與軟件;2015年06期

4 譚明超;刁興春;曹建軍;馮徑;;一種基于函數(shù)依賴的屬性相似度調(diào)整算法[J];上海交通大學學報;2015年08期

5 陳立鳳;;河馬找親戚[J];學生之友(童花果);2016年12期

6 周嫻莉;;十個中文流行語翻譯[J];初中生輔導;2016年36期

7 杜碧涵;;母愛[J];少年月刊;2017年05期

8 張呈宇;;熱點話題相似度常用算法比較[J];好家長;2017年12期

9 仇麗青;陳卓艷;;基于共同鄰居相似度的社區(qū)發(fā)現(xiàn)算法[J];信息系統(tǒng)工程;2014年05期

10 詹雪艷;林兆洲;段天璇;李磊;喬延江;;色譜指紋圖譜相似度方法的適應性研究[J];中國中醫(yī)藥信息雜志;2012年05期

相關會議論文 前10條

1 張乃岳;張學燕;;基于個體詞語相似度的定制化動態(tài)信息檢索[A];第四屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集(上)[C];2008年

2 李紅蓮;潘建軍;范京;;音節(jié)相似度及其在語音識別中的應用[A];第十四屆全國信號處理學術(shù)年會(CCSP-2009)論文集[C];2009年

3 丁維龍;吳水生;陳琦;程志君;;基于樹形結(jié)構(gòu)相似度的植物種類識別系統(tǒng)[A];2013年中國智能自動化學術(shù)會議論文集(第五分冊)[C];2013年

4 董刊生;方金云;;基于向量距離的詞序相似度算法[A];第四屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集(上)[C];2008年

5 郭瑛媚;史曉東;陳毅東;高燕;;基于詞的話題分布相似度的無監(jiān)督日文旅游意見詞翻譯[A];機器翻譯研究進展——第七屆全國機器翻譯研討會論文集[C];2011年

6 王茜;張衛(wèi)星;;基于分類樹相似度加權(quán)的協(xié)同過濾算法[A];2008年計算機應用技術(shù)交流會論文集[C];2008年

7 Peng Ding;Xin Yan;Zhihong Liu;Jiewen Du;Yuehua Xu;Qiong Gu;Jun Xu;;TarExplorer:基于三維相似度的活性小分子尋靶平臺(英文)[A];中國化學會第30屆學術(shù)年會摘要集-第二十五分會:化學信息學與化學計量學[C];2016年

8 劉曉平;陸勁挺;;任意功能樹的物元相似度求解方法[A];全國第21屆計算機技術(shù)與應用學術(shù)會議(CACIS·2010)暨全國第2屆安全關鍵技術(shù)與應用學術(shù)會議論文集[C];2010年

9 劉海波;鄭德權(quán);趙鐵軍;;基于相似度線性加權(quán)方法的檢索結(jié)果聚類研究[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年

10 羅辛;歐陽元新;熊璋;袁滿;;通過相似度支持度優(yōu)化基于K近鄰的協(xié)同過濾算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學術(shù)會議論文集A輯一[C];2010年

相關重要報紙文章 前10條

1 楊林;住宿按“相似度”分 體現(xiàn)學生視角[N];北京日報;2017年

2 證券時報記者  韓如冰;基金投資相似度趨高[N];證券時報;2006年

3 本報記者 王斌 本報實習生 蒲曉磊;版權(quán)局官員:相似度極高的不受保護[N];法制日報;2012年

4 記者 李學梅;研究證實:父親“偏愛”與自己相像的孩子[N];新華每日電訊;2009年

5 天相投資顧問公司 張新文;風格穩(wěn)定基金業(yè)績更勝一籌[N];證券時報;2007年

6 記者 劉妮;曾維會見日本新任駐沈總領事[N];沈陽日報;2012年

7 小新;妊娠中毒癥與夫婦HLA基因相似度有關[N];中國醫(yī)藥報;2007年

8 海潮;俄研究發(fā)現(xiàn)妊娠中毒癥疑與夫婦HLA基因相似度有關[N];中國醫(yī)藥報;2007年

9 欒海;妊娠中毒癥可能與夫婦 HLA基因相似度有關[N];醫(yī)藥經(jīng)濟報;2007年

10 海納;“娛樂”模仿的憂慮[N];河北日報;2013年

相關博士學位論文 前10條

1 王玉標;基于動態(tài)信任建模的云服務可信性評估與選擇研究[D];重慶大學;2018年

2 高欣健;多模態(tài)相似度學習方法研究[D];合肥工業(yè)大學;2017年

3 夏云慶;IHSMTS系統(tǒng)中啟發(fā)式類比翻譯處理機制(HATM)的設計與實現(xiàn)[D];中國科學院研究生院(計算技術(shù)研究所);2001年

4 武威;異質(zhì)數(shù)據(jù)相似度學習及其在網(wǎng)絡搜索中的應用[D];北京大學;2012年

5 張明西;信息網(wǎng)絡中的相似度搜索問題研究[D];復旦大學;2013年

6 朱娜斐;基于RTT相似度的網(wǎng)絡延遲估測理論和方法[D];北京工業(yè)大學;2012年

7 錢鵬飛;基于模糊相似度的異構(gòu)本體映射、合并及校驗方法的研究[D];上海交通大學;2008年

8 朱笑塵;異質(zhì)過程數(shù)據(jù)集成與修復[D];清華大學;2015年

9 賈連印;內(nèi)存數(shù)據(jù)庫中集合相似度及集合包含問題的研究[D];華南理工大學;2012年

10 崔曉蘭;面向在線抱怨自動處理的推薦方法研究[D];華中科技大學;2017年

相關碩士學位論文 前10條

1 呂如州;基于結(jié)構(gòu)元理論的模糊數(shù)相似度及應用研究[D];遼寧工程技術(shù)大學;2016年

2 夏雨;在線評論中產(chǎn)品特征提取與意見挖掘研究[D];武漢理工大學;2016年

3 方敏;基于節(jié)點相似度的線要素匹配方法設計[D];北京建筑大學;2018年

4 張學理;基于多因子標簽相似度的標簽聚類算法的研究[D];遼寧大學;2018年

5 李凱翔;產(chǎn)科知識圖譜的構(gòu)建與研究[D];鄭州大學;2018年

6 李超男;基于節(jié)點相似度的社會網(wǎng)絡社團發(fā)現(xiàn)的算法研究[D];重慶師范大學;2018年

7 花凌鋒;面向位置的移動新聞推薦研究[D];安徽理工大學;2018年

8 丁明珠;基于混合相似度指標的社團劃分算法研究[D];山東師范大學;2018年

9 楊飛;基于LSTM的文本相似度識別方法研究[D];吉林大學;2018年

10 常明;搜索廣告點擊率預測算法研究與實現(xiàn)[D];哈爾濱工業(yè)大學;2018年



本文編號:2814354

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/wenyilunwen/guanggaoshejilunwen/2814354.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d5f52***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com