互聯(lián)網(wǎng)違規(guī)廣告監(jiān)測(cè)系統(tǒng)的設(shè)計(jì)與開發(fā)
【文章頁數(shù)】:90 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-1廣告年收入Figure1-1Annualadvertisingrevenue
圖1-1廣告年收入Figure1-1Annualadvertisingrevenue1.2國(guó)內(nèi)外研究現(xiàn)狀(Researchstatusathomeandabroad)廣告監(jiān)測(cè)對(duì)于監(jiān)管機(jī)關(guān)來說是重要的日常工作內(nèi)容,但廣告監(jiān)測(cè)系統(tǒng)通過發(fā)現(xiàn)違規(guī)廣告信息[1],分析廣....
圖4-5詞庫效果圖
工程碩士專業(yè)學(xué)位論文于詞匯的數(shù)量太少,有些相關(guān)聯(lián)性的詞無法判別,所以識(shí)別精度還是不穩(wěn)使用相似度的方法去擴(kuò)展詞庫時(shí),由于訓(xùn)練語料庫的規(guī)模比較少,在詞匯的中會(huì)摻雜許多噪音,降低了識(shí)別的精度。隨著語料庫的不斷增大,通過語義去計(jì)算相似度去擴(kuò)展詞庫,詞庫的準(zhǔn)確性有了明顯的提高,識(shí)別廣告的精....
圖5-14數(shù)據(jù)爬取代碼圖
工程碩士專業(yè)學(xué)位論文集模塊的實(shí)現(xiàn)(Implementationofsystemac集模塊,用戶根據(jù)自己設(shè)定的網(wǎng)址以及采集頻率,系統(tǒng)根互聯(lián)網(wǎng)廣告進(jìn)行爬去,然后對(duì)采集的信息去除噪聲以及對(duì)義的信息進(jìn)行預(yù)處理,最終達(dá)到采集的效果。er.col....
圖5-15數(shù)據(jù)爬取結(jié)果圖
式;com.zm.crawler.scheduler設(shè)置了調(diào)度類,以及保存采集到的隊(duì)列和未被采集到的隊(duì)列;com.zm.crawler.thread包中存放著線性池,可以得到正在執(zhí)行線程的數(shù)量,線程的大小等信息;com.zm.crawler.weixin.*中存放微信公眾號(hào)等....
本文編號(hào):3995584
本文鏈接:http://www.lk138.cn/jingjilunwen/guojimaoyilunwen/3995584.html
下一篇:沒有了