移動互聯(lián)網(wǎng)垃圾即時消息檢測算法研究
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1垃圾即時消息檢測流程圖
中南民族大學(xué)專業(yè)碩士學(xué)位論文基于樸素貝葉斯算法的垃圾即時消消息檢測總體設(shè)計學(xué)習(xí)算法的檢測方法通常分為兩個階段,一是構(gòu)造分建的分類器進(jìn)行檢測的測試階段。如圖2.1所示,即本分類器,主要包括構(gòu)建垃圾即時消息語料庫、預(yù)處練分類器等一系列步驟。對于待檢測的數(shù)據(jù)樣本,也和文本表示等操....
圖2.2正向最大匹配法分詞過程
9圖2.2正向最大匹配法分詞過程向最大匹配法對垃圾即時消息進(jìn)行分詞,得到表2.1分詞結(jié)果刷卡送好禮!即日起至11月20日,使用您名下任意中行付寶快捷支付消費任意一筆滿59元即可獲贈2萬積分(限千積分即可兌換星巴克任意大杯飲品,周日更享兌一送一刷卡送好禮....
圖2.3貝葉斯分類器設(shè)計流程圖
圖2.3貝葉斯分類器設(shè)計流程圖實現(xiàn)消息文本語料庫涉及個人隱私問題,目前還沒有一個公實驗數(shù)據(jù)是從網(wǎng)上搜集和移動手機(jī)終時消息,其中垃圾即時消息600條,分為騷擾類、廣告推銷類、違法類和詐消息和普通消息等。選取100條,正常消息100條共500條訓(xùn)練集和測試集,其中....
圖2.4貝葉斯分類器訓(xùn)練時長和分類時長對比圖
建貝葉斯分類器,首先提取出用于訓(xùn)練分類器的特征{,,...12Ttt要構(gòu)建訓(xùn)練集和測試集,對訓(xùn)練集中的特征進(jìn)行提取,本文以詞為算詞頻,選取權(quán)重較大的詞作為特征項集合;對于選定的所有特征每個特征項的特征值以及在各類即時消息文本訓(xùn)練集中出現(xiàn)的頻型庫,從而為分類器提供分類依據(jù)....
本文編號:3994904
本文鏈接:http://www.lk138.cn/kejilunwen/wltx/3994904.html