中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁(yè) > 社科論文 > 新聞傳播論文 >

基于SVM模型優(yōu)化的互聯(lián)網(wǎng)新聞自動(dòng)分類(lèi)研究

發(fā)布時(shí)間:2020-04-25 11:14
【摘要】:隨著科學(xué)技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)已在各行各業(yè)得到廣泛應(yīng)用。大數(shù)據(jù)時(shí)代的到來(lái)使人們?cè)讷@取信息資源的過(guò)程中,也會(huì)有大量干擾、不良的危害信息,網(wǎng)絡(luò)信息的恣意傳播很容易在獲取信息時(shí)出現(xiàn)低效率、信息誤導(dǎo)等情況。如何對(duì)互聯(lián)網(wǎng)新聞數(shù)據(jù)進(jìn)行準(zhǔn)確的分類(lèi)、提高信息的利用率成為了眾多科研人員的研究目標(biāo)。隨著人工智能和智能化平臺(tái)的發(fā)展,SVM研究又逐漸變熱,重新成為熱點(diǎn)。SVM在文本和圖像分類(lèi)等領(lǐng)域都有著較為顯著的成果。本文在分析總結(jié)新聞自動(dòng)分類(lèi)過(guò)程中的分詞,表示,降維,分類(lèi)以及結(jié)果判定的基礎(chǔ)上,著重對(duì)降維和分類(lèi)進(jìn)行了深入研究。本文主要研究?jī)?nèi)容如下:(1)針對(duì)互聯(lián)網(wǎng)新聞文本數(shù)據(jù)量大,冗余數(shù)據(jù)資源較多不便于使用者查找有效信息等問(wèn)題,做出以下改進(jìn):在數(shù)據(jù)預(yù)處理中,使用線性判別分析(LDA)可以讓映射后的樣本有最好的分類(lèi)性能。在LDA進(jìn)行特征降維之前,先使用單因素方差分析對(duì)每個(gè)屬性與類(lèi)別進(jìn)行相關(guān)度的分析,將不相關(guān)或者相關(guān)性較低的特征剔除,再使用LDA在線性變換上將原始數(shù)據(jù)映射到能夠較好區(qū)分特征與類(lèi)別的低維度上,實(shí)現(xiàn)數(shù)據(jù)降維。(2)為提高鯨魚(yú)優(yōu)化算法的收斂速度和尋優(yōu)精度,提出一種基于非線性收斂因子和局部擾動(dòng)的鯨魚(yú)優(yōu)化算法。算法首先引入非線性收斂因子,提高鯨魚(yú)種群的多樣性,擴(kuò)大鯨魚(yú)搜索食物的范圍。同時(shí)在鯨魚(yú)包圍捕食階段,采用一種局部擾動(dòng)策略,使算法在跳出局部極值時(shí)的能力增強(qiáng),提高算法的尋優(yōu)精度。實(shí)驗(yàn)結(jié)果表明,改進(jìn)后算法和粒子群算法、蝙蝠算法、基本鯨魚(yú)優(yōu)化算法相比,尋優(yōu)速度、收斂精度、算法穩(wěn)定性上都要優(yōu)于其他算法。(3)通過(guò)深入分析SVM的思想、原理和流程,針對(duì)基本SVM模型中存在的易發(fā)生分類(lèi)準(zhǔn)確率不高、參數(shù)優(yōu)化費(fèi)時(shí)等缺點(diǎn),做出以下改進(jìn):在SVM參數(shù)選取中,使用鯨魚(yú)優(yōu)化算法,快速找到全局最優(yōu)解,提高模型的分類(lèi)準(zhǔn)確率,改進(jìn)后的鯨魚(yú)優(yōu)化算法在模型參數(shù)優(yōu)化中效果更佳。并用互聯(lián)網(wǎng)新聞自動(dòng)分類(lèi)系統(tǒng)與優(yōu)化后的SVM模型結(jié)合,使互聯(lián)網(wǎng)新聞信息更清晰直觀的呈現(xiàn)給新聞?dòng)脩?不僅可以提升用戶獲取有效信息的效率,也可以提高用戶的使用興趣,減少冗余數(shù)據(jù)對(duì)用戶的干擾,實(shí)現(xiàn)本文的使用價(jià)值。
【圖文】:

數(shù)據(jù),圖邊,二維數(shù)據(jù),類(lèi)別


圖 2-2 兩類(lèi)數(shù)據(jù)投影視圖在上圖提供的兩種投影方式中,從直觀上可以看出,右圖比左圖的投影效果要圖的紅色和藍(lán)色數(shù)據(jù)較為集中,且類(lèi)別之間的距離明顯,而左圖邊緣處數(shù)據(jù)雜亂通過(guò)二維數(shù)據(jù)簡(jiǎn)要直觀的體現(xiàn)了 LDA 的基本思想,但是在實(shí)際應(yīng)用中,數(shù)據(jù)

視圖,數(shù)據(jù)分類(lèi),分類(lèi)方案


圖 2-3 兩類(lèi)數(shù)據(jù)分類(lèi)視圖 1上圖中的(a)是已有的數(shù)據(jù),紅色和藍(lán)色分別代表兩個(gè)不同的類(lèi)別。數(shù)據(jù)顯然是線性的,但是能把兩類(lèi)數(shù)據(jù)點(diǎn)分離的直線有多條。圖 2-3 中的(b)圖表示分類(lèi)方案 A,(c示分類(lèi)方案 B,,其中黑色實(shí)線被稱(chēng)之為分界線,專(zhuān)業(yè)術(shù)語(yǔ)也可叫做決策面。各個(gè)決
【學(xué)位授予單位】:河南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類(lèi)號(hào)】:G210.7;TP181;TP391.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 樊存佳;汪友生;邊航;;一種改進(jìn)的KNN文本分類(lèi)算法[J];國(guó)外電子測(cè)量技術(shù);2015年12期

2 魏峻;;基于蝙蝠算法的支持向量機(jī)參數(shù)優(yōu)化[J];寶雞文理學(xué)院學(xué)報(bào)(自然科學(xué)版);2015年03期

3 王瓊瑤;何友全;彭小玲;;基于改進(jìn)遺傳算法的支持向量機(jī)參數(shù)優(yōu)化方法[J];計(jì)算機(jī)與現(xiàn)代化;2015年03期

4 李鋒剛;梁鈺;GAO Xiao-zhi;ZENGER Kai;;基于LDA-wSVM模型的文本分類(lèi)研究[J];計(jì)算機(jī)應(yīng)用研究;2015年01期

5 薛春香;張玉芳;;面向新聞?lì)I(lǐng)域的中文文本分類(lèi)研究綜述[J];圖書(shū)情報(bào)工作;2013年14期

6 崔建明;劉建明;廖周宇;;基于SVM算法的文本分類(lèi)技術(shù)研究[J];計(jì)算機(jī)仿真;2013年02期

7 石丹丹;;網(wǎng)絡(luò)新聞的特點(diǎn)[J];才智;2013年04期

8 張琳;陳燕;李桃迎;牟向偉;;決策樹(shù)分類(lèi)算法研究[J];計(jì)算機(jī)工程;2011年13期

9 林永民;朱衛(wèi)東;;模糊kNN在文本分類(lèi)中的應(yīng)用研究[J];計(jì)算機(jī)應(yīng)用與軟件;2008年09期

10 邵浩然,張亮,馬范援;基于損失最小化的SVM多類(lèi)網(wǎng)頁(yè)分類(lèi)算法[J];計(jì)算機(jī)應(yīng)用與軟件;2005年07期

相關(guān)博士學(xué)位論文 前2條

1 曹杰;基于SVM的網(wǎng)絡(luò)流量特征降維與分類(lèi)方法研究[D];吉林大學(xué);2017年

2 李榮陸;文本分類(lèi)及其相關(guān)技術(shù)研究[D];復(fù)旦大學(xué);2005年

相關(guān)碩士學(xué)位論文 前3條

1 劉春雨;改進(jìn)的支持向量機(jī)的理論研究及應(yīng)用[D];西北農(nóng)林科技大學(xué);2016年

2 周濤麗;基于支持向量機(jī)的多分類(lèi)方法研究[D];電子科技大學(xué);2015年

3 劉海旭;基于PCA和LDA的文本分類(lèi)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2013年



本文編號(hào):2640186

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/xinwenchuanbolunwen/2640186.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c5ca1***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com