基于神經(jīng)網(wǎng)絡(luò)的中文文本情感分類及其在輿情分析中的應(yīng)用
【文章頁數(shù)】:92 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3.9各類情感文本數(shù)量占比可以發(fā)現(xiàn),數(shù)據(jù)集中不同情感類型的文本比例差異很大
據(jù)集共包含了8類情感,每類情感對(duì)應(yīng)的文本數(shù)量在所有數(shù)據(jù)中所占比例如圖3.9所示。圖3.9各類情感文本數(shù)量占比可以發(fā)現(xiàn),數(shù)據(jù)集中不同情感類型的文本比例差異很大。其中,無明顯情感極性的文本占了全部文本數(shù)量的67.93%,而“恐懼”這個(gè)類別只占了全部文本數(shù)量中的0.6%。當(dāng)....
圖3.10網(wǎng)絡(luò)訓(xùn)練過程損失圖
進(jìn)一步,在接下來的實(shí)驗(yàn)中,本文將網(wǎng)絡(luò)末層全連接層的L2正則化系數(shù)設(shè)置為0.2。圖3.10網(wǎng)絡(luò)訓(xùn)練過程損失圖44
圖3.11交叉熵?fù)p失和多級(jí)情感分類損失的混淆矩陣
這樣會(huì)降低情感分類的準(zhǔn)確率。同時(shí),通過引入多級(jí)情感分類損失,使得正向和負(fù)向之間區(qū)分度更高,也使得最終的情感分類結(jié)果更加準(zhǔn)確。圖3.11交叉熵?fù)p失和多級(jí)情感分類損失的混淆矩陣3.4本章小結(jié)文本中包含的情感信息能夠通過不同層次的內(nèi)容進(jìn)行傳遞,文本中的詞語、短語和句子都能夠從不同層....
圖5.2微博爬蟲界面
本文從新浪微博抓取了2017年上半年關(guān)于“一帶一路”的微博,同時(shí)作為接下來分析的語料庫。圖5.2微博爬蟲界面5.2實(shí)驗(yàn)設(shè)計(jì)本節(jié)通過對(duì)微博平臺(tái)上“一帶一路”的相關(guān)內(nèi)容進(jìn)行分析,從而驗(yàn)證本文方法的效果。“一帶一路”是“絲綢之路經(jīng)濟(jì)帶”和“21世紀(jì)海上絲綢之路”的簡稱,是中....
本文編號(hào):4020201
本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/4020201.html