基于深度學習的跨語言文本情感分類技術研究
發(fā)布時間:2024-12-21 07:50
隨著互聯網技術的飛速發(fā)展,人們越來越熱衷于在網上發(fā)表自己對某一事件或者事物的看法,這些評論背后隱藏著巨大的商業(yè)價值,所以近年來文本情感分析越來越引起人們的關注。但是一些語言較其他語言起步晚,缺乏高質量的語料資源,人工標注又需要投入巨大的人力物力資源,這在一定程度上阻礙了其文本情感分類技術的研究?缯Z言文本情感分類任務就是利用語料資源豐富的一種語言,輔助另一種語料資源匱乏的語言實現文本情感分類。為了進一步提高跨語言文本情感的分類性能,本文做了多方面的融合和改進,提出了以下跨語言文本情感分類方法:(1)針對傳統(tǒng)的單語言詞向量表示方法不能很好地進行雙語交互學習這一問題,提出了一種對抗長短時記憶網絡的跨語言文本情感分類方法。該方法設置源語言和目標語言獨立的特征提取網絡以及雙語共享特征提取網絡,建立源語言和目標語言的聯系,減少雙語之間的語義鴻溝。同時,在共享特征提取網絡中,設置語言分類器進行對抗訓練,使分類器盡可能分不清特征是來自源語言還是目標語言,以獲得雙語的不變特征,從而使雙語之間達到更好的知識遷移效果。相比較之前的研究方法,這種方法既保留了雙語各自獨立的特征,又可以獲取到雙語的不變特征。在N...
【文章頁數】:66 頁
【學位級別】:碩士
【部分圖文】:
本文編號:4018653
【文章頁數】:66 頁
【學位級別】:碩士
【部分圖文】:
圖2.1支持向量與間隔
支持向量機的應用很廣泛,應用的領域不同,優(yōu)化的方法也不盡相同。根據實際所研究的內容,將該方法與實際任務結合,許多學者還在不斷的進行著相應的探索[51][52]。2.2.2.2樸素貝葉斯
圖2.2 LSTM單元結構
為了應對這個問題,研究人員提出了許多解決辦法[66][67]。而長短時記憶網絡就是其中比較著名且應用最廣泛的一種,長短時記憶算法最早由Hochreiter于1997年提出[68]。LSTM通過增加門機制以及記憶單元,使得自循環(huán)的權重在訓練期間不斷變化,從而有效地解決了上述問題。L....
圖3.1 Encoder-Decoder模型結構圖
若給定源語句source=(x1,x2,...,xm),則編碼器Encoder會對源語句進行編碼。然后,通過非線性變化轉化為中間語義表示C=F(x1,x2,...,xm)。解碼器Decoder根據源語句的中間語義表示C和之前已經生成的歷史信息y1,y2,...yi-1生成i時刻要....
圖3.2加入Attention機制的Encoder-Decoder模型結構圖
其中,表示輸入對輸出的概率,其代表的信息越重要,分配的權重相應的也會越大。這種對輸入進行選擇性的學習的做法,避免了大量繁復盲目的學習,提高了模型的學習效率和準確率。3.2.2跨語言文本特征提取網絡
本文編號:4018653
本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/4018653.html