中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當前位置:主頁 > 經濟論文 > 股票論文 >

基于LSTM和社交媒體文本信息的股票趨勢預測研究

發(fā)布時間:2020-09-28 13:58
   隨著中國市場經濟的發(fā)展,證券市場在國民經濟中的占據著越來越重要的地位,股票趨勢預測也被越來越多的研究者關注。傳統(tǒng)的預測模型受技術限制,多數圍繞股票的歷史數據本身展開,通過對股票歷史數據進行建模,探究其潛在規(guī)律從而達到對股價未來趨勢的變化預測的目的。然而這類預測方式并未考慮到其他會對股價產生影響的因素,如市場的宏觀調控、公司的經營狀況等。實際生活中,投資者在做出決定時并非完全理性,會受到社交媒體、新聞等影響,而當市場中大量投資者的對某一股票的進行買賣交易等行為時,這些信息也會對該股票價格產生影響,引起股市的變動。基于這一現(xiàn)象本文建立了一種基于LSTM和社交媒體文本信息的股票趨勢預測模型,使用LSTM和自注意力機制對文本信息特征進行提取,與股票歷史數據信息特征進行結合,以此來對股票趨勢進行預測,該模型可顯著提升股票短期預測模型的準確率。首先,本文構建了基于LSTM的股票趨勢預測模型,該模型利用了LSTM模型便于處理時序數據的特點同時在此模型的基礎上加入基本的社交媒體文本信息特征,以此來提高模型預測性能。LSTM模型是循環(huán)神經網絡的一種,通過改良內部結構,解決了傳統(tǒng)循環(huán)神經網絡出現(xiàn)的梯度消失的問題。實驗表明,LSTM模型可以有效的學習到股票歷史數據中時序信息,在預測準確率方面高于傳統(tǒng)的時間序列模型。針對傳統(tǒng)股票趨勢預測模型中忽略社交媒體文本信息對股價變化的影響,本文在預測模型的輸入層面加入社交媒體文本信息特征。本文利用TF-IDF和Weighted Removal的方法提取文本特征信息,將文本特征信息與股票歷史數據特征相結合,構建融合基本社交媒體文本信息的LSTM股票趨勢預測模型,實驗表明與基于LSTM的股票預測模型相比,該模型在準確率方面有進一步提升。然后,融合基本社交媒體文本信息的預測模型采用對帖子向量簡單平均的方法得到文本信息特征,忽略了帖子時間順序的信息,導致對社交媒體文本信息提取不夠充分。針對這一問題,通過對文本信息提取方式的改進和信息源種類的增加,構建基于LSTM和深度社交媒體文本信息的預測模型。采用基于LSTM和自注意力機制模型提取社交媒體文本信息特征。先將帖子向量輸入雙向LSTM模型,在LSTM模型的隱藏狀態(tài)層引入注意力機制,進一步分析與獲取不同帖子對于最終預測的不同貢獻程度。通過實驗證明,融合深度社交媒體文本信息的股票趨勢預測模型與融合基本社交媒體文本信息的LSTM股票趨勢預測模型相比,在預測準確率上有顯著的提升。在輸入數據源層面,增加基本面數據,構建了基于多種信息源的LSTM預測模型。通過實驗對比,改進模型預測準確率有進一步提升,證明了在一定程度下,增加數據源可以提升預測模型的性能。
【學位單位】:華中師范大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:TP391.1;F830.91
【部分圖文】:

感知機,表示圖,神經網絡,多層感知機


2.2.1多層感知機逡逑多層感知機(MLP)是人工神經網絡的一種[4°],是由感知機模型推廣而來。感知逡逑機(PLA)模型是一種二分類的線性分類模型,感知機的神經網絡表示如圖2.1所逡逑示:逡逑?邐二邐?邋f邋邐?Output逡逑圖2.邋1感知機神經網絡表示圖逡逑感知機模型的將實力特征向量作為輸入,類別為輸出。感知機模型通過尋找將逡逑數據劃分的分離超平面完成分類,所以感知機模型可以用來解決線性可分的二分類逡逑的問題,即將樣本分為丨+1,-1}兩類。分離超平面方程為:逡逑w邋■邋x邋+邋b邋=邋0逡逑由輸入空間到輸出空間的函數:逡逑f{x)邋=邋sign邋(w邋■邋x邋+邋b)逡逑其中,W和6為感知機模型的參數,we邋叫作權值(weight),邋be尺叫作逡逑偏置,sign表示符號函數,即逡逑sign(x)邋=邋\+1,邋X ̄°逡逑v一1,x邋<邋0逡逑多層感知機模型相較于感知機模型

多層感知機,模型,隱層,分離超平面


2.2.1多層感知機逡逑多層感知機(MLP)是人工神經網絡的一種[4°],是由感知機模型推廣而來。感知逡逑機(PLA)模型是一種二分類的線性分類模型,感知機的神經網絡表示如圖2.1所逡逑示:逡逑?邐二邐?邋f邋邐?Output逡逑圖2.邋1感知機神經網絡表示圖逡逑感知機模型的將實力特征向量作為輸入,類別為輸出。感知機模型通過尋找將逡逑數據劃分的分離超平面完成分類,所以感知機模型可以用來解決線性可分的二分類逡逑的問題,即將樣本分為丨+1,-1}兩類。分離超平面方程為:逡逑w邋■邋x邋+邋b邋=邋0逡逑由輸入空間到輸出空間的函數:逡逑f{x)邋=邋sign邋(w邋■邋x邋+邋b)逡逑其中,W和6為感知機模型的參數,we邋叫作權值(weight),邋be尺叫作逡逑偏置,sign表示符號函數,即逡逑sign(x)邋=邋\+1,邋X ̄°逡逑v一1,x邋<邋0逡逑多層感知機模型相較于感知機模型

內部結構


中xt表示在t時刻的訓練樣本的輸入;ht代表在t時刻,模型的隱藏狀態(tài);和;Cm共同決定:逡逑ht邋=邋f{UXt邋+邋WhtJ逡逑、W和V是模型相關的線性關系參數,這些參數在隱層中是相互共享的。逡逑在t時刻模型的輸出;化與模型的當前隱藏狀態(tài)\有關:逡逑ot邋—邋Vhl邋+邋c逡逑t時刻模型的損失函數;yt代表t時刻訓練樣本序列的真實輸出。逡逑常用反向傳播算法(BPTT)對循環(huán)神經網絡模型(RNN)進行訓練,調整算法的本質是BP算法,因為RNN處理時間序列的數據,所以需要基于播。BPTT算法的中心思想與BP算法相同,即沿著需要優(yōu)化參數的福梯尋找更優(yōu)點,直至模型收斂。逡逑長短期記憶神經網絡逡逑期記憶神經網絡(LSTM)很好的解決了長期以來問題,能夠記住長期的。1996

【參考文獻】

相關期刊論文 前4條

1 黃潤鵬;左文明;畢凌燕;;基于微博情緒信息的股票市場預測[J];管理工程學報;2015年01期

2 張美英;何杰;;時間序列預測模型研究綜述[J];數學的實踐與認識;2011年18期

3 周廣旭;一種新的時間序列分析算法及其在股票預測中的應用[J];計算機應用;2005年09期

4 胡桔州,蘭秋軍;金融時間序列的數據挖掘技術與經典統(tǒng)計模型的比較[J];系統(tǒng)工程;2005年06期

相關碩士學位論文 前3條

1 胡新辰;基于LSTM的語義關系分類研究[D];哈爾濱工業(yè)大學;2015年

2 尤作軍;時間序列分析在股票中的研究與應用[D];沈陽工業(yè)大學;2014年

3 王洋;基于時間序列分析的IP語音收入預測[D];吉林大學;2004年



本文編號:2828878

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/jingjilunwen/jinrongzhengquanlunwen/2828878.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶618f4***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com