文本與財務數(shù)據(jù)相結(jié)合的上市公司財務風險預測
【學位單位】:江西財經(jīng)大學
【學位級別】:碩士
【學位年份】:2020
【中圖分類】:F832.51;F275
【部分圖文】:
文本與財務數(shù)據(jù)相結(jié)合的上市公司財務風險預測2十二大章節(jié)構(gòu)成。如圖1-1所示。圖1-1年報構(gòu)成年報中較為重要的章節(jié)有“第二節(jié)公司簡介和主要財務指標”、“第四節(jié)經(jīng)營情況討論與分析”、“第五節(jié)重要事項”、“第十一節(jié)財務報告”等幾大章節(jié)。其中“第二節(jié)公司簡介和主要財務指標”主要是公司過去一年的財務報表數(shù)據(jù)的披露,用數(shù)據(jù)反映了過去一年公司的財務經(jīng)營狀況!暗谒墓(jié)經(jīng)營情況討論與分析”主要分析上市公司的經(jīng)營情況、經(jīng)營模式以及經(jīng)營策略等,是對過去一年經(jīng)營情況整體情況的匯報總結(jié),以及對未來經(jīng)營方向等方面的一個概述!暗谖骞(jié)重要事項”主要是反映過去一年上市公司需要特殊說明的事項,主要包括:重大訴訟,公司、公司董事以及高級管理人員受處罰情況,股東變更,
文本與財務數(shù)據(jù)相結(jié)合的上市公司財務風險預測102.1.1支持向量機支持向量機(SVM)模型是一種針對帶標簽數(shù)據(jù)集可以被線性分開所提出的分類模型,即對已有類別標簽的數(shù)據(jù)進行二分類監(jiān)督學習(supervisedlearning)的廣義線性分類器(generalizedlinearclassifier),其算法原理是依據(jù)有類別標簽的數(shù)據(jù)集來求解最大邊距超平面(maximum-marginhyperplane),從而以超平面為分割線,確立不同類別的有效區(qū)域。SVM分類中的其主要困難是確定能夠正確劃分帶分類標簽數(shù)據(jù)的幾何分離超平面。分類的準確率高低以及模型的好壞,取決于超平面的優(yōu)劣。如下圖2-1所示。圖2-1超平面劃分圖例如,假定現(xiàn)有數(shù)據(jù)集D={(1,1),(2,2),(31,3),…,(,)},∈{-1,1},我們希望能在樣本空間找一個很好的區(qū)分平面,但是能將樣本區(qū)分的超平面并不是唯一的,如圖2-1所示,P1、P2、P3都能區(qū)分樣本。那么應該取哪個呢?直觀的看,應該尋找位于兩類帶標簽樣本“正中間”的劃分超平面。即P2,因為P2對樣本數(shù)據(jù)局部擾動的“容忍性”最好。例如,當訓練數(shù)據(jù)擁有噪聲時,P2所受的干擾最小,因為它距離超平面兩邊的樣例的距離都相對較遠。換句話說,P2所產(chǎn)生的分類結(jié)果是最好的。對未出現(xiàn)在訓練集中的數(shù)據(jù)的泛化能力最強。在樣本空間,劃分樣本數(shù)據(jù)的超平面可以通過下列線性方程描述:+=0(2.1)
第二章相關理論與技術(shù)簡介11其中=(1;2;3;…;)為法向量,決定了超平面的方向。為位移項,決定了超平面與原點的距離。很顯然,超平面可以由法向量與位移項確定。我們將超平面記為(,),則樣本空間里面的樣本點到超平面(,)的距離可以有計算出來,即:=|+|‖‖(2.2)假設超平面(,)能將訓練數(shù)據(jù)集進行正確分類,即對于(,)∈D,若=+1,則有+>0,若=-1,則有+<0,即:{+≥+1,=+1+≤1,=1(2.3)如圖2-2所示,距離超平面最近的一些訓練數(shù)據(jù)點使式(2.3)等號成立。這些訓練樣本點被稱為“支持向量”(supportvector),兩個不同類別的支持向量到超平面的距離之和為:=2‖‖(2.4)公式(2.4)被稱為“間隔”(margin)。圖2-2支持向量的定義SVM模型就是想要去在數(shù)據(jù)空間中找出是所有數(shù)據(jù)能“最大間隔”的超平面(,),換句話說就是要找出能滿足式子(2.3)中的兩大約束條件和,使
【參考文獻】
相關期刊論文 前5條
1 蔡秋童;何宗祥;;企業(yè)財務數(shù)據(jù)的決策模型分析[J];安徽師范大學學報(自然科學版);2015年05期
2 謝德仁;林樂;;管理層語調(diào)能預示公司未來業(yè)績嗎?——基于我國上市公司年度業(yè)績說明會的文本分析[J];會計研究;2015年02期
3 劉丹;郭蕾;;A汽車股份有限公司財務報表分析[J];現(xiàn)代經(jīng)濟信息;2015年03期
4 李建平;李剛;豐吉闖;李銘祿;;證券公司整體風險的度量方法與實證[J];系統(tǒng)工程理論與實踐;2012年03期
5 包媚嬌;;新準則下長期資產(chǎn)減值不得轉(zhuǎn)回對ST公司的影響初探[J];現(xiàn)代經(jīng)濟(現(xiàn)代物業(yè)下半月刊);2008年11期
相關博士學位論文 前1條
1 劉赫;文本分類中若干問題研究[D];吉林大學;2009年
相關碩士學位論文 前10條
1 戴偉達;基于全卷積神經(jīng)網(wǎng)絡的語義分割算法研究[D];南京郵電大學;2019年
2 王霄;基于SVM的滬深300指數(shù)量化擇時策略實證研究[D];蘭州大學;2019年
3 王靜;上市交通運輸企業(yè)財務風險預測研究[D];中國民航大學;2019年
4 馬旭輝;基于機器學習的上市公司財務風險智能識別研究[D];南京大學;2019年
5 葛丹妮;基于注意力機制的特征選擇:一種面向海量復雜數(shù)據(jù)的高效架構(gòu)[D];浙江理工大學;2019年
6 賀琳;基于PCA-BP和SVM的上市公司財務風險預測研究[D];西安工程大學;2018年
7 劉陽;基于SVM的信息服務業(yè)上市公司財務風險預測研究[D];華中師范大學;2017年
8 馮珍慧;基于粒子群優(yōu)化BP神經(jīng)網(wǎng)絡的上市公司財務風險預測研究[D];東華大學;2017年
9 羅旻婧;基于時間序列的財務風險預測研究[D];廣東財經(jīng)大學;2016年
10 易可欣;基于貝葉斯網(wǎng)絡的信息產(chǎn)業(yè)財務風險預測研究[D];湖南大學;2016年
本文編號:2887748
本文鏈接:http://www.lk138.cn/shoufeilunwen/jjglss/2887748.html