基于改進(jìn)K均值聚類理論的證券時(shí)間序列奇異點(diǎn)研究
發(fā)布時(shí)間:2014-08-10 14:43
第一章緒論
1.1課題背景
證券時(shí)間序列數(shù)據(jù)由不同時(shí)間的重復(fù)測(cè)量得到的值或時(shí)問(wèn)的序列組成。這些值通常是在相等時(shí)叫間隔(例如每小時(shí),每天,每周)測(cè)量。時(shí)問(wèn)序列的數(shù)據(jù)量通常以每天(如股票的交易),甚至每分鐘(如NASA空間計(jì)劃)數(shù)字節(jié)的量級(jí)增長(zhǎng)。怎樣才能發(fā)現(xiàn)時(shí)間序列數(shù)據(jù)的相關(guān)性呢?怎樣通過(guò)快速甚至聯(lián)機(jī)的實(shí)時(shí)響應(yīng)去分析如此巨大數(shù)量的時(shí)間序列數(shù)據(jù),從而找到相似或者有規(guī)律的模式、趨勢(shì)、突變(例如突然的明顯變化)以及離群點(diǎn)呢?隨著社會(huì)科學(xué)、經(jīng)濟(jì)和生活水平的高速發(fā)展,信息科技時(shí)代逐漸來(lái)臨,大量的數(shù)據(jù)隨著信息時(shí)代的發(fā)展也呈現(xiàn)爆炸式的增長(zhǎng)。這種按照時(shí)間先后順序出現(xiàn),并且以此排序的數(shù)列集合,我們稱之為時(shí)間序列[1]。時(shí)間序列是一類重要的復(fù)雜數(shù)據(jù)對(duì)象。通過(guò)對(duì)社會(huì)、經(jīng)濟(jì)、科學(xué)技術(shù)等領(lǐng)域中的時(shí)間序列做進(jìn)一步分析與處理,便有可能揭示事物運(yùn)動(dòng)、變化和發(fā)展的內(nèi)在規(guī)律,這無(wú)疑對(duì)社會(huì)經(jīng)濟(jì)和技術(shù)的發(fā)展有著極為重要的意義[2,3]。證券市場(chǎng)作為國(guó)家經(jīng)濟(jì)運(yùn)行的核心,探求其變化規(guī)律、進(jìn)行有效的金融管理、提高金融投資效率是管理者與投資者孜孜以求的目標(biāo)之一[4]。證券時(shí)間序列是經(jīng)濟(jì)領(lǐng)域中最為重要的數(shù)據(jù)類型,對(duì)其進(jìn)行分析和預(yù)測(cè)對(duì)人們分析市場(chǎng)走勢(shì)有著至關(guān)重要的作用[5]。作為現(xiàn)代金融計(jì)量經(jīng)濟(jì)學(xué)理論中的重要內(nèi)容,證券時(shí)間序列分析已應(yīng)用到價(jià)格預(yù)測(cè)、投資決策、風(fēng)險(xiǎn)管理、客戶分析等各金融機(jī)構(gòu)業(yè)務(wù)中[6]。
.......
1.2國(guó)內(nèi)外研究現(xiàn)狀
在時(shí)間序列分析一是頻譜分析,,任何沒(méi)有趨勢(shì)的時(shí)間序列都可以被分解成為一定數(shù)量的具有周期性的譜圖。我們關(guān)心的是這些周期的長(zhǎng)度,并且時(shí)間序列能夠用這些周期來(lái)刻畫(huà)。盡管我們利用這些頻譜技術(shù)能夠獲得時(shí)間序列的一個(gè)可視化的印象,對(duì)描述時(shí)間序列也有一定的幫助,但對(duì)于預(yù)測(cè)樣本期外的值卻很不明確。第二類方法是經(jīng)濟(jì)學(xué)中最常用的,就是時(shí)域分析法,可以追溯到英國(guó)統(tǒng)計(jì)學(xué)家G.U.Yule于1927年提出的自回歸模型。在時(shí)域分析法中,我們主要利用時(shí)間序列的數(shù)據(jù)是按照時(shí)間順序依次被記錄這一事實(shí)。在這種方法中,自相關(guān)函數(shù)非常的重要。對(duì)這一類時(shí)間序列分析方法,美國(guó)統(tǒng)計(jì)學(xué)家George E.P.Box和英國(guó)統(tǒng)計(jì)學(xué)家GwilymMJenkins的工作尤為重要,他們提出了較為完善的時(shí)間序列分析和建模的理論[i4],于1970年出版《時(shí)間序列分析一預(yù)測(cè)與控制》一書(shū)。此后,時(shí)間序列分析這一研究領(lǐng)域得到了廣泛的擴(kuò)展,從經(jīng)濟(jì)預(yù)測(cè)、氣象預(yù)報(bào)到過(guò)程控制都得到應(yīng)用。George E.P.Box和Gwilym M.Jenkins提出的時(shí)序分析模型被稱作博克斯.詹金斯(Box-Jenkins)法。其基本模型有三種,自回歸模型(AR)、移動(dòng)平均模型(MA)和差分自回歸移動(dòng)平均模型(ARIMA) [15,16],這些方法對(duì)穩(wěn)定的時(shí)間序列預(yù)測(cè)有著較好的結(jié)果。但是這些模型在理論上和應(yīng)用上還存在著許多局限性,所以統(tǒng)計(jì)學(xué)家 始轉(zhuǎn)向?qū)Ψ蔷性時(shí)間序列模型的研究。
........
第二章K均值算法、時(shí)間序列及奇異點(diǎn)理論基礎(chǔ)
2.1 K均值聚類算法
國(guó)際數(shù)據(jù)挖掘大會(huì)在2006年12月,進(jìn)行了一次評(píng)選。評(píng)選的結(jié)果是K均值聚類算法位列應(yīng)用最廣泛的10大算法中的第二位。由此可見(jiàn)K均值聚類算法的應(yīng)用廣泛性。K均值算法是一個(gè)應(yīng)用廣泛又實(shí)周的算法,該算法主要是把我們的研究對(duì)象集合分成若干個(gè)聚類,至于聚類個(gè)數(shù)k,可以人為的來(lái)指定。該聚類算法已經(jīng)被很多的研究者發(fā)現(xiàn)并得以應(yīng)用。K均值算法作為一種簡(jiǎn)單常用的聚類分析方法,己經(jīng)被廣泛的應(yīng)用在許多數(shù)據(jù)聚類的問(wèn)題中。K均值聚類算法是一種間接的利用聚類之間的相似性進(jìn)行度量的方法。它的假設(shè)前提是:不相關(guān)樣本數(shù)據(jù)要高于相關(guān)樣本數(shù)據(jù)的相似度。該算法計(jì)算樣本數(shù)據(jù)間的相似度一般都采用歐氏距離。K均值算法在應(yīng)用的時(shí)候,并不需要研究者預(yù)先識(shí)別樣本數(shù)據(jù)。而且,我們并不需要了解我們所研究的樣本數(shù)據(jù),我們只需要利用這個(gè)算法對(duì)數(shù)據(jù)進(jìn)行聚類分析,然后分析實(shí)驗(yàn)結(jié)朵從而得出結(jié)論。在聚類分析方法之中,K均值算法是一種既簡(jiǎn)單又應(yīng)用廣泛的聚類方法,它是通過(guò)利用聚類間的相似性度量進(jìn)行算法實(shí)現(xiàn)的一種分析方法。K均值聚類算法是一類簡(jiǎn)單的用于解決聚類問(wèn)題的無(wú)監(jiān)督學(xué)習(xí)算法。
.........
2.2時(shí)間序列理論基礎(chǔ)
當(dāng)今,越來(lái)越多的數(shù)據(jù)被存儲(chǔ)在計(jì)算機(jī)上,如證券公司的系統(tǒng)里存儲(chǔ)了海量的股票數(shù)據(jù),軍隊(duì)的指揮系統(tǒng)里積累了大量作戰(zhàn)信息,工礦企業(yè)的控制系統(tǒng)中保存了許多參數(shù)的歷史數(shù)據(jù),學(xué)校的計(jì)算機(jī)系統(tǒng)里存儲(chǔ)了每位同學(xué)的信息數(shù)據(jù),這些系統(tǒng)里存在大量的數(shù)據(jù)都可以按照時(shí)間次序依次列出,這就是時(shí)間序列,例如股票價(jià)格數(shù)據(jù)、某種產(chǎn)品月銷售量、企業(yè)里各種參數(shù)的歷史數(shù)據(jù)。對(duì)時(shí)間序列進(jìn)行相應(yīng)分析,就可以揭示事物的運(yùn)動(dòng)、變化及發(fā)展的內(nèi)在規(guī)律。不論是經(jīng)濟(jì)領(lǐng)域里每年的生產(chǎn)總值、國(guó)民收入、某一商品在某一市場(chǎng)上的銷售量、以及商品在市場(chǎng)上的價(jià)格變動(dòng)等等;蛘呱鐣(huì)領(lǐng)域某一地區(qū)的人口數(shù)量、醫(yī)院患者人數(shù)、鐵路客流量等,還是在自然領(lǐng)域中的太陽(yáng)黑子數(shù)、降水量、河流流量等等,都可以看做是時(shí)間序列。所有這些時(shí)間序列基本特點(diǎn)就是每個(gè)時(shí)間序列都囊括產(chǎn)生該時(shí)間序列的歷史行為的特征信息。關(guān)鍵就在于怎樣才能根據(jù)這些時(shí)間序列,較準(zhǔn)確找出相應(yīng)的內(nèi)在統(tǒng)計(jì)特性以及事物的發(fā)展規(guī)律,盡可能多的從時(shí)間序列里提取我們所需要的準(zhǔn)確信息。
.........
第3章改進(jìn)的K均值聚類及實(shí)證研究..........25
3.1改進(jìn)的K均值聚類..........25
3.2實(shí)驗(yàn)相關(guān)參數(shù)的選擇標(biāo)準(zhǔn)..........29
3.3實(shí)例驗(yàn)證..........34
第4章基于改進(jìn)K均值聚類對(duì)股票市場(chǎng)的奇異點(diǎn)檢測(cè)及研究.......... 37
4.1引言..........37
4.2對(duì)股票市場(chǎng)股票收盤(pán)價(jià)和股票成交量的奇異點(diǎn)檢測(cè)及研究.......... 39
4.3奇異點(diǎn)與信息因素的實(shí)證研究..........41
第5章總結(jié)與展望..........45
5.1本文總結(jié)..........45
5.2不足與展望..........50
第四章基于改進(jìn)K均值聚類對(duì)股票市場(chǎng)的奇異點(diǎn)檢測(cè)及研究
4.1引言
隨著我國(guó)經(jīng)濟(jì)高逮發(fā)展及金融體蓋的五益完善證券時(shí)間序列作為經(jīng)濟(jì)與金融中最重要的數(shù)據(jù)類型,對(duì)其進(jìn)行分析是現(xiàn)代金融學(xué)中重要的研究?jī)?nèi)容證券市場(chǎng)是具有高風(fēng)險(xiǎn)高收益的投資領(lǐng)域,眾多投資者在追求最大化收益的同時(shí)也希望風(fēng)險(xiǎn)最小化,這就要求對(duì)其內(nèi)在規(guī)律進(jìn)行深入研究。投資股市,股民最關(guān)心的是獲利,賺錢.要做到這點(diǎn)就必須把握股市的漲跌,提前做出較為準(zhǔn)確的判斷.描述股市漲跌有眾多指標(biāo),其中最重要的是股票收盤(pán)價(jià)和股票成交量["]。下面我簡(jiǎn)要介紹這2個(gè)指標(biāo)的概念及關(guān)系。股票收盤(pán)價(jià)是指某只股票在證券交易所一天交易活動(dòng)結(jié)束前最后一筆交易的成交價(jià)格。如果當(dāng)天沒(méi)有進(jìn)行相應(yīng)的交易,那么我們就用上一次的成交價(jià)格來(lái)當(dāng)做這只股票的收盤(pán)價(jià)。由于股票收盤(pán)價(jià)是當(dāng)天證券市場(chǎng)行情的-個(gè)標(biāo)準(zhǔn),同時(shí)也是下個(gè)交該只股票 盤(pán)價(jià)的依據(jù),那么我們可以根據(jù)股票收盤(pán)價(jià)來(lái)對(duì)證券市場(chǎng)的未來(lái)行情做預(yù)測(cè);因此當(dāng)投資者需要對(duì)證券市場(chǎng)的行情做分析時(shí),他們大多都會(huì)采用股票收盤(pán)價(jià)來(lái)當(dāng)做分析的依據(jù)。但是目前滬深股市的股票收盤(pán)價(jià)并不完全是最后一筆交易的成交價(jià)格,而是一個(gè)加權(quán)平均價(jià),也叫做已調(diào)整收盤(pán)價(jià)。上海證券交易所交易規(guī)則規(guī)定滬市收盤(pán)價(jià)為當(dāng)日該證券最后一筆交易前一分鐘所有交易的成交量加權(quán)平均價(jià)(含最后一筆交易)。
證券時(shí)間序列是經(jīng)濟(jì)中重要的數(shù)據(jù)類型,對(duì)其進(jìn)行分析和預(yù)測(cè)對(duì)人們分析市場(chǎng)走勢(shì)有著至關(guān)重要的作用。所以對(duì)證券時(shí)間序列分析和預(yù)測(cè)也就成為近年來(lái)國(guó)內(nèi)外學(xué)者研究的熱點(diǎn)問(wèn)題;谧C券時(shí)間序列奇異點(diǎn)的研究,本文在基于聚類的奇異點(diǎn)檢測(cè)思想下,與K均值聚類算法相結(jié)合,提出了一種改進(jìn)的K均值聚類算法,然后利用該算法對(duì)華能國(guó)際和華夏銀行這2只股票的股票收盤(pán)價(jià)和股票成交量進(jìn)行實(shí)證分析,得出如下結(jié)論:1.通過(guò)對(duì)股票市場(chǎng)的股票收盤(pán)價(jià)和股票成交量的實(shí)證研究,驗(yàn)證了該算法能夠有效的檢測(cè)證券時(shí)間序列的奇異點(diǎn)。2.成交量是因,收盤(pán)價(jià)是果,成交量在先,收盤(pán)價(jià)在后。股票成交量對(duì)股票收盤(pán)價(jià)的變動(dòng)具有解釋作用,“價(jià)走量先行"。成交是交易的目的和實(shí)質(zhì),是市場(chǎng)存在的根本意義,股票成交量是股票市場(chǎng)的原動(dòng)力,沒(méi)有股票成交量配合的股票收盤(pán)價(jià)形同無(wú)本之木。因此,股票成交量是投資者分析判斷市場(chǎng)行情并做出投資決策的重要依據(jù).也是各種技術(shù)分析指標(biāo)應(yīng)用時(shí)不可或缺的參照。股票成交量的變化最能反映股市的大趨勢(shì)。3.信息因素是產(chǎn)生奇異點(diǎn)的起因,股市投資者對(duì)股票價(jià)值有著自己的預(yù)期,最初股市處于均衡狀態(tài),當(dāng)新信息到達(dá)市場(chǎng)時(shí)就會(huì)對(duì)投資者的預(yù)期產(chǎn)生影響,從而導(dǎo)致股票成交量奇異點(diǎn)的出現(xiàn),又因?yàn)楣善背山涣颗c股票收盤(pán)價(jià)的關(guān)系,繼而出現(xiàn)了股票收盤(pán)價(jià)的奇異點(diǎn)。
........
參考文獻(xiàn)(略)
本文編號(hào):8276
1.1課題背景
證券時(shí)間序列數(shù)據(jù)由不同時(shí)間的重復(fù)測(cè)量得到的值或時(shí)問(wèn)的序列組成。這些值通常是在相等時(shí)叫間隔(例如每小時(shí),每天,每周)測(cè)量。時(shí)問(wèn)序列的數(shù)據(jù)量通常以每天(如股票的交易),甚至每分鐘(如NASA空間計(jì)劃)數(shù)字節(jié)的量級(jí)增長(zhǎng)。怎樣才能發(fā)現(xiàn)時(shí)間序列數(shù)據(jù)的相關(guān)性呢?怎樣通過(guò)快速甚至聯(lián)機(jī)的實(shí)時(shí)響應(yīng)去分析如此巨大數(shù)量的時(shí)間序列數(shù)據(jù),從而找到相似或者有規(guī)律的模式、趨勢(shì)、突變(例如突然的明顯變化)以及離群點(diǎn)呢?隨著社會(huì)科學(xué)、經(jīng)濟(jì)和生活水平的高速發(fā)展,信息科技時(shí)代逐漸來(lái)臨,大量的數(shù)據(jù)隨著信息時(shí)代的發(fā)展也呈現(xiàn)爆炸式的增長(zhǎng)。這種按照時(shí)間先后順序出現(xiàn),并且以此排序的數(shù)列集合,我們稱之為時(shí)間序列[1]。時(shí)間序列是一類重要的復(fù)雜數(shù)據(jù)對(duì)象。通過(guò)對(duì)社會(huì)、經(jīng)濟(jì)、科學(xué)技術(shù)等領(lǐng)域中的時(shí)間序列做進(jìn)一步分析與處理,便有可能揭示事物運(yùn)動(dòng)、變化和發(fā)展的內(nèi)在規(guī)律,這無(wú)疑對(duì)社會(huì)經(jīng)濟(jì)和技術(shù)的發(fā)展有著極為重要的意義[2,3]。證券市場(chǎng)作為國(guó)家經(jīng)濟(jì)運(yùn)行的核心,探求其變化規(guī)律、進(jìn)行有效的金融管理、提高金融投資效率是管理者與投資者孜孜以求的目標(biāo)之一[4]。證券時(shí)間序列是經(jīng)濟(jì)領(lǐng)域中最為重要的數(shù)據(jù)類型,對(duì)其進(jìn)行分析和預(yù)測(cè)對(duì)人們分析市場(chǎng)走勢(shì)有著至關(guān)重要的作用[5]。作為現(xiàn)代金融計(jì)量經(jīng)濟(jì)學(xué)理論中的重要內(nèi)容,證券時(shí)間序列分析已應(yīng)用到價(jià)格預(yù)測(cè)、投資決策、風(fēng)險(xiǎn)管理、客戶分析等各金融機(jī)構(gòu)業(yè)務(wù)中[6]。
.......
1.2國(guó)內(nèi)外研究現(xiàn)狀
在時(shí)間序列分析一是頻譜分析,,任何沒(méi)有趨勢(shì)的時(shí)間序列都可以被分解成為一定數(shù)量的具有周期性的譜圖。我們關(guān)心的是這些周期的長(zhǎng)度,并且時(shí)間序列能夠用這些周期來(lái)刻畫(huà)。盡管我們利用這些頻譜技術(shù)能夠獲得時(shí)間序列的一個(gè)可視化的印象,對(duì)描述時(shí)間序列也有一定的幫助,但對(duì)于預(yù)測(cè)樣本期外的值卻很不明確。第二類方法是經(jīng)濟(jì)學(xué)中最常用的,就是時(shí)域分析法,可以追溯到英國(guó)統(tǒng)計(jì)學(xué)家G.U.Yule于1927年提出的自回歸模型。在時(shí)域分析法中,我們主要利用時(shí)間序列的數(shù)據(jù)是按照時(shí)間順序依次被記錄這一事實(shí)。在這種方法中,自相關(guān)函數(shù)非常的重要。對(duì)這一類時(shí)間序列分析方法,美國(guó)統(tǒng)計(jì)學(xué)家George E.P.Box和英國(guó)統(tǒng)計(jì)學(xué)家GwilymMJenkins的工作尤為重要,他們提出了較為完善的時(shí)間序列分析和建模的理論[i4],于1970年出版《時(shí)間序列分析一預(yù)測(cè)與控制》一書(shū)。此后,時(shí)間序列分析這一研究領(lǐng)域得到了廣泛的擴(kuò)展,從經(jīng)濟(jì)預(yù)測(cè)、氣象預(yù)報(bào)到過(guò)程控制都得到應(yīng)用。George E.P.Box和Gwilym M.Jenkins提出的時(shí)序分析模型被稱作博克斯.詹金斯(Box-Jenkins)法。其基本模型有三種,自回歸模型(AR)、移動(dòng)平均模型(MA)和差分自回歸移動(dòng)平均模型(ARIMA) [15,16],這些方法對(duì)穩(wěn)定的時(shí)間序列預(yù)測(cè)有著較好的結(jié)果。但是這些模型在理論上和應(yīng)用上還存在著許多局限性,所以統(tǒng)計(jì)學(xué)家 始轉(zhuǎn)向?qū)Ψ蔷性時(shí)間序列模型的研究。
........
第二章K均值算法、時(shí)間序列及奇異點(diǎn)理論基礎(chǔ)
2.1 K均值聚類算法
國(guó)際數(shù)據(jù)挖掘大會(huì)在2006年12月,進(jìn)行了一次評(píng)選。評(píng)選的結(jié)果是K均值聚類算法位列應(yīng)用最廣泛的10大算法中的第二位。由此可見(jiàn)K均值聚類算法的應(yīng)用廣泛性。K均值算法是一個(gè)應(yīng)用廣泛又實(shí)周的算法,該算法主要是把我們的研究對(duì)象集合分成若干個(gè)聚類,至于聚類個(gè)數(shù)k,可以人為的來(lái)指定。該聚類算法已經(jīng)被很多的研究者發(fā)現(xiàn)并得以應(yīng)用。K均值算法作為一種簡(jiǎn)單常用的聚類分析方法,己經(jīng)被廣泛的應(yīng)用在許多數(shù)據(jù)聚類的問(wèn)題中。K均值聚類算法是一種間接的利用聚類之間的相似性進(jìn)行度量的方法。它的假設(shè)前提是:不相關(guān)樣本數(shù)據(jù)要高于相關(guān)樣本數(shù)據(jù)的相似度。該算法計(jì)算樣本數(shù)據(jù)間的相似度一般都采用歐氏距離。K均值算法在應(yīng)用的時(shí)候,并不需要研究者預(yù)先識(shí)別樣本數(shù)據(jù)。而且,我們并不需要了解我們所研究的樣本數(shù)據(jù),我們只需要利用這個(gè)算法對(duì)數(shù)據(jù)進(jìn)行聚類分析,然后分析實(shí)驗(yàn)結(jié)朵從而得出結(jié)論。在聚類分析方法之中,K均值算法是一種既簡(jiǎn)單又應(yīng)用廣泛的聚類方法,它是通過(guò)利用聚類間的相似性度量進(jìn)行算法實(shí)現(xiàn)的一種分析方法。K均值聚類算法是一類簡(jiǎn)單的用于解決聚類問(wèn)題的無(wú)監(jiān)督學(xué)習(xí)算法。
.........
2.2時(shí)間序列理論基礎(chǔ)
當(dāng)今,越來(lái)越多的數(shù)據(jù)被存儲(chǔ)在計(jì)算機(jī)上,如證券公司的系統(tǒng)里存儲(chǔ)了海量的股票數(shù)據(jù),軍隊(duì)的指揮系統(tǒng)里積累了大量作戰(zhàn)信息,工礦企業(yè)的控制系統(tǒng)中保存了許多參數(shù)的歷史數(shù)據(jù),學(xué)校的計(jì)算機(jī)系統(tǒng)里存儲(chǔ)了每位同學(xué)的信息數(shù)據(jù),這些系統(tǒng)里存在大量的數(shù)據(jù)都可以按照時(shí)間次序依次列出,這就是時(shí)間序列,例如股票價(jià)格數(shù)據(jù)、某種產(chǎn)品月銷售量、企業(yè)里各種參數(shù)的歷史數(shù)據(jù)。對(duì)時(shí)間序列進(jìn)行相應(yīng)分析,就可以揭示事物的運(yùn)動(dòng)、變化及發(fā)展的內(nèi)在規(guī)律。不論是經(jīng)濟(jì)領(lǐng)域里每年的生產(chǎn)總值、國(guó)民收入、某一商品在某一市場(chǎng)上的銷售量、以及商品在市場(chǎng)上的價(jià)格變動(dòng)等等;蛘呱鐣(huì)領(lǐng)域某一地區(qū)的人口數(shù)量、醫(yī)院患者人數(shù)、鐵路客流量等,還是在自然領(lǐng)域中的太陽(yáng)黑子數(shù)、降水量、河流流量等等,都可以看做是時(shí)間序列。所有這些時(shí)間序列基本特點(diǎn)就是每個(gè)時(shí)間序列都囊括產(chǎn)生該時(shí)間序列的歷史行為的特征信息。關(guān)鍵就在于怎樣才能根據(jù)這些時(shí)間序列,較準(zhǔn)確找出相應(yīng)的內(nèi)在統(tǒng)計(jì)特性以及事物的發(fā)展規(guī)律,盡可能多的從時(shí)間序列里提取我們所需要的準(zhǔn)確信息。
.........
第3章改進(jìn)的K均值聚類及實(shí)證研究..........25
3.1改進(jìn)的K均值聚類..........25
3.2實(shí)驗(yàn)相關(guān)參數(shù)的選擇標(biāo)準(zhǔn)..........29
3.3實(shí)例驗(yàn)證..........34
第4章基于改進(jìn)K均值聚類對(duì)股票市場(chǎng)的奇異點(diǎn)檢測(cè)及研究.......... 37
4.1引言..........37
4.2對(duì)股票市場(chǎng)股票收盤(pán)價(jià)和股票成交量的奇異點(diǎn)檢測(cè)及研究.......... 39
4.3奇異點(diǎn)與信息因素的實(shí)證研究..........41
第5章總結(jié)與展望..........45
5.1本文總結(jié)..........45
5.2不足與展望..........50
第四章基于改進(jìn)K均值聚類對(duì)股票市場(chǎng)的奇異點(diǎn)檢測(cè)及研究
4.1引言
隨著我國(guó)經(jīng)濟(jì)高逮發(fā)展及金融體蓋的五益完善證券時(shí)間序列作為經(jīng)濟(jì)與金融中最重要的數(shù)據(jù)類型,對(duì)其進(jìn)行分析是現(xiàn)代金融學(xué)中重要的研究?jī)?nèi)容證券市場(chǎng)是具有高風(fēng)險(xiǎn)高收益的投資領(lǐng)域,眾多投資者在追求最大化收益的同時(shí)也希望風(fēng)險(xiǎn)最小化,這就要求對(duì)其內(nèi)在規(guī)律進(jìn)行深入研究。投資股市,股民最關(guān)心的是獲利,賺錢.要做到這點(diǎn)就必須把握股市的漲跌,提前做出較為準(zhǔn)確的判斷.描述股市漲跌有眾多指標(biāo),其中最重要的是股票收盤(pán)價(jià)和股票成交量["]。下面我簡(jiǎn)要介紹這2個(gè)指標(biāo)的概念及關(guān)系。股票收盤(pán)價(jià)是指某只股票在證券交易所一天交易活動(dòng)結(jié)束前最后一筆交易的成交價(jià)格。如果當(dāng)天沒(méi)有進(jìn)行相應(yīng)的交易,那么我們就用上一次的成交價(jià)格來(lái)當(dāng)做這只股票的收盤(pán)價(jià)。由于股票收盤(pán)價(jià)是當(dāng)天證券市場(chǎng)行情的-個(gè)標(biāo)準(zhǔn),同時(shí)也是下個(gè)交該只股票 盤(pán)價(jià)的依據(jù),那么我們可以根據(jù)股票收盤(pán)價(jià)來(lái)對(duì)證券市場(chǎng)的未來(lái)行情做預(yù)測(cè);因此當(dāng)投資者需要對(duì)證券市場(chǎng)的行情做分析時(shí),他們大多都會(huì)采用股票收盤(pán)價(jià)來(lái)當(dāng)做分析的依據(jù)。但是目前滬深股市的股票收盤(pán)價(jià)并不完全是最后一筆交易的成交價(jià)格,而是一個(gè)加權(quán)平均價(jià),也叫做已調(diào)整收盤(pán)價(jià)。上海證券交易所交易規(guī)則規(guī)定滬市收盤(pán)價(jià)為當(dāng)日該證券最后一筆交易前一分鐘所有交易的成交量加權(quán)平均價(jià)(含最后一筆交易)。
........
第五章總結(jié)與展望
5.1本文總結(jié)
證券時(shí)間序列是經(jīng)濟(jì)中重要的數(shù)據(jù)類型,對(duì)其進(jìn)行分析和預(yù)測(cè)對(duì)人們分析市場(chǎng)走勢(shì)有著至關(guān)重要的作用。所以對(duì)證券時(shí)間序列分析和預(yù)測(cè)也就成為近年來(lái)國(guó)內(nèi)外學(xué)者研究的熱點(diǎn)問(wèn)題;谧C券時(shí)間序列奇異點(diǎn)的研究,本文在基于聚類的奇異點(diǎn)檢測(cè)思想下,與K均值聚類算法相結(jié)合,提出了一種改進(jìn)的K均值聚類算法,然后利用該算法對(duì)華能國(guó)際和華夏銀行這2只股票的股票收盤(pán)價(jià)和股票成交量進(jìn)行實(shí)證分析,得出如下結(jié)論:1.通過(guò)對(duì)股票市場(chǎng)的股票收盤(pán)價(jià)和股票成交量的實(shí)證研究,驗(yàn)證了該算法能夠有效的檢測(cè)證券時(shí)間序列的奇異點(diǎn)。2.成交量是因,收盤(pán)價(jià)是果,成交量在先,收盤(pán)價(jià)在后。股票成交量對(duì)股票收盤(pán)價(jià)的變動(dòng)具有解釋作用,“價(jià)走量先行"。成交是交易的目的和實(shí)質(zhì),是市場(chǎng)存在的根本意義,股票成交量是股票市場(chǎng)的原動(dòng)力,沒(méi)有股票成交量配合的股票收盤(pán)價(jià)形同無(wú)本之木。因此,股票成交量是投資者分析判斷市場(chǎng)行情并做出投資決策的重要依據(jù).也是各種技術(shù)分析指標(biāo)應(yīng)用時(shí)不可或缺的參照。股票成交量的變化最能反映股市的大趨勢(shì)。3.信息因素是產(chǎn)生奇異點(diǎn)的起因,股市投資者對(duì)股票價(jià)值有著自己的預(yù)期,最初股市處于均衡狀態(tài),當(dāng)新信息到達(dá)市場(chǎng)時(shí)就會(huì)對(duì)投資者的預(yù)期產(chǎn)生影響,從而導(dǎo)致股票成交量奇異點(diǎn)的出現(xiàn),又因?yàn)楣善背山涣颗c股票收盤(pán)價(jià)的關(guān)系,繼而出現(xiàn)了股票收盤(pán)價(jià)的奇異點(diǎn)。
........
參考文獻(xiàn)(略)
本文編號(hào):8276
本文鏈接:http://www.lk138.cn/jingjilunwen/jinrongzhengquanlunwen/8276.html
最近更新
教材專著