中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

一種塊增量偏最小二乘模型的研究

發(fā)布時(shí)間:2020-03-29 11:02
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,各個(gè)領(lǐng)域的數(shù)據(jù)迅猛增長,我們進(jìn)入了大數(shù)據(jù)(Big Data)時(shí)代。然而,數(shù)據(jù)量的增長不只帶來了豐富的信息資源,更高的數(shù)據(jù)維數(shù)往往也相伴而至。為了能夠順利的對(duì)高維數(shù)據(jù)進(jìn)行處理分析,就需要預(yù)先對(duì)數(shù)據(jù)進(jìn)行降維處理。傳統(tǒng)的數(shù)據(jù)降維算法一般采用批量方式(Batch Model)進(jìn)行訓(xùn)練,這種訓(xùn)練方式需要在訓(xùn)練之前將所有樣本數(shù)據(jù)載入內(nèi)存;隨著數(shù)據(jù)規(guī)模的不斷擴(kuò)大,傳統(tǒng)的數(shù)據(jù)降維算法會(huì)因?yàn)樗璧膬?nèi)存過大而無法使用。因此,如何讓傳統(tǒng)的數(shù)據(jù)降維模型適應(yīng)并處理海量的高維數(shù)據(jù)是大數(shù)據(jù)時(shí)代研究的焦點(diǎn)之一。對(duì)于樣本數(shù)量過多的情況,增量學(xué)習(xí)(Incremental Learning)技術(shù)是有效的解決辦法之一。作為一種增量數(shù)據(jù)降維模型,增量式偏最小二乘(Incremental Partial Least Squares,IPLS)將增量學(xué)習(xí)技術(shù)與偏最小二乘模型相互結(jié)合,較好的解決了大規(guī)模數(shù)據(jù)的降維問題。但是,IPLS模型以單個(gè)樣本為單位進(jìn)行模型的更新,導(dǎo)致模型的計(jì)算效率不高、訓(xùn)練時(shí)間較長。針對(duì)這一問題,本文基于現(xiàn)有研究的基礎(chǔ)上提出了一種塊增量偏最小二乘(Chunk Incremental Partial Least Squares,CIPLS)算法,主要的創(chuàng)新性工作為:基于數(shù)據(jù)分塊更新的思想對(duì)IPLS算法進(jìn)行擴(kuò)展,提出了一種塊增量偏最小二乘算法。CIPLS模型將新增的樣本數(shù)據(jù)劃分為若干個(gè)數(shù)據(jù)塊(Chunk),再以數(shù)據(jù)塊為單位進(jìn)行模型的在線更新,從而降低模型的更新頻率,縮短訓(xùn)練時(shí)間。本文在K8版本的p53蛋白數(shù)據(jù)集和路透文本分類語料庫上進(jìn)行了大量的CIPLS算法與已有算法的對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,本文提出的方法明顯提高了增量式偏最小二乘算法的計(jì)算效率,大幅度縮短了訓(xùn)練時(shí)間,驗(yàn)證了塊增量偏最小二乘算法的有效性。
【圖文】:

降維處理,數(shù)據(jù),降維技術(shù),降維


本章對(duì)本文的研究內(nèi)容中涉及到的相關(guān)基礎(chǔ)理論知識(shí)進(jìn)行介紹,包括數(shù)據(jù)降維技術(shù)與增量學(xué)習(xí)技術(shù)的概況介紹。首先闡述了數(shù)據(jù)降維技術(shù)的原理并列舉了相關(guān)的數(shù)據(jù)降維方法;然后對(duì)增量學(xué)習(xí)技術(shù)的概念進(jìn)行了說明,最后對(duì)改進(jìn)的增量式數(shù)據(jù)降維方法進(jìn)行了綜述性的介紹。2.1 數(shù)據(jù)降維技術(shù)概況數(shù)據(jù)的特征維數(shù)不宜過高,這已經(jīng)是模式識(shí)別領(lǐng)域的一條經(jīng)驗(yàn)性的“公理”[21]。一般來說,大部分的分類模型都需要估計(jì)一些未知的參數(shù),而這些參數(shù)的數(shù)量通常和特征空間的維數(shù)相關(guān)。在實(shí)際情況下,如果訓(xùn)練樣本的數(shù)量有限,過高的特征維數(shù)往往會(huì)降低參數(shù)估計(jì)的精度,從而導(dǎo)致分類模型的性能下降。因此,在許多應(yīng)用中,一般的做法是:首先,在最大限度的保留原始數(shù)據(jù)的信息的前提下,將數(shù)據(jù)的特征維數(shù)降低到一個(gè)合適的范圍;然后再把降維后的數(shù)據(jù)送入后續(xù)的處理系統(tǒng)。數(shù)據(jù)降維的一般處理過程如圖 2.1 所示。

原理圖,多因變量,原理圖


LS 算法在提取主成分時(shí),同時(shí)考慮自變量和因變量的相關(guān)信 方法提取得到的主成分既能表達(dá)自變量的信息,也能表達(dá)因 研究的焦點(diǎn)是通過抽取潛在成分(latent component, latent var變量和多因變量的數(shù)據(jù)進(jìn)行建模分析。其核心假設(shè)是,認(rèn)為少量潛在成分(不是直接觀察或測量到的變量)驅(qū)動(dòng)的系統(tǒng)到潛在成分后,就可以采用潛在成分來表示原始數(shù)據(jù),從而果;诘玫降牡途S空間,我們就可以方便的進(jìn)行后續(xù)的分可以按照因變量數(shù)量的不同分為兩類:多因變量 PLS 算法和。下面就分別對(duì)這兩類算法進(jìn)行介紹。變量 PLS 算法n 個(gè)觀測樣本點(diǎn),自變量 = [ 1 2… ]和因變量 = , 1造樣本數(shù)據(jù)矩陣 ∈ × 和 ∈ × 。
【學(xué)位授予單位】:南昌大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP181

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 尤肖虎,何振亞;遞歸實(shí)現(xiàn)固定階的偏最小二乘問題——幾種新的快速算法[J];電子學(xué)報(bào);1988年02期

2 倪永年;偏最小二乘分光光度法用于多組份分析[J];巖礦測試;1989年04期

3 康健;唐力偉;左憲章;李浩;張西紅;;基于灰色小波核偏最小二乘的傳感器網(wǎng)絡(luò)數(shù)據(jù)預(yù)測融合研究[J];振動(dòng)與沖擊;2011年04期

4 張勝偉;秦斌;;偏最小二乘方法的財(cái)務(wù)預(yù)警模型研究的應(yīng)用[J];工業(yè)控制計(jì)算機(jī);2012年06期

5 姜英英;李晉明;;偏最小二乘通徑模型在某高校學(xué)院綜合實(shí)力評(píng)估中的實(shí)證研究(下)[J];教育教學(xué)論壇;2015年27期

6 杜樹新;沈進(jìn)昌;袁之報(bào);;三維熒光光譜的多維偏最小二乘建模方法[J];激光雜志;2012年01期

7 賀軍亮;崔軍麗;張淑媛;李仁杰;查勇;;基于偏最小二乘的土壤重金屬銅含量高光譜估算[J];遙感技術(shù)與應(yīng)用;2019年05期

8 姜英英;李晉明;;偏最小二乘通徑模型在某高校學(xué)院綜合實(shí)力評(píng)估中的實(shí)證研究(上)[J];教育教學(xué)論壇;2015年23期

9 陳安珍;蔣萬楓;袁航;孫磊;吳愛英;李新榮;馬雙成;;基于超高效液相色譜偏最小二乘判別分析法建立鑒別大黃真?zhèn)渭胺N屬預(yù)測模型的方法[J];中國藥學(xué)雜志;2016年03期

10 常鵬;高學(xué)金;王普;;基于多向核熵偏最小二乘的間歇過程監(jiān)測及質(zhì)量預(yù)測[J];北京工業(yè)大學(xué)學(xué)報(bào);2014年06期

相關(guān)會(huì)議論文 前10條

1 李科;;用偏最小二乘(PLS)回歸法研究數(shù)據(jù)相關(guān)性[A];全國第六屆分子振動(dòng)光譜學(xué)術(shù)報(bào)告會(huì)文集[C];1990年

2 徐揚(yáng);胡文明;王偉;徐辰武;;基于多元偏最小二乘的多性狀聯(lián)合關(guān)聯(lián)分析方法研究[A];第六屆全國動(dòng)植物數(shù)量遺傳學(xué)學(xué)術(shù)研討會(huì)論文摘要集[C];2014年

3 王檢兵;曹東升;梁逸曾;;3褼_(7.4)的計(jì)算機(jī)預(yù)測并與其他軟件方法比較[A];中國化學(xué)會(huì)第29屆學(xué)術(shù)年會(huì)摘要集——第19分會(huì):化學(xué)信息學(xué)與化學(xué)計(jì)量學(xué)[C];2014年

4 李大鵬;王惠文;;偏最小二乘Iogistic回歸在鄱陽湖洪澇災(zāi)害預(yù)測中的應(yīng)用[A];2003中國現(xiàn)場統(tǒng)計(jì)研究會(huì)第十一屆學(xué)術(shù)年會(huì)論文集(上)[C];2003年

5 王俊;許多寬;肖勇;王勇;陳志華;陳維建;;基于化學(xué)指標(biāo)的煙葉產(chǎn)區(qū)正交偏最小二乘判別分析[A];中國煙草學(xué)會(huì)學(xué)術(shù)年會(huì)優(yōu)秀論文集[C];2017年

6 樊霞;俞舟;;產(chǎn)學(xué)研協(xié)同創(chuàng)新有助于大學(xué)創(chuàng)新能力成長嗎?——基于偏最小二乘路徑模型的實(shí)證檢驗(yàn)[A];中國系統(tǒng)工程學(xué)會(huì)第十八屆學(xué)術(shù)年會(huì)論文集——A03系統(tǒng)科學(xué)理論研究創(chuàng)新[C];2014年

7 景明;蔡文生;邵學(xué)廣;;Multiblock偏最小二乘方法的新應(yīng)用[A];第十屆全國計(jì)算(機(jī))化學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2009年

8 岑芳明;王明文;王鵬鳴;戴玉娟;;基于核偏最小二乘分類的垃圾郵件過濾[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

9 李澤華;趙春暉;王偉;;一種基于稀疏偏最小二乘-典型相關(guān)分析(SPLS-CCA)的產(chǎn)品質(zhì)量智能追溯方法[A];2018中國自動(dòng)化大會(huì)(CAC2018)論文集[C];2018年

10 李建更;李輝;阮曉鋼;;一種有效的腫瘤特征基因篩選方法[A];2013年中國智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第五分冊)[C];2013年

相關(guān)博士學(xué)位論文 前10條

1 曾雪強(qiáng);偏最小二乘降維方法的研究與應(yīng)用[D];上海大學(xué);2009年

2 池清華;PLS隱變量空間模型預(yù)測控制算法研究[D];浙江大學(xué);2015年

3 楊海濤;基于遺傳算法的復(fù)合核偏最小二乘模型在組學(xué)數(shù)據(jù)疾病預(yù)測和分類中的應(yīng)用[D];山西醫(yī)科大學(xué);2016年

4 石懷濤;基于多元統(tǒng)計(jì)分析的軋鋼過程故障診斷與質(zhì)量預(yù)報(bào)研究[D];東北大學(xué);2012年

5 張海玉;張廣才嶺及完達(dá)山森林生物量遙感估測及變化驅(qū)動(dòng)力分析[D];東北林業(yè)大學(xué);2011年

6 田明璐;西北地區(qū)冬小麥生長狀況高光譜遙感監(jiān)測研究[D];西北農(nóng)林科技大學(xué);2017年

7 金鑫;基于動(dòng)態(tài)PLS框架的魯棒建模及預(yù)測控制方法研究[D];浙江大學(xué);2016年

8 毛李帆;電網(wǎng)規(guī)劃中長期負(fù)荷預(yù)測技術(shù)的研究[D];湖南大學(xué);2011年

9 華回春;干擾性負(fù)荷諧波責(zé)任定量評(píng)估的理論與方法[D];華北電力大學(xué);2014年

10 李明澤;東北林區(qū)森林生物量遙感估算及分析[D];東北林業(yè)大學(xué);2010年

相關(guān)碩士學(xué)位論文 前10條

1 葉震麟;一種塊增量偏最小二乘模型的研究[D];南昌大學(xué);2019年

2 曾青霞;偏最小二乘優(yōu)化及其在中醫(yī)藥數(shù)據(jù)分析中的應(yīng)用研究[D];江西中醫(yī)藥大學(xué);2019年

3 劉爽;混合溶液光譜分析與融合建模研究[D];東北大學(xué);2015年

4 王巖;基于回歸系數(shù)誤差逐漸調(diào)優(yōu)的增量偏最小二乘算法研究[D];東北大學(xué);2015年

5 趙丙娟;基于偏最小二乘降維的人臉年齡估計(jì)研究[D];南昌大學(xué);2017年

6 鄭明辰;基于非線性偏最小二乘方法的急性電離輻射損傷早期傷情分類研究[D];蘇州大學(xué);2013年

7 杜曉慧;基于不同罰函數(shù)約束偏最小二乘的應(yīng)用研究[D];長沙理工大學(xué);2015年

8 韓杰倫;使用偏最小二乘方法對(duì)信令負(fù)荷進(jìn)行評(píng)估[D];浙江大學(xué);2017年

9 步文斌;基于偏最小二乘的人臉識(shí)別算法研究[D];重慶大學(xué);2013年

10 郝竹林;融合偏最小二乘的隨機(jī)森林方法在中醫(yī)藥領(lǐng)域的應(yīng)用研究[D];江西中醫(yī)藥大學(xué);2015年

,

本文編號(hào):2605878

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/2605878.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶52c46***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com