基于云平臺(tái)的中醫(yī)臨床大數(shù)據(jù)頻繁模式并行挖掘方法研究
發(fā)布時(shí)間:2020-12-13 23:27
我國中醫(yī)藥資源豐富,歷史悠久,中醫(yī)藥領(lǐng)域?qū)W術(shù)觀點(diǎn)及思想的傳播主要通過個(gè)人經(jīng)驗(yàn)和實(shí)踐,以及師徒之間的口口相傳。由于信息處理和傳播速度的緩慢,導(dǎo)致了中醫(yī)藥在當(dāng)代社會(huì)發(fā)展和傳承困難,已經(jīng)難以滿足當(dāng)代社會(huì)對(duì)中醫(yī)藥知識(shí)的需求。中醫(yī)藥振興發(fā)展的重要引擎和技術(shù)支撐是實(shí)現(xiàn)中醫(yī)藥信息化,中醫(yī)藥信息化建設(shè)也被納入國家的“十三五”規(guī)劃中。在云計(jì)算、數(shù)據(jù)挖掘等信息技術(shù)的加持下,中醫(yī)藥信息化已經(jīng)成為研究熱點(diǎn)。中醫(yī)講究辨證施治,臨床醫(yī)學(xué)是中醫(yī)學(xué)的基礎(chǔ)學(xué)科,辨證論治過程中產(chǎn)生了癥狀、證候、病機(jī)、治則治法、診斷、四診信息、中藥處方等“知識(shí)密集型”數(shù)據(jù),此類知識(shí)量豐富、非結(jié)構(gòu)化的數(shù)據(jù)成為中醫(yī)臨床數(shù)據(jù)研究的重要資料。本研究致力于研究中醫(yī)藥“知識(shí)密集型”數(shù)據(jù),挖掘“癥—證—方”之間潛在的、有用的信息。在現(xiàn)有的數(shù)據(jù)分析挖掘方法的基礎(chǔ)上,本文主要在云計(jì)算環(huán)境下并行挖掘框架的搭建、云計(jì)算環(huán)境下頻繁模式挖掘算法等方面進(jìn)行了研究。本文的主要?jiǎng)?chuàng)新性工作如下:1)中醫(yī)臨床數(shù)據(jù)來源多樣、數(shù)據(jù)結(jié)構(gòu)復(fù)雜,加上肺癌患者的癥情差別較大,往往表現(xiàn)出多病位多病性錯(cuò)綜復(fù)雜的證候,治療上也多以復(fù)方為主,大大增加了分析的難度,采用傳統(tǒng)的數(shù)據(jù)分析方法面臨挑戰(zhàn)...
【文章來源】:南京中醫(yī)藥大學(xué)江蘇省
【文章頁數(shù)】:66 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-2?MapReduce并行計(jì)算過程??MapReduce運(yùn)行按照時(shí)間順序包括五個(gè)階段:輸入分片(input?split)、map階段、combiner??階段、shuffle階段和reduce階段
Dffi(3)??DAE?(3),DAEB(3),DAB(3)??圖3-3?FP-Tree的挖掘過程??最后,設(shè)置最小置信度。為便于分析說明,本小節(jié)實(shí)驗(yàn)中設(shè)置的最小置信度為0.85,??執(zhí)行DeepFP-Growth算法,得出方藥示例數(shù)據(jù)庫的核心方為:BEA。??3.4實(shí)驗(yàn)結(jié)果比較??下面我們對(duì)云計(jì)算環(huán)境下運(yùn)行并行Deep?FP-Growth算法,并在不同節(jié)點(diǎn)、不同數(shù)據(jù)量??下進(jìn)行核心方挖掘運(yùn)行時(shí)間的比較,對(duì)比試驗(yàn)結(jié)果如圖3-4所示。測試數(shù)據(jù)集部分為真實(shí)??世界數(shù)據(jù),剩下的部分為合成數(shù)據(jù)。三個(gè)數(shù)據(jù)集的記錄條數(shù)分別為90萬、120萬和150萬。??為了方便中醫(yī)藥治療肺癌的核心方挖掘,Deep?FP-Growth算法較之FP-Growth算法,??增加了有效后繼的判斷與計(jì)算。由圖3-4可知,云計(jì)算環(huán)境下,節(jié)點(diǎn)數(shù)越多、數(shù)據(jù)量越小,??核心方挖掘時(shí)間越少。??19??
4.3.2?藥物出現(xiàn)的頻次與頻率??根據(jù)統(tǒng)計(jì),病例中共出現(xiàn)500種藥物,按照藥物出現(xiàn)頻率的高低排序,選取頻率不低??于40%的藥物,共計(jì)19種。總體用藥頻次與頻率見表4-2,藥物出現(xiàn)頻次見圖4-3。???表4-2總體用藥頻次與頻率???藥名??mm???北沙參?2481?93.0259%??南沙參?2362?88.5639%??麥冬?2361?88.5264%??山慈菇?2308?86.5392%??澤漆?2298?86.1642%??太子參?1887?70.7537%???23??
【參考文獻(xiàn)】:
期刊論文
[1]現(xiàn)代名老中醫(yī)臨床診療方藥數(shù)據(jù)抽取與清理方法研究[J]. 謝佳東,房裴裴,胡孔法,楊濤,胡晨駿,李柳. 時(shí)珍國醫(yī)國藥. 2017(11)
[2]基于FP-Tree的中藥飲片頻繁路徑模式挖掘算法[J]. 房裴裴,胡孔法,胡晨駿,謝佳東. 時(shí)珍國醫(yī)國藥. 2017(06)
[3]工業(yè)和信息化部印發(fā)《云計(jì)算發(fā)展三年行動(dòng)計(jì)劃(2017-2019年)》[J]. 印刷雜志. 2017(05)
[4]一種面向HDFS的多層索引技術(shù)[J]. 何龍,陳晉川,杜小勇. 軟件學(xué)報(bào). 2017(03)
[5]云計(jì)算中Hadoop技術(shù)研究與應(yīng)用綜述[J]. 夏靖波,韋澤鯤,付凱,陳珍. 計(jì)算機(jī)科學(xué). 2016(11)
[6]中醫(yī)藥發(fā)展“十三五”規(guī)劃發(fā)布[J]. 魏敏. 中醫(yī)藥管理雜志. 2016(17)
[7]論中醫(yī)藥數(shù)據(jù)挖掘[J]. 朱彥,朱玲,崔蒙. 中華中醫(yī)藥雜志. 2016(08)
[8]中醫(yī)藥治療中晚期非小細(xì)胞肺癌文獻(xiàn)計(jì)量分析[J]. 陸穎,李潔,陳馳,許玲. 中國中醫(yī)藥信息雜志. 2015(09)
[9]十三五:大力發(fā)展中醫(yī)藥信息化建設(shè) 打造智慧云服務(wù)平臺(tái)[J]. 醫(yī)學(xué)信息學(xué)雜志. 2015(08)
[10]中醫(yī)藥“知識(shí)密集型”數(shù)據(jù)研究思路[J]. 于彤,李敬華,楊碩,于琦. 中國中醫(yī)藥圖書情報(bào)雜志. 2015(04)
博士論文
[1]集群環(huán)境下的關(guān)聯(lián)規(guī)則挖掘及應(yīng)用[D]. 荀亞玲.太原科技大學(xué) 2017
碩士論文
[1]基于Hadoop的MapReduce的性能分析與優(yōu)化[D]. 戴新華.南京郵電大學(xué) 2015
[2]海量數(shù)據(jù)并行挖掘技術(shù)研究[D]. 孫芬芬.北京交通大學(xué) 2014
[3]基于FP-Growth關(guān)聯(lián)規(guī)則的并行算法分析及其應(yīng)用研究[D]. 李濤.遼寧工程技術(shù)大學(xué) 2011
[4]關(guān)聯(lián)規(guī)則算法研究及其在中醫(yī)藥數(shù)據(jù)挖掘中的應(yīng)用[D]. 馬麗偉.南京理工大學(xué) 2009
本文編號(hào):2915369
【文章來源】:南京中醫(yī)藥大學(xué)江蘇省
【文章頁數(shù)】:66 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-2?MapReduce并行計(jì)算過程??MapReduce運(yùn)行按照時(shí)間順序包括五個(gè)階段:輸入分片(input?split)、map階段、combiner??階段、shuffle階段和reduce階段
Dffi(3)??DAE?(3),DAEB(3),DAB(3)??圖3-3?FP-Tree的挖掘過程??最后,設(shè)置最小置信度。為便于分析說明,本小節(jié)實(shí)驗(yàn)中設(shè)置的最小置信度為0.85,??執(zhí)行DeepFP-Growth算法,得出方藥示例數(shù)據(jù)庫的核心方為:BEA。??3.4實(shí)驗(yàn)結(jié)果比較??下面我們對(duì)云計(jì)算環(huán)境下運(yùn)行并行Deep?FP-Growth算法,并在不同節(jié)點(diǎn)、不同數(shù)據(jù)量??下進(jìn)行核心方挖掘運(yùn)行時(shí)間的比較,對(duì)比試驗(yàn)結(jié)果如圖3-4所示。測試數(shù)據(jù)集部分為真實(shí)??世界數(shù)據(jù),剩下的部分為合成數(shù)據(jù)。三個(gè)數(shù)據(jù)集的記錄條數(shù)分別為90萬、120萬和150萬。??為了方便中醫(yī)藥治療肺癌的核心方挖掘,Deep?FP-Growth算法較之FP-Growth算法,??增加了有效后繼的判斷與計(jì)算。由圖3-4可知,云計(jì)算環(huán)境下,節(jié)點(diǎn)數(shù)越多、數(shù)據(jù)量越小,??核心方挖掘時(shí)間越少。??19??
4.3.2?藥物出現(xiàn)的頻次與頻率??根據(jù)統(tǒng)計(jì),病例中共出現(xiàn)500種藥物,按照藥物出現(xiàn)頻率的高低排序,選取頻率不低??于40%的藥物,共計(jì)19種。總體用藥頻次與頻率見表4-2,藥物出現(xiàn)頻次見圖4-3。???表4-2總體用藥頻次與頻率???藥名??mm???北沙參?2481?93.0259%??南沙參?2362?88.5639%??麥冬?2361?88.5264%??山慈菇?2308?86.5392%??澤漆?2298?86.1642%??太子參?1887?70.7537%???23??
【參考文獻(xiàn)】:
期刊論文
[1]現(xiàn)代名老中醫(yī)臨床診療方藥數(shù)據(jù)抽取與清理方法研究[J]. 謝佳東,房裴裴,胡孔法,楊濤,胡晨駿,李柳. 時(shí)珍國醫(yī)國藥. 2017(11)
[2]基于FP-Tree的中藥飲片頻繁路徑模式挖掘算法[J]. 房裴裴,胡孔法,胡晨駿,謝佳東. 時(shí)珍國醫(yī)國藥. 2017(06)
[3]工業(yè)和信息化部印發(fā)《云計(jì)算發(fā)展三年行動(dòng)計(jì)劃(2017-2019年)》[J]. 印刷雜志. 2017(05)
[4]一種面向HDFS的多層索引技術(shù)[J]. 何龍,陳晉川,杜小勇. 軟件學(xué)報(bào). 2017(03)
[5]云計(jì)算中Hadoop技術(shù)研究與應(yīng)用綜述[J]. 夏靖波,韋澤鯤,付凱,陳珍. 計(jì)算機(jī)科學(xué). 2016(11)
[6]中醫(yī)藥發(fā)展“十三五”規(guī)劃發(fā)布[J]. 魏敏. 中醫(yī)藥管理雜志. 2016(17)
[7]論中醫(yī)藥數(shù)據(jù)挖掘[J]. 朱彥,朱玲,崔蒙. 中華中醫(yī)藥雜志. 2016(08)
[8]中醫(yī)藥治療中晚期非小細(xì)胞肺癌文獻(xiàn)計(jì)量分析[J]. 陸穎,李潔,陳馳,許玲. 中國中醫(yī)藥信息雜志. 2015(09)
[9]十三五:大力發(fā)展中醫(yī)藥信息化建設(shè) 打造智慧云服務(wù)平臺(tái)[J]. 醫(yī)學(xué)信息學(xué)雜志. 2015(08)
[10]中醫(yī)藥“知識(shí)密集型”數(shù)據(jù)研究思路[J]. 于彤,李敬華,楊碩,于琦. 中國中醫(yī)藥圖書情報(bào)雜志. 2015(04)
博士論文
[1]集群環(huán)境下的關(guān)聯(lián)規(guī)則挖掘及應(yīng)用[D]. 荀亞玲.太原科技大學(xué) 2017
碩士論文
[1]基于Hadoop的MapReduce的性能分析與優(yōu)化[D]. 戴新華.南京郵電大學(xué) 2015
[2]海量數(shù)據(jù)并行挖掘技術(shù)研究[D]. 孫芬芬.北京交通大學(xué) 2014
[3]基于FP-Growth關(guān)聯(lián)規(guī)則的并行算法分析及其應(yīng)用研究[D]. 李濤.遼寧工程技術(shù)大學(xué) 2011
[4]關(guān)聯(lián)規(guī)則算法研究及其在中醫(yī)藥數(shù)據(jù)挖掘中的應(yīng)用[D]. 馬麗偉.南京理工大學(xué) 2009
本文編號(hào):2915369
本文鏈接:http://www.lk138.cn/guanlilunwen/ydhl/2915369.html
最近更新
教材專著