面向維度的高維聚類邊界檢測技術(shù)研究
本文選題:高維空間 切入點:聚類邊界 出處:《鄭州大學》2017年碩士論文 論文類型:學位論文
【摘要】:聚類是數(shù)據(jù)挖掘的一個重要研究問題,它可以有效地幫助我們分析數(shù)據(jù)的分布、研究數(shù)據(jù)的特征、尋找隱藏在數(shù)據(jù)中的結(jié)構(gòu),以便作進一步分析和利用。聚類邊界代表著那些歸屬明確,但又具備著脫離事物原屬類別特征的對象。在醫(yī)學隱性遺傳疾病、基因表達譜數(shù)據(jù)、手寫體簽名、目標追蹤等領(lǐng)域的研究中起著重要作用。本文在研究現(xiàn)有的聚類技術(shù)和聚類邊界模式識別技術(shù)的基礎(chǔ)上,針對高維空間中聚類邊界理論還缺乏有效的研究工作這一問題展開研究,從面向空間和面向維度兩個角度研究了高維邊界檢測模型及其有效性,并建立和引入多個高維測試數(shù)據(jù)集。論文的主要創(chuàng)新工作如下:(1)通過引入一種動態(tài)自適應(yīng)kNN采樣窗口降低固定采樣窗口對密度估計敏感性的方法改進了核密度估計技術(shù),并將改進的核密度估計技術(shù)作為鄰域空間中均值漂移向量的權(quán)重,從而提出了面向高維空間的邊界檢測算法BorderShift。合成數(shù)據(jù)集和真實數(shù)據(jù)集上的實驗結(jié)果表明該技術(shù)能有效地檢測高維空間聚類邊界模式。(2)為提高聚類邊界的檢測精度,采用面向維度的思想對霍普金斯統(tǒng)計量進行高維變換,提出一種新的描述高維空間均勻性的Symmetry統(tǒng)計量;通過引進物理學中的粒子空間對稱性理論,即以當前數(shù)據(jù)點作為高維空間的中心原點,構(gòu)建一個與數(shù)據(jù)空間維度相同的高維坐標系,并對中心原點的k近鄰對象進行坐標反演,將近鄰空間內(nèi)的數(shù)據(jù)點投影到高維坐標系。以這兩種技術(shù)為基礎(chǔ)提出了Spinver算法。在合成數(shù)據(jù)集、醫(yī)學數(shù)據(jù)集、手寫體數(shù)據(jù)集、多姿態(tài)人臉數(shù)據(jù)集等上的實驗結(jié)果驗證了該方法有效性和具有較高的效率。(3)在證明了該杠桿上平衡支點存在的必然性和唯一性基礎(chǔ)上,提出了從多個視角分析高維空間的思想,即將高維空間模擬為與空間維度數(shù)相同的多條杠桿,使用當前樣本點在各維度上的投影坐標與平衡支點之間的距離計算平衡性系數(shù),提出了Lever算法,人工合成數(shù)據(jù)集和真實數(shù)據(jù)集的實驗表明,Lever算法能夠較好的處理高維空間的聚類邊界檢測問題且具有更高的檢測精度。(4)為解決更高維度空間中的聚類邊界檢測問題,提出了一種基于馬爾科夫圖模型的邊界檢測算法Knight。該技術(shù)將高維空間模擬為離散狀態(tài)空間,并將狀態(tài)空間內(nèi)騎士巡游的馬爾科夫過程轉(zhuǎn)換為相應(yīng)的圖模型,并構(gòu)造Hard系數(shù)判斷圖模型中路徑求解的難度進行邊界檢測。在基因表達譜數(shù)據(jù)集、目標追蹤、復雜人臉識圖像數(shù)據(jù)集、萬維人工合成數(shù)據(jù)集上的實驗結(jié)果驗證了Knigit算法的有效性。(5)提出了面向維度技術(shù)。將高維空間分解為與維數(shù)相同的多個一維子空間,從每個子空間分析數(shù)據(jù)分布特性。本文的研究工作展示了面向維度技術(shù)如何從面向全維空間至面向一維子空間的技術(shù)演變,豐富了高維空間聚類邊界檢測技術(shù)的理論研究,提高了技術(shù)的檢測性能,降低了技術(shù)的實現(xiàn)難度,擴展了聚類邊界的研究范圍,特別是在基因表達譜數(shù)據(jù)、人臉識別、目標追蹤、萬維空間等領(lǐng)域的一些積極嘗試和探索,進一步加速了理論研究向現(xiàn)實應(yīng)用的轉(zhuǎn)化。
[Abstract]:Clustering is an important research problem in data mining, which can effectively help us to analyze the data distribution characteristics of the data, find the structure hidden in the data, for further analysis and utilization. The cluster boundary represents those of clear ownership, but also has the object from the things formerly category feature in medical. Recessive genetic disease, gene expression data, handwritten signature, plays an important role in the research of target tracking and other fields. Based on the research of clustering and clustering boundary existing pattern recognition techniques for clustering on high dimensional space boundary theory is the problem to a lack of effective research study, from the space oriented and two angles for dimensions of a detection model of high dimensional boundary and its effectiveness, and to establish and introduce a number of high dimensional data set. The main innovations of this dissertation are as : (1) reduce the fixed sampling window improved kernel density estimation method for density estimation of sensitivity method by introducing a dynamic adaptive kNN sampling window, and the improved kernel density estimation technique as the weight of the mean shift vector space in the neighborhood, and then put forward the BorderShift. edge detection algorithm for synthetic data sets for high dimensional space and the experimental results on real data show that this technique can effectively detect the high dimensional clustering boundary model. (2) in order to improve the detection accuracy of cluster boundary, using the dimension of thought for high dimensional transformation of the Hopki statistic, presents a new description of the high dimensional space of uniform Symmetry statistics; through the introduction of particle space symmetry theory in physics, the current data point as the center of origin of high dimensional space, and a Gou Jianyi high dimensional data space coordinates of the same dimension Department of the center, and the origin of the k nearest neighbor object coordinate inversion, the projection space nearest neighbor data points to a high dimensional coordinate system. With the two kinds of technology based on Spinver algorithm is proposed. In the synthetic data set, medical data sets, handwritten data sets, multi pose face data sets the experimental results show the method is effective and has high efficiency. (3) in proving the existence of the lever balance fulcrum of the inevitability and uniqueness based on the proposed high-dimensional space analysis from the angle of thought, to simulation in high dimensional space into a plurality of lever with the same space dimension, using balance the coefficient between the current sample points in each dimension of the projection coordinate and balance pivot distance calculation, Lever algorithm is proposed, that the synthetic and real data sets of experiments, the Lever algorithm can better deal with the boundary clustering in high dimensional space The detection problem and has higher detection accuracy. (4) to solve the clustering boundary detection problem of higher dimensional space, presents a simulation of Knight. edge detection algorithm for Markov graph model of the technology based on high dimensional space into discrete state space, and convert the Markov process in the state space for the parade map the corresponding model, and construct the Hard graph model of path coefficient to determine the difficulty of solving the boundary detection. Expression data sets in gene target tracking, face recognition of complex image data sets, the synthetic data sets. The experimental results verify the effectiveness of the Knigit algorithm. (5) proposed for the dimension of technology. The high dimensional space is decomposed into multiple one-dimensional subspaces with the same dimension, analysis of distribution characteristics of the data from each subspace. This research work shows how technology oriented dimension from the full dimensional space To the one-dimensional subspace technology evolution, enriches the theory of research on detection technology of high dimensional spatial clustering boundary, improves the detection performance, reduce the complexity of technology, expands the research scope of cluster boundaries, especially in gene expression data, face recognition, target tracking, web space etc. some positive exploration, to further accelerate the theoretical research into practical application.
【學位授予單位】:鄭州大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP311.13
【相似文獻】
相關(guān)期刊論文 前10條
1 張香琴,方如明,蔡健榮,許俐;基于去噪的熵算子邊界檢測法[J];江蘇理工大學學報(自然科學版);2000年02期
2 郭圣文,羅立民;一種新的線邊界檢測方法[J];計算機學報;2003年07期
3 韓海;線條化的邊界檢測[J];湖北大學學報(自然科學版);2003年03期
4 張俊燕;全方向M型心動圖像的邊界檢測[J];成都信息工程學院學報;2004年01期
5 許先斌,汪長城,陳勇華;一種基于運動特征的快速鏡頭邊界檢測方法[J];計算機應(yīng)用;2004年12期
6 韓冰,姬紅兵,高新波;一種基于小波的分層和多分辨的鏡頭邊界檢測方法[J];西安電子科技大學學報;2005年01期
7 韓冰,姬紅兵,高新波;一種先切分后檢測的分層鏡頭邊界檢測方法[J];系統(tǒng)工程與電子技術(shù);2005年02期
8 高健;周宇玫;茅時群;;一種基于相關(guān)性分析的鏡頭邊界檢測系統(tǒng)[J];電視技術(shù);2006年03期
9 蔣興浩;孫錟鋒;方之昕;李榮杰;馮冰;;基于可變窗的鏡頭邊界檢測算法[J];上海交通大學學報;2009年11期
10 肖永良;朱韶平;劉超群;;基于結(jié)構(gòu)保留投影的鏡頭邊界檢測[J];計算機工程與應(yīng)用;2012年32期
相關(guān)會議論文 前9條
1 Yue Feng WAN;Jack-Gérard POSTAIRE;Fran噻ois CABESTAING;;圖像邊界檢測[A];1995年中國控制會議論文集(上)[C];1995年
2 管永紅;劉瑞根;周俸才;;用計算機對比法進行邊界檢測[A];中國工程物理研究院科技年報(1998)[C];1998年
3 盧文鋒;;基于貝葉斯方法的超聲波圖像邊界檢測[A];2007北京地區(qū)高校研究生學術(shù)交流會通信與信息技術(shù)會議論文集(上冊)[C];2008年
4 彭進業(yè);郝重陽;;一種基于二維圖像分割的視頻鏡頭邊界檢測方法[A];信號與信息處理技術(shù)第三屆信號與信息處理全國聯(lián)合學術(shù)會議論文集[C];2004年
5 劉瑞根;董維申;周俸才;管永紅;;三種不依賴對比樣品的閃光X光照相圖像邊界檢測[A];中國工程物理研究院科技年報(1999)[C];1999年
6 宋二祥;;無限地基數(shù)值模擬的傳輸邊界[A];第六屆全國結(jié)構(gòu)工程學術(shù)會議論文集(第三卷)[C];1997年
7 王麗輝;袁保宗;苗振江;;結(jié)合FCM和邊界檢測算法進行不規(guī)則點云去噪[A];第十三屆全國信號處理學術(shù)年會(CCSP-2007)論文集[C];2007年
8 高煜;程昊;畢傳興;陳劍;;基于分布源邊界點的結(jié)構(gòu)聲輻射和聲靈敏度的研究[A];第九屆全國振動理論及應(yīng)用學術(shù)會議論文摘要集[C];2007年
9 范競往;翟曉飛;封化民;楊鼎才;方勇;;一種雙層新聞邏輯單元分割框架[A];第一屆建立和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2005)論文集[C];2005年
相關(guān)博士學位論文 前10條
1 邰振華;位場數(shù)據(jù)高精度處理方法的研究與應(yīng)用[D];吉林大學;2016年
2 張輝;基于朝向?qū)Ρ榷鹊倪吔鐧z測和圖像分類研究[D];北京交通大學;2014年
3 司馬玉洲;基于雙互易法的雜交邊界點法及其應(yīng)用研究[D];華中科技大學;2009年
4 晏飛;雙重互易雜交邊界點法理論及其應(yīng)用研究[D];華中科技大學;2008年
5 李桂丹;無線傳感器網(wǎng)絡(luò)路由協(xié)議及容錯事件邊界檢測研究[D];天津大學;2009年
6 王橋;快速多極雜交邊界點法理論及在結(jié)構(gòu)工程復合材料中的應(yīng)用[D];華中科技大學;2013年
7 苗雨;奇異雜交邊界點法理論研究及應(yīng)用[D];華中科技大學;2005年
8 顧德;無線傳感器網(wǎng)絡(luò)拓撲邊界與瓶頸辨識[D];浙江大學;2012年
9 劉劍明;可壓縮流體計算中的浸入邊界方法及其應(yīng)用[D];南京航空航天大學;2010年
10 黃坤朋;基于改善時域有限差分邊界的房間低頻可聽化實現(xiàn)[D];華南理工大學;2011年
相關(guān)碩士學位論文 前10條
1 曹曉鋒;面向維度的高維聚類邊界檢測技術(shù)研究[D];鄭州大學;2017年
2 耿鵬;混合屬性數(shù)據(jù)聚類邊界檢測技術(shù)的研究[D];鄭州大學;2015年
3 樊駿笠;關(guān)聯(lián)稀疏在圖像恢復和邊界檢測中的應(yīng)用[D];浙江師范大學;2015年
4 孫娟;新的視頻鏡頭邊界檢測的度量標準[D];蘭州大學;2015年
5 劉烽;基于動態(tài)閾值與擬合特征的鏡頭邊界檢測[D];南京大學;2013年
6 劉勝男;基于超像素的點互信息圖像邊界檢測與分割算法研究[D];西北農(nóng)林科技大學;2016年
7 王瑞宇;無監(jiān)督在線學習實現(xiàn)遮擋邊界檢測與遮擋規(guī)避方法研究[D];燕山大學;2016年
8 張鋮;基于小型無人直升機的環(huán)境污染區(qū)域邊界檢測與跟蹤算法的研究[D];華南理工大學;2016年
9 嚴征;無人車的道路邊界檢測研究[D];西安工業(yè)大學;2016年
10 Malichenko Viktor;實時道路邊界檢測和交通標志識別[D];北京工業(yè)大學;2016年
,本文編號:1597330
本文鏈接:http://www.lk138.cn/shoufeilunwen/xixikjs/1597330.html