顯著性目標分割模型及其應(yīng)用
本文選題:顯著性目標分割 + 圖像分割。 參考:《深圳大學(xué)》2016年博士論文
【摘要】:視覺感知在人類獲取周圍環(huán)境的知識中起到了不可替代的作用,而圖像是視覺感知的重要載體之一。隨著智能手機的廣泛普及,互聯(lián)網(wǎng)上的圖像資源呈現(xiàn)爆炸性的增長。如果可以模擬人類的視覺注意感知機制,對進入視野的海量圖片信息自動找出最重要、最顯著的部分進行處理,這樣有助于突破信息處理的瓶頸,節(jié)省計算和分析資源,提高信息處理的速度。顯著性目標就是一個場景中最重要、最吸引人注意的部分。顯著性目標分割就是自動將輸入圖片中最顯著的目標進行精確分割的一種模型。近年來,顯著性目標分割模型吸引了研究者極大的興趣,涌現(xiàn)出了眾多的優(yōu)秀的模型與算法。而且顯著性目標分割技術(shù)在機器人視覺、視頻安全監(jiān)控、目標探測與識別、視頻壓縮與編碼、運動檢測、視頻目標跟蹤等領(lǐng)域得到了廣泛應(yīng)用。本文從基于區(qū)域的圖像分割研究出發(fā),逐步深入到顯著性目標分割問題,結(jié)合子空間聚類理論、非局部各向異性擴散方程、流擴散等相關(guān)理論,提出了一些新的算法和模型。本文工作主要包括以下幾個方面:1.在基于區(qū)域的圖像分割問題研究中,提出了一個新的基于非凸半范數(shù)約束的稀疏低秩耦合的圖像分割模型。將子空間聚類模型引入到圖像分割問題中,并且采用S1/2范數(shù)替代核范數(shù)來近似低秩表示,采用L1/2范數(shù)替代L1范數(shù)來近似稀疏表示。研究發(fā)現(xiàn),對低秩表示問題和稀疏表示問題而言,S1/2范數(shù)和L1/2范數(shù)雖然是非凸的,但它們是一種更好的松弛,且它們的極小化問題具有閉式解。通過ALM算法分離變量,利用半閾值算子得到一種有效的離散算法。大量的實驗證明了模型分割的準確性和對噪聲的魯棒性。2.進一步深入研究了非凸低秩子空間聚類問題。用Schatten-q擬范數(shù)松弛低秩子空間聚類模型中的秩函數(shù),提出了基于Schatten-q正則化的低秩子空間聚類模型。我們證明了Schatten-q正則最小化問題的最優(yōu)解可以通過一個廣義的矩陣軟閾值收縮算子表示,模型通過自適應(yīng)線性交替方向乘子法(LADMAP)求解。理論分析證明,廣泛應(yīng)用的軟閾值(SVT)算法和半閾值算法分別是我們新模型在q=1和q=0.5的兩個特例。大量的實驗證明了我們方法的有效性。3.本文進一步研究了顯著性目標分割問題。本文將視覺顯著性目標檢測過程建模為一個非局部各向異性擴散方程,提出了一個基于非局部各向異性擴散方程的兩階段顯著性檢測模型。在第一階段,利用邊界先驗進行了由邊界到全圖像的背景擴散,通過排序的方法選擇了部分顯著性值高的元素作為初始顯著性種子。在第二階段,從顯著性種子出發(fā)將顯著性值擴散到全圖像域。在第二階段的顯著性迭代擴散過程中對顯著性種子作了更新和優(yōu)化,消除了錯誤種子的的影響,從而有效抑制了背景。對于模型的求解,本文提出了多方向離散格式來求解新模型。實驗結(jié)果表明,無論從主觀分析,還是從客觀評價,新方法在3個常用數(shù)據(jù)庫上都得到了良好的檢測效果。4.通過對現(xiàn)有的基于擴散思想的顯著性模型分析發(fā)現(xiàn),現(xiàn)有模型只考慮了點與點之間的擴散強度,而沒有考慮到擴散方向。這會導(dǎo)致,兩個區(qū)域如果特征相似而所處的類別不同時,模型檢測會出現(xiàn)較大的誤差;谶@一觀察,本文對前一個模型進行了改進,引入了非局部擴散張量,以在控制擴散強度的同時考慮擴散方向問題。在主方向上,抑制擴散從而保證了背景和前景之間的差異性;在其它方向上,新模型提升了擴散,從而保證相似部分作為一個整體高亮檢測出來。大量實驗證明了新模型的良好性能。5.進一步,本文利用多特征的并行框架來模擬人類視覺感知機制,提出一個新的基于多特征融合的顯著性流模型。本文提出一個基本共識,即顯著性目標分割時,在大部分特征通道中都顯著的區(qū)域才認為是顯著性目標;谶@個共識,在每個特征通道中,采用顯著性流擴散的方法進行建模。然后用二次規(guī)劃的方法訓(xùn)練以得到融合權(quán)重。以調(diào)整過的權(quán)重進行線性融合來得到最終的檢測結(jié)果。經(jīng)過大量的實驗證明我們的模型有很好的綜合性能。
[Abstract]:Visual perception plays an irreplaceable role in the knowledge of human access to the surrounding environment, and image is one of the important carriers of visual perception. With the widespread popularity of smart phones, the image resources on the Internet are explosively growing. If we can simulate human visual perception mechanism, the mass picture letter that enters the field of vision Interest automatically finds the most important and most significant part of the process, which helps to break through the bottleneck of information processing, save computing and analysis resources, and improve the speed of information processing. The significant target is the most important and most attractive part of a scene. The significant target segmentation is the most significant target in the input of the picture. A model for accurate segmentation. In recent years, the significant target segmentation model has attracted the great interest of the researchers, and many excellent models and algorithms have emerged. Moreover, the significant target segmentation technology is in robot vision, video security monitoring, target detection and recognition, video compression and coding, motion detection, video target tracking. Based on the study of region based image segmentation, this paper goes deep into the problem of significant target segmentation, and proposes some new algorithms and modes combining the subspace clustering theory, non local anisotropic diffusion equation, flow diffusion and other related theories. This paper mainly includes the following aspects: 1. In the study of region based image segmentation, a new image segmentation model based on sparse and low rank coupling based on non convex semi norm constraints is proposed. Subspace clustering model is introduced into the image segmentation problem, and S1/2 norm is used instead of kernel norm to approximate low rank representation, and L1/2 norm is used instead of L1 norm to approximate sparse representation. It is found that, for the problem of low rank representation and sparse representation, the S1/2 norm and the L1/2 norm are not convex, but they are a better relaxation, and their minimization problem has a closed solution. A valid discrete algorithm is obtained by using the semi threshold operator by the ALM algorithm. A large number of experiments prove the model points. The accuracy of cutting and the robustness to noise.2. further studies the problem of non convex and low rank subspace clustering. Using the rank function in the Schatten-q quasi norm relaxation low rank subspace clustering model, a low rank subspace clustering model based on the Schatten-q regularization is proposed. We prove the optimal solution of the Schatten-q regular minimization problem. By means of a generalized matrix soft threshold contraction operator, the model is solved by the adaptive linear alternating direction multiplier (LADMAP) method. The theoretical analysis shows that the widely used soft threshold (SVT) algorithm and the semi threshold algorithm are two special examples of our new model in q=1 and q=0.5. A large number of experiments prove the effectiveness of our method.3. This paper further studies the problem of significant target segmentation. In this paper, the visual saliency target detection process is modeled as a nonlocal anisotropic diffusion equation, and a two stage salience detection model based on nonlocal anisotropic diffusion equation is proposed. In the first stage, the boundary prior to the full image is carried out with the boundary prior. In the second stage, the value of saliency is spread to the whole image domain. In the second stage of the significant iterative diffusion process, the significant seeds are updated and optimized to eliminate the effect of the wrong seeds. For the solution of the model, a multi direction discrete scheme is proposed to solve the new model. The experimental results show that the new method, both from the subjective analysis and the objective evaluation, has got a good detection effect on 3 common databases through the analysis of the existing significant model based on the existing diffusion thought. It is found that the existing model only takes into account the diffusion strength between point and point, but does not take into account the diffusion direction. This will lead to a larger error in the model detection in the two regions if the characteristics are similar and the categories are different. Based on this observation, the previous model is improved and the non local diffusion tensor is introduced to the model. The diffusion strength is controlled and the diffusion direction is considered at the same time. In the main direction, the diffusion is suppressed to ensure the difference between the background and the foreground; in other directions, the new model improves the diffusion, thus ensuring the similar part as a whole bright detection. A large number of experiments prove that the good performance of the new model is further.5., Wen Li uses multi feature parallel framework to simulate human visual perception mechanism, and proposes a new model of saliency flow based on multi feature fusion. This paper proposes a basic consensus that significant regions in most characteristic channels are considered explicit targets when significant targets are segmented. Based on this consensus, each feature is connected. In the channel, the model is modeled using the method of significant flow diffusion. Then the fusion weight is trained by two programming methods. The final results are obtained by the linear fusion of the adjusted weights. A lot of experiments show that our model has good comprehensive performance.
【學(xué)位授予單位】:深圳大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:TP391.41
【相似文獻】
相關(guān)期刊論文 前10條
1 詹天明;肖亮;張軍;韋志輝;;基于時空連續(xù)約束的4D腦圖像分割模型[J];電子學(xué)報;2013年08期
2 董建磊;郝礦榮;李允明;丁永生;;一種新的知覺分割模型[J];計算機應(yīng)用研究;2007年04期
3 喻罡;李鵬;繆亞林;卞正中;;多分辨超聲心動圖像分割模型[J];西安交通大學(xué)學(xué)報;2006年04期
4 孫曉歡;楊豐;趙祺陽;;改進的分級多相圖像分割模型及其快速實現(xiàn)[J];數(shù)據(jù)采集與處理;2010年01期
5 俞璐;謝鈞;吳樂南;;格點上的一種統(tǒng)計分割模型(英文)[J];Journal of Southeast University(English Edition);2008年01期
6 王海軍;張圣燕;;融合局部和全局信息的兩相腦圖分割模型[J];濱州學(xué)院學(xué)報;2013年06期
7 吳繼明;龐雄文;;一種具有去噪能力的全局最小值分割模型[J];計算機工程;2012年07期
8 趙在新;成禮智;;模糊分段光滑圖像分割模型及其快速算法[J];光電子.激光;2011年06期
9 楊曉藝;王小歡;宋錦萍;;連續(xù)最大流圖像分割模型及算法[J];中國圖象圖形學(xué)報;2013年11期
10 賴軍臣;湯秀娟;謝瑞芝;白中英;李少昆;;基于G-MRF模型的玉米葉斑病害圖像的分割[J];中國農(nóng)業(yè)科學(xué);2010年07期
相關(guān)會議論文 前5條
1 徐濤;;時間序列優(yōu)化分割模型和提取算法[A];2006中國控制與決策學(xué)術(shù)年會論文集[C];2006年
2 葉娜;鄭妍;朱靖波;張斌;;基于二維動態(tài)規(guī)劃的文本分割模型[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
3 文和平;綦耀光;柯映林;程耀東;;常用刀具的優(yōu)化分割模型[A];第一屆全國幾何設(shè)計與計算學(xué)術(shù)會議論文集[C];2002年
4 葉娜;羅海濤;鄭妍;朱靖波;張斌;;基于改進型Dotplotting的文本分割模型[A];中文信息處理前沿進展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年
5 全剛;徐鐘;孫即祥;;一種改進的C-V圖像分割模型[A];第十四屆全國信號處理學(xué)術(shù)年會(CCSP-2009)論文集[C];2009年
相關(guān)博士學(xué)位論文 前4條
1 張秀君;顯著性目標分割模型及其應(yīng)用[D];深圳大學(xué);2016年
2 原野;偏微分方程圖像分割模型研究[D];重慶大學(xué);2012年
3 葛琦;基于局部統(tǒng)計和結(jié)構(gòu)的活動輪廓分割模型[D];南京理工大學(xué);2013年
4 章菲倩;數(shù)字幾何模型聯(lián)合分割方法研究[D];南京大學(xué);2015年
相關(guān)碩士學(xué)位論文 前10條
1 李春;基于Chan-Vese圖像分割模型的研究與應(yīng)用[D];中央民族大學(xué);2015年
2 劉金彥;噪聲魯棒的偏微分方程圖像分割模型[D];重慶大學(xué);2015年
3 林靜;PDE分割模型中的局部窗口動態(tài)調(diào)整及Bregman實現(xiàn)[D];福州大學(xué);2014年
4 龔海晏;基于Ambrosio-Tortorelli圖像分割模型的研究與應(yīng)用[D];安徽工業(yè)大學(xué);2016年
5 尹溶芳;兩個變分圖像分割模型的數(shù)值求解[D];重慶大學(xué);2016年
6 王昊;基于位置與形狀建模的視覺媒體語義分割研究[D];南京大學(xué);2014年
7 張娜;基于全局凸分割模型的兩相圖像分割研究[D];青島大學(xué);2010年
8 王小歡;連續(xù)最大流圖像分割模型及其算法[D];河南大學(xué);2013年
9 彭小朋;一種腦MRI圖像的混合分割模型[D];上海交通大學(xué);2010年
10 李祁鳳;多相M-S模型最小圖分割理論與醫(yī)學(xué)應(yīng)用研究[D];湖南大學(xué);2011年
,本文編號:2101949
本文鏈接:http://www.lk138.cn/shoufeilunwen/xxkjbs/2101949.html