基于群智能算法的蛋白質結構預測研究
發(fā)布時間:2020-04-11 03:35
【摘要】:對蛋白質折疊形態(tài)的研究是確定蛋白質在各種復雜因素作用下的有規(guī)律性、穩(wěn)定性和具有生物活性的結構。研究的依據(jù)是如何利用多肽鏈的一級結構獲得蛋白質的空間構象。本文圍繞蛋白質空間結構預測問題,以粒子群算法和遺傳算法為代表的群智能算法為研究基礎,并結合蛋白質的折疊能量勢阱模型,提出了多種優(yōu)化的衍生算法;其中以搜索最小蛋白質勢能對應的空間構象為主要的單優(yōu)化目標,并研究了將氨基酸疏水性和離散性作為輔助對象的多目標優(yōu)化算法。所提出的算法結合了蛋白質折疊的生化過程,并采用多種評價指標評測獲得的蛋白質空間結構。本文提出了利用蛋白質勢能勢阱理論及微觀群落普遍存在的布朗運動現(xiàn)象所啟發(fā)的粒子群算法(Potential-well Particle Swarm Optimization,PPSO),其中具備布朗運動效應的粒子數(shù)量由社會學中的學習效應來確定。在12個基本測試函數(shù)和選出的蛋白質HP格點模型的優(yōu)化上進行了PPSO算法測試,在算法效率上PPSO算法優(yōu)于選出的7個代表性的粒子群衍生算法,同時,在選出的三個蛋白質HP序列的折疊問題上也優(yōu)化于作為對比的基本(Particle Swarm Optimization,PSO)算法。與大多數(shù)現(xiàn)代啟發(fā)式優(yōu)化算法相比,PPSO粒子群算法具有易于實現(xiàn),控制參數(shù)少的特點,且易于解決蛋白質的二維HP格點結構預測問題。本文提出了基于人口的增量學習(Population Based Incremental Learning,PBIL)的蛋白質預測的衍生算法(Protein-Population Based Incremental Learning,PPBIL)。P-PBIL采用了概率向量來搜索最優(yōu)值,利用蛋白質勢能勢模型來進行粒子的學習,它支持復雜的等位基因結構,機器學習水平要求大大低于傳統(tǒng)的遺傳算法(Genetic algorithm,GA)。此外,P-PBIL沒有復雜的遺傳算子,具有計算成本較少和搜索空間大的特點。實驗中,本文采用了CB513和智人蛋白數(shù)據(jù)集作為訓練集,得到了不同氨基酸長度的釋放概率矩陣,并成功應用于蛋白質結構預測,結果表明P-PBIL在單序列蛋白質的預測上優(yōu)于目前的主流算法,是一種較好的預測學習方法。根據(jù)蛋白質肽鏈形成的生物過程,本文提出了邊形成邊折疊的蛋白質折疊設想,該設想和蛋白質空間結構的形成過程的生物學發(fā)現(xiàn)相符,同時設計了改進的3D Off-lattice蛋白質結構模型,該模型采用基于布朗運動策略的粒子群優(yōu)化算法(PPSO)來預測蛋白質空間結構,算法中進行空間搜索的粒子數(shù)量僅限于最后進入肽鏈的氨基酸和少數(shù)幾個隨機選出的粒子。本文不僅對Fibonacci序列進行了數(shù)值模擬,而且還對真實蛋白質toy模型也進行了預測計算,結果顯示本算法具有收斂快和較強的全局搜索能力,能夠用很少的計算時間得到各氨基酸的空間坐標。實驗表明,PPSO比基本PSO具有更好的性能,是解決3D Off-lattice蛋白質空間構象的有效方法。蛋白質折疊過程中涉及到很多除了力場模型外的影響因素,由于蛋白質折疊的過程是在力場模型主導下的多目標優(yōu)化問題,本文提出了多指標梯度排序多目標進化算法(Gradient Stochastic Ranking Algorithm,GSRA)。GSRA引入了小生境高斯距離存檔方法,為了保持多樣性和收斂性之間的平衡,本文選取了兩個具有不同偏向的指標進行數(shù)據(jù)的環(huán)境選擇。實驗結果顯示,在多目標標準測試函數(shù)集MaF上,GSRA算法優(yōu)于7種用于對比的多目標算法。在蛋白質結構預測問題上,本文在最低折疊能量的主目標下引入了疏水性指標和離散性指標指標來優(yōu)化蛋白質空間構象,結果顯示大部分測試蛋白在敏感性、特異性及MCC值上都優(yōu)于本文提出的PPSO算法。
【圖文】:
為通過實驗獲取蛋白質的結構,蛋白質需要通過離心、沉淀、電泳和色種技術從其他細胞成分中純化,基因工程技術的出現(xiàn)和發(fā)展促進了蛋白質和空間結構的研究,常用的蛋白質結構研究方法有免疫組化、定點誘變、X晶體學。2.3 蛋白質分子的結構蛋白質分子是由氨基酸首尾相連通過縮合而成的共價多肽鏈,天然蛋白不是松散多肽鏈,,每種蛋白質都具有其特有的空間結構或稱三維結構。蛋然折疊的形狀被稱為其原生構象。生物化學家通常將蛋白質的構象劃分為構,圖 1-1 描述了血紅蛋白的結構層級圖:一級結構:組成蛋白質多肽鏈的線性氨基酸序列。二級結構: 在不同氨基酸間由氫鍵鏈接的有一定規(guī)律重復形成的局部構。α 螺旋,β 折疊和無規(guī)則轉角是常見的二級結構。二級結構僅包含殘局部空間結構,不包括與肽鏈其他區(qū)段的相互關系及側鏈構象。三級結構:球狀蛋白質的二級結構中α螺旋、β折疊、β轉角和無規(guī)則
1 緒論很長時間主要依靠純實驗的測量,直到二初,Joseph Bryngelson 和 Peter Wolynes定折疊構象的研究才得到轉變。這種方法為自然選擇決定了氨基酸序列的構象以使的蛋白質處于非常穩(wěn)定的狀態(tài)。此外,狀態(tài)的次數(shù)逐漸減少,使折疊過程能夠快出錯程度。實驗中,可以觀察到蛋白質的小值的現(xiàn)象。將蛋白質結構折疊過程用勢含全局最優(yōu)點和多個局部最優(yōu)點的“漏斗白質最小勢能值對應了蛋白質的最穩(wěn)定
【學位授予單位】:中國礦業(yè)大學
【學位級別】:博士
【學位授予年份】:2018
【分類號】:TP18;Q51
本文編號:2623096
【圖文】:
為通過實驗獲取蛋白質的結構,蛋白質需要通過離心、沉淀、電泳和色種技術從其他細胞成分中純化,基因工程技術的出現(xiàn)和發(fā)展促進了蛋白質和空間結構的研究,常用的蛋白質結構研究方法有免疫組化、定點誘變、X晶體學。2.3 蛋白質分子的結構蛋白質分子是由氨基酸首尾相連通過縮合而成的共價多肽鏈,天然蛋白不是松散多肽鏈,,每種蛋白質都具有其特有的空間結構或稱三維結構。蛋然折疊的形狀被稱為其原生構象。生物化學家通常將蛋白質的構象劃分為構,圖 1-1 描述了血紅蛋白的結構層級圖:一級結構:組成蛋白質多肽鏈的線性氨基酸序列。二級結構: 在不同氨基酸間由氫鍵鏈接的有一定規(guī)律重復形成的局部構。α 螺旋,β 折疊和無規(guī)則轉角是常見的二級結構。二級結構僅包含殘局部空間結構,不包括與肽鏈其他區(qū)段的相互關系及側鏈構象。三級結構:球狀蛋白質的二級結構中α螺旋、β折疊、β轉角和無規(guī)則
1 緒論很長時間主要依靠純實驗的測量,直到二初,Joseph Bryngelson 和 Peter Wolynes定折疊構象的研究才得到轉變。這種方法為自然選擇決定了氨基酸序列的構象以使的蛋白質處于非常穩(wěn)定的狀態(tài)。此外,狀態(tài)的次數(shù)逐漸減少,使折疊過程能夠快出錯程度。實驗中,可以觀察到蛋白質的小值的現(xiàn)象。將蛋白質結構折疊過程用勢含全局最優(yōu)點和多個局部最優(yōu)點的“漏斗白質最小勢能值對應了蛋白質的最穩(wěn)定
【學位授予單位】:中國礦業(yè)大學
【學位級別】:博士
【學位授予年份】:2018
【分類號】:TP18;Q51
【參考文獻】
相關期刊論文 前1條
1 李紹新;張延嬌;;改進的遺傳算法在蛋白質結構預測中的應用[J];華南師范大學學報(自然科學版);2009年01期
本文編號:2623096
本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/2623096.html
最近更新
教材專著