中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當前位置:主頁 > 科技論文 > 自動化論文 >

蛋白質殘基相互作用預測及其在結構建模中的應用研究

發(fā)布時間:2020-03-26 07:38
【摘要】:在后基因組時代,蛋白質組學已成為非常重要的研究熱點之一。蛋白質作為生命活動的重要載體,對其三維結構進行解析有助于了解蛋白質功能,進而深入理解各種生命現(xiàn)象的本質。蛋白質結構在藥物設計和蛋白質設計等方面也有著廣泛的應用,然而,相對于已經(jīng)測定出的蛋白質序列的數(shù)量,已知蛋白質結構的數(shù)量相對甚少,并且蛋白質序列和結構數(shù)量之間的差距日益增大。幸運的是,隨著生物大數(shù)據(jù)的不斷積累以及模式識別方法特別是深度學習技術的快速進步,使得直接基于蛋白質序列快速準確地從頭預測出蛋白質結構成為可能。由于蛋白質結構預測具有速度快及成本低等優(yōu)點,它已然成為通過理論實驗解析蛋白質結構的一種補充方法。在預測蛋白質三維結構的過程中,空間約束起著關鍵的作用,如角度和距離約束等,它們可以大幅降低構象空間的熵,以達到優(yōu)化蛋白質結構的目的。蛋白質殘基網(wǎng)絡中的相互作用信息,特別是長距離的相互作用,能夠協(xié)助結構建模算法計算出高質量的構象空間。研究表明,二硫鍵作為一種特殊的殘基相互作用,在蛋白質折疊過程中至關重要。近些年來,科研人員利用各種模式識別方法開發(fā)了多種蛋白質殘基相互作用預測模型,并成功地把預測結果轉化為空間距離約束條件優(yōu)化三維結構模型。但在實際應用中,對于相似序列較少的蛋白質,如何精確地預測殘基之間的相互作用信息,一直困擾著研究人員,因為從序列中提取到的特征并不準確。當前,絕大多數(shù)預測模型僅適用于水溶性蛋白,對于膜蛋白殘基相互作用預測的研究相對較少,這是由于已知膜蛋白的結構很少,因而沒有足夠的樣本訓練出高質量的預測模型。本文直接從蛋白質序列出發(fā),基于機器學習和數(shù)據(jù)挖掘技術,主要研究對象是蛋白質殘基之間的相關性,包括水溶性蛋白和膜蛋白中的殘基相互作用以及二硫鍵連接模式。除此之外,還研究了空間距離約束在蛋白質三維結構建模中的應用。本文主要的研究內容與創(chuàng)新點如下:一、提出了基于動態(tài)決策的蛋白質殘基相互作用預測算法R_2C。本文研發(fā)了一種動態(tài)融合策略,充分利用有監(jiān)督的機器學習法和無監(jiān)督的相關性分析法的優(yōu)點,針對不同的輸入采取不同的線性融合權重,提高了預測殘基相互作用的正確率。全局相關性分析算法能夠有效去除因傳遞噪聲帶來的假陽性,然而,在其輸出中仍然可以觀察到高斯噪聲,本文首次應用高斯濾波模型進一步優(yōu)化相關性分析法的輸出,強化了長距離殘基相互作用的預測正確率。二、構建了基于卷積神經(jīng)網(wǎng)絡的殘基相互作用預測模型MemBrain。在膜蛋白中,跨膜螺旋間的殘基相互作用信息對結構建模更加重要,因而得到了更多的關注。現(xiàn)有方法只用跨膜螺旋間的殘基對訓練模型,然而本文則使用全序列的樣本訓練機器學習模型。一方面可以增加訓練樣本,另一方面預測模型將有能力計算全序列的殘基相互作用。由蛋白質三維結構的固有特性決定了殘基相互作用信息是密集分布的,據(jù)此,MemBrain預測模型被設計成兩級的架構,第一級用于預測序列中每個殘基對發(fā)生相互作用的概率,第二級則以待測殘基對及其鄰域內的殘基對的初始概率為輸入,利用卷積神經(jīng)網(wǎng)絡挖掘隱含在其中的相互作用關聯(lián)模式,從而大幅地提高了預測殘基相互作用的正確率。三、開發(fā)了基于降階方法的Cyscon模型以預測二硫鍵連接模式。二硫鍵可能的連接模式數(shù)量與蛋白質序列中二硫鍵的數(shù)量呈指數(shù)正相關,當序列中含有5個以上的二硫鍵時,當前的預測算法都難以正確預測出其連接模式。針對這一難題,本文創(chuàng)新地引入了降階的思想,即首先基于序列比對的方法找出待測序列中較為保守的二硫鍵,然后再用傳統(tǒng)的機器學習法預測出序列中剩余的二硫鍵。在該框架下,一方面預測模型能夠處理包含更多二硫鍵的蛋白質序列,另一方面提高了二硫鍵連接模式的預測正確率;贑yscon的預測結果,本文首次系統(tǒng)地驗證了二硫鍵作為空間距離約束能夠提高蛋白質三維結構建模的精度。四、設計了基于窮盡約束搜索的算法ExSSO用于輔助核磁共振(NMR)實驗解析膜蛋白結構。與蛋白質殘基網(wǎng)絡中的相互作用信息不同,利用NMR技術測得的NOE(Nuclear Overhauser Enhancement)距離約束非?煽,但是卻具有雙向不確定性。本文在已知跨膜多聚體的單體結構以及單體數(shù)量的條件下,利用不確定的NOE約束窮盡地篩選跨膜多聚體的構象空間。ExSSO通過對歐拉角的均勻采樣,實現(xiàn)了對單體結構朝向近乎完全地搜索,最后通過聚類的方法計算出具有代表性的結構,有效地避免顯式求解每個NOE約束的方向。
【圖文】:

狀態(tài)圖,二級結構,蛋白質,狀態(tài)


3圖 1-1 以蛋白質 3e88A 為例展示三種二級結構狀態(tài)igure 1-1 Illustration of three states of secondary structure using the protein 3e8

序列,殘基,蛋白質,網(wǎng)絡結構


連邊即表示相應的兩個殘基發(fā)生相互作用,如圖 1-2 所示,它實際網(wǎng)絡。殘基之間的相互作用信息可以轉化為空間距離約束條件,殘學術界有多種定義方式,總體來說,如果蛋白質結構中兩個殘基在小于某個閾值,,那么就可以認為它們之間發(fā)生相互作用。常用的定:一種定義針對水溶性蛋白,兩個殘基 Cβ原子之間的距離小于 針對膜蛋白的,即兩個殘基重原子之間最小的距離小于 5.5 。另對之間的序列間距,還可以把蛋白質殘基相互作用分為短距離((12-23)和長距離(≥24)的相互作用。殘基相互作用信息已被證維結構建模中起著至關重要的作用,例如,Wu 等人在 2011 年利互作用信息提高了蛋白質結構建模的精度[12]。
【學位授予單位】:上海交通大學
【學位級別】:博士
【學位授予年份】:2018
【分類號】:Q51;TP181;TP311.13

【參考文獻】

相關期刊論文 前2條

1 張春霆;人與其他生物基因組若干重要問題的生物信息學研究[J];自然科學進展;2004年12期

2 張春霆;生物信息學的現(xiàn)狀與展望[J];世界科技研究與發(fā)展;2000年06期



本文編號:2601167

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/2601167.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶04ef3***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com