中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

蛋白質(zhì)殘基相互作用預(yù)測(cè)及其在結(jié)構(gòu)建模中的應(yīng)用研究

發(fā)布時(shí)間:2020-03-26 07:38
【摘要】:在后基因組時(shí)代,蛋白質(zhì)組學(xué)已成為非常重要的研究熱點(diǎn)之一。蛋白質(zhì)作為生命活動(dòng)的重要載體,對(duì)其三維結(jié)構(gòu)進(jìn)行解析有助于了解蛋白質(zhì)功能,進(jìn)而深入理解各種生命現(xiàn)象的本質(zhì)。蛋白質(zhì)結(jié)構(gòu)在藥物設(shè)計(jì)和蛋白質(zhì)設(shè)計(jì)等方面也有著廣泛的應(yīng)用,然而,相對(duì)于已經(jīng)測(cè)定出的蛋白質(zhì)序列的數(shù)量,已知蛋白質(zhì)結(jié)構(gòu)的數(shù)量相對(duì)甚少,并且蛋白質(zhì)序列和結(jié)構(gòu)數(shù)量之間的差距日益增大。幸運(yùn)的是,隨著生物大數(shù)據(jù)的不斷積累以及模式識(shí)別方法特別是深度學(xué)習(xí)技術(shù)的快速進(jìn)步,使得直接基于蛋白質(zhì)序列快速準(zhǔn)確地從頭預(yù)測(cè)出蛋白質(zhì)結(jié)構(gòu)成為可能。由于蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)具有速度快及成本低等優(yōu)點(diǎn),它已然成為通過(guò)理論實(shí)驗(yàn)解析蛋白質(zhì)結(jié)構(gòu)的一種補(bǔ)充方法。在預(yù)測(cè)蛋白質(zhì)三維結(jié)構(gòu)的過(guò)程中,空間約束起著關(guān)鍵的作用,如角度和距離約束等,它們可以大幅降低構(gòu)象空間的熵,以達(dá)到優(yōu)化蛋白質(zhì)結(jié)構(gòu)的目的。蛋白質(zhì)殘基網(wǎng)絡(luò)中的相互作用信息,特別是長(zhǎng)距離的相互作用,能夠協(xié)助結(jié)構(gòu)建模算法計(jì)算出高質(zhì)量的構(gòu)象空間。研究表明,二硫鍵作為一種特殊的殘基相互作用,在蛋白質(zhì)折疊過(guò)程中至關(guān)重要。近些年來(lái),科研人員利用各種模式識(shí)別方法開(kāi)發(fā)了多種蛋白質(zhì)殘基相互作用預(yù)測(cè)模型,并成功地把預(yù)測(cè)結(jié)果轉(zhuǎn)化為空間距離約束條件優(yōu)化三維結(jié)構(gòu)模型。但在實(shí)際應(yīng)用中,對(duì)于相似序列較少的蛋白質(zhì),如何精確地預(yù)測(cè)殘基之間的相互作用信息,一直困擾著研究人員,因?yàn)閺男蛄兄刑崛〉降奶卣鞑⒉粶?zhǔn)確。當(dāng)前,絕大多數(shù)預(yù)測(cè)模型僅適用于水溶性蛋白,對(duì)于膜蛋白殘基相互作用預(yù)測(cè)的研究相對(duì)較少,這是由于已知膜蛋白的結(jié)構(gòu)很少,因而沒(méi)有足夠的樣本訓(xùn)練出高質(zhì)量的預(yù)測(cè)模型。本文直接從蛋白質(zhì)序列出發(fā),基于機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘技術(shù),主要研究對(duì)象是蛋白質(zhì)殘基之間的相關(guān)性,包括水溶性蛋白和膜蛋白中的殘基相互作用以及二硫鍵連接模式。除此之外,還研究了空間距離約束在蛋白質(zhì)三維結(jié)構(gòu)建模中的應(yīng)用。本文主要的研究?jī)?nèi)容與創(chuàng)新點(diǎn)如下:一、提出了基于動(dòng)態(tài)決策的蛋白質(zhì)殘基相互作用預(yù)測(cè)算法R_2C。本文研發(fā)了一種動(dòng)態(tài)融合策略,充分利用有監(jiān)督的機(jī)器學(xué)習(xí)法和無(wú)監(jiān)督的相關(guān)性分析法的優(yōu)點(diǎn),針對(duì)不同的輸入采取不同的線性融合權(quán)重,提高了預(yù)測(cè)殘基相互作用的正確率。全局相關(guān)性分析算法能夠有效去除因傳遞噪聲帶來(lái)的假陽(yáng)性,然而,在其輸出中仍然可以觀察到高斯噪聲,本文首次應(yīng)用高斯濾波模型進(jìn)一步優(yōu)化相關(guān)性分析法的輸出,強(qiáng)化了長(zhǎng)距離殘基相互作用的預(yù)測(cè)正確率。二、構(gòu)建了基于卷積神經(jīng)網(wǎng)絡(luò)的殘基相互作用預(yù)測(cè)模型MemBrain。在膜蛋白中,跨膜螺旋間的殘基相互作用信息對(duì)結(jié)構(gòu)建模更加重要,因而得到了更多的關(guān)注,F(xiàn)有方法只用跨膜螺旋間的殘基對(duì)訓(xùn)練模型,然而本文則使用全序列的樣本訓(xùn)練機(jī)器學(xué)習(xí)模型。一方面可以增加訓(xùn)練樣本,另一方面預(yù)測(cè)模型將有能力計(jì)算全序列的殘基相互作用。由蛋白質(zhì)三維結(jié)構(gòu)的固有特性決定了殘基相互作用信息是密集分布的,據(jù)此,MemBrain預(yù)測(cè)模型被設(shè)計(jì)成兩級(jí)的架構(gòu),第一級(jí)用于預(yù)測(cè)序列中每個(gè)殘基對(duì)發(fā)生相互作用的概率,第二級(jí)則以待測(cè)殘基對(duì)及其鄰域內(nèi)的殘基對(duì)的初始概率為輸入,利用卷積神經(jīng)網(wǎng)絡(luò)挖掘隱含在其中的相互作用關(guān)聯(lián)模式,從而大幅地提高了預(yù)測(cè)殘基相互作用的正確率。三、開(kāi)發(fā)了基于降階方法的Cyscon模型以預(yù)測(cè)二硫鍵連接模式。二硫鍵可能的連接模式數(shù)量與蛋白質(zhì)序列中二硫鍵的數(shù)量呈指數(shù)正相關(guān),當(dāng)序列中含有5個(gè)以上的二硫鍵時(shí),當(dāng)前的預(yù)測(cè)算法都難以正確預(yù)測(cè)出其連接模式。針對(duì)這一難題,本文創(chuàng)新地引入了降階的思想,即首先基于序列比對(duì)的方法找出待測(cè)序列中較為保守的二硫鍵,然后再用傳統(tǒng)的機(jī)器學(xué)習(xí)法預(yù)測(cè)出序列中剩余的二硫鍵。在該框架下,一方面預(yù)測(cè)模型能夠處理包含更多二硫鍵的蛋白質(zhì)序列,另一方面提高了二硫鍵連接模式的預(yù)測(cè)正確率。基于Cyscon的預(yù)測(cè)結(jié)果,本文首次系統(tǒng)地驗(yàn)證了二硫鍵作為空間距離約束能夠提高蛋白質(zhì)三維結(jié)構(gòu)建模的精度。四、設(shè)計(jì)了基于窮盡約束搜索的算法ExSSO用于輔助核磁共振(NMR)實(shí)驗(yàn)解析膜蛋白結(jié)構(gòu)。與蛋白質(zhì)殘基網(wǎng)絡(luò)中的相互作用信息不同,利用NMR技術(shù)測(cè)得的NOE(Nuclear Overhauser Enhancement)距離約束非常可靠,但是卻具有雙向不確定性。本文在已知跨膜多聚體的單體結(jié)構(gòu)以及單體數(shù)量的條件下,利用不確定的NOE約束窮盡地篩選跨膜多聚體的構(gòu)象空間。ExSSO通過(guò)對(duì)歐拉角的均勻采樣,實(shí)現(xiàn)了對(duì)單體結(jié)構(gòu)朝向近乎完全地搜索,最后通過(guò)聚類的方法計(jì)算出具有代表性的結(jié)構(gòu),有效地避免顯式求解每個(gè)NOE約束的方向。
【圖文】:

狀態(tài)圖,二級(jí)結(jié)構(gòu),蛋白質(zhì),狀態(tài)


3圖 1-1 以蛋白質(zhì) 3e88A 為例展示三種二級(jí)結(jié)構(gòu)狀態(tài)igure 1-1 Illustration of three states of secondary structure using the protein 3e8

序列,殘基,蛋白質(zhì),網(wǎng)絡(luò)結(jié)構(gòu)


連邊即表示相應(yīng)的兩個(gè)殘基發(fā)生相互作用,如圖 1-2 所示,它實(shí)際網(wǎng)絡(luò)。殘基之間的相互作用信息可以轉(zhuǎn)化為空間距離約束條件,殘學(xué)術(shù)界有多種定義方式,總體來(lái)說(shuō),如果蛋白質(zhì)結(jié)構(gòu)中兩個(gè)殘基在小于某個(gè)閾值,,那么就可以認(rèn)為它們之間發(fā)生相互作用。常用的定:一種定義針對(duì)水溶性蛋白,兩個(gè)殘基 Cβ原子之間的距離小于 針對(duì)膜蛋白的,即兩個(gè)殘基重原子之間最小的距離小于 5.5 。另對(duì)之間的序列間距,還可以把蛋白質(zhì)殘基相互作用分為短距離((12-23)和長(zhǎng)距離(≥24)的相互作用。殘基相互作用信息已被證維結(jié)構(gòu)建模中起著至關(guān)重要的作用,例如,Wu 等人在 2011 年利互作用信息提高了蛋白質(zhì)結(jié)構(gòu)建模的精度[12]。
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類號(hào)】:Q51;TP181;TP311.13

【參考文獻(xiàn)】

相關(guān)期刊論文 前2條

1 張春霆;人與其他生物基因組若干重要問(wèn)題的生物信息學(xué)研究[J];自然科學(xué)進(jìn)展;2004年12期

2 張春霆;生物信息學(xué)的現(xiàn)狀與展望[J];世界科技研究與發(fā)展;2000年06期



本文編號(hào):2601167

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/2601167.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶04ef3***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com