基于重復信息測定與卷積神經(jīng)網(wǎng)絡的蛋白質亞細胞定位研究
發(fā)布時間:2024-06-28 00:03
細胞由細胞膜、細胞核、內質網(wǎng)等被稱為“亞細胞”的各部分組成,亞細胞的功能由位于其中的蛋白質執(zhí)行。蛋白質的亞細胞結構被叫做蛋白質的“亞細胞位置”。蛋白質必須被運送到適當?shù)膩喖毎恢貌拍苷0l(fā)揮功能,否則會產(chǎn)生機體功能紊亂和疾病,因而準確的了解亞細胞定位信息對于深入了解蛋白質的功能、細胞生命活動等具有重要意義。同時,蛋白質數(shù)據(jù)本身的海量、多模態(tài)、關聯(lián)性、不完整等特征,使蛋白質亞細胞定位問題成為生物信息學領域具有挑戰(zhàn)性的研究熱點。蛋白質亞細胞定位問題一般分為三個步驟,分別為特征提取、分類預測和算法評估。特征提取是最關鍵的一步。通過對蛋白質序列進行分析,提取主要特征,建立特征向量;分類預測是將特征提取的特征作為分類算法的輸入送到不同的分類器中;算法評估是評估分類結果,判定特征提取方法和分類算法的優(yōu)劣。本文圍繞蛋白質亞細胞定位問題,主要進行特征提取方法和分類算法兩個方面的研究。論文工作如下:(1)針對傳統(tǒng)特征提取方法上的不足,本文提出三種新的基于重復信息測定的特征提取方法,分別為R-Dipeptide、I-PseAAC、PseAAC2。其中,R-Dipeptide通過窗口移動測定關鍵信息,并通過...
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3996140
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【部分圖文】:
圖1.1細胞結構
第一章緒論研究背景及意義胞是由溶酶體、內質網(wǎng)、核糖體等諸多“亞細胞結構”構成的生命體的基如圖1.1所示。有機體絕大多數(shù)生命活動,如生長、發(fā)育、生殖、遺傳、代細胞及亞細胞水平,都由蛋白質作為主要承擔者來完成。蛋白質是所有細成分,參與DNA的轉錄翻譯過程、細胞的信號傳導過....
圖2.2系統(tǒng)化生物信息學生物信息學主要包括以下幾方面的研究內容,如生物信息學數(shù)據(jù)庫的建立與使用、同源性序列的查找與對比分析、蛋白質結構方面的分析、非編碼區(qū)方面的分析、系統(tǒng)發(fā)
圖4.1支持向量機結構圖
基于重復信息測定與卷積神經(jīng)網(wǎng)絡的蛋白質亞細胞定位研究持向量機的存在是為了解決非線性可分問題。當樣本A與樣本B兩類樣分時,則可以通過支持向量機算法將兩類樣本的特征向量映射到高維從而征向量的方式加以處理,若樣本A與樣本B兩類樣本在映射后的高維空間即支持向量機執(zhí)行的大體....
圖4.2神經(jīng)元結構圖
圖4.2神經(jīng)元結構圖P神經(jīng)網(wǎng)絡為各類神經(jīng)網(wǎng)絡算法的基礎且由于其具備可靠的理論依據(jù)與嚴,因而被廣泛使用。不過BP神經(jīng)網(wǎng)絡雖被廣泛使用卻不免存在不足之處現(xiàn)很多改進算法,如帶有動量項的改進BP、帶有自適應學習率的改進BP適應率相結合的改進BP、L-M學習規(guī)則等等分別針....
本文編號:3996140
本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/3996140.html
上一篇:不確定混沌系統(tǒng)的自適應網(wǎng)絡同步與混沌多智能體系統(tǒng)一致性
下一篇:沒有了
下一篇:沒有了
最近更新
教材專著