基于序列信息對人類DNaseⅠ超敏位點進(jìn)行預(yù)測
【文章頁數(shù)】:52 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1k-mer算法獲取序列示意圖
第二章數(shù)據(jù)集與特征7圖2-1k-mer算法獲取序列示意圖2.2.2理化性質(zhì)相關(guān)性k-mer僅僅只考慮了短程相關(guān)信息,因此,我們加入了理化性質(zhì)的相關(guān)性,以代表寡核苷酸之間的遠(yuǎn)程相互作用,其表達(dá)式如下:Dphysicochemical=Λ(5)其中u可以用如下等式表示:ΛΛΛΛΛ(6....
圖4-1每個k值構(gòu)建的模型基于SVM的最終準(zhǔn)確率結(jié)果
電子科技大學(xué)碩士學(xué)位論文20第四章結(jié)果分析與討論DNaseI超敏位點的識別是鑒定脊椎動物的順式調(diào)控序列的標(biāo)準(zhǔn)方法,它促進(jìn)了發(fā)現(xiàn)位于核心啟動子之外的絕大多數(shù)已驗證的人類順式調(diào)控元件。盡管最近已發(fā)表了好幾個用于DNaseI超敏位點序列大規(guī)模定位的新型分子方法,但人類DNaseI超敏位....
圖4-26種二核苷酸理化性質(zhì)的不同λ值在基于SVM的模型中的最終準(zhǔn)確率
第四章結(jié)果分析與討論21從結(jié)果中可以看到k值取2和5時模型的訓(xùn)練結(jié)果都表現(xiàn)出了不錯的表現(xiàn)。通常,對于二型PseKNC公式中的一個特征向量,只會選擇一個k值來訓(xùn)練模型,而在其他k值特征向量中可能會丟失一些重要的特征信息。因此,我們選用范圍為2到5的四個k值作為特征集,以發(fā)現(xiàn)更多有效....
圖4-4k=2,g=2時根據(jù)mRMR特征篩選得到的結(jié)果,取前108個特征的結(jié)果
電子科技大學(xué)碩士學(xué)位論文24圖4-3二核苷酸和三核苷酸的G-gap特征提取算法的最終準(zhǔn)確率結(jié)果從圖4-3的結(jié)果中可以看出三核苷酸在整體水平上明顯表現(xiàn)得不如二核苷酸,并且由于基準(zhǔn)數(shù)據(jù)集中序列長度比較偏短,將更高維度的核苷酸聯(lián)體作為特征向量的意義不大,因此我們不再嘗試四核苷酸及以上更....
本文編號:3991485
本文鏈接:http://www.lk138.cn/shoufeilunwen/benkebiyelunwen/3991485.html