久久精品精选,精品九九视频,www久久只有这里有精品,亚洲熟女乱色综合一区
    分享

    基因功能注釋方法

     葉子Dr 2019-08-02

    基因組注釋(Genome annotation) 是利用生物信息學(xué)方法和工具,對(duì)基因組所有基因的生物學(xué)功能進(jìn)行高通量注釋,是當(dāng)前功能基因組學(xué)研究的一個(gè)熱點(diǎn)。de novo組裝得到的基因組進(jìn)行的下一步分析就是基因組注釋,通常注釋內(nèi)容主要包括以下四個(gè)方面:基因結(jié)構(gòu)注釋、基因功能注釋、重復(fù)序列分析、非編碼RNA注釋。本文主要介紹真核生物中的基因組注釋方法。

    (1)基因結(jié)構(gòu)注釋

    基因結(jié)構(gòu)預(yù)測(cè)包括預(yù)測(cè)基因組中的基因位點(diǎn)、開(kāi)放性閱讀框架(ORF)、翻譯起始位點(diǎn)和終止位點(diǎn)、內(nèi)含子和外顯子區(qū)域、啟動(dòng)子和終止子、可變剪切位點(diǎn)以及蛋白編碼序列(CDS)等。需要指出,真核生物基因結(jié)構(gòu)注釋難度較大,主要因?yàn)檎婧松镏械膯?dòng)子和終止子等信號(hào)位點(diǎn)較為復(fù)雜,且存在廣泛的可變剪切現(xiàn)象,預(yù)測(cè)真核生物的基因結(jié)構(gòu)常用隱馬科夫模型。

    基因結(jié)構(gòu)注釋采用從頭測(cè)序,同源預(yù)測(cè)和基于RNA-Seq的證據(jù)支持預(yù)測(cè)相結(jié)合的方法。利用物種已發(fā)表的基因序列,蛋白序列,mRNA/ESTs序列集構(gòu)建物種的基因結(jié)構(gòu)模型;同時(shí)采用從頭測(cè)序方法對(duì)初始預(yù)測(cè)模型進(jìn)行自我訓(xùn)練,通過(guò)多輪訓(xùn)練和優(yōu)化,獲得從頭預(yù)測(cè)的基因結(jié)構(gòu)模型;利用RNA-Seq數(shù)據(jù)通過(guò)Tophat比對(duì)得到基因組的內(nèi)含子結(jié)構(gòu)模型及基因側(cè)翼序列信息;最后對(duì)上述不同方法預(yù)測(cè)的結(jié)構(gòu)模型進(jìn)行整合和優(yōu)化獲得最終的基因結(jié)構(gòu)模型。

    其中,從頭預(yù)測(cè)主要應(yīng)用軟件有Augustus、Genscan、Glimmer等;同源預(yù)測(cè)代表軟件包括Genewise(動(dòng)物);而基于轉(zhuǎn)錄組數(shù)據(jù)預(yù)測(cè)則是由常見(jiàn)的Tophat+cufflinks軟件完成。

    真核基因結(jié)構(gòu).jpg

    圖1. 真核基因結(jié)構(gòu)示意圖

    (2)基因功能注釋

    全基因組測(cè)序?qū)a(chǎn)生大量數(shù)據(jù),此前普遍采用比對(duì)方法對(duì)對(duì)預(yù)測(cè)出來(lái)的編碼基因進(jìn)行功能注釋,通過(guò)與各種功能數(shù)據(jù)庫(kù)(NR、Swiss-Prot 、GO、KOG、KEGG)進(jìn)行蛋白質(zhì)比對(duì),獲取該基因的功能信息。其中GO和KEGG數(shù)據(jù)庫(kù)分別在基因功能和代謝通路研究中占據(jù)重要地位。

    image

    圖2. 基因功能注釋

    (3)重復(fù)序列分析

    重復(fù)序列廣泛存在于真核生物基因組中,這些重復(fù)序列或集中成簇,或分散在基因之間,根據(jù)分布把重復(fù)序列分為分散重復(fù)序列(Interpersed repeat)和串聯(lián)重復(fù)序列(Tendam repeat)。重復(fù)序列的注釋主要通過(guò)同源注釋和從頭注釋兩種方式進(jìn)行預(yù)測(cè)。同源注釋采用RepeatMasker通過(guò)與Repbase數(shù)據(jù)庫(kù)進(jìn)行比對(duì)尋找基因組中的重復(fù)區(qū)域,并對(duì)其進(jìn)行分類;從頭注釋采用RepeatModler鑒定重復(fù)元件,最后通過(guò)整合獲得全基因組的重復(fù)序列注釋,從頭注釋能夠發(fā)現(xiàn)未知的新的轉(zhuǎn)座子元件。

    image

    圖3.重復(fù)序列種類

    (4)非編碼RNA注釋

    非編碼RNA,指不翻譯成蛋白質(zhì)的RNA,如tRNA,rRNA等。利用tRNAscan-SE對(duì)全基因組進(jìn)行tRNA預(yù)測(cè);利用RNAmmer預(yù)測(cè)全基因的核糖體RNA;利用Rfam數(shù)據(jù)庫(kù)通過(guò)cmscan鑒定全基因組non-coding RNA(ncRNA)。

    通過(guò)基因組注釋獲得的信息可進(jìn)一步用于后續(xù)比較基因組分析,例如系統(tǒng)發(fā)育分析、基因家族分析、歷史群體結(jié)構(gòu)分析等,重復(fù)序列的注釋則通常可用于全基因組加倍事件分析。但我們目前的大部分注釋工作主要建立在與已有數(shù)據(jù)庫(kù)的比對(duì)基礎(chǔ)上,因此,對(duì)某些研究較少的物種限制很大。另一方面,序列相似并不表示實(shí)際生物學(xué)功能相似,這對(duì)于基因功能注釋時(shí)會(huì)造成較大影響,仍需要進(jìn)一步完善基因功能注釋工作。

      本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
      轉(zhuǎn)藏 分享 獻(xiàn)花(0

      0條評(píng)論

      發(fā)表

      請(qǐng)遵守用戶 評(píng)論公約

      類似文章 更多

      主站蜘蛛池模板: 一本色道久久88亚洲精品综合 | 国产精品免费看久久久| 女人张开腿让男人桶爽| 99热精品毛片全部国产无缓冲| 久久精品A一国产成人免费网站 | 99RE8这里有精品热视频| 不卡高清AV手机在线观看| 国产精品中文av专线| 天天综合亚洲色在线精品| 性一交一乱一伦| 久久大香伊蕉在人线免费AV| 国产成人亚洲日韩欧美| 男同精品视频免费观看网站 | 9色国产深夜内射| 日韩欧国产精品一区综合无码| 人妻精品动漫H无码中字| 久久综合九色欧美综合狠狠| 亚洲 制服 丝袜 无码| 国产强奷在线播放| 亚洲VA成无码人在线观看天堂 | 性色欲情网站iwww九文堂| 精品国产午夜肉伦伦影院| 国内精品一区二区不卡| 欧美XXXX色视频在线观看| 免费人成再在线观看网站| 亚洲va久久久噜噜噜久久狠狠| 天堂久久久久VA久久久久| 亚洲日韩精品无码一区二区三区| 亚洲成AV人片在线观看WV| 精品视频在线观看免费观看| 无遮挡H肉动漫在线观看| 丰满人妻被黑人连续中出 | 国产精品福利自产拍在线观看| 国产日韩入口一区二区| 亚韩精品中文字幕无码视频 | 亚洲人成影院在线观看| 男女动态无遮挡动态图| 少妇xxxxx性开放| 国产波霸爆乳一区二区| 亚洲欧美中文日韩V在线观看 | 日本高清在线观看WWW色|