久久精品精选,精品九九视频,www久久只有这里有精品,亚洲熟女乱色综合一区
    分享

    生信小白學習系列:如何進行基因組組裝?(1)

     yjt2004us 2019-05-15

    隨著測序的發展,越來越多的生物體被進行基因組進行測序,這些測序的reads,再被用于組裝或者其它相關的研究。基因組序列組裝是一個研究的起點,如果你研究的物種沒有參考基因序列,就無從找到該生物有的基因,進行基因的功能分析,然后開展下游的群體遺傳,結構差異等等一系列非常有趣的研究。所以說組裝好參考基因組是基因組研究的最基礎的事情之一。接下來,希望通過網上一些教程,和大家熟悉了解一下如何進行基因組組裝。

    首先先讓我們從大的picture來回顧一下,基因組組裝的相關知識。

    基因組組裝的目的與其成功的決定因素

    目的:

    • 獲得該生物體完整的基因組序列

    • 注釋蛋白質編碼序列(注釋(結構注釋和功能)非常重要,了解知道蛋白質的功能是解決生物學問題的基礎)

    組裝成功的決定因素:

    • 被測序物種的基因特性(下個小節會講)

    • 測序的樣品質量

    • 測序技術的限制(短序列:短,組裝碎片化;長序列:費用較高,錯誤率高)

    • 使用的組裝軟件的合適性

    組裝中會遇到的“硬問題”

    一般來說生物體的基因組越簡單越好組裝,像細菌真菌都比較好組裝。那么影響組裝的硬問題有哪些呢?

    多態性

    • 二倍體,甚至多倍體 (物種的基因結構復雜,染色體有多個拷貝,基因組重復)

    • 生物體雜合性高

    • 有些物種非常小,你需要收集多個個體才能取得足夠的DNA去測序去組裝出基因組。

    重復序列

    • 重復序列往往會“迷惑”組裝的工具 

    具體例子如下圖:

    假如reads S和T 在橙色的片段都具有一長串A的堿基,那么組裝工具將會很難識別,糾結這兩個片段是擁有兩個相同copy的重復序列,還是他們本來就是overlap的可以連接起來。這樣會造成組裝的錯誤。

    這里也順帶簡單介紹一下常見的重復序列:

    • SINEs ( Short interspersed nuclear elements)

    一般長度為500bp左右,人類的基因組大概還有1.5Mbp的這種短的重復片段。

    • LINEs (long interspersed nuclear elements)

    一般長度為1Kbp左右,人類的基因組大概還有1.5Mbp的這種短的重復片段。

    • 大片的重復

    可以長至40Kbp或者更多

    測序的質量

    • 不同的測序技術有不同的優缺點

    • 測序的深度(有些regions沒有被很好覆蓋到)

    • 測序時候含有的污染(人的,細菌,真菌病毒等)都會影響組裝。據統計,10%的已經在文獻中發表的基因組,都還含有污染。

    水平的專業性

    需要知道如何安裝組裝的工具,了解組裝工具的工具原理,并且調試組裝的相關參數讓你組裝結果得到最優化,還有選擇合適的組裝工具,都需要一定的專業水平。

    主要的組裝算法

    重疊序列相連

    簡單來說這種算法就是將所有的reads拿出來,相互比對,找到重疊的reads,然后構建長的連續的contigs,最后再將contigs組在一起形成scaffolds。這個過程可以基于下圖來進行總結:

    De Bruijn 圖 或者 k-mer 方法

    主要的步驟包括:

    • 將reads切成長度不同的片段(這里叫k-mers)

    • 基于這些k-mers的組合,構建De Bruijn 圖

    • 構建序列基于重疊的k-mers

    • 基于已經構建的序列片段,選擇合適的片段,構建整個基因組的序列。

    大概的過程如下圖:

    我該選用哪個組裝的工具?

    目前已經開發了很多不同的組裝工具,根據你的物種或者測序技術,可以相應的選擇不同的工具,一般來說我們可以這樣選擇:

    • 如果你組裝的是原核生物基因組,那么可以使用SPAdes,通常該工具比較適合小的基因組。

    • 如果你組裝的是真核生物基因組:

    1. 只使用短序列的reads進行組裝:推薦使用MaSuRCA

    2. 只使用長序列的reads進行組裝:推薦使用Canu或者Falcon

    3. 混合使用短序列和長序列的reads:推薦使用MaSuRCA

    4. 雜合度高的物種推薦使用Platanus

    上面只是簡單通用的推薦,當然如果你是專家,你可能還會使用一些更加個性化的工具方法。

    這期介紹就到這里了,希望大家有所收獲,組裝并沒有我們想像中那么難,后面會繼續給大家帶來組裝的實戰還有評估等等的教程,敬請大家關注點贊。

    參考資料:

    1.https://isugenomics./bioinformatics-workbook/dataAnalysis/GenomeAssembly/Intro_GenomeAssembly.html2.https://environmentalmicrobiome./articles/10.1186/1944-3277-10-18


      本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發布,不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息,謹防詐騙。如發現有害或侵權內容,請點擊一鍵舉報。
      轉藏 分享 獻花(0

      0條評論

      發表

      請遵守用戶 評論公約

      類似文章 更多

      主站蜘蛛池模板: 二区中文字幕在线观看| 日韩精品无码一区二区视频| 久久久久香蕉国产线看观看伊| 成人午夜av在线播放| 日日摸夜夜添夜夜添无| 亚洲欧洲自拍拍偷午夜色无码| 免费无码AV一区二区波多野结衣 | 中文有无人妻vs无码人妻激烈| 秋霞电影院午夜无码免费视频| 亚洲综合无码一区二区| 不卡一区二区国产在线| 无码AV无码天堂资源网影音先锋 | 少妇无套内射中出视频| 呦交小U女精品视频| 国产另类ts人妖一区二区| 国产一区二区三区日韩精品| 澳门永久av免费网站| 国产娱乐凹凸视觉盛宴在线视频| 国产精品免费看久久久| 任你躁国产自任一区二区三区| 最近中文字幕国产精选| 亚洲AV无码AV在线影院| 国厂精品114福利电影免费| 亚洲欧美日韩中文字幕一区二区三区| 亚洲男人AV天堂午夜在| 国产成人无码区免费内射一片色欲| 亚洲国产在一区二区三区| 无码熟妇人妻AV在线电影| 99RE6在线观看国产精品| 人妻日韩人妻中文字幕| 国产又粗又猛又爽又黄的视频在线观看动漫| 2020国产欧洲精品网站| 无码国内精品人妻少妇| 男人把女人桶爽30分钟| 亚洲欧美日韩在线码| 亚洲a∨国产av综合av| 无码一区二区三区中文字幕| 永久免费无码成人网站| 国产精品三级中文字幕| 久久国产精品波多野结衣AV| 色8久久人人97超碰香蕉987 |