大家好,這里是專注表觀組學十余年,領跑多組學科研服務的易基因。 長讀長測序最常用方法主要包括Oxford Nanopore Technologies(ONT)的納米孔測序和PacBio的單分子實時(SMRT)測序。近日,冰島deCODE Genetics公司/雷克雅未克大學Brynja D. Sigurpalsdottir等人系統(tǒng)比較了長讀長測序技術(ONT和SMRT測序)在檢測人基因組DNA甲基化(特別是CpG甲基化)方面的性能。研究共使用7,179個ONT測序樣本、132個精準甲基化測序(oxBS)樣本和50個SMRT測序樣本,詳細評估不同測序技術和分析工具在檢測CpG甲基化(5-mCpG)時的準確性、一致性及局限性。研究還引入了質(zhì)量過濾器以提高甲基化檢測的準確性,并強調(diào)了最新一代ONT R10.4芯片技術在甲基化檢測中的優(yōu)勢。相關研究成果以《A comparison of methods for detecting DNA methylation from long-read sequencing of human genomes》為題發(fā)表于《Genome Biology》期刊。 標題:A comparison of methods for detecting DNA methylation from long-read sequencing of human genomes(人基因組DNA甲基化長讀長測序檢測方法比較) 發(fā)表時間:2024-03-11 發(fā)表期刊:Genome Biology 影響因子:IF10.1/Q1 技術平臺:ONT、oxBS、SMRT DOI:10.1186/s13059-024-03207-9 本研究揭示了7,179個納米孔測序的DNA樣本中檢測到的CpG甲基化具有高度準確性和一致性,與相同血液樣本中分離出來的132個精準甲基化測序(oxBS)樣本的檢測結果相匹配。研究引入靶向CpG位點的質(zhì)量過濾器(過濾約30%的CpG)以進一步提高納米孔測序CpG甲基化檢測的準確性。研究評估了在不同基因組特征和CpG甲基化率下,每個位點的CpG甲基化檢測性能,并展示了最新的ONT R10.4芯片和堿基識別算法優(yōu)化ONT納米孔測序中的甲基化檢測的具體過程。此外,研究還納入了50個SMRT測序樣本基因組的甲基化檢測結果和oxBS測序的結果,與ONT測序進行橫向比較研究闡明了每種測序方法的優(yōu)勢和局限性,并為使用長讀長測序進行基因組規(guī)模的堿基修飾檢測工具的標準化和評估提出了建議。 易小結本研究系統(tǒng)比較了長讀長測序技術在檢測CpG甲基化中的性能,特別強調(diào)了ONT R10芯片的顯著優(yōu)勢,包括更優(yōu)秀的甲基化檢測準確性和優(yōu)化的堿基識別能力,為表觀遺傳學研究提供了更高效、更精準的工具。 ONT R10長讀長測序技術因其在CpG甲基化檢測中的高準確性和直接檢測能力,已成為表觀基因組學研究中的重要工具。易基因作為專注于表觀基因組學研究的領先企業(yè),通過引入最新的ONT R10芯片技術,易基因能夠為客戶提供更高分辨率、更準確的甲基化檢測服務,助力疾病機制研究、生物標志物開發(fā)以及個性化醫(yī)療等領域的前沿探索。 研究方法ONT測序:使用PromethION R9.4和R10.4芯片,通過檢測DNA分子通過納米孔時的電流變化來識別甲基化修飾。 SMRT測序:通過檢測DNA合成過程中堿基摻入的動力學變化來識別甲基化修飾。 oxBS測序:通過化學氧化和亞硫酸鹽處理精準區(qū)分5-甲基胞嘧啶(5-mC)和5-羥甲基胞嘧啶(5-hmC)。 數(shù)據(jù)分析工具:
質(zhì)量過濾器:引入多種質(zhì)量過濾器,包括過濾序列變異周圍CpG位點、低質(zhì)量區(qū)域(如暗區(qū))CpG位點以及異常測序深度或高鏈偏倚的CpG位點。 結果圖形(1)ONT納米孔測序檢測CpG甲基化研究首先利用promethION平臺對7,179名個體全血樣本進行Nanopore測序,平均測序度為20.6×(中位數(shù)為19.5×,范圍從10×到108×)。同一樣本還被用于研究CpG甲基化、基因表達和序列變異之間的相關性。研究通過Nanopolish工具進行CpG甲基化檢測,該工具將相距10bp以內(nèi)的CpG位點歸為一個單元,稱為CpG單元。Nanopolish以參考基因組比對的reads為input和每個read數(shù)據(jù)參考基因組的鏈信息,為每個CpG單元判斷其對數(shù)似然比(LLR)。LLR為二進制值,表示測序CpG位點甲基化狀態(tài)。當LLR未達到預測CpG單元為甲基化或未甲基化標準時,將CpG單元分類為“不可靠”。本研究分析范圍為隊列中Nanopolish檢測到的22,178,458個常染色體CpG單元,共27,651,488個CpG位點。 (2)ONT測序和oxBS的CpG甲基化檢測比較研究對132個個體的DNA樣本進行Nanopore測序和oxBS測序比較分析以評估Nanopore測序在CpG甲基化檢測中的準確性。樣本平均測序深度為25×,每個CpG單元在兩個數(shù)據(jù)集中分別計算了所有個體的平均5-mCpG率,并通過皮爾遜相關系數(shù)(APC)來評估Nanopolish工具性能。結果顯示,兩個數(shù)據(jù)集之間的APC非常高(r=0.9594),表明Nanopore測序的甲基化檢測結果與oxBS測序結果高度一致。 圖1:ONT測序和oxBS在同一DNA樣本中5-甲基胞嘧啶(5-mCpG)率的一致性表現(xiàn)。 A. 132個DNA樣本中ONT(紅色)和oxBS(綠色)的5-mCpG率整體檢測值。 B-C. ONT測序中每個CpG位點的5-mCpG率的皮爾遜相關系數(shù)r(B)和平均絕對差異(MAD)(C)。 D. ONT測序樣本中用于分析特定CpG位點的5-mCpG率的序列數(shù)量(X軸),影響與oxBS高深度檢測5-mCpG率的一致性(皮爾遜相關系數(shù)r,Y軸)。 E. ONT測序(Y軸)和oxBS(X軸,分組)中的CpG率。平均值紅色(ONT)和綠色(oxBS)。 F. 樣本間比較通過ONT測序正確分類的CpG位點數(shù)量(Y軸,單位=/M CpGs,藍色)。錯誤分類的CpG位點根據(jù)5-mCpG率的MAD著色(顏色圖例)。D/E/F中的oxBS位點測序深度>25×。 (3)測序深度影響ONT測序數(shù)據(jù)中CpG甲基化檢測的一致性研究進一步探討了測序深度對Nanopore測序CpG甲基化檢測一致性的影響。結果顯示,測序深度越高,CpG甲基化檢測一致性越好。當測序深度在12×或更高時,皮爾遜相關系數(shù)顯著提高,而20×或更高的測序深度時,檢測結果一致性進一步提高。當測序深度低于10×時,甲基化檢測準確性會顯著下降。這一結果表明,較高的測序深度能夠顯著提高CpG甲基化檢測的準確性和一致性。為了獲得高準確性的CpG甲基化檢測結果,建議每個樣本的測序深度至少為12×,20×或更高則更為理想。 (4)ONT測序數(shù)據(jù)在未甲基化和高甲基化CpG單元中的一致性更高研究發(fā)現(xiàn),ONT測序在未甲基化和高甲基化CpG單元的檢測上表現(xiàn)更為一致。研究將CpG位點分為未甲基化(0–0.15)、低甲基化(0.15–0.5)、中等甲基化(0.5–0.85)和高甲基化(0.85–1)四個類別,通過比較ONT測序和oxBS的結果顯示,Nanopore測序在未甲基化和高甲基化CpG單元上的預測準確性最高,分別為86%和77%。這表明Nanopore測序在極端甲基化狀態(tài)下檢測更為可靠,而在低甲基化和中等甲基化狀態(tài)下的檢測準確性相對較低,分別為52%和56%。這一結果為研究者在選擇測序技術和分析工具時提供重要的參考依據(jù)。 (5)Nanopolish甲基化檢測質(zhì)量受CpG單元序列背景影響研究發(fā)現(xiàn),Nanopolish甲基化檢測質(zhì)量受CpG單元序列背景的影響。為了分析這種影響,研究者將CpG單元分為序列變異周圍(5bp以內(nèi))、“暗區(qū)”(即難以可靠比對的區(qū)域)、具有異常測序深度(高于平均深度1.5倍或低于平均深度0.5倍)以及存在鏈偏倚(大于0.2)的4個CpG單元。分析結果表明,序列變異周圍CpG位點(5bp以內(nèi))的預測準確性較低,其APC為0.9219,而其他CpG位點的APC為0.9656。此外,“暗區(qū)”CpG位點APC也較低,為0.698。這些結果表明,序列背景對Nanopore測序的甲基化檢測準確性有顯著影響。因此,在進行CpG甲基化檢測時,需要特別關注這些區(qū)域的質(zhì)控,以提高檢測結果的可靠性。 圖2:根據(jù)DNA序列屬性評估5-mCpG率檢測質(zhì)量。 A. 比較位于特定序列屬性內(nèi)部(灰色)和外部(粉色)的CpG位點的平均皮爾遜相關系數(shù)(APC)。 B. 每個屬性內(nèi)部的CpG單元(紅色)和位點(綠色)數(shù)量。 C. 單個CpG單元(單例)和多CpG位點單元(非單例)中高質(zhì)量(深藍色)與非高質(zhì)量(淺藍色)CpG單元的比例。 D. 不同甲基化狀態(tài)類別中高質(zhì)量和非高質(zhì)量CpG單元比例。 (6)與oxBS數(shù)據(jù)的對比分析中,Guppy在CpG位點甲基化檢測上表現(xiàn)優(yōu)于Nanopolish研究比較了Guppy和Nanopolish在CpG位點的甲基化檢測。分析結果表明Guppy在與oxBS測序結果的對比分析中表現(xiàn)優(yōu)于Nanopolish。具體而言,Guppy與oxBS測序結果的APC為0.97256,高于Nanopolish的0.9594。且Guppy平均鏈偏倚更低,表明其甲基化檢測準確性更高。通過應用與Nanopolish相同的質(zhì)量過濾器,Guppy能夠鑒定出更多的高質(zhì)量CpG位點(hq-CpGs),其APC為0.98691。這一結果表明,Guppy在CpG甲基化檢測上具有更高的準確性和可靠性,特別是在處理低甲基化和中等甲基化狀態(tài)下的CpG位點時表現(xiàn)更為出色。 (7)最新的Nanopore R10.4芯片技術在甲基化檢測上實現(xiàn)了更高準確性和改進的檢測結果研究人員對ONT的最新R10.4芯片在CpG甲基化檢測方面的表現(xiàn)進行了評估,并與早期的R9.4芯片進行了比較。研究發(fā)現(xiàn),R10.4芯片在多個方面表現(xiàn)出顯著的優(yōu)勢,特別是在提高甲基化檢測的準確性和減少鏈偏倚方面。
(8)ONT測序與SMRT測序的CpG甲基化檢測比較研究以50個oxBS樣本作為參考標準,對50個SMRT測序樣本、50個ONT測序樣本(分別使用R9.4和R10.4芯片)的CpG甲基化檢測數(shù)據(jù)進行比較分析。研究對所有樣本的平均5-mCpG率進行分析,并比較所有五種方法(SMRT、R9.4-Guppy、R10.4-Guppy、R9.4-Nanopolish和oxBS)之間的平均皮爾遜相關系數(shù)(APC)以及5-mCpG率與oxBS之間的平均絕對差異(MAD)(表1A)。 表1:不同測序技術在CpG甲基化檢測中的一致性和準確性比較 (A) APC比較結果展示在主對角線以下,MMAD比較結果展示在主對角線以上。 (B) 基于所有CpG、序列變異周圍CpG或暗區(qū)CpG位點的APC比較分析。 結果顯示,Guppy R10.4和Guppy R9.4在與oxBS數(shù)據(jù)的比較中表現(xiàn)最佳,其平均皮爾遜相關系數(shù)(APC)最高,分別為0.97845和0.97256。表明Guppy在甲基化檢測上的準確性最高,能夠最接近oxBS測序的參考標準。研究還分析了不同測序技術在CpG甲基化率分布上的表現(xiàn)。所有測序技術均能準確復現(xiàn)oxBS測序觀察到的CpG甲基化率的雙峰分布,Guppy R10.4的分布與oxBS測序結果最為接近,表明其在極端甲基化狀態(tài)下的檢測更為準確。 此外,CpG周圍的序列變異會在oxBS中引入比對偏倚,導致甲基化檢測不準確和APC降低(表1B)。因此對于Guppy和PacBio而言,序列變異周圍CpG位點的重要性較低。所有長讀長測序技術都使用特定序列背景和與參考基因組的比較來檢測CpG甲基化狀態(tài),因此可以過濾那些序列變異周圍的CpG位點。 (9)5-mCpG率的分布研究分析了不同測序技術在CpG甲基化率分布上的表現(xiàn)。結果顯示,所有測序技術在CpG甲基化率的分布上表現(xiàn)出預期的雙峰分布,但在完全甲基化和完全未甲基化狀態(tài)下的分布略有差異。Guppy R10.4測序結果與oxBS測序結果最為接近,而SMRT測序和Guppy R9.4測序結果則在極端甲基化狀態(tài)下表現(xiàn)出一定的偏倚。這一結果表明,不同測序技術在處理低甲基化和中等甲基化狀態(tài)下的CpG位點時可能存在差異,研究者在選擇測序技術時需要考慮這些因素。 圖3:不同方法檢測CpG甲基化的比較。 A. 在oxBS、Guppy R9.4和R10.4中,CpG甲基化率(0-1)在個體中平均后呈現(xiàn)出oxBS數(shù)據(jù)中預期的雙峰分布。 B. 在oxBS、PacBio和Nanopore中,CpG甲基化率(0-1)在個體中平均后呈現(xiàn)出oxBS數(shù)據(jù)中預期的雙峰分布。 C. 全血中表達基因的轉(zhuǎn)錄起始位點(TSS)的CpG甲基化率在50bp范圍內(nèi)平均值。 D. 每種方法檢測到的CpG位點數(shù)量。Nanopolish統(tǒng)計每個CpG單元的所有CpG位點。 (10)功能區(qū)域的5-mCpG分布為了研究生物學背景對甲基化檢測準確性的作用,研究人員分析了全血中表達基因的TSS處50bp以內(nèi)的平均5-mCpG率。所有甲基化檢測方法都高度匹配oxBS測序樣本中的甲基化模式,表明在TSS區(qū)域內(nèi)甲基化缺失(圖3C)。其中PacBio和Guppy R9.4在TSS處顯示出更高的CpG甲基化率,而在TSS之外則顯示出低甲基化率,這與這兩種方法的甲基化分布輕微偏移一致(圖3A、B)。而Guppy R10.4測序結果更接近于oxBS中的TSS甲基化水平(圖3C)。表明其在功能區(qū)域的甲基化檢測上具有高準確性。這一結果進一步證實了Guppy R10.4測序技術在表觀遺傳學研究中的應用潛力,特別是在基因表達調(diào)控和細胞分化機制研究中。 (11)長讀長測序比oxBS測序檢測到更多的CpG位點數(shù)量研究發(fā)現(xiàn),長讀長測序技術在檢測CpG位點數(shù)量上優(yōu)于oxBS測序。Nanopore測序和SMRT測序平均每個樣本檢測到約27M CpG位點(Guppy R9.4=27,467,383個CpG位點,Guppy R10.4=27369144個CpG位點,PacBio=26,739,539個CpG位點,Nanopolish=26,487,587個CpG位點,分布在22,058,476個CpG單元中),而oxBS測序僅檢測到約26M CpG位點(圖3D)。這一結果表明,長讀長測序技術在CpG甲基化檢測上具有更高的分辨率和更全面的覆蓋范圍,能夠為研究者提供更豐富的表觀遺傳學信息。這一優(yōu)勢在研究復雜基因組區(qū)域和稀有甲基化中尤為顯著。 討論和啟示本研究通過大規(guī)模樣本分析,揭示了長讀長測序技術在CpG甲基化檢測中的優(yōu)勢和局限性。研究揭示了測序深度、鏈偏倚、序列背景等因素對甲基化檢測的準確性有顯著影響。同時,長讀長測序技術在檢測CpG甲基化方面具有顯著優(yōu)勢,尤其是在無需化學處理DNA的情況下直接檢測甲基化修飾的能力。最新的R10.4芯片技術,通過降低鏈偏倚和提高檢測準確性,進一步提升了ONT測序在甲基化檢測中的性能。未來的研究可以利用這些技術優(yōu)勢,深入探索基因表達調(diào)控、細胞分化以及疾病發(fā)生機制等領域的表觀遺傳學變化。 關于易基因ONT全基因組甲基化測序服務 涵蓋人類/大鼠/小鼠等哺乳動物、細菌、植物等全物種 DNA甲基化作為表觀遺傳調(diào)控的核心機制,通過不改變DNA序列的方式影響基因功能,在發(fā)育、疾病等生命過程中發(fā)揮關鍵作用。Oxford Nanopore Technologies(ONT)推出的三代全基因組甲基化測序技術,基于納米孔電信號實現(xiàn)單分子實時檢測,無需化學處理即可同步解析5mC和6mA修飾。從R9到R10芯片的升級顯著提升了技術性能,已成功應用于人類疾病診斷、作物表觀育種和微生物-噬菌體互作研究等。該技術為揭示跨物種表觀遺傳調(diào)控網(wǎng)絡提供了強大工具,推動精準醫(yī)學和合成生物學發(fā)展。 ONT R10芯片技術核心原理與創(chuàng)新優(yōu)勢如下:
ONT全基因組甲基化測序原理示意圖 應用場景 疾病研究與診斷:研究疾病中基因甲基化模式及變化,探索疾病發(fā)生和發(fā)展的機制。 微生物學研究:研究細菌甲基化修飾,了解其在基因表達調(diào)控和病原性中的作用以及噬菌體與宿主相互作用。 進化與生態(tài)學研究:物種間甲基化比較,研究進化關系和生態(tài)適應性;分析微生物在不同環(huán)境條件下的甲基化變化,研究其適應機制。 法醫(yī)學應用:利用甲基化模式的個體差異,進行個體識別和親子鑒定。 農(nóng)業(yè)與植物研究:研究作物在不同環(huán)境條件下的甲基化變化,指導作物改良育種或應急響應機制。 藥物研發(fā)與毒理學:通過甲基化分析揭示與藥物反應相關的基因和通路;研究藥物和環(huán)境毒素對基因甲基化的影響,評估其毒性。 參考文獻: Sigurpalsdottir, B.D., Stefansson, O.A., Holley, G. et al. A comparison of methods for detecting DNA methylation from long-read sequencing of human genomes. Genome Biol 25, 69 (2024). Doi:10.1186/s13059-024-03207-9 相關閱讀: 1、易基因ONT全基因組甲基化測序服務 涵蓋人類/大鼠/小鼠等哺乳動物、細菌、植物等全物種范圍服務 2、Genome Res:三代ONT測序技術檢測人原代組織DNA甲基化 R10和R9芯片測序性能數(shù)據(jù)比較 |
|