 Genomes of six viruses that infect Asgard archaea from deep-sea sedimentsDOI:10.1038/s41564-022-01150-8原文鏈接:https:///10.1038/s41564-022-01150-8主要單位:Department of Marine Science, University of Texas Austin(德克薩斯大學(xué)奧斯汀分校海洋科學(xué)系)阿斯加德古菌是全球分布的與真核生物有關(guān)的原核微生物;然而,感染這些生物的病毒還沒有被描述。在這里,利用從深海熱液沉積物中提取的宏基因組序列,我們描述了6個相對較大(達117 kb)的雙鏈DNA(dsDNA)病毒基因組,它們感染了兩個阿斯加德古菌門,Lokiarchaeota和Helarchaeota。這些病毒編碼類似于Caudovirales的結(jié)構(gòu)蛋白,以及與已知古生物病毒中描述的蛋白不同的蛋白。它們的基因組包含與真核細(xì)胞質(zhì)大DNA病毒(NCLDVs)相關(guān)的大約1-5%的基因,似乎能夠進行半自主的基因組復(fù)制、修復(fù)、表觀遺傳修飾和轉(zhuǎn)錄調(diào)控。此外,Helarchaeota病毒可能劫持宿主的泛素系統(tǒng),與真核生物病毒類似。對這些阿斯加德病毒的基因組分析顯示,它們同時含有原核和真核病毒的特征,此次研究提供了對其潛在感染和宿主互動機制的新見解。 阿斯加德古菌是全球分布的微生物,與真核生物有關(guān)。它們的基因組組成表明它們是產(chǎn)生第一個真核生物共同祖先的古細(xì)菌宿主的后代。近年來,由于從一系列海洋和陸地水生沉積物中恢復(fù)了基因組,阿斯加德的生物多樣性大大擴展。一個厭氧的、生長緩慢的阿斯加德譜系,Lokiarchaeota,最近被培養(yǎng)出來,似乎與細(xì)菌有互養(yǎng)的依賴關(guān)系。這支持了多種基于基因組的阿斯加德-細(xì)菌相互作用的推論,這些推論被認(rèn)為導(dǎo)致了第一個含有線粒體的真核細(xì)胞的形成。還有人假設(shè),與病毒的相互作用促成了復(fù)雜細(xì)胞生命的起源。這是基于一些NCLDVs和噬菌體的核狀病毒工廠的存在,它允許在宿主細(xì)胞質(zhì)內(nèi)復(fù)制,并通過mRNA加帽使轉(zhuǎn)錄和翻譯脫鉤。在Lokiarchaeota的基因組內(nèi)已經(jīng)發(fā)現(xiàn)了推測的病毒蛋白,這表明病毒在遺傳元素的交換和阿斯加德古菌的進化中發(fā)揮了作用。I型和III型CRISPR-Cas免疫系統(tǒng)已在幾個阿斯加德門(Odinarchaeota、Thorarchaeota、Lokiarchaeota和Helarchaeota)中被描述,但迄今尚未對與阿斯加德古菌相關(guān)的病毒基因組進行表征。為了探索病毒在阿斯加德古菌中的作用,我們搜索了Guaymas盆地(~2,000米水深,加利福尼亞灣)熱液相關(guān)沉積物中~5TB的宏基因組序列數(shù)據(jù)(assemblies)。從中,我們恢復(fù)了6,756個未培養(yǎng)的病毒基因組(UViGs)(圖1),估計是高質(zhì)量和中等質(zhì)量的(見方法)。UViGs與來自Guaymas盆地宏基因組組裝基因組(MAGs)的CRISPR間隔序列(spacer)相連,以確定哪些病毒感染了阿斯加德古菌細(xì)胞。這揭示了7個雙鏈DNA(dsDNA)UViG,它們感染了Lokiarchaeota、Helarchaeota和Thorarchaeota(圖2)。有趣的是,兩個與阿斯加德古菌有關(guān)的病毒也感染了從Guaymas盆地重建的Chloroflexi和Omnitrophica細(xì)菌,表明阿斯加德與這些細(xì)菌有密切聯(lián)系。其中一個UViG是Chloroflexi基因組中的整合型原病毒,與Thorarchaeota有CRISPR間隔序列聯(lián)系,而其他六個是非整合型的,被歸類為裂解型。我們暫且以北歐神話中的生物命名這些UViG。“Vedfolnir'”(Chloroflexi provirus與Thorarchaeota相關(guān)聯(lián))、Fenrir(Lokiarchaeota)、Sk?ll(Lokiarchaeota)、Nidhogg(Helarchaeota)以及Ratatoskr(Helarchaeota和Omnitrophica)。它們的基因組大小(約21.9-117.5kb)屬于已知的古菌dsDNA病毒的范圍(圖2)。從Meg22_1012號樣本中發(fā)現(xiàn)的Nidhogg和Fenrir病毒與Meg22_1214號樣本的核苷酸一致性很高(分別為99.98和99.90%)。Nidhogg病毒被封閉成完整的環(huán)形基因組(圖2D),兩個線性的Fenrir病毒被預(yù)測為>90%的完整性。圖1. 從Guaymas盆地沉積物中發(fā)現(xiàn)的病毒基因組與以前描述的病毒相比的蛋白質(zhì)聚類網(wǎng)絡(luò)。 用vContact2 v.0.9.19和Cytoscape v.3.8.0構(gòu)建的單體網(wǎng)絡(luò)分析,對Guaymas盆地的UViG(n = 6,756,以淺藍(lán)色顯示)進行分類分配,使用來自RefSeq的參考真核生物、細(xì)菌和古菌病毒基因組(n = 11,082)和巨大噬菌體(n = 361)(見方法)。節(jié)點代表單個基因組,邊緣表示病毒簇內(nèi)基因組之間的相似性(n = 770)。與阿斯加德古菌有關(guān)的病毒被標(biāo)記為Fenrir、Nidhogg和Ratatoskr。Vedfolnir和Sk?ll被列為離群值(outliers)。  圖2. 病毒-宿主與阿斯加德古菌的聯(lián)系。(A)Lokiarchaeota, (B)Helarchaeota, 和(C)Thorarchaeota MAGs通過CRISPR-Cas系統(tǒng)與UViG相連。(D)完整的環(huán)狀Nidhogg病毒基因組的概述。CRISPR間隔條與UViG的blastn-short alignments顯示,箭頭代表100%的一致性(實線)和95%-99.9%的一致性(虛線)。本研究中回收了Lokiarchaeaota、Helarchaeota和Omnitrophica MAGs。Chloroflexi和Thorarchaeota的基因組先前已被恢復(fù)。預(yù)測的阿斯加德MAGs的CRISPR-Cas系統(tǒng)由箭頭表示,根據(jù)其Cas基因的類型特征著色,箭頭指向右側(cè)為(+),即正義,左側(cè)為(-)即反義。CRISPR陣列末端的箭頭以同樣的方式表示正義或反義。顯示的每個cas盒都位于不同的scaffold上。病毒用類似噬菌體的圖標(biāo)表示,盡管只有Ratatoskr包含一個可識別的二十面體的外殼。Nidhogg基因組內(nèi)的編碼區(qū)域指向右側(cè)為(+),左側(cè)為(-),并按比例繪制。cas1,CRISPR相關(guān)內(nèi)切酶Cas1;cas2,CRISPR相關(guān)內(nèi)切酶Cas2;cas3,CRISPR相關(guān)內(nèi)切酶/螺旋酶Cas3;cas4,CRISPR相關(guān)外切酶Cas4;cas5,CRISPR系統(tǒng)Cascade亞單位Cas5。cas6,CRISPR相關(guān)內(nèi)切酶Cas6;cas7,CRISPR-Cas第一類效應(yīng)器復(fù)合體亞單位Cas7;cas8,CRISPR相關(guān)蛋白Cas8;csm2,第三類CSM效應(yīng)器復(fù)合體小亞單位Csm2;csm3,第三類RAMP超家族CSM效應(yīng)器復(fù)合體Csm3。csm4, III型RAMP超家族CSM效應(yīng)器復(fù)合物Csm4; csm5, III型RAMP超家族CSM效應(yīng)器復(fù)合物Csm5; csx1, CRISPR系統(tǒng)內(nèi)切核酸酶Csx1; csx14, III-U亞型相關(guān)蛋白Csx14。cft2,Cft2家族RNA處理外切酶;MoaA,鉬輔助因子生物合成蛋白MoaA;TA,毒素-抗毒素;NT,核苷酸轉(zhuǎn)移酶;HEPN,高等真核生物和原核生物核苷酸結(jié)合域;kb,千堿基。用BioRender.com創(chuàng)建。為了分類和了解阿斯加德病毒的進化歷史,我們確定了七個UViG中的DNA聚合酶B(PolB)蛋白。來自Fenrir、Nidhogg和Ratatoskr的PolB蛋白序列與來自細(xì)胞生物、噬菌體、古菌和真核生物病毒以及NCLDVs的PolB進行了對比。這些序列的系統(tǒng)發(fā)育分析顯示,Fenrir、Nidhogg和Ratatoskr與以前的特征病毒不同,具有復(fù)雜的進化歷史(圖3A)。Fenrir PolB與Gammaproteobacteria的密切關(guān)系表明,這些基因是由細(xì)菌水平轉(zhuǎn)移而來的,而Nidhogg PolB似乎與宿主為鹽桿菌的myoviruses有系統(tǒng)發(fā)育關(guān)系(圖3A)。Ratatoskr PolB在系統(tǒng)發(fā)育上與Heimdallarchaeota有關(guān),Heimdallarchaeota是被認(rèn)為與真核生物關(guān)系最密切的Asgard門(圖3B)。為了確定阿斯加德病毒的科水平分類,我們對其病毒蛋白家族(VPF)的組成進行了表征。所有七種Asgard UViGs都含有與Myoviridae、Siphoviridae和Podoviridae以及與NCLDVs和嗜熱古菌病毒科水平相關(guān)的基因同源物(圖3C)。Asgard UViGs不與基于單方基因共享網(wǎng)絡(luò)的現(xiàn)有參考病毒聚類(圖1),這可能表明它們是Caudovirales的新科或?qū)佟_@一點得到了以往研究的支持,這些研究確定了全球性的Caudovirales和古菌之間的關(guān)聯(lián)。與以前描述的病毒缺乏明確的隸屬關(guān)系,突出了這些新發(fā)現(xiàn)的阿斯加德病毒的新穎性。 圖3. 基于系統(tǒng)發(fā)育和蛋白質(zhì)組成的阿斯加德病毒的分類位置。(A) 使用LG+F+R10模型生成的DNA聚合酶B的最大似然系統(tǒng)發(fā)育樹。樹枝上的圓圈代表ultrafast bootstrap支持率>=95。本文中描述的病毒用金色突出顯示。(B) Ratatoskr在A部分所示的LG+F+R10模型樹中的位置,Bootstraps以樹枝上的數(shù)值顯示。(C) 阿斯加德病毒中共享的VPF的成員比率。病毒蛋白家族分類圖例中的A、B或E表示古菌、細(xì)菌和/或真核生物宿主。我們在Asgard UViGs中發(fā)現(xiàn)了Caudovirales的標(biāo)志蛋白,包括小頭蛋白、基底板J、尾部纖維、門戶蛋白和終止酶大亞基(圖4)。在Ratatoskr、Nidhogg和Vedfolnir中發(fā)現(xiàn)了編碼病毒蛋白外殼的推測的衣殼蛋白。在Ratatoskr中發(fā)現(xiàn)了一個HK-97-折疊的主要衣殼蛋白(MCP)。在Nidhogg和Vedfolnir(PhANNs,分別為80%和90%的置信度)中檢測到的推測的MCPs與收縮性噬菌體尾鞘樣蛋白(>99.9%的概率,e-值<4.4e-24)和噬菌體原殼蛋白酶(99.5%的概率,e-值1.6e-13)有結(jié)構(gòu)相似性(HHPred,數(shù)據(jù)S5)。Fenrir和Ratatoskr都編碼HNH內(nèi)切酶,在包裝過程中可能將DNA裂解成基因組長度的單位,并可能與它們的終止酶大亞基和門戶蛋白協(xié)同運作。然而,在Fenrir和Sk?ll的基因組中沒有發(fā)現(xiàn)推定的MCPs,這可能是由于在古菌特異性病毒中普遍存在著新的病毒結(jié)構(gòu)。MCPs的缺失可能是由于含衣殼的病毒和無衣殼的自私元素(capsidless selfish elements,CSE)的緊密進化聯(lián)系。含衣殼的古菌病毒通過衣殼基因的獲得和喪失,經(jīng)歷了向CSE的多次來回轉(zhuǎn)變,就像在真核病毒中看到的那樣,但仍然寄生在其宿主的遺傳信息中。為了了解阿斯加德病毒如何影響它們的宿主,我們搜索了存在于原核生物病毒和NCLDVs中涉及基因組復(fù)制、核苷酸代謝、轉(zhuǎn)錄和宿主-病毒相互作用的基因(圖4)。阿斯加德病毒編碼原核和真核病毒中存在的核心DNA復(fù)制基因(PolB、古/真核引物酶、鉗形裝載器、RNase H和ATP依賴的DNA連接酶)(26)。據(jù)預(yù)測,Nidhogg病毒有參與自主基因組復(fù)制和校對的基因,包括一個具有轉(zhuǎn)錄因子S-II類鋅指結(jié)構(gòu)域的ATP依賴性DNA連接酶(ligD)、RNase HI/逆轉(zhuǎn)錄酶樣蛋白、PolB和引物聚合酶(PrimPol)。據(jù)預(yù)測,病毒的PrimPol樣蛋白在DNA和/或RNA引物活動中具有額外的作用,以及耐破壞的DNA聚合酶活性。迄今為止,這些基因還沒有在古菌病毒中被描述過,只在棒狀桿菌病毒BFK20和Acanthamoeba polyphaga (棘變形蟲)mimivirus病毒中被鑒定過。Ratatoskr UViG編碼一個古菌-真核生物DNA引物酶,用于DNA復(fù)制中的引物活動,同時也編碼PolB。Fenrir和Nidhogg編碼AAA ATP酶,與復(fù)制因子C小亞基(rfcS)和大亞基(rfcL)相似,可能具有鉗形裝載器的功能。Sk?ll有增殖細(xì)胞核抗原(PCNA),與來自深海沉積物的Lokiarchaeota關(guān)系最密切(蛋白質(zhì)相似度為36.5%)。PCNA是真核生物和古菌中一個重要的復(fù)制過程因子,并存在于它們的一些病毒中。Sk?ll還編碼一個與核糖核苷還原酶(核糖核苷二磷酸還原酶,β亞基)和hedgehog/intein超家族結(jié)構(gòu)域相似的蛋白質(zhì)。核糖核苷還原酶是由一個保守的核心基因編碼,用于NCLDVs的核苷酸代謝。在這個核糖核苷酸還原酶中存在一個hedgehog/intein(Hint)蛋白結(jié)構(gòu)域,可能表明這個基因是從以前的宿主轉(zhuǎn)移到Sk?ll的。Fenrir病毒在復(fù)制過程中可能通過一個類似于細(xì)胞膜5'(3')脫氧核糖核酸酶的鹵素脫鹵酶(HAD)超家族蛋白來調(diào)節(jié)dNTP池。Fenrir還含有一種脫氧核苷單磷酸激酶(DNMP激酶),與一種大湖藻病毒脫氧核苷單磷酸激酶(bitscore=115.9)和幾種Mimiviridae DNMP激酶相似。Fenrir、Nidhogg和Ratatoskr病毒擁有DNA修復(fù)基因,這是NCLDVs的一個主要特征。這與缺乏這些基因的小型病毒形成對比。Fenrir、Nidhogg和Ratatoskr病毒還編碼ERCC4內(nèi)切酶域蛋白,與非洲豬瘟內(nèi)切酶EP364R相似。Nidhogg和Fenrir編碼的ERCC4內(nèi)切酶與古菌XPF 3'瓣修復(fù)內(nèi)切酶相似。這些類似XPF的內(nèi)切酶含有螺旋-發(fā)夾-螺旋結(jié)構(gòu)域,能夠?qū)崿F(xiàn)非特異性DNA結(jié)合。  圖4. 阿斯加德病毒感染機制的模型以及與其他病毒的蛋白質(zhì)相似性。(A)阿斯加德病毒中確定的參與感染、復(fù)制、轉(zhuǎn)錄和翻譯的基因。阿斯加德病毒顯示為不同顏色的六邊形,阿斯加德病毒宿主顯示為不同顏色的圓圈,宿主的轉(zhuǎn)錄機器用按功能編碼的橢圓來標(biāo)記(見圖例)。(B)40個基因(X軸下部)在阿斯加德病毒(Y軸)中的分布。填充的圓圈表示有注釋的直系同源物,而白色的圓圈表示沒有發(fā)現(xiàn)直系同源物。縮寫:NCVOG,核質(zhì)巨DNA病毒蛋白質(zhì)同源物群。用BioRender.com創(chuàng)建。除了核心的DNA復(fù)制機器和修復(fù)基因外,Fenrir和Nidhogg病毒還有各種基因表達和翻譯后修飾的機制。Nidhogg可能通過一個homeodomain蛋白調(diào)節(jié)轉(zhuǎn)錄。Homeodomain蛋白是DNA結(jié)合的轉(zhuǎn)錄因子,存在于真核生物和Mimiviridae中。Nidhogg病毒編碼一個具有TROVE和von Willebrand因子A結(jié)構(gòu)域的Ro60蛋白。Ro60可能與非編碼Y RNA形成核糖核蛋白復(fù)合物,與蛋白質(zhì)和其他RNA相互作用。Nidhogg病毒還可能通過RNA連接酶修復(fù)、拼接和編輯轉(zhuǎn)錄本(圖4)。Fenrir編碼一個翼狀螺旋-轉(zhuǎn)折螺旋結(jié)構(gòu)蛋白,這是在古菌病毒轉(zhuǎn)錄因子中發(fā)現(xiàn)的一個常見的DNA結(jié)合motif。我們沒有在這些UViG中發(fā)現(xiàn)任何翻譯機器,這表明它們利用宿主核糖體和阿斯加德宿主中存在的真核生物啟動因子。然而,Nidhogg和Fenrir可能用編碼的肽酶處理病毒蛋白前體。據(jù)預(yù)測,Nidhogg編碼的肽酶與Vaccinia病毒(NCLDV病毒的一個種)I7L/C57家族的加工內(nèi)肽酶相似,而Fenrir似乎能夠產(chǎn)生M42家族的氨基肽酶(圖4)。幾個阿斯加德門編碼真核生物泛素蛋白修飾系統(tǒng)的同源物。真核生物病毒已被證明可以劫持這些系統(tǒng)來幫助病毒傳播的各個階段。Nidhogg編碼三個泛素激活(ThiF家族/E1-like)蛋白同源物,可以利用Helarchaeota泛素系統(tǒng)(E1-like激活酶、E2-like連接酶和泛素類蛋白結(jié)構(gòu)域),并將其重新用于復(fù)制、轉(zhuǎn)錄、病毒子形成和釋放等過程。對Nidhogg蛋白的系統(tǒng)發(fā)育分析表明,它們是新型的E1泛素激活同源物,是Helarchaeota E1-like和真核生物類泛素修飾物激活5蛋白的祖先。鑒于這種類型的宿主-病毒相互作用只在真核系統(tǒng)中被描述過,這很有趣。阿斯加德病毒含有自主DNA甲基化和糖基化的基因,可能在宿主相互作用中發(fā)揮作用。DNA甲基化已被記錄在噬菌體和Mimiviridae中,作為一種表觀遺傳修飾,用于逃避宿主的防御,如限制性修飾(RM)系統(tǒng),劫持轉(zhuǎn)錄機器,調(diào)節(jié)復(fù)制周期,和/或防御具有RM系統(tǒng)的競爭病毒。有趣的是,Guaymas盆地的阿斯加德病毒可能能夠自主地進行DNA甲基化,因為它們編碼了5-甲基胞嘧啶、N4-甲基胞嘧啶和D12類N6-甲基腺嘌呤甲基轉(zhuǎn)移酶。限制性內(nèi)切酶(RE)類基因的同時出現(xiàn),如Nidhogg中的RecB家族RE,可能表明功能性RM系統(tǒng)可以抑制宿主基因的表達,并將轉(zhuǎn)錄從宿主轉(zhuǎn)移到病毒。Fenrir、Nidhogg和Ratatoskr也編碼己糖轉(zhuǎn)移酶,這是一類糖基轉(zhuǎn)移酶(GTs),可能賦予修改DNA、蛋白質(zhì)或脂質(zhì)上的己糖的能力,以逃避宿主防御系統(tǒng)和抑制宿主分子功能。GTs已經(jīng)在噬菌體和NCLDVs中被確認(rèn),但在古菌病毒中沒有充分的記錄。Fenrir編碼兩個重疊的基因,其序列與Sulfolobus islandicus rod-shaped virus 1 uncharacterized GT(SIRV1-GT)和alpha-1,2-mannosyltransferase(WbdA)同源。這表明Fenrir可以產(chǎn)生甘露糖糖鏈,這些糖鏈被編碼的SAM依賴性甲基轉(zhuǎn)移酶(WbdD)終止,而不利用宿主機器。此外,Fenrir編碼L-malate GT(BshA),這是一個在Asgards中普遍存在的基因,被認(rèn)為參與了細(xì)菌和古菌中低分子量硫醇(LMWT)的生物合成。Ratatoskr編碼一個N-乙酰-α-D-葡糖胺基L-蘋果酸脫氫酶1(BshB1)的同源物,這個基因也與LMWT的生物合成有關(guān)。最后,Nidhogg編碼一個與SIRV1-GT相匹配的GT,以及一個可能形成葡聚糖鏈的糖原合成酶(GlgA)同源物(圖4A)。鑒于阿斯加德古菌與真核生物的關(guān)系,有趣的是,阿斯加德感染的病毒具有與真核生物NCLDV相似的復(fù)制和調(diào)節(jié)機制(PCNA、PolB、核糖核苷酸還原酶、DNA連接酶、DNMP激酶和類復(fù)制因子C AAA ATP酶)。然而,允許NCLDVs中轉(zhuǎn)錄和翻譯解耦的mRNA加帽基因似乎并不存在于這些病毒中。此外,它們的許多特征與以前研究的古菌病毒不同。例如,完整的Nidhogg基因組編碼了homeobox和PrimPol蛋白域,而這些蛋白域在古菌病毒中是缺乏的。它們還含有泛素蛋白修飾系統(tǒng)的基因,這些基因以前在古菌病毒中沒有描述過,而在真核生物病毒中用于病毒的繁殖。它們編碼的結(jié)構(gòu)蛋白讓人聯(lián)想到Caudovirales中的那些蛋白,然而它們的大部分蛋白組成卻與這一目不同。阿斯加德病毒似乎同時具有古菌和真核生物的病毒特征,這與它們的宿主的進化位置相一致。對與阿斯加德古菌有關(guān)的病毒的首次描述,推進了我們對病毒在阿斯加德古菌的生態(tài)和進化中的作用的理解。Rambo, I.M., Langwig, M.V., Le?o, P. et al. Genomes of six viruses that infect Asgard archaea from deep-sea sediments. Nat Microbiol (2022). DOI: https:///10.1038/s41564-022-01150-8Brett Baker是德克薩斯大學(xué)奧斯汀分校海洋科學(xué)系和綜合生物學(xué)系的海洋微生物學(xué)副教授。他的研究旨在了解未培養(yǎng)的細(xì)菌和古細(xì)菌的生態(tài)學(xué)和進化。他的實驗室主要利用計算方法來描述海洋沉積物的基因組多樣性。近年來,他的團隊對未培養(yǎng)的基因組的重建,使人們首次看到了生命之樹上新分支的生理能力。Baker博士的研究小組還使用各種基于活動的方法來跟蹤自然界中這些新型微生物的代謝活動。他的實驗室在表征與真核生物有關(guān)的古菌方面也發(fā)揮了作用,這些古細(xì)菌推動了我們對復(fù)雜細(xì)胞生命起源的理解。2014年,他在密歇根大學(xué)獲得了地質(zhì)科學(xué)博士學(xué)位,在那里他研究了深海熱液羽流和河口沉積物的地質(zhì)微生物學(xué)。在此之前,他曾在加州大學(xué)伯克利分校擔(dān)任過10年的研究助理,研究與酸性礦井排水有關(guān)的微生物。
|