發(fā)文章
發(fā)文工具
撰寫
網(wǎng)文摘手
文檔
視頻
思維導(dǎo)圖
隨筆
相冊(cè)
原創(chuàng)同步助手
其他工具
圖片轉(zhuǎn)文字
文件清理
AI助手
留言交流
摘要
RNA-蛋白質(zhì)復(fù)合物在介導(dǎo)重要的基本細(xì)胞過(guò)程(例如運(yùn)輸和定位)中是必不可少的。特別是,ncRNA-蛋白質(zhì)相互作用在mRNA定位,mRNA穩(wěn)定化,聚腺苷酸化,剪接和翻譯等轉(zhuǎn)錄后基因調(diào)控中發(fā)揮重要作用。解決RNA-蛋白質(zhì)相互作用預(yù)測(cè)問(wèn)題的實(shí)驗(yàn)方法仍然是昂貴和耗時(shí)的。在這里,作者提出RPI-Pred (RNA-蛋白質(zhì)互做預(yù)測(cè)器),一種基于支持向量機(jī)的新方法,根據(jù)序列和結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì) - RNA相互作用對(duì)。結(jié)果表明,當(dāng)使用序列和實(shí)驗(yàn)確定的蛋白質(zhì)和RNA結(jié)構(gòu)時(shí),RPI-Pred可以正確預(yù)測(cè)RNA-蛋白質(zhì)相互作用對(duì),預(yù)測(cè)準(zhǔn)確率為94%,使用序列和預(yù)測(cè)蛋白質(zhì)和RNA結(jié)構(gòu)時(shí)為83% 。此外,作者提出的RPI-Pred方法通過(guò)預(yù)測(cè)來(lái)自不同生物體的更多實(shí)驗(yàn)驗(yàn)證的ncRNA-蛋白質(zhì)相互作用對(duì),優(yōu)于其他現(xiàn)有方法。受RPI-Pred的改進(jìn)性能的啟發(fā),作者進(jìn)一步將方法用于可靠構(gòu)建ncRNA-蛋白質(zhì)相互作用網(wǎng)絡(luò)。 RPI-Pred公開發(fā)布于:http://ctsb.is./projects/rpi-pred。
介紹
RNA-蛋白質(zhì)相互作用(RPI)在諸如人類疾病,植物復(fù)制和植物病原體抗性等基因調(diào)控細(xì)胞過(guò)程中起著至關(guān)重要的作用。最近的高通量技術(shù)產(chǎn)生了顯著的證據(jù)證明蛋白質(zhì)可以與RNA相互作用介導(dǎo)不同種類的細(xì)胞功能。在轉(zhuǎn)錄后調(diào)控過(guò)程中,RPI復(fù)合體與靶向的mRNA和/或非編碼RNA(ncRNA)相互作用以調(diào)節(jié)細(xì)胞功能,例如RNA剪接,RNA轉(zhuǎn)運(yùn),RNA穩(wěn)定性和RNA翻譯。 RPI實(shí)驗(yàn)研究表明,許多功能性ncRNA在基因表達(dá)和調(diào)控中發(fā)揮關(guān)鍵作用。盡管一些單獨(dú)的ncRNA已被充分研究,例如HOTAIR,MALAT-1和Xist,但大多數(shù)仍然沒有得到很好的理解。已經(jīng)確定了超過(guò)3萬(wàn)個(gè)ncRNAs,預(yù)計(jì)這個(gè)數(shù)字每年都會(huì)增加。目前,NPInter是唯一提供所有經(jīng)實(shí)驗(yàn)驗(yàn)證的ncRNA-蛋白質(zhì)相互作用(ncRPI)功能信息的數(shù)據(jù)庫(kù)。實(shí)驗(yàn)技術(shù)通常耗時(shí)且昂貴。我們對(duì)單個(gè)ncRNAs功能的理解遠(yuǎn)遠(yuǎn)超過(guò)了現(xiàn)有數(shù)據(jù)的龐大數(shù)量和多樣性。此外,我們對(duì)基因調(diào)控網(wǎng)絡(luò)中ncRPI的理解非常有限,特別是與蛋白質(zhì) - 蛋白質(zhì)和DNA-蛋白質(zhì)復(fù)合物的調(diào)節(jié)作用相比時(shí)。這是因?yàn)榛蚪M學(xué)和蛋白質(zhì)組學(xué)技術(shù)的進(jìn)步已經(jīng)導(dǎo)致大量關(guān)于蛋白質(zhì) - 蛋白質(zhì)和蛋白質(zhì) - DNA相互作用的數(shù)據(jù);但是,關(guān)于ncRPI的信息要少得多。
盡管人類基因組中成功鑒定的RNA結(jié)合蛋白(RBP)數(shù)量(400)有所增加,但仍然缺乏對(duì)RPI復(fù)合物及其在轉(zhuǎn)錄后調(diào)控網(wǎng)絡(luò)中的作用的完整理解。盡管基于序列同源性的方法(如基本局部比對(duì)搜索工具和PFAM有助于檢測(cè)蛋白質(zhì)的功能區(qū)域(結(jié)合域)并因此檢測(cè)可能的功能,但這些功能方法缺乏識(shí)別給定蛋白質(zhì)的相互作用伙伴(RNAs)的能力,或者確定給定的蛋白質(zhì)和RNA對(duì)是否可以形成相互作用。據(jù)我們所知,目前很少有計(jì)算方法可以預(yù)測(cè)RPI。 Pancaldi和Balerler于2011年報(bào)道了預(yù)測(cè)ncRPI的第一種計(jì)算方法之一。他們使用從蛋白質(zhì)二級(jí)結(jié)構(gòu)和定位,蛋白質(zhì)和基因物理特性以及未轉(zhuǎn)譯區(qū)域(UTRs)中提取的超過(guò)100種特征訓(xùn)練了隨機(jī)森林(RF)和支持向量機(jī)(SVM)分類器。此后,CATRAPID開發(fā)利用包括二級(jí)結(jié)構(gòu),氫鍵和范德華傾向的物理化學(xué)性質(zhì)。接下來(lái),Muppirala等人引入了一種稱為RPISeq的方法,該方法使用蛋白質(zhì)和RNA序列衍生的特征構(gòu)建。他們還分別對(duì)氨基酸和核苷酸序列使用3聚體和4聚體三聯(lián)體特征訓(xùn)練了RF和SVM分類器。 Wang等人提出了一種基于Naive Bayes(NB)和Extended NB(ENB)分類器的方法,它使用了Muppirala等人的工作中報(bào)告的相同的數(shù)據(jù)集和類似的三元組特征。最近,Lu等人提出了一種稱為'lncPro'的方法,用于預(yù)測(cè)ncRNA-蛋白質(zhì)結(jié)合,采用Fisher線性鑒別方法。他的訓(xùn)練特征是三種類型的經(jīng)典蛋白質(zhì)二級(jí)結(jié)構(gòu),氫鍵和范德華力,以及六種類型的RNA二級(jí)結(jié)構(gòu)(RSS)。
Muppirala等人和Wang等人基于序列特征提出了他們的方法來(lái)預(yù)測(cè)RPI相互作用。其他方法也已經(jīng)通過(guò)組合序列和結(jié)構(gòu)特征被提出。 lncPro方法使用蛋白質(zhì)和RSS,氫鍵和范德華力。然而,上述方法都沒有使用高階三維蛋白和RNA結(jié)構(gòu)特征,這些特征已知是其可能功能的關(guān)鍵。
在目前的工作中,作者提出了一種計(jì)算方法來(lái)預(yù)測(cè)蛋白質(zhì)-RNA相互作用對(duì)和/或從候選物中鑒定給定蛋白質(zhì)或RNA的結(jié)合配偶體。除了序列特征之外,我們還結(jié)合了蛋白質(zhì)和RNA的高階結(jié)構(gòu),全面了解RPI相互作用。我們考慮蛋白質(zhì)結(jié)構(gòu)的16個(gè)稱為蛋白質(zhì)塊(PB)的結(jié)構(gòu)片段。與傳統(tǒng)的三態(tài)蛋白質(zhì)二級(jí)結(jié)構(gòu)(α-螺旋,β-折疊和卷曲)相比,PB能夠更準(zhǔn)確地表示已知的蛋白質(zhì)結(jié)構(gòu),并已應(yīng)用于許多基于蛋白質(zhì)結(jié)構(gòu)的分析 。對(duì)于RNA高階結(jié)構(gòu),我們考慮了五類RSS,即莖,發(fā)夾,環(huán),凸起和內(nèi)部環(huán)。這些PB和RSS與其相應(yīng)的氨基酸和核苷酸序列組合。利用這些功能,作者開發(fā)了一種基于SVM的機(jī)器學(xué)習(xí)方法RPI-Pred來(lái)預(yù)測(cè)蛋白質(zhì)-RNA相互作用。作者的訓(xùn)練數(shù)據(jù)庫(kù)是使用來(lái)自Protein Data Bank(PDB)的蛋白質(zhì)和RNA的序列和實(shí)驗(yàn)驗(yàn)證結(jié)構(gòu)構(gòu)建的。作者還使用序列和預(yù)測(cè)結(jié)構(gòu)來(lái)測(cè)試不同數(shù)據(jù)集(如RPI369和RPI2241)以及ncRPI數(shù)據(jù)集(如RPI367,RPI13243和NPInter10412)上的RPI-Pred。作者擴(kuò)展了分析,構(gòu)建了一個(gè)計(jì)算機(jī)網(wǎng)絡(luò)來(lái)研究蛋白質(zhì)和ncRNA之間的潛在相互作用,這可以幫助我們進(jìn)一步理解ncRNA的功能。最后,該方法的網(wǎng)絡(luò)服務(wù)器也在http://ctsb.is./projects/rpi- pred上開發(fā)和免費(fèi)訪問(wèn)。
材料和方法
工作流程
圖1顯示了開發(fā)RPI-Pred方法的工作流程。 所提出的方法包括三個(gè)步驟:
(1)提取蛋白質(zhì)和RNA的序列和結(jié)構(gòu)特征以開發(fā)RPI-Pred預(yù)測(cè)方法,(2)預(yù)測(cè)ncRPI和(3)基于計(jì)算機(jī)的生物網(wǎng)絡(luò)的構(gòu)建對(duì)步驟2中的預(yù)測(cè)結(jié)果的影響。步驟 1包括各種過(guò)程,例如構(gòu)建訓(xùn)練數(shù)據(jù)集,去除多余的RNA-蛋白質(zhì)對(duì),從訓(xùn)練數(shù)據(jù)集中的序列和結(jié)構(gòu)中提取特征以及開發(fā)'RPI-Pred'模型。 步驟2包括使用RPI-Pred針對(duì)給定蛋白質(zhì)和/或ncRNA的一級(jí)序列和預(yù)測(cè)結(jié)構(gòu)以及ncRPI預(yù)測(cè)的特征提取。 步驟3包括基于RPI-Pred交互預(yù)測(cè)的交互網(wǎng)絡(luò)的構(gòu)建。 下面給出每個(gè)步驟的更詳細(xì)的描述。
培訓(xùn)數(shù)據(jù)集
為了開發(fā)RPI-Pred方法,我們首先通過(guò)解析核酸數(shù)據(jù)庫(kù)(NDB)和蛋白質(zhì)-RNA界面數(shù)據(jù)庫(kù)(PRIDB)來(lái)構(gòu)建RPI復(fù)合體的非冗余訓(xùn)練數(shù)據(jù)集。 前者提供RNA-蛋白質(zhì)復(fù)合物的數(shù)據(jù),而后者提供RNA-蛋白質(zhì)相互作用對(duì)的原子界面。 本研究使用NDB中總共1560個(gè)RPI復(fù)合物(截至2014年2月1日)。 作者從PRIDB中提取1336個(gè)復(fù)合物的原子和鏈接口,得到13 163個(gè)蛋白質(zhì)和2715個(gè)RNA鏈。 這1336個(gè)復(fù)合物被進(jìn)一步用于構(gòu)建訓(xùn)練數(shù)據(jù)集,其中包括可能的正和負(fù)蛋白質(zhì) - RNA對(duì)。構(gòu)建訓(xùn)練數(shù)據(jù)集的過(guò)程包括通過(guò)序列相似性標(biāo)準(zhǔn)去除多余的蛋白質(zhì)/ RNA對(duì),如下所示。 例如,具有PDB ID'1a9n'的RPI復(fù)合物分別具有四條蛋白質(zhì)鏈(A,B,C,D)和兩條RNA鏈(Q,R)。 作者從PRIDB獲得了可能的交互對(duì),如A-Q,B-Q,C-R和D-R。 然后通過(guò)搜索蛋白質(zhì)(RNA)序列之間的序列相似性來(lái)去除同源RNA-蛋白質(zhì)對(duì)(即與相似RNA鏈相互作用的相似蛋白質(zhì)鏈)。 在這項(xiàng)研究中,作者使用EMBOSS針編程,標(biāo)準(zhǔn)序列同一性截?cái)?0%,以去除具有高序列相似性的蛋白質(zhì)(和RNA鏈)。 在目前的'1a9n'實(shí)驗(yàn)中,蛋白質(zhì)鏈A&C,B&D和RNA鏈Q(jìng)&R是100%序列相似的,因此我們將冗余蛋白質(zhì)對(duì)刪除。 最后,A-Q和B-Q被鑒定為非冗余RNA-蛋白質(zhì)對(duì)。
上述選定的非冗余對(duì)進(jìn)一步測(cè)試原子相互作用與距離閾值(3.40A?)。這個(gè)距離閾值有助于加強(qiáng)訓(xùn)練數(shù)據(jù)集中的積極配對(duì),只包括強(qiáng)相互作用的RPI對(duì)。已經(jīng)使用不同的閾值來(lái)區(qū)分結(jié)合的RNA-蛋白質(zhì)對(duì)和非結(jié)合的RNA-蛋白質(zhì)對(duì)。我們使用閾值3.40A?。閾值3.4A?是合理的,足以涵蓋“強(qiáng)”和“中”氫鍵以及能量豐富的范德華接觸。因此,我們?cè)O(shè)置閾值(3.4A?)來(lái)區(qū)分強(qiáng)相互作用的蛋白質(zhì)-RNA對(duì)(陽(yáng)性對(duì))和弱相互作用的蛋白質(zhì)-RNA對(duì)(陰性對(duì))。在上面給出的例子中,具有至少兩個(gè)原子,一個(gè)來(lái)自蛋白質(zhì),另一個(gè)來(lái)自RNA,距離3.40A°的B-Q對(duì)被認(rèn)為是陽(yáng)性對(duì)。在閾值內(nèi)沒有原子 - 原子距離的A-Q對(duì)被認(rèn)為是負(fù)值對(duì)。該程序應(yīng)用于所有1336個(gè)RNA-蛋白質(zhì)復(fù)合物以鑒定正和負(fù)對(duì)。此外,從這些陽(yáng)性和陰性數(shù)據(jù)集中排除肽(序列長(zhǎng)度<25個(gè)氨基酸的蛋白質(zhì))和小RNA(序列長(zhǎng)度<15個(gè)核苷酸)。
因此,作者獲得了1807個(gè)陽(yáng)性對(duì)(由1807個(gè)蛋白質(zhì)和1078個(gè)RNA鏈組成)和1436對(duì)陰性對(duì)(含有1436個(gè)蛋白質(zhì)和493個(gè)RNA鏈)的訓(xùn)練數(shù)據(jù)集,即RPI1807。 補(bǔ)充表S1列出了RPI1807的正和負(fù)對(duì)。
測(cè)試數(shù)據(jù)集
RPI-Pred采用不同的數(shù)據(jù)集進(jìn)行測(cè)試,包括以前研究的四個(gè)數(shù)據(jù)集和本文中構(gòu)建的新數(shù)據(jù)集。 前三個(gè)數(shù)據(jù)集從中獲得,并且分別基于蛋白質(zhì)-RNA對(duì)的數(shù)目(369,2241和13243)表示為RPI369,RPI2241和RPI13243。 其中,前兩個(gè)數(shù)據(jù)集被用作訓(xùn)練數(shù)據(jù)集來(lái)開發(fā)分類器,第三個(gè)被用來(lái)評(píng)估分類器。 RPI13243由13243RPI組成,其包括Hogan等人發(fā)表的所有5166種蛋白質(zhì)-mRNA相互作用。。 第四個(gè)數(shù)據(jù)集(表示為RPI367)由Wang等人構(gòu)建的367個(gè)蛋白質(zhì)-ncRNA相互作用組成, 來(lái)自NPInter數(shù)據(jù)庫(kù)。
訓(xùn)練數(shù)據(jù)集RPI1807中的配對(duì)也用于構(gòu)建第五個(gè)測(cè)試數(shù)據(jù)集。 在這種情況下,應(yīng)用RPI-Pred來(lái)預(yù)測(cè)RPI,通過(guò)使用蛋白質(zhì)和RNA的序列和預(yù)測(cè)結(jié)構(gòu),而不是從PDB獲得的實(shí)驗(yàn)確定的結(jié)構(gòu)。 第六個(gè)測(cè)試數(shù)據(jù)集從NPInter數(shù)據(jù)中提取,即RPI10412,包括來(lái)自六種不同模型生物的10 412個(gè)ncRPI對(duì)。 這些ncRNA和蛋白質(zhì)對(duì)已經(jīng)通過(guò)實(shí)驗(yàn)確定為具有物理關(guān)聯(lián)并列入'ncRBP'類別中。
PB和RSS
除了一級(jí)序列,我們還使用了從RPI-Pred中的蛋白質(zhì)和RNA兩者的實(shí)驗(yàn)測(cè)定結(jié)果(可在PDB中獲得)或理論預(yù)測(cè)結(jié)果。蛋白質(zhì)三維結(jié)構(gòu)可以用16個(gè)字母的1D結(jié)構(gòu)片段來(lái)表示,稱為PB。PDB-2-PB數(shù)據(jù)庫(kù)根據(jù)PDB中可用的實(shí)驗(yàn)解析的蛋白質(zhì)結(jié)構(gòu)提供PB信息。作者使用PDB-2-PB為我們的訓(xùn)練數(shù)據(jù)集中的每種蛋白質(zhì)檢索16個(gè)字母的PB結(jié)構(gòu)特征。
作者使用3DNA套件從相應(yīng)的3D結(jié)構(gòu)中提取RSS。作者使用五類RSS,即Stem(S),Hairpin(H),Loop(L),Bulges(B)和Internal loop(I)來(lái)構(gòu)造我們的RPI-Pred方法。在這項(xiàng)研究中,假結(jié)RNA的結(jié)構(gòu)沒有考慮,因?yàn)樗鼈冊(cè)谟?xùn)練數(shù)據(jù)集中的數(shù)量較少。這些PB和RSS進(jìn)一步與相應(yīng)的蛋白質(zhì)和RNA序列結(jié)合以分別代表蛋白質(zhì)和RNA。這些組合的序列結(jié)構(gòu)特征被用于開發(fā)我們的用于預(yù)測(cè)潛在ncRPI對(duì)的RPI-Pred方法。
序列和結(jié)構(gòu)特征的表示
這項(xiàng)工作中使用的蛋白質(zhì)和RNA的序列和結(jié)構(gòu)特征如下所示。根據(jù)它們的偶極矩和側(cè)鏈體積將20個(gè)氨基酸的蛋白序列分為7組(7個(gè)字母的縮減序列字母):(A,G,V),(I,L,F(xiàn),P),(Y,M, T,S),(H,N,Q,W),(R,K),(D,E)和(C )。然后,我們將這些7個(gè)字母的序列特征與16個(gè)字母的PB結(jié)構(gòu)表示組合在一起,從而得到112(7X16)種可能的組合。 112個(gè)組合的歸一化頻率形成了112個(gè)蛋白質(zhì)向量。類似地,RNA序列和RSS表示導(dǎo)致了4種可能的組合(4種為核苷酸類型; A,U,C和G和5為RSS),并且這20種組合的歸一化頻率導(dǎo)致20種RNA載體。補(bǔ)充表S2給出了蛋白質(zhì)和RNA的序列和結(jié)構(gòu)特征標(biāo)簽。總之,為了構(gòu)建RPI-Pred方法,我們使用了132個(gè)載體的序列和結(jié)構(gòu)特征,其中前112個(gè)載體代表蛋白質(zhì),其余20個(gè)載體代表RNA。
SVM分類器
支持向量機(jī)方法是一種流行的監(jiān)督機(jī)器學(xué)習(xí)技術(shù),用于許多分類和回歸問(wèn)題。 在這里,作者應(yīng)用了一個(gè)眾所周知的SVM分類器LIBSVM-3.17包作為獨(dú)立內(nèi)部程序?qū)崿F(xiàn),以執(zhí)行RPI預(yù)測(cè)。 作者使用代表蛋白質(zhì)和RNA序列和結(jié)構(gòu)的132個(gè)特征向量構(gòu)建了RPI-Pred方法。 RPI-Pred使用不同的核函數(shù)及其相應(yīng)的參數(shù)進(jìn)行了優(yōu)化。 作者選擇了“多項(xiàng)式”核函數(shù),它比其他預(yù)測(cè)準(zhǔn)確度更高。 RPI-Pred訓(xùn)練有效地預(yù)測(cè)蛋白質(zhì)和RNA相互作用對(duì),并且遵循以下優(yōu)化參數(shù):C = 1000,μ= 1,cofe0 = 1和degree = 4。
預(yù)測(cè)PB和RSS
由于許多蛋白質(zhì)和RNA尚未得到實(shí)驗(yàn)解決,我們必須使用理論方法來(lái)預(yù)測(cè)其結(jié)構(gòu)。 許多研究小組提出了PB預(yù)測(cè)方法。 在這項(xiàng)工作中,作者使用PB-kPRED方法來(lái)預(yù)測(cè)包含在所有測(cè)試數(shù)據(jù)集中的蛋白質(zhì)的PB結(jié)構(gòu)。
同樣,RSS也可以用可用的RNA結(jié)構(gòu)預(yù)測(cè)方法預(yù)測(cè)。 在這里,我們從維也納軟件包中選擇了RNAfold - 一個(gè)內(nèi)部的單獨(dú)程序來(lái)預(yù)測(cè)測(cè)試數(shù)據(jù)集中RNA的RSSs。 預(yù)測(cè)的PB和RSS分別與相應(yīng)的氨基酸和核苷酸序列結(jié)合,并用于我們的RPI-Pred方法。
績(jī)效評(píng)估
使用10倍交叉驗(yàn)證(10倍CV)方法評(píng)估RPI-Pred的表現(xiàn)。 為了執(zhí)行這個(gè)測(cè)試,訓(xùn)練數(shù)據(jù)集被分成10個(gè)相同大小的子集。 每個(gè)子集用于測(cè)試,而剩余的九個(gè)子集用于訓(xùn)練。 這個(gè)過(guò)程重復(fù)了10次,以涵蓋所有可能性。 最后,記錄了所有10個(gè)測(cè)試子集的平均性能。 使用精確度(PRE),回憶(REC),F(xiàn)分?jǐn)?shù)(FSC)和準(zhǔn)確度(ACC)評(píng)估預(yù)測(cè)性能,定義如下:
其中,tp和tn分別表示正確預(yù)測(cè)的正和負(fù)對(duì)的數(shù)量,fp和fn分別表示錯(cuò)誤預(yù)測(cè)的正和負(fù)對(duì)的數(shù)量。 接收器工作特性曲線的曲線下面積(AUC)用10倍CV計(jì)算。 AUC范圍從0到1,其中1表示最佳預(yù)測(cè)。
結(jié)果
作者建立了識(shí)別蛋白質(zhì)或RNA結(jié)合成分的RPI-Pred方法。 在本節(jié)中,作者測(cè)試了RPI-Pred在包括RPI1807,RPI2241和RPI369在內(nèi)的不同測(cè)試數(shù)據(jù)集的性能,并與以前的方法進(jìn)行了比較。 作者還將RPI-Pred方法應(yīng)用于大型ncRPI數(shù)據(jù)集,并將預(yù)測(cè)結(jié)果與其他現(xiàn)有方法進(jìn)行比較。
用實(shí)驗(yàn)確定的結(jié)構(gòu)表現(xiàn)RPI-Pred
RPI-Pred方法的表現(xiàn)使用RPI1807,RPI2241和RPI369數(shù)據(jù)集上的10倍CV進(jìn)行評(píng)估。實(shí)驗(yàn)驗(yàn)證的結(jié)構(gòu)從PDB數(shù)據(jù)庫(kù)中提取。通過(guò)計(jì)算每個(gè)數(shù)據(jù)集的ACC,AUC,PRE,REC和FSC評(píng)估RPI-Pred的性能。我們的RPI-Pred成功預(yù)測(cè)了RPI1807數(shù)據(jù)集上的RNA-蛋白質(zhì)對(duì),其預(yù)測(cè)準(zhǔn)確度(ACC)為93%。其他測(cè)量值(AUC,PRE,REC和FSC)分別為0.97,0.940,0.95和0.95。預(yù)測(cè)準(zhǔn)確度高表明我們的基于序列和結(jié)構(gòu)的方法可靠地預(yù)測(cè)了RPI。
同樣,使用RPI2241和RPI369數(shù)據(jù)組的正負(fù)對(duì)評(píng)估RPI-Pred的表現(xiàn)。從RPI2241和RPI369數(shù)據(jù)集直接采用陽(yáng)性對(duì),并按照步驟生成相應(yīng)的陰性對(duì)。然后,將RPI-Pred應(yīng)用于這些數(shù)據(jù)集,以正確預(yù)測(cè)所有正和負(fù)對(duì)。 RPI-pred數(shù)據(jù)集達(dá)到了RPI2241數(shù)據(jù)集的預(yù)測(cè)準(zhǔn)確度(ACC)84%。 AUC,PRE,REC和FSC也分別為0.89,0.88,0.78和0.83。將RPI-pred應(yīng)用于RPI369數(shù)據(jù)集導(dǎo)致預(yù)測(cè)準(zhǔn)確度為92%,AUC,PRE,REC和FSC分別為0.95,0.89,0.89和0.89。作者新構(gòu)建的數(shù)據(jù)集RPI1807的結(jié)果分別顯示RPI2241和RPI369結(jié)果的準(zhǔn)確度分別提高了10%和2%。
RPI-Pred與現(xiàn)有方法的比較
作者用RPI2241和RPI369數(shù)據(jù)集分別比較RPI-Pred和Mup-pirala方法的性能,使用10倍CV。 該比較顯示RPI-Pred方法的預(yù)測(cè)性能和結(jié)構(gòu)在RPI預(yù)測(cè)中的重要性。使用AUC,PRE,REC,F(xiàn)SC和ACC測(cè)量比較了從RPI2241和RP1369數(shù)據(jù)集(分別為RPI2241-RPI-Pred和RPI369-RPI-Pred)獲得的RPI-Pred結(jié)果。 比較結(jié)果顯示在表1中。將Muppirala等人的結(jié)果表示為RPI2241-SVM,RPI369-SVM,RPI2241-RF和RPI369RF,基于兩個(gè)分類器SVM和RF以及使用的訓(xùn)練數(shù)據(jù)庫(kù)。如表1所示,RPI2241-RPI-Pred結(jié)果顯示預(yù)測(cè)精度為84%。 這比RPI2241-SVM(~87%)和RPI2241-RF(~89%)結(jié)果的結(jié)果分別低?3%和?5%。 另一方面,RPI369-RPI-Pred結(jié)果顯示預(yù)測(cè)精度為92%,意味著比RPI369-SVM(~72%)和RPI369-RF(?76%)增加了?24%和?18% %)的結(jié)果。這些結(jié)果說(shuō)明RPI369-RPI-Pred在預(yù)測(cè)與蛋白質(zhì)相互作用的非核糖體RNA對(duì)方面可以優(yōu)于RPI369-SVM和RPI369-RF分類器。還包括結(jié)構(gòu)特征可以改善RPI預(yù)測(cè)。 RPI2241數(shù)據(jù)集觀察到的預(yù)測(cè)精確度略低,其中包含更多與蛋白質(zhì)配對(duì)的核糖體RNA。核糖體RNA結(jié)構(gòu)更可能含有假結(jié)構(gòu)。然而,這項(xiàng)工作中使用的RNA折疊不具備預(yù)測(cè)這種結(jié)構(gòu)的能力,因此所提出的RPI-Pred不能考慮假結(jié)構(gòu)。這可能影響核糖體RNA與蛋白質(zhì)相互作用的正確預(yù)測(cè)。此外,Muppirala等人使用3-mer序列特征,而RPI-Pred使用序列和結(jié)構(gòu)的1-mer特征來(lái)執(zhí)行RPI預(yù)測(cè)。這導(dǎo)致特征空間中的維度增加,這可能導(dǎo)致改進(jìn)的預(yù)測(cè)。但是,這也會(huì)導(dǎo)致更復(fù)雜的模型和更長(zhǎng)的處理時(shí)間。最近,王等人在RPI2241和RPI369數(shù)據(jù)集上開發(fā)了使用NB和ENB分類器的RPI預(yù)測(cè)方法。 作者還將這兩個(gè)數(shù)據(jù)集的RPI-Pred方法的預(yù)測(cè)性能與Wang等人的性能進(jìn)行了比較。報(bào)告結(jié)果。 為了進(jìn)行比較,我們根據(jù)所使用的數(shù)據(jù)集和分類器將結(jié)果分為四類:RPI2241-NB,RPI369-NB,RPI2241-ENB和RPI369-ENB。 與RPI2241-NB(75.7%)和RPI2241-ENB(74.0%)相比,RPI-Pred方法的預(yù)測(cè)準(zhǔn)確度分別提高了9%和10%。 作者在RPI369數(shù)據(jù)集上的RPI-Pred法也顯示RPI369-NB(77.7%)和RPI369-ENB(75.0%)的預(yù)測(cè)準(zhǔn)確度分別提高了15%和17%。
RPI-Pred性能與序列和預(yù)測(cè)結(jié)構(gòu)
作者通過(guò)使用序列和預(yù)測(cè)結(jié)構(gòu),而不是實(shí)驗(yàn)確定的結(jié)構(gòu),進(jìn)一步測(cè)試了RPI-Pred方法。由于缺乏針對(duì)許多RNA的實(shí)驗(yàn)驗(yàn)證的結(jié)構(gòu),特別是ncRNA和蛋白質(zhì),該實(shí)驗(yàn)是必需的。目標(biāo)是了解RPI-Pred性能在多大程度上可能受到預(yù)測(cè)(而非已知)結(jié)構(gòu)的影響。為了進(jìn)行這種分析,作者使用基于RPI1807數(shù)據(jù)集構(gòu)建的RPI模型,并在相同的數(shù)據(jù)集內(nèi)進(jìn)行測(cè)試。作者觀察到預(yù)測(cè)準(zhǔn)確率為83%。對(duì)于其余的測(cè)量AUC,PRE,REC和FSC,性能分別為0.89,0.79,0.94和0.86。與早期報(bào)道的已知結(jié)構(gòu)(AUC,PRE,REC和FSC分別為0.97,0.94,0.95和0.95)的結(jié)果相比較。特別是,與已知結(jié)構(gòu)的RPI1807數(shù)據(jù)集上的RPI-Pred的性能相比,預(yù)測(cè)準(zhǔn)確度(ACC)降低了近10%。作者可以觀察到其他績(jī)效指標(biāo)的下降。預(yù)計(jì)使用預(yù)測(cè)結(jié)構(gòu)時(shí),精度顯著降低,而精度幾乎沒有影響。因?yàn)樽髡叩臏y(cè)試數(shù)據(jù)集(即RPI367,RPI13243和NPInter10412)沒有可用的實(shí)驗(yàn)結(jié)構(gòu)特征,所以我們使用預(yù)測(cè)的PB和RSS來(lái)執(zhí)行RPI預(yù)測(cè)。
RPI-Pred預(yù)測(cè)ncRPI對(duì)的性能
盡管大多數(shù)DNA轉(zhuǎn)錄物都是ncRNA,但很少有已知的功能。 ncRNA功能可以通過(guò)鑒定不同的相互作用配偶體,如DNA,RNA和蛋白質(zhì)來(lái)預(yù)測(cè)。目前認(rèn)為,ncRNA與蛋白質(zhì)相互作用,然后執(zhí)行其調(diào)節(jié)功能,如染色質(zhì)重塑,以增強(qiáng)或抑制基因表達(dá)。因此,研究ncRPI可以揭示ncRNA在轉(zhuǎn)錄后調(diào)控過(guò)程中的重要性。很少有計(jì)算研究用于預(yù)測(cè)蛋白質(zhì)或ncRNA的結(jié)合伴侶,使用序列和結(jié)構(gòu)信息。在這里,使用序列和高階結(jié)構(gòu)信息來(lái)預(yù)測(cè)RPI-Pred在預(yù)測(cè)給定蛋白質(zhì)或ncRNA的結(jié)合伴侶方面的表現(xiàn)。在RPI367,RPI13243和NPInter10412數(shù)據(jù)集上測(cè)試了RPI-Pred方法,其中包含ncRPI對(duì)。從RPI-Pred方法獲得的這三個(gè)數(shù)據(jù)集的結(jié)果進(jìn)一步與其他現(xiàn)有方法得到的結(jié)果進(jìn)行了比較。
RPI-Pred方法首先使用小型RPI367數(shù)據(jù)集進(jìn)行測(cè)試,該數(shù)據(jù)集由六種不同模式生物體中的367個(gè)ncRPI組成:線蟲,果蠅,大腸桿菌,智人,小家鼠和釀酒酵母。 RPI-Pred預(yù)測(cè)結(jié)果與Wang等人的四個(gè)分類器(RPI369-NB(62%),RPI369-NB(77) %),RPI2241-ENB(66%)和RPI2241-ENB(79%)在RPI367數(shù)據(jù)集上的結(jié)果。RPI-Pred方法的預(yù)測(cè)準(zhǔn)確率高達(dá)89%(367對(duì)中的328個(gè)被正確預(yù)測(cè))當(dāng)比較Wang等人的分類器的預(yù)測(cè)結(jié)果時(shí),RPI369-NB(62%),RPI369-NB(77%)的準(zhǔn)確度超過(guò)80% ,RPI2241-ENB(66%)和RPI2241-ENB(79%),我們的RPI-Pred結(jié)果顯示預(yù)測(cè)精度分別提高了27%,22%,23%和10%,特別是我們的RPI- Pred預(yù)測(cè)了更多的ncRPI配對(duì)(預(yù)測(cè)線蟲,黑腹果蠅,大腸桿菌和智人的預(yù)測(cè)準(zhǔn)確度分別為100%,92%,96%和91%)比Wang等人分類。
下一個(gè)ncRPI預(yù)測(cè)分析是在Muppirala使用的更大的數(shù)據(jù)集上進(jìn)行的,其中包含13 243個(gè)ncRPI對(duì)。我們的RPI-Pred方法在這個(gè)數(shù)據(jù)集的13 243個(gè)相互作用對(duì)中正確地預(yù)測(cè)了12 240個(gè),預(yù)測(cè)準(zhǔn)確率為92%。與Muppirala報(bào)告的精確度(SVM和RF分類器分別為65%和78%)相比,作者的方法顯示準(zhǔn)確度提高了27%和14%。
最后,作者測(cè)試了RPI-Pred方法在當(dāng)前可用的NPInter數(shù)據(jù)庫(kù)(版本2.0)中預(yù)測(cè)ncRPI對(duì)的能力。 NPInter數(shù)據(jù)庫(kù)是為不同模型生物提供實(shí)驗(yàn)驗(yàn)證的ncRPI對(duì)的唯一資源。新NPInter10412數(shù)據(jù)集由NPInter數(shù)據(jù)庫(kù)中的10個(gè)412 ncRPI對(duì)六個(gè)模型生成器組成。由于在NPInter數(shù)據(jù)庫(kù)中沒有實(shí)驗(yàn)驗(yàn)證的陰性對(duì),因此對(duì)NPInter10412數(shù)據(jù)集中的所有陽(yáng)性對(duì)進(jìn)行隨機(jī)洗牌(即通過(guò)保持RNA固定并重新排序蛋白質(zhì))以產(chǎn)生陰性數(shù)據(jù)集。RPI-Pred對(duì)NPInter10412數(shù)據(jù)集的表現(xiàn)通過(guò)預(yù)測(cè)正確的ncRPI對(duì)和ncRPI對(duì)進(jìn)行評(píng)估。 RPI-Pred在NPInter10412數(shù)據(jù)集上的預(yù)測(cè)準(zhǔn)確率為87%。其余測(cè)量值(PRE,REC和FSC)分別為0.85,0.90和0.87。
在測(cè)試的10 412個(gè)陽(yáng)性ncRPI對(duì)中,RPI-Pred方法正確預(yù)測(cè)了9335個(gè)交互配對(duì),精確度為90%。 RPI-Pred方法預(yù)測(cè)線蟲,黑腹果蠅和大腸桿菌的ncRNA-蛋白對(duì)較少,預(yù)測(cè)準(zhǔn)確度分別為78%,77%和76%。智人,小家鼠和釀酒酵母的RPI-Pred預(yù)測(cè)準(zhǔn)確度分別為89%,97%和82%。表3顯示了每種生物體測(cè)試的陽(yáng)性ncRNA-蛋白質(zhì)對(duì)的總數(shù)以及用RPI-Pred方法正確預(yù)測(cè)的配對(duì)總數(shù)。補(bǔ)充表S3顯示了每個(gè)生物體的NPInter10412數(shù)據(jù)集的RPI-PRed預(yù)測(cè)結(jié)果。
進(jìn)一步分析了每個(gè)生物體中某些特定復(fù)合物的預(yù)測(cè)結(jié)果不正確。在四種生物體中發(fā)現(xiàn)了一些病例(黑腹果蠅,大腸桿菌,智人和小家鼠)。大多數(shù)情況下,對(duì)于與不同ncRNA相互作用的相同蛋白質(zhì),觀察到這些不正確的預(yù)測(cè)。在黑腹果蠅21個(gè)假陰性ncRNA-蛋白對(duì)中,16個(gè)涉及3個(gè)蛋白(Uniprot ID's:P17133,P26017和Q9V3W7)。類似地,在大腸桿菌中48個(gè)不正確的預(yù)測(cè)中,18個(gè)涉及3種蛋白質(zhì)(P0AFZ3,P0C077和P10121)。 RPI-Pred法也未能預(yù)測(cè)H. Sapiens中涉及兩種蛋白質(zhì)(P19338和P62312)的配對(duì)。在上述幾種蛋白質(zhì) - RNA相互作用中,一種蛋白質(zhì)與多種ncRNA相互作用。這是由于錯(cuò)誤地預(yù)測(cè)了蛋白質(zhì)結(jié)構(gòu)。在這個(gè)提議的方法中,RPI-Pred方法使用從蛋白質(zhì)和ncRNA的預(yù)測(cè)結(jié)構(gòu)中提取的特征。因此,RPI-Pred預(yù)測(cè)性能將受到蛋白質(zhì)或RNA結(jié)構(gòu)預(yù)測(cè)方法的強(qiáng)烈影響。
RPI-Pred與RPISeq對(duì)ncRPI預(yù)測(cè)的比較
作者對(duì)NPInter10412數(shù)據(jù)集的RPI-Pred方法的性能進(jìn)一步與現(xiàn)有方法的結(jié)果進(jìn)行比較。 用RPISeq測(cè)試了NPIner10412數(shù)據(jù)集,然后將預(yù)測(cè)結(jié)果與RPI-Pred結(jié)果進(jìn)行比較。 獨(dú)立的和本地實(shí)施的RPISeq計(jì)劃是從開發(fā)商處獲得的。 在這里,基于RPI2241和RPI369數(shù)據(jù)集的RF和SVM分類器開發(fā)的RPISeq模型被用于測(cè)量NPIner10412數(shù)據(jù)集上的RPI預(yù)測(cè)性能。 為了執(zhí)行這個(gè)測(cè)試,作者使用了NPInter10412正對(duì)和相應(yīng)的混洗負(fù)對(duì)。 如來(lái)自RPISeq的概率為0.5的相互作用被認(rèn)為是正確的預(yù)測(cè)。 進(jìn)一步比較了RPI2241-SVM,RPI369-SVM,RPI2241-RF和RPI369-RF模型的預(yù)測(cè)結(jié)果,并將比較結(jié)果列于表4。
NPInter10412數(shù)據(jù)集上的RPI2241-RF模型的預(yù)測(cè)性能分別為PRE,REC,F(xiàn)SC和ACC的0.50,0.97,0.66和0.50。 NPInter10412數(shù)據(jù)集上的RPISeq準(zhǔn)確率僅為50%。與我們的RPI-Pred 87%的準(zhǔn)確度相比,這種性能非常低。然而,RPI2241-RF正確地預(yù)測(cè)了更多的陽(yáng)性對(duì)為真陽(yáng)性(10 412個(gè)中有10 157個(gè)),很少有相互作用被預(yù)測(cè)為真陰性(10 412個(gè)中的288個(gè))。其他測(cè)量PRE,REC和FSC分別為0.50,0.98和0.66。我們還觀察到了RPI2241-SVM結(jié)果分析中的類似趨勢(shì)。 RPI2241-SVM的表現(xiàn)為49%,真實(shí)陽(yáng)性率更高(預(yù)測(cè)10 412對(duì)陽(yáng)性對(duì)中有9682),真實(shí)陰性(預(yù)測(cè)10 412對(duì)陰性對(duì)中有730對(duì))的表現(xiàn)更少。其他測(cè)量值PRE,REC和FSC分別為0.50,0.93和0.65。
同樣,作者分析了RPI369-RF和RPI369-SVM模型的結(jié)果。表4顯示RPI369-RF模型預(yù)測(cè)非常少的相互作用為真正的陽(yáng)性(10 412個(gè)中有3972個(gè)),其中近一半的相互作用被預(yù)測(cè)為真正的陰性(10 412個(gè)中有5125個(gè))。因此,總體預(yù)測(cè)準(zhǔn)確率僅為44%。 PRE,REC和FSC分?jǐn)?shù)分別為0.43,0.38和0.40。同樣,RPI369-SVM模型的總體預(yù)測(cè)精度僅為39%。這個(gè)模型預(yù)測(cè)超過(guò)一半的積極互動(dòng)是真正的積極(10 412個(gè)中有6271個(gè)),而負(fù)面互動(dòng)的數(shù)量則少為真正的消極(10 412個(gè)中的1851個(gè))。其余測(cè)量值PRE,REC和FSC分別為0.42,0.60和0.50。
RPI-Pred在lncRNA-蛋白質(zhì)網(wǎng)絡(luò)構(gòu)建中的應(yīng)用
進(jìn)一步擴(kuò)展了計(jì)算機(jī)輔助制造ncRPI網(wǎng)絡(luò)的RPI-Pred方法。 Nacher和Araki是最早研究ncRPI網(wǎng)絡(luò)計(jì)算結(jié)構(gòu)的人之一。 他們?cè)贜PInter數(shù)據(jù)庫(kù)中建立了基于各種模型生物體的ncRPI的互動(dòng)網(wǎng)絡(luò)。 在這種方法之后,Muppirala等人也使用了他們提出的RPISeq方法建立ncRPI網(wǎng)絡(luò)的結(jié)果。 在這里,我們擴(kuò)展了我們的RPI-Pred方法來(lái)構(gòu)建ncRPI網(wǎng)絡(luò)以進(jìn)一步研究ncRNA的重要功能。 我們?cè)u(píng)估了我們?cè)贜PInter數(shù)據(jù)庫(kù)中預(yù)測(cè)ncRPI的性能。
在圖2中,作者展示了從NPInter數(shù)據(jù)庫(kù)獲得的黑腹果蠅91 ncRPI的交互網(wǎng)絡(luò)。 在91個(gè)積極的相互作用中,RPI-Pred方法成功預(yù)測(cè)了70個(gè)相互作用。 ncRPI的
黑腹果蠅含有蛋白質(zhì)中樞(一種蛋白質(zhì)與多種RNA相互作用)和RNA中樞(一種RNA與多種蛋白質(zhì)相互作用)。 基于計(jì)算機(jī)的網(wǎng)絡(luò)結(jié)構(gòu)有助于理解我們的RPI-Pred方法在相同的蛋白質(zhì)或RNA中心中正確預(yù)測(cè)了多少種相互作用,以及作者的模型在推導(dǎo)新的ncRPI和構(gòu)建新的生物學(xué)方面的可靠性網(wǎng)絡(luò)。
結(jié)論
許多重要的基本細(xì)胞過(guò)程由蛋白質(zhì)和RNA相互作用(RPIs)加以處理;因此,RPI的研究對(duì)于理解其功能很有價(jià)值。近年來(lái),高通量推導(dǎo)方法已經(jīng)導(dǎo)致發(fā)現(xiàn)大量的ncRNA,它們也與蛋白質(zhì)相互作用并調(diào)節(jié)基因表達(dá)。因此,通過(guò)研究正確的交互伙伴來(lái)理解它們的功能是非常重要的。然而,確定ncRNA正確相互作用配偶體的實(shí)驗(yàn)方法是昂貴且勞動(dòng)密集型的。在這種情況下,計(jì)算方法高度依賴于預(yù)測(cè)ncRNA分子的相互作用分子。據(jù)所知,有關(guān)RPI預(yù)測(cè)的研究報(bào)道很少,并且沒有一種方法被認(rèn)為是高級(jí)蛋白質(zhì)和RNA結(jié)構(gòu),這些結(jié)構(gòu)已知對(duì)其功能至關(guān)重要。
在這項(xiàng)工作中,作者開發(fā)了一種計(jì)算方法RPI-Pred來(lái)解決RPI的預(yù)測(cè)問(wèn)題,并且使用蛋白質(zhì)和RNA的序列和結(jié)構(gòu)來(lái)鑒定任何給定蛋白質(zhì)或RNA的相互作用伴侶。
作者提出的方法考慮了高階結(jié)構(gòu)特征,即PB和RSS,以及它們相應(yīng)的用于RPI調(diào)查的主要序列。實(shí)驗(yàn)和預(yù)測(cè)結(jié)構(gòu)都用于RPI-Pred訓(xùn)練和測(cè)試目的。我們用一組(nc)RPI數(shù)據(jù)集測(cè)試了RPI-Pred方法,結(jié)果表明,與其他現(xiàn)有方法相比,所提出的RPI-Pred能夠以更高的準(zhǔn)確度識(shí)別(nc)RPI。因此,作者的方法可用于鑒定蛋白質(zhì)或RNA的結(jié)合配偶體。作者進(jìn)一步將該方法應(yīng)用于ncRNA-蛋白質(zhì)網(wǎng)絡(luò)的計(jì)算機(jī)構(gòu)建。此外,所提出的RPI-Pred方法也可以擴(kuò)展以確定其他類型蛋白質(zhì)的結(jié)合配偶體(RNA),例如轉(zhuǎn)錄因子,它們能夠與DNA和RNA相互作用。可以在http://ctsb.is./projects/ rpi-pred上免費(fèi)訪問(wèn)RPI-Pred的Web服務(wù)器。
計(jì)算表觀遺傳學(xué)
計(jì)算表觀遺傳學(xué)微信號(hào):intro4gcer
來(lái)自: 小白Elsa > 《RNA與蛋白質(zhì)結(jié)合預(yù)測(cè)》
0條評(píng)論
發(fā)表
請(qǐng)遵守用戶 評(píng)論公約
你都知道?非編碼RNA研究技術(shù)大盤點(diǎn)
非編碼RNA研究技術(shù)大盤點(diǎn)。現(xiàn)在可能連實(shí)驗(yàn)室的插槍頭阿姨都知道絕大多數(shù)的RNA分子并不翻譯,這非編碼RNA(noncoding RNA),包括miRNA、ln...
重磅綜述 | Trends in Genetics:非編碼RNA在前列腺癌中的研究進(jìn)展
重磅綜述 | Trends in Genetics:非編碼RNA在前列腺癌中的研究進(jìn)展。長(zhǎng)非編碼RNA(lncRNAs)根據(jù)其基因組定位和進(jìn)化譜系可進(jìn)一步細(xì)分為...
在基因組中是否存在著大量的垃圾DNA?
在基因組中是否存在著大量的垃圾DNA?說(shuō)起基因組,在基因組中有沒有存在著大量的垃圾DNA呢?可是,當(dāng)人類基因組工作框架圖問(wèn)世后,出乎...
文獻(xiàn)速遞|XRNAX--一種研究人類RNA-蛋白質(zhì)組的新方法
但目前研究蛋白質(zhì)-RNA相互作用的方法僅限于表征某種特定蛋白質(zhì)的相互作用(如交聯(lián)免疫沉淀測(cè)序[CLIP-seq]),特定種類的RNA(如RAP、CHI...
2021.07在線數(shù)據(jù)庫(kù)匯總
2021.07在線數(shù)據(jù)庫(kù)匯總。在 7月期間 ,總共發(fā)表了醫(yī)學(xué)相關(guān)在線數(shù)據(jù)庫(kù)35 個(gè)。下面就來(lái)給大家介紹一下主要有哪些數(shù)據(jù)庫(kù),以及筆者比較感興...
整整24個(gè)!lncRNA科研必備最全數(shù)據(jù)庫(kù)收錄
Linc2Go是一個(gè)lncRNA的功能注釋數(shù)據(jù)庫(kù),它基于ceRNA假說(shuō),即假設(shè)lncRNAs與microRNAs相互作用來(lái)抑制mRNA的轉(zhuǎn)錄,從而預(yù)測(cè)lncRNA功能。ChI...
干貨!如何預(yù)測(cè)lncRNA的結(jié)合蛋白?
如何預(yù)測(cè)lncRNA的結(jié)合蛋白?2. 如何尋找lncRNA的結(jié)合蛋白?2. 一篇名為《Identification of novel long non-coding RNAs in clear cell ...
ANNOVAR結(jié)果說(shuō)明-SNP/INDEL
Func.refGene:對(duì)變異位點(diǎn)所在的區(qū)域進(jìn)行注釋(exonic,splicing, UTR5, UTR3, intronic, ncRNA_exonic, ncRNA_intronic, ncRNA_UTR3,ncRNA_UTR5, ncRNA _splicing, upstream, downstream,intergenic)...
暗能量和垃圾DNA
其中一個(gè)叫做L1序列的轉(zhuǎn)座子,大約每50個(gè)人基因組中就有一個(gè)新的L1序列插入,它具有修復(fù)雙鏈DNA的功能,可幫助它前后的基因移動(dòng)并插入到基因組其他位置,可通過(guò)它包含的反義啟動(dòng)子改變基因的表達(dá),還能...
微信掃碼,在手機(jī)上查看選中內(nèi)容