廣州市黃埔區學(xué)大道攬月路廣州企業(yè)孵化器B座402
電話(huà):020-85625352
手機:18102256923、18102253682
Email:servers@gzscbio.com
Fax:020-85625352
QQ:386244141
項目名稱(chēng):miRNA如何預測其靶基因?
所屬分類(lèi):生物信息學(xué)分析
聯(lián)系電話(huà):020-85625352
QQ:386244141
Email:servers@gzscbio.com
技術(shù)服務(wù)描述
miRNA如何預測其靶基因?
??miRNA是一類(lèi)在生物體內起到重要調控作用的的小片段非編碼RNA。一般認為miRNA通過(guò)和mRNA的結合,可以抑制mRNA的表達,從而影響到Gene的表達。
??目前miRNA的靶基因預測軟件主要是依據miRNA與其靶位點(diǎn)的互補性、miRNA與其靶位點(diǎn)的調控關(guān)系、miRNA靶位點(diǎn)的保守性、miRNA-mRNA雙鏈之間的熱穩定性及附近序列的二級結構等原則設計的。 目前miRNA預測主要基于算法預測,目前也有一部分以實(shí)驗結果為收集對象的數據庫。使用算法預測的數據庫,有如 TargetScan、miRDB、RNAhybrid、DIANA-microT-CDS 等。以實(shí)驗實(shí)驗驗證的收集的靶標相互作用數據庫,有如 miRTarBase、Tarbase v8 等。 考慮到研究時(shí)效性,我們選擇基于miRbase22為基礎研究的數據庫,在此基礎上篩選出近5年內較新的數據庫。
??其中, miRDB
數據庫 是根據 “miRNA通過(guò)下調其靶基因的表達” miRNA主要功能特征,采用機器學(xué)習來(lái)進(jìn)行模型預測得到的靶標數據庫。它通過(guò)采用大量RNA數據集,使用 “過(guò)表達的miRNA“ 及 “下調的轉錄本” 進(jìn)一步量化miRNA靶向下調的特征,采用SVM算法開(kāi)發(fā)了預測模型 MirTarget
。 該算法結合實(shí)驗數據同時(shí)比較 TargetScan
,DIANA-MicroT
,miRanda
和 PITA
另外四種預測算法,獲得了最優(yōu)表現。 該模型對于每個(gè)候選靶標基因,它都會(huì )生成由SVM計算出的概率分數,該分數反映了預測結果的統計置信度,分數越高,置信度越高。所有預測目標的目標預測分數在50到100之間,一般而言,預測得分 > 80 的預測目標具有較高的可信度。如果分數低于60,則需要謹慎選擇,一般需要提供其他證據支持。
?? TargetScan
數據庫 則基于序列互補原則,找到比對到靶 3'UTR 的保守性 8 mer、7 mer 或 6 mer 位點(diǎn)(seed match 序列),進(jìn)一步根據熱力學(xué)穩定性篩選得到 miRNA 的靶基因。 隨后,對于不具備保守性的 seed match 區域計算相應的 context score
。 將保守和不保守區域的 context score
進(jìn)行排序即得到 context score percentile
。 一般考慮 context score percentile
> 90 為預測的可能具有功能的 miRNA 的靶基因。
??綜上,miRDB數據庫主要通過(guò)miRNA-mRNA調控關(guān)系來(lái)進(jìn)行量化計算,而TargetScan通過(guò)序列互補原則篩選后再進(jìn)行熱穩定性量化計算,前者相較于后者更有說(shuō)服力,而后者得到的數據較為全面。我們綜合兩者,通過(guò)標準 miRDB Score >= 80 & TargetScan context score percentile >= 90
的靶基因作為預測結果。通過(guò)預測給出的miRNA-靶基因對,用于后續進(jìn)一步網(wǎng)絡(luò )圖或富集分析。
Venn 圖 示例:
圖 2.7.1. TargetScan vs miRDB 的靶基因交集veen圖