廣州市天河區黃埔大道中124號2705室
電話(huà):020-29031124
手機:18102256923
Email:servers@gzscbio.com
Fax:020-85625352
QQ:2913120624
隨著(zhù)生物實(shí)驗所驗證的轉錄因子結合位點(diǎn)的不斷積累,目前出現了專(zhuān)門(mén)收集TFBS相關(guān)信息而各具特色的數據庫。TRANSFAC是真核生物轉錄調控信息的數據庫,包含轉錄因子,轉錄調控關(guān)系以及轉錄因子結合位點(diǎn)等相關(guān)信息,涵蓋的物種有酵母、擬南芥、線(xiàn)蟲(chóng)、果蠅、大鼠、小鼠、人等。它通過(guò)文獻挖掘來(lái)收集數據,并有嚴格的質(zhì)量控制。TRANSFAC中收錄的TFBS都是經(jīng)過(guò)實(shí)驗驗證的, 并且在每一個(gè)結合位點(diǎn)的條目中都標注了相應的實(shí)驗技術(shù), 實(shí)驗條件并對該TFBS的可信度進(jìn)行了評價(jià)。TRANSFAC中不僅有TFBS的標注,還提供了相應轉錄因子與靶基因的信息,如物種、蛋白質(zhì)一級序列、蛋白質(zhì)功能域等。TRANSFAC 11.3中,共收集了10 018個(gè)轉錄因子,以及20 431個(gè)轉錄因子結合位點(diǎn),為T(mén)FBS預測算法提供了高質(zhì)量的訓練集和驗證集。JASPAR收錄了多細胞真核生物轉錄因子結合位點(diǎn)的信息,并以矩陣的形式保存,這些矩陣是由實(shí)驗驗證的結合位點(diǎn)統計得來(lái)的。JASPAR包括3個(gè)子庫,JASPAR CORE、JASPAR FAM、JASPAR PHYLOFACTS。目前,JASPAR CORE中包含123個(gè)頻數矩陣,矩陣中的元素表示某個(gè)位置上出現某個(gè)堿基的頻數,JASPAR FAM中將轉錄因子按其DNA結合域的結構特性分成若干家族,并提供了11個(gè)“家族共有”的TFBS的位置權重矩陣,為從結構角度進(jìn)行TFBS研究提供了方便,JASPAR PHYLOFACTS中包含174個(gè)從在進(jìn)化上保守的基因上游元件中提取的頻數矩陣。值得一提的是,與商業(yè)數據庫TRANSFAC不同,JASPAR是完全開(kāi)放的資源,JASPAR與TRANSFAC的另一個(gè)主要區別是,JASPAR中含有的TFBS信息是非冗余的,即一個(gè)轉錄因子對應至多一個(gè)TFBS條目。SELEX_DB和HTPSELEX中收集了經(jīng)SELEX實(shí)驗驗證的TFBS信息。它們不同于綜合型的數據庫,除了實(shí)驗驗證的結合位點(diǎn)信息,還盡可能詳盡的提供了實(shí)驗中間產(chǎn)物。此類(lèi)數據庫包含的TFBS相對較少,但針對每一個(gè)TFBS提供了更為豐富的實(shí)驗信息,這為致力于建立更精準TFBS模型的研究者提供了寶貴的數據。
另外,還有一些收集特定物種轉錄因子以及TFBS信息的數據庫:PlantTFDB中包含22種植物中的26 402個(gè)轉錄因子的信息,AGRIS中包含了模式生物擬南芥的轉錄因子及其結合位點(diǎn)的信息,SCPD是收集酵母啟動(dòng)子區域序列的數據庫,里面包含轉錄起始位點(diǎn)以及轉錄因子結合位點(diǎn)的注釋?zhuān)琓RED是收集哺乳動(dòng)物轉錄調控元件的數據庫,對人、小鼠、大鼠等物種的啟動(dòng)子區域有相對完整的注釋?zhuān)琁TFP中收集了哺乳動(dòng)物的轉錄因子與靶基因之間的調控關(guān)系信息。
主要是ENCODE這個(gè)數據庫DNA元件百科全書(shū)(英語(yǔ):Encyclopedia of DNA Elements,簡(jiǎn)稱(chēng)為ENCODE計劃)是一個(gè)由美國國家人類(lèi)基因組研究所在2003年9月發(fā)起的一項公共聯(lián)合研究項目,旨在找出人類(lèi)基因組中所有功能組件。這是既完成人類(lèi)基因組計劃后國家人類(lèi)基因組研究所開(kāi)始的最重要的項目之一。所有在該項目中產(chǎn)生的數據都會(huì )被迅速的在公共數據庫中公開(kāi)。
2012年9月5日,該項目的初步結果被整理為30篇論文并發(fā)表于《自然》、《基因組生物學(xué)》及《基因組研究》中。這些發(fā)表的論文顯示人類(lèi)基因組內的非編碼DNA至少80%是有生物活性的,而非像之前認為的僅僅是“垃圾”。這個(gè)結果非常重要,因為人類(lèi)基因組中98%的DNA是非編碼的,意味著(zhù)它們并不直接編碼任何蛋白質(zhì)序列。