廣州市黃埔區學(xué)大道攬月路廣州企業(yè)孵化器B座402
電話(huà):020-85625352
手機:18102256923、18102253682
Email:servers@gzscbio.com
Fax:020-85625352
QQ:386244141
項目名稱(chēng):差異Peak計算
所屬分類(lèi):生物信息學(xué)分析
聯(lián)系電話(huà):020-85625352
QQ:386244141
Email:servers@gzscbio.com
技術(shù)服務(wù)描述
1. 差異Peak計算
1.1. 背景簡(jiǎn)介
為了理解細胞中更為復雜的生物過(guò)程,許多研究已在通過(guò)比較ChIP-seq的差異獲得的不同數據。
越來(lái)越多的ChIP-seq實(shí)驗正在研究多種實(shí)驗條件(例如各種治療條件,幾個(gè)不同的時(shí)間點(diǎn)和不同的治療劑量水平)下的轉錄因子結合。由于差異富集在生物學(xué)和醫學(xué)研究中已變得具有實(shí)際重要性,因此已有更多工具可用于此類(lèi)分析。
每種工具的工作方式互不相同,但總體目標相同。您選擇的一個(gè)將歸結為您正在使用的數據集以及您的生物學(xué)問(wèn)題。要考慮的一些事情: - 用戶(hù)需要什么輸入?一些工具需要通過(guò)外部峰調用算法對富集區域進(jìn)行初步檢測,而其他工具則實(shí)現了自己的檢測方法。 - 該工具是否有助于在每個(gè)樣本組中使用重復樣本? - 用于信號分配的基礎統計模型是什么?它是基于泊松分布還是基于更靈活的負二項式分布。 - 已經(jīng)針對特定的ChIP-seq數據(信號類(lèi)型)專(zhuān)門(mén)設計了一些工具,例如組蛋白修飾或轉錄因子(TF)結合。
對于有兩個(gè)重復的樣本,最好使用DiffBind之類(lèi)的工具來(lái)利用這些重復項。
1.1. DiffBind
DiffBind是一種R Bioconductor軟件包,用于識別兩個(gè)或多個(gè)樣品組之間差異富集的位點(diǎn)。 它主要與峰調用集(“峰集”)配合使用,這是代表每個(gè)樣品的候選蛋白質(zhì)結合位點(diǎn)的基因組間隔集。它包括支持峰集處理的功能,包括在整個(gè)數據集中重疊和合并峰集,對峰集中重疊間隔中的測序讀數進(jìn)行計數,并根據結合親和力的證據在統計學(xué)上顯著(zhù)鑒定差異結合位點(diǎn)(通過(guò)讀數差異來(lái)衡量)密度)。
1.2. DiffBind的基本計算步驟介紹
1.2.1. 閱讀峰集
第一步是讀取一組峰集和關(guān)聯(lián)的元數據。這是使用樣本表完成的。讀入峰集后,合并功能會(huì )找到所有重疊的峰,并得出覆蓋所有提供的峰的單組獨特的基因組間隔(實(shí)驗的共識峰集)。如果一個(gè)區域出現在兩個(gè)以上的樣本中,則認為該區域為共識集。該共有集代表將在進(jìn)一步分析中使用的候選結合位點(diǎn)的總體集。
簡(jiǎn)言之:尋找兩組對比樣本中的共有Peak區域。
1.2.2. 親和力結合矩陣
下一步是獲取比對文件,并為共識集中的每個(gè)峰/區域計算計數信息。在此步驟中,對于每個(gè)共有區域,DiffBind會(huì )獲取ChIP樣本和輸入樣本中對齊的讀取數,以計算每個(gè)潛在結合位點(diǎn)上每個(gè)樣本的標準化讀取數。共識峰集中的峰可以基于計算其峰頂(最大讀取重疊點(diǎn))進(jìn)行重新居中和修整,以提供更標準的峰間隔。
1.2.3. 探索性數據分析
1.2.3.1. Peak共有位點(diǎn)相關(guān)性分析
為了了解樣本之間的聚類(lèi)程度,我們使用所有共有位點(diǎn)繪制PCA圖,相關(guān)性熱圖
1.2.3.2. 差異分析
DiffBind的核心功能是差異結合親和力分析,該功能可識別出在樣品組之間統計學(xué)上顯著(zhù)差異結合的結合位點(diǎn)。默認情況下,使用DESeq2執行核心分析例程,并且還可以選擇使用edgeR。每個(gè)工具將為每個(gè)候選結合位點(diǎn)分配一個(gè)p值和FDR,以表明它們被差分結合的置信度。
1.2.3.2.1. 差異Peak的相關(guān)性分析
為了了解樣本之間的差異Peak計算結果的重復性,我們使用所有差異分析結果繪制PCA圖,相關(guān)性熱圖
MA圖
差異Peak一種可視化方法。
箱型圖
顯示在樣品中表現出增加的親和力的差異結合位點(diǎn)中的reads分布。
結果
表頭說(shuō)明 【 之前給的分析報告里面有,待抄過(guò)來(lái)
】
Demo
1.1.chip/DiffBind/Demo_analysis/
文件 | 說(shuō)明 |
---|---|
ZGW_H3K27ac/1cor_readCont_ZGW_H3K27ac.png | 讀取的reads計數的相關(guān)性分析(熱圖) |
ZGW_H3K27ac/1pca_readCont_ZGW_H3K27ac.png | 讀取的reads計數的相關(guān)性分析(PCA) |
ZGW_H3K27ac/2cor_peakScore_ZGW_H3K27ac.png | Peak共有位點(diǎn)相關(guān)性分析(熱圖) |
ZGW_H3K27ac/2pca_peakScore_ZGW_H3K27ac.png | Peak共有位點(diǎn)相關(guān)性分析(PCA) |
ZGW_H3K27ac/ZGW_H3K27ac_treat-vs-con_1cor.png | 差異Peak可視化,相關(guān)性分析(熱圖) |
ZGW_H3K27ac/ZGW_H3K27ac_treat-vs-con_2pca.png | 差異Peak可視化,相關(guān)性分析(熱圖) |
ZGW_H3K27ac/ZGW_H3K27ac_treat-vs-con_3ma.png | 差異Peak可視化,MA圖 |
ZGW_H3K27ac/ZGW_H3K27ac_treat-vs-con_4vol.png | 差異Peak可視化,火山圖 |
ZGW_H3K27ac/ZGW_H3K27ac_treat-vs-con_5box.png | 差異Peak可視化,關(guān)于reads分布的箱型圖 |
ZGW_H3K27ac/ZGW_H3K27ac_treat-vs-con_6heatmap.png | 差異Peak可視化,表達熱圖 |