廣州市黃埔區學(xué)大道攬月路廣州企業(yè)孵化器B座402
電話(huà):020-85625352
手機:18102256923、18102253682
Email:servers@gzscbio.com
Fax:020-85625352
QQ:386244141
項目名稱(chēng):Call Peak 流程簡(jiǎn)介
所屬分類(lèi):生物信息學(xué)分析
聯(lián)系電話(huà):020-85625352
QQ:386244141
Email:servers@gzscbio.com
技術(shù)服務(wù)描述
Call Peak 流程簡(jiǎn)介
對于ChIP-seq實(shí)驗,我們從比對文件中觀(guān)察到的是鏈的不對稱(chēng)性,其中+/-鏈上的讀取密度位于結合位點(diǎn)的中心。所選片段的5'末端將在正鏈和負鏈上形成基團。然后使用統計方法評估這些組的分布,并與背景(輸入或模擬IP樣本)進(jìn)行比較,以確定富集位點(diǎn)是否可能是真實(shí)的結合位點(diǎn)。
MACS2
MACS2,一個(gè)基于模型分析的,常用于ChIP-seq識別轉錄因子結合位點(diǎn)的工具。 MACS算法捕獲基因組的復雜性的影響,以評估豐富的CHIP區域的意義。盡管它是為檢測轉錄因子結合位點(diǎn)而開(kāi)發(fā)的,但它也適用于較大的區域。
MACS通過(guò)結合測序標簽位置和方向信息來(lái)提高結合位點(diǎn)的空間分辨率。MACS可以輕松地單獨用于ChIP樣品,也可以與增加峰值調用特異性的對照樣品一起使用。MACS工作流程如下所示。
配對峰建立模型
真實(shí)結合位點(diǎn)周?chē)臉撕灻芏葢@示雙峰富集模式(或成對的峰)。MACS利用這種雙峰模式來(lái)對移動(dòng)大小進(jìn)行經(jīng)驗建模,以更好地定位精確的結合位點(diǎn)。
為了找到配對峰以建立模型,MACS首先掃描整個(gè)數據集,以尋找高度重要的富集區域。僅使用ChIP示例即可完成!給定超聲處理的大?。╞andwidth)和高置信度的折疊富集(mfold),MACS會(huì )bandwidth在基因組上滑動(dòng)兩個(gè)窗口,以找到具有相對于隨機標簽基因組分布而言富集程度更高的標簽的mfold區域。
MACS隨機采樣這些高質(zhì)量峰中的1,000個(gè),分離其正鏈和負鏈標簽,并按其中心之間的中點(diǎn)對齊它們。的在對準的兩個(gè)峰的模式之間的距離被定義為“d”和表示所估計的片段長(cháng)度。MACS將所有標簽朝著(zhù)3'末端移動(dòng)d / 2到最可能的蛋白質(zhì)-DNA相互作用位點(diǎn)。
糾正低映射區域中真實(shí)信號的丟失
為了從標簽數計算λBG,MAC2需要有效的基因組大小或可映射的基因組大小??捎成湫耘c基因組中特定位置的k聚體的獨特性有關(guān)。低復雜度和重復區域的唯一性較低,這意味著(zhù)可映射性較低。因此,我們需要提供有效的基因組長(cháng)度,以糾正低映射區域中真實(shí)信號的丟失。
峰值檢測
MACS將每個(gè)標簽移動(dòng) d / 2 后,它會(huì )使用2d的窗口大小在基因組中滑動(dòng)以找到候選峰。沿著(zhù)基因組的標簽分布可以通過(guò)泊松分布來(lái)建模。泊松是一個(gè)參數模型,其中參數λ是該窗口中預期的讀取次數。
MACS2輸出文件
.narrowPeak
是 BED 6 + 4 格式,表示標準BED文件的前6列以及4個(gè)其他字段: