Chromatin immunoprecipitation, followed by high throughput sequencing provides vital insights into locations on the genome with differential DNA occupancy between experimental states. However, since ChIP-Seq data is collected experimentally, it must be normalized between samples in order to properly assess which genomic regions have differential DNA occupancy via differential binding analysis. While between-sample normalization is a crucial for downstream differential binding analysis, the technical conditions underlying between-sample ChIP-Seq normalization methods have yet to be specifically examined. We identify three important technical conditions underlying ChIP-Seq between-sample normalization methods: symmetric differential DNA occupancy, equal total DNA occupancy, and equal background binding across experimental states. We categorize popular ChIP-Seq normalization methods based on their technical conditions and simulate ChIP-Seq read count data to exemplify the importance of satisfying a normalization method's technical conditions to downstream differential binding analysis. We assess the similarity between normalization methods in experimental CUT&RUN data to externally verify our simulation findings. Our simulation and experimental results underscore that satisfying the technical conditions underlying the selected between-sample normalization methods is crucial to conducting biologically meaningful downstream differential binding analysis. We suggest that researchers use their understanding of the ChIP-Seq experiment at hand to guide their choice of between-sample normalization method when possible. Researchers could use the intersection of the differentially bound peaksets derived from different normalization methods to determine which regions have differential DNA occupancy between experimental states when there is uncertainty about which technical conditions are met.


翻译:染色质免疫沉淀结合高通量测序技术为揭示不同实验状态下基因组DNA占据位点的差异提供了关键信息。然而,由于ChIP-Seq数据通过实验采集,样本间必须进行标准化处理才能通过差异结合分析准确评估基因组区域的DNA占据差异。虽然样本间标准化对下游差异结合分析至关重要,但现有ChIP-Seq样本间标准化方法所依赖的技术条件尚未得到系统检验。本文识别了ChIP-Seq样本间标准化方法的三个重要技术条件:对称性DNA占据差异、等量总DNA占据以及跨实验状态的等背景结合。我们依据技术条件对常用ChIP-Seq标准化方法进行分类,并通过模拟ChIP-Seq读数数据阐明满足标准化方法技术条件对下游差异结合分析的重要性。在实验性CUT&RUN数据中评估不同标准化方法的结果相似性,以外部验证模拟研究结论。模拟与实验结果共同表明:满足所选样本间标准化方法的技术条件对开展具有生物学意义的下游差异结合分析至关重要。建议研究人员尽可能依据对具体ChIP-Seq实验的理解来指导样本间标准化方法的选择。当技术条件的满足情况存在不确定性时,可通过整合不同标准化方法所得差异结合峰集的交集区域来确定实验状态间存在DNA占据差异的基因组区域。

0
下载
关闭预览

相关内容

FlowQA: Grasping Flow in History for Conversational Machine Comprehension
专知会员服务
34+阅读 · 2019年10月18日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
60+阅读 · 2019年10月17日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
32+阅读 · 2019年10月17日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
164+阅读 · 2019年10月12日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
41+阅读 · 2019年10月9日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
STRCF for Visual Object Tracking
统计学习与视觉计算组
15+阅读 · 2018年5月29日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
12+阅读 · 2018年3月15日
IJCAI | Cascade Dynamics Modeling with Attention-based RNN
KingsGarden
13+阅读 · 2017年7月16日
From Softmax to Sparsemax-ICML16(1)
KingsGarden
74+阅读 · 2016年11月26日
国家自然科学基金
13+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
12+阅读 · 2022年1月26日
VIP会员
相关资讯
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
STRCF for Visual Object Tracking
统计学习与视觉计算组
15+阅读 · 2018年5月29日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
12+阅读 · 2018年3月15日
IJCAI | Cascade Dynamics Modeling with Attention-based RNN
KingsGarden
13+阅读 · 2017年7月16日
From Softmax to Sparsemax-ICML16(1)
KingsGarden
74+阅读 · 2016年11月26日
相关基金
国家自然科学基金
13+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员