利用数据库数据进行定制化的生信分析

让您的文字更出彩

详细内容

ChIP-Seq测序

是将染色质免疫共沉淀(Chromatin Immunoprecipitation,ChIP)与二代测序相结合的表观遗传研究技术,能够高效地在全基因组范围内对DNA和蛋白的相互作用进行检测,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。

ChIP-seq Assay Kit for Histone Methylation(Laboratorytalk,2016)

我们的优势

1. 定制化分析策略:根据不同测序方案和测序目标,定制化选择比对算法、Peak Calling算法以及注释用数据库区域信息;

2. 强大的自研能力:拥有已发表的自主开发Peak Calling算法(Wang et al., BMC Bioinformatics, 2010)和定位注释系统以及一系列下游分析工具;

3. 全面的数据库整合:不断更新基因组数据库并进行多数据库多版本整合,获得准确的Peak定位信息与注释;

4. 强大的组学联合分析能力:将ChIP-Seq与甲基化测序、转录组测序以及全基因组测序等技术进行结合,将单一的蛋白结合数据更进一步拓展。


样本要求

注:前期免疫共沉淀(ChIP)实验需客户自主完成,我们提供测序和数据分析服务。

ChIP DNA样品要求:

1. DNA总量≥20ng,浓度≥1ng/μL(Qubit检测),体积要求20-100μL;

2. OD260/280介于1.8-2.0之间;

3. Agilent 2200质检合格,DNA样本主峰范围在100-500bp;

4. 电泳检测无明显RNA污染,基因组条带清晰、完整,无降解;

5. 送样时请标记清楚样品编号,管口使用Parafilm膜密封;

6. 样品保存期间切忌反复冻融;

7. 送样时请使用干冰运输。


实验流程

          

1. 细胞交联固定:甲醛处理细胞,将目标蛋白与染色质连结起来;

2. DNA超声打断:将基因组DNA打断至100-500bp;

3. 免疫共沉淀:添加与目标蛋白特异性结合的抗体,形成免疫沉淀复合物;

4. DNA片段回收:去交联,纯化DNA;

5. 文库构建:PCR扩增构建文库;

6. 上机测序:建议使用Hiseq或NovaSeq测序平台,数据量6Gb。




数据分析流程

结果示例

1、原始数据质量控制采用Fastp软件对下机原始数据中低质量序列,未检测序列,接头序列进行过滤,并对于过滤前后数据的GC比值,碱基质量,长度分布,接头留存,Duplication比率等指数进行分析。图1中部分展示了raw data质控结果。


碱基质量结果图

注:左图横坐标代表碱基位点,纵坐标代表碱基质量值,不同颜色曲线代表不同碱基在每条read上的质量值;右图横坐标代表碱基位点,纵坐标代表碱基含量比值,不同颜色曲线代表不同位点各碱基含量。




2、DNA基因组比对(DNA Mapping)采用Bowtie2算法将过滤后的数据比对到基因组上,得到基因组比对的bam文件,并基于bam文件进行信息统计,得到基因组比对率、reads在染色体上的分布情况。


DNA mapping结果图

注:左图为reads在基因组上的比对情况;右图为reads在染色体上的分布情况,灰色柱子表示每条染色体上碱基数占基因组的比例,绿色柱子表示比对到染色体上reads的碱基数占基因组的比例。




3、Peak Calling和Peak注释(Peak Annotation)采用MACS2算法对DNA Mapping后的bam文件进行peak峰的检测,得到ChIP样本中转录因子结合或组蛋白修饰的富集区域,即peak区域。并采用Chipseeker算法对peak进行注释,得到peak对应的基因以及所在的基因结构,包括启动子、外显子、内含子、基因间区等。此外,我们还可以采用deeptools软件对目标区域内测序序列的覆盖情况进行绘图,得到reads在peak区域或基因结构上的分布情况。


peak数量及其在基因结构上的分布情况

Twohig JP et al., Nat Immunol, 2019

注:左图为不同分组peak在基因组结构上的占比情况,右图为不同分组peak的总数量。




4、Motif分析(Motif Analysis)采用HOMER/MEME算法以及JAPSAR数据库,对peak区域进行motif分析,得到潜在的motif特征序列。


特定转录因子结合motifs的富集情况

Twohig JP et al., Nat Immunol, 2019

注:MEME与STAMP/Jaspar软件共同对STAT1和STAT3预测出来的binding Motif。




5、功能分析(GO Analysis)信号通路分析(Pathway Analysis)分别采用NCBI/UNIPROT/SWISSPROT/AMIGO等GO数据库,以及KEGG数据库对Peak Annotation的相关基因进行功能分析和信号通路分析,得到这些基因群体所显著性富集的GO条目和Pathway条目。


GO分析结果

Zhang QT et al., Theranostics. 2019

注:左图为下调基因所显著富集的GO条目(Top 10),右图为上调基因所显著富集的GO条目(Top 10)。




1、IGV截图采用igvtools算法将基因组比对后bam文件转换为tdf格式,通过IGV软件对目标基因附近的peak分布情况进行可视化展示。


ISL1靶基因peak分布情况

Zhang QT et al., Theranostics. 2019

注:该图展示了ISL1靶基因附近H3K4me1H3K27ac和ISL1peak分布情况,箭头表示结合的peak。




2、基因间相互作用关系网络(Gene-Act-Network Analysis)以显著性GO Analysis和显著性Pathway Analysis的和组蛋白相关的表型基因为研究目标,采用KEGG数据库基因间关系注释,绘制Gene-Act-Network。


基因间相互作用关系网络

Gao et al., Cancer. 2015

注:Profile12、4基因集间基因互作网络图。




文献示例

[1] Twohig JP, Cardus Figueras A, Andrews R, et al. Activation of naïve CD4+ T cells re-tunes STAT1 signaling to deliver unique cytokine responses in memory CD4+ T cells. Nat Immunol. 2019 Apr;20(4):458-470. (IF=21.809)


[2] Mirtschink P, Bischof C, Pham MD, et al. Inhibition of the HIF1α-Induced Cardiospecific HERNA1 eRNA Protects from Heart Disease. Circulation. 2019 Mar 29. (IF=18.88)


[3] Han X, Huang H, Gao P, et al. E-protein regulatory network links TCR signaling to effector Treg cell differentiation. PNAS. 2019 Feb 15. pii: 201800494. (IF=9.504)


[4] Zhang QT, Zhang QQ, Jiang X, et al. Collaborative ISL1/GATA3 interaction in controlling neuroblastoma oncogenic pathways overlapping with but distinct from MYCN.Theranostics. 2019; 9(4): 986–1000. (IF=8.537)


[5] Ranjit M, Hirano M, Aoki K , et al. Aberrant Active cis-Regulatory Elements Associated with Downregulation of RET Finger Protein Overcome Chemoresistance in Glioblastoma. Cell Rep. 2019 Feb 26;26(9):2274-2281.e5. (IF=8.032)


[6] Gao Y, et al. Single Cas9 nickase induced generation of NRAMP1 knockin cattle with reduced offtarget effects. Genome Biol. 2017 Feb 1;18(1):13. (IF=9.202)

电话:010-85795702
邮箱:fanlin@zhongkeshengxin.com
地址:北京市朝阳区都会国际A座20N

扫一扫添加微信

获取公开数据库

单细胞挖掘方案和科研大礼包

  • 电话直呼

    • 15120095864
  • 添加客服,沟通科研方向

技术支持: e科技 | 管理登录
seo seo