这是描述信息
资讯分类

ChIP-seq数据比对注意事项

  • 分类:新闻中心
  • 作者:
  • 来源:
  • 发布时间:2021-11-26 14:16
  • 访问量:

【概要描述】 核对的目的很简单,就是“追溯”,让我们来看看我们过滤的reads匹配基因组的哪里,下面一起了解下ChIP-seq数据比对注意事项吧!

ChIP-seq数据比对注意事项

【概要描述】 核对的目的很简单,就是“追溯”,让我们来看看我们过滤的reads匹配基因组的哪里,下面一起了解下ChIP-seq数据比对注意事项吧!

  • 分类:新闻中心
  • 作者:
  • 来源:
  • 发布时间:2021-11-26 14:16
  • 访问量:
详情

  核对的目的很简单,就是“追溯”,让我们来看看我们过滤的reads匹配基因组的哪里,下面一起了解下ChIP-seq数据比对注意事项吧!

ChIP-Seq

  挑战包括:

  基因组大(例如人类的是30亿碱基对,也就是60亿碱基。

  序列的reads数量很多(30M为3千万条reads)。

  测序read和基因组之间并不存在严密的接缝,中间一定有不整合的碱基。 (可能是测序错误,也可能与参考基因组不同,存在变异位点。 )那么,到底存在多少个mismatch才能匹配成功呢?

  1介绍比较方法和工具ChIP-seq属于DNA序列,所得reads应予使用。 连续短序列比较工具常用的采用方法是种子序列的定位和扩展

  第一,通过扫描参照基因组序列,针对参照基因组序列制作哈希表,将序列分成一定长度的小片段(k-mer )。 这个小片段也被称为种子。 根据算法,seed可以与基因组完全一致,也可以存在失配

  第二,在目标序列中寻找并标记与种子序列相同的片段,将这些标记点作为锚点左右最大限度地延伸,中间不能有gap

  第三,舍弃不符合条件的,符合条件的结果输出保存。

  中文文章: 4种常用的生物序列比对软件比较不同软件的算法比对水平和运算水平(消耗时间和内存)不同; 此外,比对和运算结果因所选seed的长度而异。 一般来说,短seed可以提高比对的灵敏度,长seed可以提高比对速度。 大多数算法为比对结果提供质量值。 (出现在SAM/BAM的结果中) ) )。

  本文中介绍了不同的工具。 ChIP-seq使用最多的是Bowtie2,兼顾正确性和速度,消耗内存少,支持3代序列比对。 除此之外,BWA作为ENCODE程序使用的比对工具也很好。

  2参数设定和注意事项2.1失配mismatch

  由于序列有一定的错误率,也有SNV的存在,所以一些reads与参考基因组不完全一致。 但是,为了不丢失这些测序数据,在比对时可能存在一定数量的失配。

  关于测序错误率:

  测序:测序长度达到800-1K bp,用于测序的时间短,测序精度高达99.999%

  Illumina第二代测序:低于0.1%

  三代测序:错误率12-15%

  关于SNV :

  失配设定的阈值因样本类型和实验而异,大多数比对软件支持以下方式:使用固定数字:直接指定每次匹配允许的失配数量。

  在变异的细胞,例如癌细胞中进行的ChIP-seq和部分非模式物种的参考基因组质量低的情况下,可以允许更多的错配数; 另外,根据不同的测序平台的错误率调整该阈值

  2.2多匹配多映射

  多重比对是指reads同时比对基因组的多个位置,比对质量良好,在短序列比对中尤为明显。 一般来说,该模糊匹配的发生源是基因组上的重复区域,例如人类基因组上的10%以上是Alu元件; 另外在植物中,串联重复事件的发生频率较高,例如拟南芥的全基因组重复也形成重复区域

  Alu元件: Alu element是分散分布在人类基因组中的相关序列,分别为长约300bp,由2段130bp的重复序列和1段31bp的间隔序列组成,两侧分别有6~20bp的正向重复序列,逆转录酶, 每个成员的每个末端都有一个Alu (藤黄节杆菌的简称)限制酶的切割位点,并由此命名。 Alu元件是人类基因组中丰度最高的易位元件

  处理这种多重比对的比较保守的方法是保留比对的reads; 考虑到此部分多重比对的reads,您可能会选择所有多重比对reads (因此比对结果中的项目超过reads数)或随机选取一个reads作为结果。

  ChIP-seq的DNA的片段一般为200bp左右,当许多reads与短重叠区一致时,该结合位点仍被捕获。 如果认为这种情况确实存在的话,可以加上与重复序列数据库Repbase的比对,一般来说可以得到更高的复盖率,可以更准确地统计重复区域

  以上介绍的就是ChIP-seq数据比对注意事项,如需了解更多,可随时联系我们!


关键词:

扫二维码用手机看

这是描述信息

邮箱:marketing@sz-acegen.com

官网:http://www.sz-acegen.com

地址:深圳市龙岗区立信路43号永昌大厦407-408室

Copyright © 2021  |  深圳市艾斯基因科技有限公司 All Rights Reserved.  |   粤ICP备16072881号  |  网站建设:中企动力 龙岗