
甲基化芯片数据的扩展方法与流程
- 分类:行业新闻
- 作者:
- 来源:
- 发布时间:2022-06-10 10:50
- 访问量:
【概要描述】甲基化芯片是表观遗传学中研究较多的修饰形式,也是人类认识早的表观遗传学现象之一。 甲基化芯片的变化影响着细胞正常发育过程中基因组转录模式的变化,在疾病的发生和发展中起着重要作用,目前我们获取dna甲基化数据主要是通过实验方法检测dna甲基化状态,这种方法测量数据比较准确,但人力财力费用较大。 因此,用计算方法预测dna甲基化数据显得尤为重要和重要,那么,下面一起了解下甲基化芯片数据的扩展方法与流程
甲基化芯片数据的扩展方法与流程
【概要描述】甲基化芯片是表观遗传学中研究较多的修饰形式,也是人类认识早的表观遗传学现象之一。 甲基化芯片的变化影响着细胞正常发育过程中基因组转录模式的变化,在疾病的发生和发展中起着重要作用,目前我们获取dna甲基化数据主要是通过实验方法检测dna甲基化状态,这种方法测量数据比较准确,但人力财力费用较大。 因此,用计算方法预测dna甲基化数据显得尤为重要和重要,那么,下面一起了解下甲基化芯片数据的扩展方法与流程
- 分类:行业新闻
- 作者:
- 来源:
- 发布时间:2022-06-10 10:50
- 访问量:
甲基化芯片是表观遗传学中研究较多的修饰形式,也是人类认识早的表观遗传学现象之一。 甲基化芯片的变化影响着细胞正常发育过程中基因组转录模式的变化,在疾病的发生和发展中起着重要作用,目前我们获取dna甲基化数据主要是通过实验方法检测dna甲基化状态,这种方法测量数据比较准确,但人力财力费用较大。 因此,用计算方法预测dna甲基化数据显得尤为重要和重要,那么,下面一起了解下甲基化芯片数据的扩展方法与流程吧!
甲基化芯片检测方法常用的方法是亚硫酸盐序列和亚硫酸盐微阵列法,全基因组亚硫酸氢钠序列(wgbs )具有全面的基因组覆盖,但高序列深度使其非常昂贵。 亚硫酸盐微阵列方法成本较低,但受制于先验目标区域,覆盖的基因组范围较小。
甲基化芯片技术实现要素:
本发明的目的是克服现有技术的不足,提供使用在不同组织中具有类似的局部甲基化芯片模式的cpg部位甲基化值和相邻的cpg部位甲基化加权值进行建模和扩展的dna甲基化芯片数据的扩展方法,从而实现上述发明的目的
1、提取数据
从甲基化芯片通用数据库geo中获取31种不同组织的t1.t2.t31全基因组亚硫酸盐测序数据和31种组织相应的dna甲基化芯片数据; 另外,从该数据库中取得与上述31种组织不同其他任意组织t32的全部基因组亚硫酸盐测序的数据和dna甲基化芯片的数据;
2、数据预处理
分别判断全基因组亚硫酸氢盐测序数据和dna甲基化芯片数据各行是否有空值,如有空值则删除相应行,得到标准全基因组亚硫酸氢盐测序数据和dna甲基化芯片数据;
3、特征提取
假设各组织中有n个相同数量的cpg位点,其中n个位点的甲基化值通过全基因组亚硫酸盐序列检测到,n个位点中m个位点同时通过dna甲基化芯片检测到,则剩下的k个位点通过dna甲基化芯片检测到将组织t32中的第k (k=1.2.…,k )个芯片未检测到的部位设为cpgk;在31个组织中找到局部甲基化模式与cpgk位点相似的组织,根据该组织对应cpgk位点的全部基因组亚硫酸顺序检测到的甲基化值以及接近cpgk的2个位点的甲基化加权值和cpgk位点的全部基因组亚硫酸盐顺序。
4、训练逻辑回归模型
作为logistic回归模型的输入,以yk为logistic回归模型的输出训练logistic回归模型,得到标准的logistic回归模型
5、独立样本预测
甲基化芯片获取任意组织的dna甲基化芯片数据,t1、t2、t31的全部基因组移位测序数据和对应的dna甲基化芯片数据,并通过步骤(2、3 )中描述的方法获取甲基化值。
扫二维码用手机看

邮箱:marketing@sz-acegen.com
官网:http://www.sz-acegen.com
地址:深圳市龙岗区立信路43号永昌大厦407-408室

龚老师企业微信

张老师企业微信

微信公众号
Copyright © 2021 | 深圳市艾斯基因科技有限公司 All Rights Reserved. | 粤ICP备16072881号 | 网站建设:中企动力 龙岗