课题研究的是基因芯片与高通量DNA测序的数据融合,以解决仅依靠单一技术手段只能获取部分实验基因信息的问题,为后续研究提供高质量的生物实验依据。实验发现,分别利用基因芯片与高通量DNA测序测得的数据具有很强的互补性。技术原理上,高通量DNA测序数据具有较高真阳率和假阴率;基因芯片数据则具有较高真阴率和假阳率。可见,两种数据的融合可以得到更高质量的实验测试结果。本课题拟首先通过实验数据并结合实验技术原理,分析基因芯片与高通量DNA测序数据分别在DNA-蛋白质相互作用检测、基因表达检测和小分子RNA检测等生物实验中针对不同测试对象的测试数据质量及其互补性,建立不同实验背景下数据质量评估方法,设计二者在不同实验中的测试数据融合原则,并研究基因芯片与高通量DNA测序的数据融合方法,以生成更全面、更准确的生物实验测试结果。本课题研究可有效提高生物实验测试质量,并有利于后续生物研究获取有意义的成果。
本项目首先对基因芯片检测数据和高通量DNA测序数据的数据质量进行了分析。通过分析,发现相比于基因芯片,高通量DNA测序数据具有分辨率高,准确率高,信息检测全等优点,无疑是生物信息检测的首选方式。但以Ilumina测序平台为代表的测序设备所生成的测序数据具有一定规律的原理性检测误差。这些测序误差的存在将严重影响测序数据的检测精度。由于检测原理的不同,基因芯片则不具有测序数据所特有的这些原理性误差。这就使得两类数据具有融合的可能和必要性。.随后,确定了基因芯片和高通量DNA测序数据融合原则:以高通量DNA测序数据为主生成生物信息检测数据,在此基础上,利用基因芯片对高通量DNA测序数据所特有的原理性误差进行校正,以最终生成更准确的生物信息检测数据。校正方式则根据测序数据所特有原理性误差的不同而具体问题具体分析。.最后,我们分别研究了基因表达检测和DNA与蛋白互作检测等常规生物信息检测过程中基因芯片和高通量DNA测序数据融合方法,以生成更准确的生物信息检测结果。所研究成果分别应用于测序数据比对增强,基因表达差异检测分析,RNA前体可变剪切分析,DNA甲基化对转录因子调控分析,不规则蛋白质结构预测等生物前沿课题的研究中,取得了更好的分析效果。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
高通量DNA测序片段的拼接
增加高通量DNA测序阅读长度方法研究
基于高通量测序数据的多层次生物网络分析理论与关键技术
高通量DNA甲基化测序数据的处理及功能基因组区域识别研究