预测未知的潜在病毒基因序列的研究与传染病预测平台

基本信息
批准号:91746119
项目类别:重大研究计划
资助金额:60.00
负责人:丘成栋
学科分类:
依托单位:清华大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:杨广文,龚海鹏,高峰,吴琦,刘津平,田昆,裴少君,赵鑫,董睿
关键词:
未知病毒预测自然向量法新基因序列传染病预防
结项摘要

From the SARS outbreak in 2002 to Ebola in 2014, viral infectious diseases seriously endanger human health and the development of the country. However, the mutation of viral genes makes the prevention of infectious diseases not timely enough. so how to make use of the known virus gene sequences to find the new virus gene sequences is the key to prevent infectious disease in advance. Biological experiment always use gene recombination techniques to obtain new sequences of viral genes, but the whole process was time-consuming and could not be predicted quickly. This project is based on the existing virus gene library, and uses the natural vector method to transform the prediction of the gene sequence of unknown virus into a mathematical problem, so that it can be solved by the large data computing algorithm. Compared to the biological method, this project is committed to using a large data computing platform to predict gene sequence of unknown virus. This algorithm greatly saves manpower and time, and can be used in biological experiments, thus more accurate for viral infectious diseases prevention in advance.

从2002年的SARS到2014年的埃博拉,病毒性传染病严重危害着人类的健康和国家社会的发展。但由于病毒基因的变异速度快,使得传染病的预防具有滞后性,所以如何利用已知的病毒基因序列来提前获得未知病毒的基因序列,从而进行提前预防便是传染病研究的重点。生物上,多数是采用基因重组技术从而获得新的病毒基因序列,但整个实验过程耗时耗力,因此不能进行快速大量的预测。本项目基于现有的病毒基因库,利用自然向量法将对未知病毒的基因序列的预测转化为数学问题,从而利用大数据运算算法对其进行解决,并且基于提出的算法建立一个传染病预测平台。相比于生物方法,本项目致力于利用大数据计算平台对未知病毒基因序列进行预测,大大节约了时间与人力,同时可以对生物实验进行辅助,从而更精确更快速的对病毒性传染病进行提前预防。

项目摘要

2002年的非典,2014年的埃博拉以及2019年的新型冠状病毒,病毒性传染病严重危害着人类的生命健康和国家社会的经济发展,尤其是今年的新型冠状病毒,给全球敲响了重视传染病预防的警钟。但由于病毒种类繁多,变异速度快,这使得传染病的预防变得非常困难,并且具有滞后性,所以如何能够提前获得大量潜在的未知病毒的基因序列,从而研究其毒性,传播,进行提前预防,便是传染病研究的一大重点。生物上,多数是采用基因重组技术研究病毒的变异株,或者从动物体中采集分离病毒株,但整个实验过程耗时耗力,因此不能进行快速大量的预测。本项目基于现有的病毒基因库,收集公开数据库中所有的病毒全基因组序列,计算其自然向量,存储建立了自然向量病毒基因库 ‘VirusDB’,在此基础上力求开发一个高效的预测潜在未知病毒的数学算法模型。研究过程中,我们主要得到了以下三个重要结果:.1. 构建了病毒基因空间,定义了病毒基因空间的一个新度量,并在病毒科和属的水平验证了凸包原理,从而确认病毒基因空间可等价一个32维欧氏空间。.2. 开发了适用于超算平台的,基于自然向量法和凸包原理对潜在未知病毒的基因序列的预测算法,并在HIV病毒和新冠病毒中进行了初步的应用。.3. 进一步改进和完善了自然向量法,并将方法推广应用到细菌动物等基因组以及蛋白质组。.我们的自然向量方法是一种高效的降维方法,相比于传统的生物方法,可以大大节约了时间与人力,未来可以对生物实验进行辅助,从而更精确更快速的对病毒性传染病进行提前预防,并且可以用于其他高维的数据。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
2

氟化铵对CoMoS /ZrO_2催化4-甲基酚加氢脱氧性能的影响

氟化铵对CoMoS /ZrO_2催化4-甲基酚加氢脱氧性能的影响

DOI:10.16606/j.cnki.issn0253-4320.2022.10.026
发表时间:2022
3

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
4

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
5

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018

丘成栋的其他基金

批准号:31271408
批准年份:2012
资助金额:60.00
项目类别:面上项目
批准号:11531007
批准年份:2015
资助金额:230.00
项目类别:重点项目
批准号:11471184
批准年份:2014
资助金额:80.00
项目类别:面上项目

相似国自然基金

1

随机传染病模型渐近性质的研究与预测

批准号:11401090
批准年份:2014
负责人:杨青山
学科分类:A0210
资助金额:22.00
项目类别:青年科学基金项目
2

局域平稳时间序列的统计推断与预测

批准号:11901337
批准年份:2019
负责人:吴未迟
学科分类:A0402
资助金额:28.90
项目类别:青年科学基金项目
3

传染病疫情预测预报方法学的研究

批准号:38870691
批准年份:1988
负责人:曾光
学科分类:H3011
资助金额:2.50
项目类别:面上项目
4

基于实例空间的时间序列预测研究

批准号:11701022
批准年份:2017
负责人:康雁飞
学科分类:A0402
资助金额:20.00
项目类别:青年科学基金项目