The bio-economy is becoming one of the important growth points of China's economy, accounting for 4.63% of GDP. In 2014, China's bio-industrial output value reached 316 million yuan. Biological phylogenetic tree research is an important branch of biotechnology and genetic research. However, the existing algorithms are difficult to meet the practical requirements in terms of time complexity, spatial complexity and accuracy in the dimension and magnitude of data for practical application level. In order to make a breakthrough, our group proposed a scalable data structure to describe the high dimensional unequal gene orders, and based on that structure to analyze an universal calculation method of "biological distance" between unequal two gene orders; Based on this data structure and the "biological distance" calculation method, the stepwise recursive inversion model of unequal gene orders is designed, and the algorithm design and performance optimization of the proposed model are studied. Finally, according to tree structure and solution space and feature of the model, we design a biological evolutionary tree iterative inversion construction model, and study the algorithm implementation and performance optimization. The research results of this project are expected to provide technical support for the further promotion and application of the biological phylogenetic tree in the biotechnology industry.
生物经济正成为中国经济的重要增长点之一,占GDP的比重达到4.63%。2014年,我国生物产业产值达3.16亿元。生物进化树研究是生物技术与遗传研究领域中的一个重要分支。但现有算法在面向实际应用级别的数据维度与量级时在时间复杂度、空间复杂度与精度方面都很难达到实用性要求。为了作出突破,本项目组拟从设计高维度不等序列可扩展性的数据结构模型入手,提出具有普适性的不等序列间“生物距离”的计算方法;基于此数据结构与“生物距离”计算方法,设计不等序列间步进式递推反演模型,并研究所提出模型的算法描述与性能优化;最后依据此模型与树结构的解空间与特征,设计具有普适性的生物进化树迭代反演构建模型,并进行算法实现与性能优化。本项目的研究成果可望为生物进化树领域在生物技术产业中的进一步推广与应用提供技术支持。
生物经济正成为中国经济的重要增长点之一,占GDP的比重达到4.63%。2014年,我国生物产业产值达3.16亿元。生物信息相关产业从 2015 之后有着越来越大的市场空间与发展前景。生物进化树研究是生物技术与遗传研究领域中的一个重要分支。但现有算法在时间复杂度、空间复杂度与精度方面很难达到面向实际应用级别的数据维度与数据量级的要求。为了有效解决维度、运算效率与精度的问题,本文首先从最基本的高维数据表征入手,设计了可扩展性的数据结构化模型,并基于此提出具有普适性的不等序列间“生物距离”的计算方法;然后根据多维数据结构与Median Problem的特性,设计出了不等序列间步进式递推反演模型,分析了两个不同染基因组序列间的演变空间;最后,依据树模型/图模型在仅获知部分节点信息的条件下,反演出最优生物进化过程,生成生物进化树/图,并做推理分析。. 本研究给出了完整的面向高维染色体数据的生物进化树反演算法,量化了不同基因组序列之间距离的度量指标,结合物种间的启发式算法与分布式框架以获得较高的精度与效率,为生物技术产业及生物大数据分析提供了理论支持。本项目成功完成了计划任务,发表期刊论文9,会议论文1篇,其中SCI/EI索引论文6篇;获受理的发明专利4项;培养硕士/博士研究生4人。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
基于LASSO-SVMR模型城市生活需水量的预测
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
基于几何光学模型反演林冠郁闭度的普适性方法研究
普适环境下自适应中间件模型与方法研究
普适服务冲突识别方法研究
普适计算环境下多层语义位置模型层间关联映射方法