种群结构推断是生物信息领域中的关键问题。本项目针对不同遗传序列数据集,结合基于集成学习和图算法的高维遗传序列降维和种群关键特征选择方法,对基于概率图和优化自适应聚类的混合遗传序列种群结构推断方法进行研究,探索能够合理推断物种种群遗传结构,提取各种群对应关键遗传特征的计算方法,为疾病治疗、作物育种等提供遗传关键信息,为机器学习方法在遗传序列分析中的应用奠定基础,指导相关分子生物学实验,为其节省成本,推动生命科学研究的发展。同时,研究中通过生物学问题检验计算方法的效果,指导计算方法的改进,也将对计算机科学中降维、特征提取及聚类算法的发展起到重要的推动作用。本项目拟:(1)提出针对具有混合特征高维样本集的自适应聚类算法;(2)开发可以处理不同类型数据的混合特征种群结构推断方法和系统,并应用于疾病分析和作物育种;(3)发表高水平期刊论文8-10篇。
种群结构推断是生物信息领域中的关键问题。本项目从此问题出发,针对不同类型的遗传序列数据集,结合机器学习、数据挖掘与统计学习方法,围绕混合遗传序列种群结构推断及相关的生命科学应用进行深入研究。(1)在遗传序列分析与种群结构推断方面,我们研究了大规模遗传序列的比对和分析算法,在此基础上进行遗传关键SNP位点挖掘,开发了基于统计的种群结构推断方法,并将其应用于复杂疾病的关联预测;(2)在生物医学应用建模方面,研究了遗传序列分析和分类方法,结合基于常微分方程和偏微分方程的数学模型构建,提出了基于多层次代理的生物发育过程计算建模方法,并将其用于指导疾病药物实验设计;(3)在机器学习与数据挖掘新型算法方面,从遗传序列分析这一实际问题出发,提出了能够面向高维遗传数据的加权集成聚类算法、基于稀疏表示的半监督分类方法和多标记分类方法。本项目研究过程中共发表期刊论文和会议论文13篇,开发了相应的位点挖掘、种群结构推断和进化分析软件3项。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
基于SSVEP 直接脑控机器人方向和速度研究
基于FTA-BN模型的页岩气井口装置失效概率分析
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
基于特征聚类的高维混合属性数据特征选择方法
基于非参数概率混合模型的方向数据聚类算法研究
基于混合聚类技术的交叉学科结构特征和演进趋势研究
基于概率幂律标度的聚类和回归方法