原因学习:理论及在全基因组关联分析中的应用

基本信息
批准号:61070137
项目类别:面上项目
资助金额:32.00
负责人:张军英
学科分类:
依托单位:西安电子科技大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:杨利英,王文俊,袁细国,彭柳青,石丛艳,YueWang,蒋胜利,薛宇玲,尚军亮
关键词:
稳定性原因性模式原因学习基因关联分析
结项摘要

疾病在分子水平上原因的发现是国际研究前沿、国家发展战略和重大交叉学科的首选研究领域之一,需要从大量生物数据中学习疾病原因。然而如何定义原因始终困扰和限制了学习理论的发展。在不试图解决原因定义的情况下,本项目针对高通量生物数据,独创性地提出从数据中学习出原因的理论、方法和算法,并开发软件分析平台。基于"原因是客观存在的、独立于数据和技术",以"稳定性"测度因素的客观性,以"具有最大稳定性的因素最有可能成为原因"为线索进行搜索,通过层层剥离准则去表及里地学习可能存在的多个原因。整个学习过程是无假设的,从而达到从数据中学习出客观存在的原因和因果关系的目的。其理论体系(原因性模式的定义、以原因学习为目的、纯统计学的无假设学习)是对现行学习理论(模式被含糊定义、以模式分类为目的、在假设空间中寻优)的重要发展,并运用于2型糖尿病全基因组关联分析和建模上,为对疾病的生物学病理研究提供可靠依据。

项目摘要

全面完成研究计划并有所拓展,进展如下:.一、原因学习.1. (致病原因的定义)针对致病原因(模式)没有严格定义却要从数据中发现的问题,基于“原因是客观的、独立于数据和技术”的原则,给出了严格数学定义,解决了“原因是什么”的问题。.2. (致病因素的评价)研究了单基因致病、多基因致病、单因素致病和多因素致病各种复杂情况下的致病原因的基本性质,提出了基于数据驱动的致病基因评价体系。.二、全基因组SNP关联分析.3. (SNP数据仿真系统)建立了全基因组SNP数据仿真系统,解决了多种复杂疾病模型、多致病因素以及多致病基因的全基因组SNP数据仿真问题;.4. (致病原因的搜索)提出了复杂疾病多因素致病以及多基因联合致病的致病基因搜索算法,并与传统方法进行了系统比较,解决了在全基因组范围高效搜索和发现复杂疾病的致病因素以及联合致病的致病基因问题;.5. (调控变异的搜索与可视化)在基因表达调控网络构建基础上,通过建立基因调控变异网络,解决了依生物网络是典型复杂网络的特点构建基因调控网络及基于基因调控变异网络识别致病基因及其基因之间调控关系的问题;.6. (模体识别)鉴于在生物网络中频繁出现模体具有生物功能的特性,提出了基于局部拓扑特性聚类的模体识别方法,解决了网络模体的快速识别问题。.7. (与疾病相关lncRNA预测)以已知的lncRNA与疾病关系为基础,通过建立lncRNA与疾病的二部网络,生成与lncRNA相关疾病网络(lncDN)和与疾病相关的lncRNA网络(DlncN),通过对网络拓扑性质的分析,揭示了复杂疾病在lncRNA层面上的关系以及lncRNA在导致复杂疾病发生过程上的关系。.三、对本项目的拓展.8. 在拷贝数变异数据的仿真、体细胞拷贝数变异的识别、拷贝数变异各种方法的比较等方面也进行了有益的研究并取得了成果。.9. 针对基因表达数据具有稳定分布的重托尾特性这一特点,研究了稳定分布的基本性质,得出了稳定分布是特征域中具有最大特征熵的分布的结论。.10. 全基因组关联分析是超高维空间组合搜索问题,研究了多种组合优化问题的求解,解决了超大规模图最短路问题和旅行商问题的高效搜索。.11.复杂疾病的诊断往往是一个复杂多分类问题,提出了将复杂多分类问题分解成多个简单分类问题的方法;提出了具有高鲁棒特性的数据聚类算法等。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018

张军英的其他基金

批准号:60071026
批准年份:2000
资助金额:15.00
项目类别:面上项目
批准号:69105001
批准年份:1991
资助金额:4.00
项目类别:青年科学基金项目
批准号:60371044
批准年份:2003
资助金额:7.00
项目类别:面上项目

相似国自然基金

1

泛全基因组关联分析:人类复杂疾病全基因组关联分析的整合研究

批准号:11601259
批准年份:2016
负责人:侯琳
学科分类:A0403
资助金额:17.00
项目类别:青年科学基金项目
2

基于Laplace Error惩罚函数的变量选择方法及其在全基因组关联分析中的应用

批准号:11001280
批准年份:2010
负责人:王学钦
学科分类:A0403
资助金额:17.00
项目类别:青年科学基金项目
3

多性状全基因组关联分析新方法及其在设计育种中的应用研究

批准号:31470083
批准年份:2014
负责人:徐海明
学科分类:C1301
资助金额:30.00
项目类别:面上项目
4

全基因组关联荟萃分析的新方法研究与应用

批准号:31570371
批准年份:2015
负责人:马闯
学科分类:C0210
资助金额:63.00
项目类别:面上项目