农艺性状是人们在农业生产中最关心的问题之一,而构建与分析农作物基因和农艺性状关系的复杂网络,是目前农作物基因组学研究的前沿和热点问题。本课题在搜集农作物基因芯片数据的基础上,研究基因表达数据噪声控制和归一化方法,利用多阶段混合方法识别与农艺性状相关的基因及基因组合,进而整合农作物的基因组、性状、发育阶段以及各种组织器官等不同层次的信息。使用群智能和统计学习等多种方法构建农艺性状及相关基因的多维度多层次复杂关系网络,并借鉴社会网络挖掘的思想和方法,结合基因表达数据聚类及双聚类方法挖掘此复杂关系网络中具有生物学意义的子网络。本项目着力于研究一套系统生物学范畴的系列方法,旨在建立以农艺性状为中心的农作物系统网络模型,以揭示农艺性状的遗传学机理,为指导农业生产提供科学依据,促进计算机智能算法和系统生物学研究在相关领域的研究与应用。
在对农艺性状的研究中,对环境胁迫有重要影响的抗性基因的识别起着不可或缺的作用。我们在GEO上采集了22套与拟南芥抗旱性状相关的基因表达数据,用SVM-RFE特征选择方法来预测拟南芥的抗旱基因。提出了使用交叉验证来改进SVM-RFE的方法,用该方法在非抗性的基因型数据上进行了扩展研究,从而更准确地预测了抗旱基因,实验结果揭示了一些有趣的生物学现象。我们开发了一套完整的数据流程从水稻基因芯片中选择抗盐基因。采用一些新方法构建了抗盐机理的调控网络。使用融合机器学习的改进volcano plot方法选出差异表达基因,利用这些基因结合蛋白质相互作用数据构建机理网络,得到了若干个重要的模块。通过QTL分析、启动子模块分析、Gene Ontology分析、共表达分析和蛋白结构预测,在系统生物学层面上部分阐述了水稻的抗盐机理。.我们基于12种作物的基因芯片数据构建了植物miRNA靶基因表达数据库PMTED,提供了miRNA靶基因在不同的状态下、不同的细胞类型与组织内以及在不同的胁迫条件下的所有表达信息的查询和统合分析功能,进而进行了miRNA以及靶基因的功能预测与挖掘,用户可以通过浏览miRNA 靶基因的表达模式来挖掘其生物学功能。.提出了一种蛋白质相互作用网络中关键蛋白的识别方法,首先对SoECC进行改进,使其可应用于网络中所有的节点,然后将网络中连通分量的信息融入到算法中。提出了基于RNA三向量曲线表达的小波基多尺度RNA比较方法。设计了RNA二级结构的数值表达方式,构造了基于小波分解的新的相似性度量,可以获得RNA序列和结构间局部和全局信息的差异。提出了一些生物信息学相关算法,例如,基于微阵列数据的多阶段特征选择算法,基于保守基因簇的系统发生树推断方法,关于转录因子文本挖掘算法,基于支持向量与K-均值的混合聚类算法,基于Silhouette Index自适应参考度的AP聚类算法,增/减量式半监督吸引子传播算法,基于变点的差异基因表达检测方法,基于三均值的差异基因表达检测方法等。.本项目共发表学术论文30篇,其中SCI检索论文16篇,EI检索论文14篇。出版专著1部(生物信息学中的数据挖掘方法及应用,科学出版社),获得发明专利1项(一组微阵列误标记样本检测方法),软件著作权7项,获得全国商业科技进步二等奖1项。组织国际学术系列会议3次。培养博士生8人、硕士生8人。
{{i.achievement_title}}
数据更新时间:2023-05-31
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
跨社交网络用户对齐技术综述
城市轨道交通车站火灾情况下客流疏散能力评价
基于FTA-BN模型的页岩气井口装置失效概率分析
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
水稻重要农艺性状表达的生化基础和基因调控
基于GBS测序的燕麦地方品种遗传多样性研究及产量相关农艺性状的全基因组关联分析
可可蔗糖载体基因克隆及其与种子农艺性状和可可脂含量的关联分析
单层及双层关联网络上若干关键共演化问题研究