基于数据挖掘技术的信号通路识别模型与算法研究

基本信息
批准号:60973074
项目类别:面上项目
资助金额:27.00
负责人:陈庆锋
学科分类:
依托单位:广西大学
批准年份:2009
结题年份:2012
起止时间:2010-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:葛志辉,赵志刚,李林,王春霞,廖其耀
关键词:
频繁模式信号通路关联规则蛋白激酶数据挖掘
结项摘要

数据挖掘技术是生物信息学中的重要研究课题之一,研究大规模生物序列分析新算法和复杂的生物模型建模,在提供有商业价值的生物信息,科研启示和生物医学上极为有用。通常的数据挖掘方法不能处理在数据复杂程度,数据量和建模上都要复杂得多的生物数据。因此,发展有效的生物数据挖掘算法有重要的应用意义和理论价值。本项目将研究新陈代谢信号通路相关数据的采集,存储,建模和分析的理论技术和方法。信号通路中的激活跟抑制模式都非常重要,但后者因为较低的支持度易被忽略,因此挖掘算法需要搜索和考虑所有频繁的和非频繁的项集合。其次传统挖掘方法会产生大量规则,需要改进算法分组从中筛选出支持度比较大的频繁模式,避免有用规则丢失或冗余规则产生。该项目的主要目标是发现在外界刺激下蛋白激酶调控的功能和特征,包括研究对外界刺激诱导产生变化的调控机制,研究相关基因表达特征和相关基因结构功能关系。这些结果为疾病诊断和治疗提供了一条有效途径。

项目摘要

该项目主要完成了信号通路数据挖掘的理论框架、基于信号通路数据采集和建模的生物信息学数据库平台设计、数据预处理 (包括不同数据源数据分析和数据标准化)、和软件工具系统等方面的研究。已经按要求完成全部项目计划内的研究目标,并在研究范围,研究问题的深度,发表科研论文等方面超出了预期目标,提出了信号通路研究的新思路,为后续研究奠定了良好的基础。已取得的成果包括(1)提出新陈代谢信号通路相关数据的采集,存储,建模和分析的理论技术和方法。(2)对AMPK蛋白激酶相关论文检索筛选,通过使用关键词搜索NCBI公用数据库中收录的发表论文,从文本中提取有意义的调控数据。对抽取的数据进行形式化,格式标准化处理,建立蛋白激酶调控数据网络共享数据库。(3)通过数据离散化处理,找到合理的属性值划分区间,确保挖掘的准确性。设置约束条件有针对性的控制规则输出,从而帮助生物学家从发现的大量规则中快速的筛选出有真正生物意义的规则。(4)扩展和改编传统的关联规则挖掘,提出根据贝叶斯规则把规则表示成为 X → Y和一个概率矩阵 MY|X,发现蛋白激酶调控亚基之间关联的直观调控图。(5)信号通路中的激活跟抑制模式都非常重要,但后者因为较低的支持度易被忽略,因此挖掘算法需要搜索和考虑所有频繁的和非频繁的项集合。其次传统挖掘方法会产生大量规则,需要改进算法分组从中筛选出支持度比较大的频繁模式,避免有用规则丢失或冗余规则产生。(6)提出距离区间矢量的非编码RNA结构建模理论,并提出考虑子结构特征的相似性度量函数,从数量巨大的发现的二级结构中快速查找结构上相似的同源结构,从而确定相关功能。该项目主要研究单信号通路挖掘,但对相互之间复杂的调控网络机制没有充分考虑,项目负责人在后续研究中从生物学系统的角度,综合考虑信号通路中调控因子的相互作用,包括非编码RNA,蛋白激酶,蛋白质等激活因子和抑制因子,构建多条信号通路协同作用形成的复杂调控网络。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022
5

基于分形维数和支持向量机的串联电弧故障诊断方法

基于分形维数和支持向量机的串联电弧故障诊断方法

DOI:
发表时间:2016

陈庆锋的其他基金

批准号:61363025
批准年份:2013
资助金额:43.00
项目类别:地区科学基金项目
批准号:41877041
批准年份:2018
资助金额:62.00
项目类别:面上项目
批准号:41003033
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目

相似国自然基金

1

基于多组学数据的癌症驱动信号通路的识别算法研究

批准号:61877064
批准年份:2018
负责人:张玉森
学科分类:F0126
资助金额:50.00
项目类别:面上项目
2

基于对象识别与挖掘技术的视频水墨风格化算法研究

批准号:61202165
批准年份:2012
负责人:王征
学科分类:F0209
资助金额:23.00
项目类别:青年科学基金项目
3

基于大数据挖掘技术的盾构刀具磨损分析与识别研究

批准号:51608529
批准年份:2016
负责人:卢浩
学科分类:E0806
资助金额:20.00
项目类别:青年科学基金项目
4

时间序列数据挖掘中的聚类模型与算法研究

批准号:70871015
批准年份:2008
负责人:郭崇慧
学科分类:G0112
资助金额:23.00
项目类别:面上项目