Gene is the carrier of genetic information, the proteins encoded by genes are the direct manifestation of the complexity and variability of life phenomenon, so the study of protein is significant. In the post genome era, predicting of protein structural classes is one of the hotpot problems in bioinformatics research. A large number of nonlinear problems are contained in bioinformatics. Fractal is an important branch of nonlinear science and have been widely used in bioinformatics. In recent years, there aroused an upsurge of the study of complex networks, and some researchers focus on multifractal analysis of complex networks. This project focus on application of fractal and complex network methods to problems of protein structural classes prediction in bioinformatics. The research content of our project mainly includes: constructing all kinds of networks for fractal and multifractal analysis of complex networks, extracting feature, feature fusion, selecting feature, using machine learning methods, developing a fast and high performance algorithm for prediction protein structural classes of four low-homology datasets.
基因是遗传信息的载体,而其编码的蛋白质是生命现象复杂性和多变性的直接体现者,所以对蛋白质的研究显得极其重要。在后基因组时代,预测蛋白质结构类是生物信息学研究的热点问题之一。生物信息学中蕴含着大量的非线性问题。分形现如今已是非线性科学的一个重要分支且在生物信息学问题中应用广泛。近年来,全球掀起了研究复杂网络的热潮,部分研究人员把注意力集中在了复杂网络的重分形分析上。本项目重点研究分形和复杂网络方法在蛋白质结构类预测中的应用。我们的研究内容主要是针对四种低同源蛋白质数据,构建各种网络,进行网络的分形和重分形分析,提取特征,融合特征,降维,利用机器学习方法,最终发展一套可靠且高效快速的计算方法和算法用于预测蛋白质结构类。
基因是遗传信息的载体,而其编码的蛋白质是生命现象复杂性和多变性的直接体现者,所以对蛋白质的研究显得极其重要。本项目原计划重点研究分形和复杂网络方法在蛋白质结构类预测中的应用。目前主要研究内容分两部分阐述。第一,近年来多数文献是基于蛋白质二级结构预测三种低同源蛋白质数据的结构类,在特征提取过程中没有用到网络的方法。而在我们的研究中,针对每个蛋白质,基于蛋白质的二级结构,执行混沌游戏表示,提取两条时间序列,进而对两条时间序列,分别构建可视化网络和水平可视化网络;每种网络可以提取9个不同的网络特征,分别是:网络节点的数目,平均度,特征路径长度,直径,网络的聚集系数,皮尔森相关系数,平均接近中心,能,拉普拉斯能;将数据进行正规化处理;分别用支持向量机和线性判别分析法对蛋白质结构类做预测;为了评估我们的方法,在三个数据集上执行了留一交叉验证测试。结果显示我们的方法在三个低同源数据集上的预测总体精度都能达到80%左右。这说明网络特征对低同源蛋白质结构类的预测是有效的。第二:研究了由谢尔宾斯基正六边形产生的演化加权网络的拓扑特性,结果显示它们的节点强度是幂律分布,且拓扑度和加权强度之间有幂律关系。项目资助发表SCI论文1篇,待发表2篇。项目投入经费3万元,累计支出2.00311万元,各项支出基本与预算相符,结余经费0.99689万元。结余经费计划用于本项目研究后续支出。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
跨社交网络用户对齐技术综述
资本品减税对僵尸企业出清的影响——基于东北地区增值税转型的自然实验
氯盐环境下钢筋混凝土梁的黏结试验研究
城市轨道交通车站火灾情况下客流疏散能力评价
分形及相关方法在时间序列分析与复杂网络研究中的应用
分形与统计相关方法在蛋白质亚细胞定位及功能预测中的应用
分形与序列复杂度方法在DNA调控元件预测中的应用
混沌及分形理论在复杂网络动力学研究中的应用