系统生物学是研究生物系统中所有组成成分的构成及在特定条件下它们的相互关系的前沿学科,构建生物网络是其重要研究内容之一。目前,生物网络构建方法的准确性不高,其主要原因是:生物序列中已知功能元件的数量较少或基因表达数据质量难以保证,这将导致构建网络的关键步骤"序列间关联关系识别和预测"的准确性难以满足。因此,为提高生物网络构建的准确性,研究新的网络构建方法是一项重要工作。本项目采用数据挖掘技术构建生物网络:首先通过数据挖掘技术挖掘生物序列的特征,在此基础上建立基于多特征的生物网络模型,然后根据该网络模型生成生物网络。这样构建的生物网络将具有较高的准确性。主要研究内容包括:1、多种功能元件数据挖掘算法的研究;2、功能元件组合模块挖掘算法的研究;3、基因表达数据的特征挖掘算法的研究;4、基于多特征的生物网络模型的研究等。本项目研究有望为系统生物学中构建生物网络研究提供一个更高准确性的生物网络模型。
生物网络的构建与分析是系统生物学的重要内容,有助于从整体上理解生物学进程。第二代测序技术使得单个测序仪输出数据量可达40Gb每天,大数据对生物网络分析提出新挑战。生物网络研究的技术问题是生物学家对数据挖掘中新型技术的跟踪和掌握不够及时;而数据挖掘专家没有很好理解生物网络特点。这导致数据挖掘研究领域中的最新研究成果难以直接用于生物网络构建和分析中。因此,如何结合生物领域知识和需求,利用数据挖掘领域中的新技术更有效的研究生物网络是生物信息学中的重要研究内容之一。生物序列的特征对于构建生物网络具有重要影响,是构建生物网络的关键,然而,由于目前生物序列中已知功能元件数量较少以及基因表达数据质量难以保证,导致序列间关联关系的识别和预测准确性不高,因此,影响生物网络构建的准确性。本项目围绕这一重要问题开展了研究,深入分析了生物序列数据的特点,结合现有的数据挖掘技术,研究并设计了生物序列特征挖掘算法,包括基于序列模式的保守功能元件挖掘算法、基于多数据域描述的非保守功能元件挖掘算法、功能元件组合挖掘算法、基因表达数据的特征挖掘算法。在此基础上,研究基于不同语义路径的异质生物网络模型和构建方法,所构建的生物网络具有语义相关性。这些研究成果为生物网络分析研究提供了基础。本项目工作进展顺利,完成了项目要求的各项指标。下一步的研究将在生物网络深层次挖掘方面,包括异质生物网络的关键模块挖掘、基于生物网络的药物和疾病挖掘研究等。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
跨社交网络用户对齐技术综述
拥堵路网交通流均衡分配模型
动态生物分子网络演化模式挖掘算法研究
基于多模态特征相关性挖掘的跨媒体语义子空间构建算法研究
复杂生物网络集的频繁模式挖掘算法研究
基于图论的复杂网络高阶组织结构挖掘算法研究