基于高通量多组学数据的癌症驱动通路识别算法研究

基本信息
批准号:61762015
项目类别:地区科学基金项目
资助金额:38.00
负责人:吴璟莉
学科分类:
依托单位:广西师范大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:程民权,闻炳海,李高仕,刘金露,黄丹,蔡齐荣,吴湧
关键词:
驱动通路智能优化驱动基因癌症基因组多组学
结项摘要

The problem of identifying mutated driver pathways in cancer has become a hot research area in bioinformatics, because of the importance of mutated driver pathways for promoting cancer precision medicine, and the sequenced multiple high-throughout omic data now available. Due to the noise and incomplete of high-throughout omic data, it can not only improve the integrity and accuracy of data, but also make full use of the potential information of different omic data to integrate multi-omic data. Therefore, there is a pressing need to identify mutated driver pathways in cancer based on multi-omic data. This project mainly studies effective computational models and algorithms for discovering individual driver pathway and cooperative driver pathways by using multi-omic data. In this project, integrative methods will be proposed by analyzing the expressions and characteristics of diverse omic data, and by taking advantage of the theories of statistics and matrix analysis to study the correlation between them. Based on the multi-omic integrated data, the effective computational models for discovering individual driver pathway and cooperative driver pathways will be presented through analyzing the characteristics of driver pathways in cancer. Based on such well-developed algorithmic theory as intelligent optimization computation and graph algorithms, we will design effective and practical algorithms. The project will further stimulate the research of models and algorithms for discovering mutated driver pathway, offer systematic theories and methods, and promote the development of identifying mutated driver pathway in cancer, and the application of driver pathways in precision medicine.

癌症驱动通路对癌症精准医疗的重要性及高通量多组学数据的测定,使癌症驱动通路识别问题成为生物信息学的研究热点。高通量测序技术下产生的组学数据具有噪声多和不完整的特点,整合多组学数据既能提高数据的完整性和准确性,还能充分利用不同组学数据中的潜在信息,迫切需要对基于多组学数据的癌症驱动通路识别问题展开研究。本项目主要研究高通量多组学数据下单驱动通路和协作通路的有效识别模型和算法。项目通过分析各组学数据的表达方式和特点,利用统计学、矩阵分析等理论和技术研究不同组学数据之间的相关性,设计有效的整合方法;基于多组学整合数据,归纳分析致癌驱动通路的表现特征,提出单驱动通路和协作驱动通路识别问题的有效计算模型,通过采用智能优化计算、图论算法等成熟理论和技术,寻求实用有效算法。项目的开展将进一步激发癌症驱动通路识别模型及算法的研究,为其提供系统的理论和方法,有力地促进癌症驱动通路识别及其在精准医疗中的应用。

项目摘要

本项目通过分析单组学数据的表达方式和特点,设计有效的整合方法,基于多组学整合数据提出驱动通路和驱动基因的识别模型和算法,并研制原型系统进行理论验证和性能分析。主要研究内容包括:研究高通量多组学数据的整合问题;研究单驱动通路识别模型和算法;研究协作驱动通路识别模型和算法;研究驱动基因识别模型和算法;研究泛癌驱动通路识别模型和算法。. 依托本项目发表学术论文14篇,其中SCI/EI收录10篇。获发明专利受理2项,获软件著作权3项。项目所取得的研究成果主要体现在以下几个方面:(1)组学数据整合。提出体细胞突变、拷贝数变异、基因表达的整合方法;提出体细胞突变、PPI网络、亚细胞定位的整合方法;提出基因表达、PPI网络的整合方法;提出体细胞突变、基因表达、小RNA、PPI网络的整合方法;(2)单驱动通路识别。提出用通路内基因的平均权重调节覆盖度和互斥度,及基于短染色体编码和贪心重组算子的单亲遗传算法PGA-MWS;提出基于非二进制突变矩阵的互斥度、覆盖度计算方法,及合作协同演化算法CGA-MWS和CGP-NCM;提出无参数非线性识别模型,及竞争协同演化算法CCA-NMWS;提出基于高基因评分和强连通性的贪心算法NSEA;(3)协作驱动通路识别问题。提出基于通路内高互斥高覆盖、通路间高共现的识别模型和算法GA-CMM;提出基于非二进制突变矩阵的通路间共现度计算方法;(4)驱动基因识别问题;提出驱动基因的三层评价机制,设计了各层评价方法,及基于调和均值和POC的综合排名方法GSCORE和PSCORE(5)泛癌驱动通路识别。提出基于相对权重的方差和调和均值识别模型CDP-V and CDP-H,及求解模型的单亲遗传算法PGA-V和PGA-H。. 本项目是一个多学科交叉的研究课题,涉及生物学、智能科学、统计学科、计算机科学领域。项目的开展将进一步激发癌症驱动通路识别模型及算法的研究,为其提供系统的理论和方法,有力地促进癌症驱动通路和基因的识别及其在精准医疗中的应用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
3

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022
4

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

DOI:10.3799/dqkx.2020.083
发表时间:2020
5

基于二维材料的自旋-轨道矩研究进展

基于二维材料的自旋-轨道矩研究进展

DOI:10.7498/aps.70.20210004
发表时间:2021

吴璟莉的其他基金

批准号:61363035
批准年份:2013
资助金额:45.00
项目类别:地区科学基金项目

相似国自然基金

1

基于多组学数据的癌症驱动信号通路的识别算法研究

批准号:61877064
批准年份:2018
负责人:张玉森
学科分类:F0126
资助金额:50.00
项目类别:面上项目
2

基于多组学数据整合的癌症驱动突变识别

批准号:61873001
批准年份:2018
负责人:郑春厚
学科分类:F0305
资助金额:66.00
项目类别:面上项目
3

基于多组学数据的癌症驱动模块网络挖掘方法研究

批准号:61902216
批准年份:2019
负责人:李凤
学科分类:F0213
资助金额:27.00
项目类别:青年科学基金项目
4

基于多组学数据整合与深度学习的癌症驱动基因研究

批准号:61902126
批准年份:2019
负责人:杨海
学科分类:F0213
资助金额:25.00
项目类别:青年科学基金项目