面向复杂疾病的序列标记物发现及其动态迁移研究

基本信息
批准号:61602460
项目类别:青年科学基金项目
资助金额:20.00
负责人:张劲松
学科分类:
依托单位:中国科学院分子细胞科学卓越创新中心
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:张万纬,王璐,赵娟,刘伟鑫,樊小亚,唐莹
关键词:
蛋白质序列分析序列比对生物序列分析复杂疾病序列分析DNA
结项摘要

The search and discovery of the biomarkers of complex diseases at the molecular level can help study the mechanisms of the occurrence and process of complex diseases. The biomarkers play a import role in early diagnosis, stage determining, drug target finding of complex diseases and precise medicine. Using the protein quantitation assay of proteomics to find the biomarkers of complex diseases is important pipeline in the discovery of biomarkers, which has raised great interest and become a very active topic in biomedicine communities. However, it still encounters a significant challenge at small sample data. Existing high-throughput sequencing can obtain the DNA sequences with both excellent efficiency and low cost, which contributes to the discovery of sequential biomarkers from biological sequences. This project studies the sequential biomarker discovering of complex diseases and the dynamic transferring model of the sequential biomarkers. First, a reverse-index-and-pattern-growth-based algorithm is proposed to efficiently mine the closed sequential patterns. And then, this project introduces a weighted cosine similarity distance algorithm to measure the significance level of difference between any two sequence mapping pattern sets. Third, an algorithm, named Bipartite Graph-based theory is drawn to identify the sequential biomarkers and find the dynamic model from the multiple mapping pattern sets. Moreover, based on the above results, this project will release the algorithms and develop an online website for the sequential biomarker discovering, which supports the related researchers of complex diseases.

寻找和发现复杂疾病分子层面的生物标记物,有助于研究复杂疾病的发生、发展机理,对复杂疾病的早期检测、分期判断、药物靶点确定、以及实现精准医疗具有重要意义。通过蛋白质组学中的蛋白质定量技术来发现复杂疾病生物标记物是目前生物标记物发现的重要途径和研究热点,但该方法面临着小样本数据的巨大挑战。高通量测序技术的成熟,使得从生物序列中发现序列标记物具有可行性。本课题研究复杂疾病的序列标记物发现方法,以及标记物的动态迁移模型。首先提出基于倒排索引的模式增长方法高效地挖掘闭合序列模式,接着研究基于赋权向量余弦相似度方法来测度序列映射模式集合间的差异距离,进而研究基于类二分图搜索方法从多映射模式集合中发现序列标记物及其动态迁移模型。此外,根据前述研究结果,本课题拟公开算法程序源码,开发和部署序列标记物发现的 Web Server 平台,为相关研究人员提供序列分析支持。

项目摘要

生物标记物在临床医学领域扮演着极其重要的角色。寻找和发现癌症分子层面的生物标记物,有助于研究癌症的发生、发展机理,对癌症的前期筛选、早期检测、分期判断、药物靶点确定、以及实现精准医疗具有重要意义。通过蛋白质组学中的蛋白质定量技术来发现癌症生物标记物是目前生物标记物发现的重要途径和研究热点,但该方法面临着小样本数据以及测量误差的巨大挑战。高通量测序技术的成熟,使得从生物序列中发现序列标记物具有可行性。本课题研究癌症的敏感序列标记物发现方法,进而研究敏感序列标记物与癌症前期状态之间的因果关系,从而辅助医疗检测机构进行癌症前期筛查。首先提出基于倒排索引的前缀增长方法高效地挖掘等价类模式,接着研究基于赋权向量余弦相似度方法来测度序列映射模式集合间的差异距离,进而从多映射模式集合中发现动态迁移的序列标记物,即敏感序列标记物。此外,根据前述研究结果,本课题已开发和部署敏感序列标记物发现的Web 服务平台,该平台构建敏感序列标记物的迁移模型,给出比对序列对应个体的健康、癌前或分期状态分析报告。发现的蛋白质序列标记物为药物设计研究者提供线索。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

张劲松的其他基金

批准号:81571875
批准年份:2015
资助金额:60.00
项目类别:面上项目
批准号:91117012
批准年份:2011
资助金额:160.00
项目类别:重大研究计划
批准号:81772057
批准年份:2017
资助金额:56.00
项目类别:面上项目
批准号:40871106
批准年份:2008
资助金额:44.00
项目类别:面上项目
批准号:30872836
批准年份:2008
资助金额:31.00
项目类别:面上项目
批准号:30471371
批准年份:2004
资助金额:23.00
项目类别:面上项目
批准号:39900009
批准年份:1999
资助金额:13.00
项目类别:青年科学基金项目
批准号:39370723
批准年份:1993
资助金额:5.00
项目类别:面上项目
批准号:91317306
批准年份:2013
资助金额:200.00
项目类别:重大研究计划
批准号:90717005
批准年份:2007
资助金额:160.00
项目类别:重大研究计划
批准号:81470617
批准年份:2014
资助金额:73.00
项目类别:面上项目
批准号:31040025
批准年份:2010
资助金额:10.00
项目类别:专项基金项目
批准号:31771971
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:31101069
批准年份:2011
资助金额:20.00
项目类别:青年科学基金项目
批准号:61175019
批准年份:2011
资助金额:55.00
项目类别:面上项目
批准号:31170648
批准年份:2011
资助金额:50.00
项目类别:面上项目
批准号:81270988
批准年份:2012
资助金额:70.00
项目类别:面上项目
批准号:81870644
批准年份:2018
资助金额:57.00
项目类别:面上项目
批准号:31530004
批准年份:2015
资助金额:273.00
项目类别:重点项目
批准号:30370130
批准年份:2003
资助金额:21.00
项目类别:面上项目

相似国自然基金

1

面向动态复杂数据的粒化模型与知识发现研究

批准号:61502213
批准年份:2015
负责人:钱文彬
学科分类:F0607
资助金额:19.00
项目类别:青年科学基金项目
2

序列大数据复杂情景模式发现算法研究

批准号:61602438
批准年份:2016
负责人:敖翔
学科分类:F0607
资助金额:20.00
项目类别:青年科学基金项目
3

复杂疾病的结构化组织规律发现方法研究

批准号:61772395
批准年份:2017
负责人:王炳波
学科分类:F0213
资助金额:63.00
项目类别:面上项目
4

复杂疾病恶化过程相关模式发现理论与方法研究

批准号:91130006
批准年份:2011
负责人:高琳
学科分类:A0403
资助金额:75.00
项目类别:重大研究计划