面向复杂疾病的序列标记物发现及其动态迁移研究

基本信息

批准号：61602460

项目类别：青年科学基金项目

资助金额：20.00

负责人：张劲松

学科分类：

依托单位：中国科学院分子细胞科学卓越创新中心

批准年份：2016

结题年份：2019

起止时间：2017-01-01 - 2019-12-31

项目状态：已结题

项目参与者：张万纬,王璐,赵娟,刘伟鑫,樊小亚,唐莹

关键词：

蛋白质序列分析序列比对生物序列分析复杂疾病序列分析DNA

结项摘要

The search and discovery of the biomarkers of complex diseases at the molecular level can help study the mechanisms of the occurrence and process of complex diseases. The biomarkers play a import role in early diagnosis, stage determining, drug target finding of complex diseases and precise medicine. Using the protein quantitation assay of proteomics to find the biomarkers of complex diseases is important pipeline in the discovery of biomarkers, which has raised great interest and become a very active topic in biomedicine communities. However, it still encounters a significant challenge at small sample data. Existing high-throughput sequencing can obtain the DNA sequences with both excellent efficiency and low cost, which contributes to the discovery of sequential biomarkers from biological sequences. This project studies the sequential biomarker discovering of complex diseases and the dynamic transferring model of the sequential biomarkers. First, a reverse-index-and-pattern-growth-based algorithm is proposed to efficiently mine the closed sequential patterns. And then, this project introduces a weighted cosine similarity distance algorithm to measure the significance level of difference between any two sequence mapping pattern sets. Third, an algorithm, named Bipartite Graph-based theory is drawn to identify the sequential biomarkers and find the dynamic model from the multiple mapping pattern sets. Moreover, based on the above results, this project will release the algorithms and develop an online website for the sequential biomarker discovering, which supports the related researchers of complex diseases.

寻找和发现复杂疾病分子层面的生物标记物，有助于研究复杂疾病的发生、发展机理，对复杂疾病的早期检测、分期判断、药物靶点确定、以及实现精准医疗具有重要意义。通过蛋白质组学中的蛋白质定量技术来发现复杂疾病生物标记物是目前生物标记物发现的重要途径和研究热点，但该方法面临着小样本数据的巨大挑战。高通量测序技术的成熟，使得从生物序列中发现序列标记物具有可行性。本课题研究复杂疾病的序列标记物发现方法，以及标记物的动态迁移模型。首先提出基于倒排索引的模式增长方法高效地挖掘闭合序列模式，接着研究基于赋权向量余弦相似度方法来测度序列映射模式集合间的差异距离，进而研究基于类二分图搜索方法从多映射模式集合中发现序列标记物及其动态迁移模型。此外，根据前述研究结果，本课题拟公开算法程序源码，开发和部署序列标记物发现的 Web Server 平台，为相关研究人员提供序列分析支持。

项目摘要

生物标记物在临床医学领域扮演着极其重要的角色。寻找和发现癌症分子层面的生物标记物，有助于研究癌症的发生、发展机理，对癌症的前期筛选、早期检测、分期判断、药物靶点确定、以及实现精准医疗具有重要意义。通过蛋白质组学中的蛋白质定量技术来发现癌症生物标记物是目前生物标记物发现的重要途径和研究热点，但该方法面临着小样本数据以及测量误差的巨大挑战。高通量测序技术的成熟，使得从生物序列中发现序列标记物具有可行性。本课题研究癌症的敏感序列标记物发现方法，进而研究敏感序列标记物与癌症前期状态之间的因果关系，从而辅助医疗检测机构进行癌症前期筛查。首先提出基于倒排索引的前缀增长方法高效地挖掘等价类模式，接着研究基于赋权向量余弦相似度方法来测度序列映射模式集合间的差异距离，进而从多映射模式集合中发现动态迁移的序列标记物，即敏感序列标记物。此外，根据前述研究结果，本课题已开发和部署敏感序列标记物发现的Web 服务平台，该平台构建敏感序列标记物的迁移模型，给出比对序列对应个体的健康、癌前或分期状态分析报告。发现的蛋白质序列标记物为药物设计研究者提供线索。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1093/bib/bbab336

发表时间：2021

DOI：10.16796/j.cnki.1000-3770.2022.03.003

发表时间：2022

DOI：10.12354/j.issn.1000-8179.2021.20201763

发表时间：2021

DOI：10.7524 /j.issn.0254-6108.2017122903

发表时间：2018

DOI：10.12202/j.0476-0301.2022178

发表时间：2022

张劲松的其他基金

批准号：81571875

批准年份：2015

资助金额：60.00

项目类别：面上项目

批准号：91117012

批准年份：2011

资助金额：160.00

项目类别：重大研究计划

批准号：81772057

批准年份：2017

资助金额：56.00

项目类别：面上项目

批准号：40871106

批准年份：2008

资助金额：44.00

项目类别：面上项目

批准号：30872836

批准年份：2008

资助金额：31.00

项目类别：面上项目

批准号：30471371

批准年份：2004

资助金额：23.00

项目类别：面上项目

批准号：39900009

批准年份：1999

资助金额：13.00

项目类别：青年科学基金项目

批准号：39370723

批准年份：1993

资助金额：5.00

项目类别：面上项目

批准号：91317306

批准年份：2013

资助金额：200.00

项目类别：重大研究计划

批准号：90717005

批准年份：2007

资助金额：160.00

项目类别：重大研究计划

批准号：81470617

批准年份：2014

资助金额：73.00

项目类别：面上项目

批准号：31040025

批准年份：2010

资助金额：10.00

项目类别：专项基金项目

批准号：31771971

批准年份：2017

资助金额：60.00

项目类别：面上项目

批准号：31101069

批准年份：2011

资助金额：20.00

项目类别：青年科学基金项目

批准号：61175019

批准年份：2011

资助金额：55.00

项目类别：面上项目

批准号：31170648

批准年份：2011

资助金额：50.00

项目类别：面上项目

批准号：81270988

批准年份：2012

资助金额：70.00

项目类别：面上项目

批准号：81870644

批准年份：2018

资助金额：57.00

项目类别：面上项目

批准号：31530004

批准年份：2015

资助金额：273.00

项目类别：重点项目

批准号：30370130

批准年份：2003

资助金额：21.00

项目类别：面上项目

相似国自然基金

面向动态复杂数据的粒化模型与知识发现研究

批准号：61502213

批准年份：2015

负责人：钱文彬

学科分类：F0607

资助金额：19.00

项目类别：青年科学基金项目

序列大数据复杂情景模式发现算法研究

批准号：61602438

批准年份：2016

负责人：敖翔

学科分类：F0607

资助金额：20.00

项目类别：青年科学基金项目

复杂疾病的结构化组织规律发现方法研究

批准号：61772395

批准年份：2017

负责人：王炳波

学科分类：F0213

资助金额：63.00

项目类别：面上项目

复杂疾病恶化过程相关模式发现理论与方法研究

批准号：91130006

批准年份：2011

负责人：高琳

学科分类：A0403

资助金额：75.00

项目类别：重大研究计划

面向复杂疾病的序列标记物发现及其动态迁移研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

DNAgenie: accurate prediction of DNA-type-specific binding residues in protein sequences

EBPR工艺运行效果的主要影响因素及研究现状

外泌体在胃癌转移中作用机制的研究进展

珠江口生物中多氯萘、六氯丁二烯和五氯苯酚的含量水平和分布特征

复杂系统科学研究进展

张劲松的其他基金

长链非编码RNA 2700086A05Rik参与肺纤维化疾病的分子机制研究

乙烯受体互作蛋白及对胁迫反应的调控机制研究

lncRNA 2700086A05Rik吸附miR-1236介导百草枯致肺纤维化过程的新机制研究

华北山地典型农林复合系统土壤呼吸变化特征及其影响机制

OREBP对晶状体纤维细胞分化过程中AQP0 C-末端与Cx细胞内段的相互作用的影响

黄河小浪底退耕还林工程区主要中药材树种蒸腾耗水规律与分形特征的研究

烟草两组分信号系统基因NTHK1的研究

抗兔晶体上皮细胞单克隆抗体-药物偶联的实验研究

乙烯信号途径相关蛋白对植物根生长和胁迫反应的调控机制研究

乙烯受体信号传递及植物非生物胁迫反应

Smad4介导的信号转导通路网络在眼发育中的作用

新miRNA分子ca-65在免疫反应中的调节机制及转基因小鼠构建和分析

茶氨酸通过抑制铜促进儿茶素氧化预防儿茶素肝毒性

miR-29对附睾上皮增殖的调控及转基因小鼠模型

基于语流音变认知机理建模的语音识别研究

茶EGCG活性和毒性与含硒酶的关联

Eaf2基因调控microRNA抑制白内障发生的机制研究

基因间长链非编码RNA-p21在年龄相关性白内障中的作用及调控机制研究

乙烯调控水稻非生物胁迫反应的机制研究

烟草乙烯受体NTHK1和NTHK2的功能及其与植物耐逆性的关系

相似国自然基金