基于多关联数据融合的疾病相似度算法研究

基本信息
批准号:61502125
项目类别:青年科学基金项目
资助金额:20.00
负责人:程亮
学科分类:
依托单位:哈尔滨医科大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:石洪波,张德楠,马文超,陈彬彬,史宇晨,赵浩,王哲
关键词:
生物信息学多关联数据融合疾病研究潜在治疗药物疾病相似度
结项摘要

Measuring similarity between diseases plays an important role in disease-related molecular function research. Currently, literature, gene, and semantic association data between diseases is often used to calculate disease similarity. Disease similarity can be reflected by each type of association data from different view. However, not all of these association data is considered in existing methods. In order to comprehensively understand disease similarity, we focus on fusing multi-association data. The main studies include: 1) Method for calculating disease similarity is proposed by fusing multi-association data. First, disease similarities based on existing methods are compared using real associations and permutated associations, and false discovery rate (FDR) of disease similarity from each type of association can be accessed. Then, P-value of the disease similarity can be obtained using Fisher's combined probability test. 2) Receiver Operating Characteristic (ROC) curve is exploited to access the performance. In addition, the method is validated using the hypothesis that similar diseases can be treated by the same drugs. 3) Potential therapeutic drugs of disease are predicted, and coherent paths between diseases are mined and prioritized, and then the calculation and analysis system of disease similarity is established.

疾病相似度对于研究与疾病相关的分子功能有非常重要的作用。当前,疾病对的文献、基因以及语义关联数据常被用于计算疾病相似度。尽管每种关联数据都从不同的角度反映了疾病的相似性,但是现有的方法并没有综合的利用所有的关联数据。为了更加全面地理解疾病相似度,本项目致力于融合所有的关联数据。本项目的主要研究内容包括以下三部分:1)设计多关联数据融合的疾病相似度方法。首先,比较真实的关联关系与重新排列的关联关系在已有的方法下的疾病相似性,基于每种类型的关联关系得到一个疾病相似性的假阳性率;然后通过Fisher联合概率检验得到疾病相似性的P-value。2)基于ROC(Receiver Operating Characteristic)曲线评估方法的性能,并验证方法符合假设“相似的疾病可以被同样的药物治疗”。3)预测疾病的潜在治疗药物、挖掘并排序疾病间的关联路径,进而构建疾病相似度计算与分析系统。

项目摘要

疾病相似度对于研究与疾病相关的分子功能有非常重要的作用。当前,疾病对的文献、基因以及语义关联数据常被用于计算疾病相似度。尽管每种关联数据都从不同的角度反映了疾病的相似性,但是现有的方法并没有综合的利用所有的关联数据。为了更加全面地理解疾病相似度,本项目致力于融合所有的关联数据。本项目的主要研究内容包括以下三部分:1)设计多关联数据融合的疾病相似度方法。首先,比较真实的关联关系与重新排列的关联关系在已有的方法下的疾病相似性,基于每种类型的关联关系得到一个疾病相似性的假阳性率;然后通过Fisher联合概率检验得到疾病相似性的P-value。2)基于ROC(Receiver Operating Characteristic)曲线评估方法的性能,并验证方法符合假设“相似的疾病可以被同样的药物治疗”。3)预测疾病的潜在治疗药物、挖掘并排序疾病间的关联路径,进而构建疾病相似度计算与分析系统。经过三年的研究,开发的疾病相似度算法已经发表在BMC Medical Genomics期刊上,该方法可应用于预测非编码RNA与疾病之间的关联,预测的AUC值达到90%左右。相关算法已经集成为一套疾病相似度分析工具集,发表在Bioinformatics期刊上。此外,我们还开发了一个代谢物与疾病关联数据库MetSigDis,并把疾病相似度方法应用于预测疾病相关的代谢产物,相关文章发表在Briefings in Bioinformatics期刊上。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
4

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
5

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018

程亮的其他基金

批准号:61100227
批准年份:2011
资助金额:21.00
项目类别:青年科学基金项目
批准号:81202473
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:41001238
批准年份:2010
资助金额:18.00
项目类别:青年科学基金项目
批准号:41371017
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:11201164
批准年份:2012
资助金额:22.00
项目类别:青年科学基金项目
批准号:51479025
批准年份:2014
资助金额:82.00
项目类别:面上项目
批准号:51572180
批准年份:2015
资助金额:64.00
项目类别:面上项目
批准号:31160371
批准年份:2011
资助金额:48.00
项目类别:地区科学基金项目
批准号:51509158
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:51905233
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:51804055
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:30860165
批准年份:2008
资助金额:20.00
项目类别:地区科学基金项目
批准号:61772506
批准年份:2017
资助金额:16.00
项目类别:面上项目
批准号:51302180
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:11126193
批准年份:2011
资助金额:3.00
项目类别:数学天元基金项目
批准号:61871160
批准年份:2018
资助金额:63.00
项目类别:面上项目

相似国自然基金

1

基于相似度学习的异构数据聚类算法研究及其应用

批准号:61876193
批准年份:2018
负责人:王昌栋
学科分类:F0603
资助金额:65.00
项目类别:面上项目
2

基于特征头颅与相似度评估的人头建模关键算法研究

批准号:60703002
批准年份:2007
负责人:梁荣华
学科分类:F0209
资助金额:18.00
项目类别:青年科学基金项目
3

基于多相似度融合的非编码RNA结构比对和分类识别

批准号:61173117
批准年份:2011
负责人:刘琦
学科分类:F0213
资助金额:55.00
项目类别:面上项目
4

基于数据集相似性的分类算法自动选择研究

批准号:61602308
批准年份:2016
负责人:潘彬彬
学科分类:F0605
资助金额:16.00
项目类别:青年科学基金项目