基于自然语言处理技术的蛋白质结构和功能预测

基本信息
批准号:61003090
项目类别:青年科学基金项目
资助金额:21.00
负责人:董启文
学科分类:
依托单位:复旦大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:丁建栋,邵明玉,郁抒思,万琳霞,王世春,黄可平
关键词:
蛋白质序列结构预测自然语言处理技术功能预测
结项摘要

近年来大量的基因组和蛋白质组序列、结构和功能数据不断增加,使得采用数据驱动的方法来解决蛋白质序列-结构-功能映射问题成为可能。生物序列和自然语言之间存在一定的相似性。大量语料库的出现推动了计算语言学的发展,同理,大量的蛋白质序列-结构-功能数据的出现,使得计算的方法和信息技术得以应用于此领域中。本项目将采用计算语言学的工具包括统计语言模型、文本分类技术、机器学习算法以及更高层的语言处理方法来理解细胞中蛋白质的结构和功能。通过将自然语言处理的相关技术引入到生物信息学中,针对蛋白质结构和功能预测的相关问题采用新的计算手段,简化蛋白质结构和功能预测的模型,提高蛋白质结构和功能预测的精度,进而推动蛋白质序列-结构-功能映射问题的发展。项目的研究在生物医学、人类生活、生产实践等方面都有着极为重要的意义。

项目摘要

项目采用自然语言处理的相关技术和方法解决蛋白质结构和功能预测的问题。通过将自然语言处理的相关技术引入到生物信息学中,针对蛋白质结构和功能预测的相关问题采用新的计算手段,简化蛋白质结构和功能预测的模型,提高蛋白质结构和功能预测的精度,进而推动蛋白质序列-结构-功能映射问题的发展。项目揭示了蛋白质序列的语言特征;提出了多种蛋白质同源性检测方法;实现了基于自然语言处理技术的蛋白质结构预测和功能预测方法,取得了良好的结果。项目的研究在生物医学、人类生活、生产实践等方面都有着极为重要的意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
5

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019

董启文的其他基金

批准号:61672234
批准年份:2016
资助金额:63.00
项目类别:面上项目

相似国自然基金

1

基于自然语言处理技术的DNA结合蛋白质预测

批准号:61573118
批准年份:2015
负责人:王晓龙
学科分类:F03
资助金额:64.00
项目类别:面上项目
2

基于自然语言处理技术的蛋白质相互作用预测方法研究

批准号:60673019
批准年份:2006
负责人:林磊
学科分类:F0214
资助金额:26.00
项目类别:面上项目
3

基于自然语言处理语义分析技术的蛋白质远同源性检测和折叠识别

批准号:61672184
批准年份:2016
负责人:刘滨
学科分类:F0213
资助金额:62.00
项目类别:面上项目
4

基于自然语言处理技术的生物实体语义网络研究和应用

批准号:61202304
批准年份:2012
负责人:魏小梅
学科分类:F0211
资助金额:25.00
项目类别:青年科学基金项目