随着基因组学研究和高通量技术的飞速进步,蛋白质之间的相互作用数据迅速积累,从蛋白质相互作用网络中识别出蛋白质复合物,是生物体行为理解、蛋白质功能预测和药物设计的基础。本项目综合利用各种生物医学知识源,使用特征耦合泛化策略构建蛋白质的实体识别模型;使用基于语义的相似度计算解决蛋白质名标准化中的歧义问题;使用平面特征核、卷积树核以及特征耦合泛化核的复合核模型进行蛋白质相互作用关系抽取,从而构建高准确的蛋白质相互作用网络。在抽取蛋白质复合物的过程中,综合考虑图的拓扑结构、蛋白质复合物的生物结构和蛋白质的功能标注信息,并引入基于监督的分类算法,从已知蛋白质复合物提取包括结合图的拓扑结构信息、关系的可信度和络合物内蛋白质相似程度在内的特征,结合机器学习模型抽取蛋白质复合物。本项目将相关技术应用于肺癌的蛋白质相互作用网络构建和蛋白质复合物提取,发现肺癌肿瘤标志物,用于肺癌早期诊断。
随着基因组学研究和高通量技术的飞速进步,蛋白质之间的相互作用数据迅速积累,从蛋白质相互作用网络中识别出蛋白质复合物,是生物体行为理解、蛋白质功能预测和药物设计的基础。本项目综合利用各种生物医学知识源,使用特征耦合泛化策略构建蛋白质的实体识别模型;使用基于语义的相似度计算解决蛋白质名标准化中的歧义问题;使用平面特征核、卷积树核以及图核的复合核模型进行蛋白质相互作用关系抽取,此外,引入排序学习方法自动学习不同核的权重,进一步提高了蛋白质关系抽取的效果。使用该技术从生物文献中抽取蛋白质交互关系,与PPI数据库中的数据进行融合,构建了高性能的蛋白质交互网络,从中进行复合物发现。在抽取蛋白质复合物的过程中,引入基于监督的分类算法,从已知蛋白质复合物提取包括结合图的拓扑结构信息、关系的可信度和络合物内蛋白质相似程度在内的特征,结合机器学习模型抽取蛋白质复合物。
{{i.achievement_title}}
数据更新时间:2023-05-31
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理
大规模蛋白质相互作用网络中可重叠复合物的识别算法研究
动态蛋白质网络复合物识别方法研究及其应用
多源信息融合的蛋白质相互作用研究及功能模块识别
基于蛋白质二级结构的蛋白质相互作用及网络的研究