面向多模态混合语义相似性查询的可解释嵌入机制研究

基本信息
批准号:61802116
项目类别:青年科学基金项目
资助金额:24.00
负责人:朱命冬
学科分类:
依托单位:河南工学院
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:徐立新,任刚,杨文志,李娜,王镇威,杜俊良
关键词:
异构数据实体搜索数据编码语义搜索个性化推荐
结项摘要

The Internet is consisted of plentiful multi-modal data, and these data contain a great deal of valuable information. Hence, an efficient query method to acquire hybrid semantic similarities from the multi-modal data is required, especially in the field of information retrieval and data management. However, at present, the embedding mechanisms of the existing methods have some limitations, due to difficulties such as the high complexity of latent semantics, the low interpretability of data representation learning, the low amount of tagged data and the low efficiency of large-scale dataset query. To address this problem, the project will study the embedding mechanism with semantic integrity and interpretability by analyzing multi-modal data features, so that an efficient and accurate hybrid semantic similarity query model can be proposed. The main research contents include the following three subjects in order to achieve the semantic integrity, interpretability, adaptability and efficiency of hybrid semantic similarity queries. First, an embedded representation model with semantic integrity and interpretability will be constructed. Second, a training model based on semi-supervised learning will be proposed. Third, a hybrid semantic similarity query model and its indexing method will be designed. The research results will provide valuable theoretical innovations and systematic guidance to heterogeneous data query management with broad prospects.

互联网中存在着大量的多模态数据,其中蕴含着大量有价值的信息。对多模态数据进行信息检索和数据管理时,需要一种高效的混合语义相似性查询方法。然而,针对当前多模态数据中隐含语义复杂性高,数据表示学习模型可解释性低、标签数据量少、面向大规模数据集查询效率低等问题,现有的面向混合语义相似性查询的嵌入机制存在一定的局限性。基于此,本项目通过分析多模态数据特征,研究面向多模态数据的嵌入表示学习模型,进而设计高效准确的相似性查询模型。项目以实现混合语义相似性查询的语义完整性、可解释性、适应性和高效性为研究目的,其主要研究内容是:首先构建具有语义完整性和可解释性的嵌入表示模型,其次探讨基于半监督学习的训练模型,最后设计混合语义相似性查询模型和索引方法。该研究成果将为异构数据查询管理提供有价值的理论创新和系统性的指导方法,具有广阔前景。

项目摘要

互联网中存在着大量的多模态数据,对多模态数据进行信息检索和数据管理时,需要一种高效的混合语义相似性查询方法。本课题的目标是要解决多模态混合语义相似性计算的问题。该目标主要包含了两个层面,一是准确的多模态语义分析,构建统一的混合语义空间;二是面对大规模数据和高维数据特征时,可以进行高性能的相似性计算。因此,在本课题计划执行过程中,涉及统一语义构建、跨语义查询转换、多模态数据获取与预处理、大数据分析平台构建、复杂数据特征提取的深度学习网络架构构建等。.三年来,本课题组在多粒度图像文本的深度学习语义嵌入模型方面进行研究,以支持统一语义空间构建;在自然语言查询转SQL语句方面进行研究,以支持可解释的高速查询;在图像中的文字识别方面进行研究,以支持具有连续语义关联的OCR识别;在分布式环境下跨模态查询架构方面进行研究,以支持具有可扩展性的跨模态查询架构的构建;在基于云平台的文本情感分析方面的研究,以支持可交互的分布式情感分析平台的构建;在生物信息蛋白质溶解性分析应用和电极纤维纳米流道结构分析等跨领域应用方面的研究,以支持验证神经网络架构的通用性。.本项目应用数据库、数据挖掘、人工智能等理论,在跨模态查询、语义嵌入、可解释查询、大数据架构与算法、跨领域应用等方面取得了相应的研究成果。在国内外各种学术会议和期刊上发表了学术论文13篇(不包括仅录用未发表和未标注者),其中被SCI收录3篇次,EI收录4篇次。申请发明专利3项(其中1项已授权),获得软件著作权1项。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018
4

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
5

多空间交互协同过滤推荐

多空间交互协同过滤推荐

DOI:10.11896/jsjkx.201100031
发表时间:2021

朱命冬的其他基金

相似国自然基金

1

多尺度空间场景相似性查询及其松弛化反馈机制研究

批准号:41401443
批准年份:2014
负责人:陈占龙
学科分类:D0114
资助金额:25.00
项目类别:青年科学基金项目
2

面向大规模带注释语义知识的高效查询算法研究

批准号:61402173
批准年份:2014
负责人:王昊奋
学科分类:F0607
资助金额:24.00
项目类别:青年科学基金项目
3

基于语义的农业多模态数据深度解析机制研究

批准号:31601218
批准年份:2016
负责人:邓寒冰
学科分类:C1301
资助金额:20.00
项目类别:青年科学基金项目
4

基于多模态融合机制的视频语义表征方法研究

批准号:61702313
批准年份:2017
负责人:侯素娟
学科分类:F0210
资助金额:25.00
项目类别:青年科学基金项目