基于跨媒体语义关联模型的图像检索技术研究

基本信息

批准号：61305047

项目类别：青年科学基金项目

资助金额：25.00

负责人：秦曾昌

学科分类：

依托单位：北京航空航天大学

批准年份：2013

结题年份：2016

起止时间：2014-01-01 - 2016-12-31

项目状态：已结题

项目参与者：李阳,黄丕培,廖仁杰,游尊文,于静,从永慧,刘旭

关键词：

贝叶斯模型跨媒体检索主题模型语义关联

结项摘要

How to use the information of associated texts or tags to a given image for content-based image retrieval task is investigated in the proposal.Bag-of-features model and topic models are used to model the image and its associated texts or tags, respectively. The corrleation between these two high-level semantic representations will be studied. Automatic learned topic distributions will be used to label images， that is referred to as semantic annotation. More textual words or tags are provided, more precise semantic representations we can obtain for the given image, as well as improved search quality. Based on such a correlation, we propose a new nonparametric Bayesian model by considering the crowdsoucing effects of the tags. We use a systematic probabilistic generative model to describe such cross-modal semantic correlations. The variational method is used and the updating equations are deduced. The significance of this new correlation model is not only limited to image-text modality, it can be applied to study any cross-modal information correlations.

如何能更好的利用图像附带的文本与标签信息来帮助改善基于内容的图像检索是本项目重点研究的问题。本项目利用"特征包模型"和"主题模型"，分别对图像及其周围文本或标签进行建模，挖掘图像特征与关联文本语义之间的联系。同时提出自动的语义标注模型，获取图像在语义主题上的分布情况。使得在用户提供越多信息的情况下，越能够得到更加准确的检索结果。在此基础上我们提出了一种新的非参数贝叶斯模型来对语义关联中的"众包"特性进行建模。把属于不同媒体的信息的语义关联用一个完整和系统的概率生成模型表达，并给出了该模型的变分推理方法。该模型的重要意义在于可以应用到任何跨媒体的信息关联的建模中，并不只局限于图像和文本。

项目摘要

如何能更好的利用图像附带的文本与标签信息来帮助改善基于内容的图像检索是本项目重点研究的问题。也是跨媒体检索研究的热点问题之一。本项目提出了利用“特征包模型”和“主题模型”，分别对图像及其周围文本或标签进行建模，挖掘图像特征与关联文本语义之间的联系。在此基础上提出了Topic Correlation Model (TCM) 模型，通过与现存的同类方法比较体现出比较好的准确率。同时提出自动的语义标注模型，获取图像在语义主题上的分布情况。使得在用户提供越多信息的情况下，越能够得到更加准确的检索结果。在此基础上我们提出了一种新的非参数贝叶斯模型（NPBUS）来对语义关联中的“众包” 特性进行建模。把属于不同媒体的信息的语义关联用一个完整和系统的概率生成模型表达，并给出了该模型的变分推理方法。该模型的重要意义在于可以应用到任何跨媒体的信息关联的建模中，并不只局限于图像和文本。项目的重要意义在于我们利用不同模态的信息可以建立一个新的语义空间，在这个空间上语义相类似的多模态信息可以聚类，为跨媒体检索提供了新的机器学习模型与相应技术。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：10.16383/j.aas.c180673

发表时间：2021

DOI：

发表时间：2020

DOI：10.11949/0438-1157.20201662

发表时间：2021

DOI：10.12005/orms.2019.0029

发表时间：2019

秦曾昌的其他基金

相似国自然基金

跨媒体语义医学图像检索中关键技术研究

批准号：60873185

批准年份：2008

负责人：吴洪

学科分类：F0210

资助金额：30.00

项目类别：面上项目

跨媒体语义映射与智能检索关键技术研究

批准号：61663004

批准年份：2016

负责人：李志欣

学科分类：F0604

资助金额：40.00

项目类别：地区科学基金项目

基于位置敏感哈希的图像语义检索技术研究

批准号：61301232

批准年份：2013

负责人：彭天强

学科分类：F0113

资助金额：24.00

项目类别：青年科学基金项目

基于生物视觉机制的语义图像检索模型及方法

批准号：60975007

批准年份：2009

负责人：何东健

学科分类：F0604

资助金额：30.00

项目类别：面上项目

基于跨媒体语义关联模型的图像检索技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

二维FM系统的同时故障检测与控制

扶贫资源输入对贫困地区分配公平的影响

LTNE条件下界面对流传热系数对部分填充多孔介质通道传热特性的影响

基于直觉模糊二元语义交互式群决策的技术创新项目选择

秦曾昌的其他基金

相似国自然基金