句子语义的视觉表示研究

基本信息
批准号:90920006
项目类别:重大研究计划
资助金额:50.00
负责人:王小捷
学科分类:
依托单位:北京邮电大学
批准年份:2009
结题年份:2012
起止时间:2010-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:任福继,周延泉,李蕾,李睿凡,李霞,邹永忠,刘咏彬,江会星,张碧川
关键词:
基于视觉信息的词汇语义表示图像-语言描述对对齐图像特征
结项摘要

认知科学的研究表明,人类在语言习得过程中,其他认知通道(如视觉)的信息具有重要的辅助作用。探索利用其他认知通道的信息辅助进行语言计算,有助于更深刻地理解人类语言处理的机制,为自然语言处理研究提供新的材料和思路,也为像基于语言命令的车辆自动驾驶这样一些需要多模态信息协同工作的任务提供合适的解决方法。本项目从人类语言认知发展的机理出发,研究如何在视觉信息的基础上建立语言的意义,力图在基于图像的汉语词汇习得和表示理论及关键技术上有所突破。项目着重研究基于图像-文本描述对的范畴化词汇聚类技术、视觉对象和描述词汇间的对齐和表示抽取技术、对象时空关系对齐和抽取技术,以抽取各类汉语词汇基于视觉信息的语义表示;研究针对描述对象间时空关系的句子语义分析技术,以抽取对象间时空关系的视觉语义描述;结合这些技术,实现一个可以为句子语义生成图像描述的原型系统,在基于语言命令的车辆自动驾驶任务中进行演示验证。

项目摘要

认知科学的研究表明,人类在语言习得过程中,视觉通道的信息具有重要的辅助作用,许多语言信息源于视觉感知,即所谓语言的视觉接地。本项目研究在视觉信息的基础上建立语言的意义,取得了如下成果:. 提出了一个基于图像信息的词汇语义习得模型ViMac。该模型建立了基于静态图像信息的词汇意义习得和表示方法,该方法主要关注名词、形容词和方位词。模型的核心部分包括基于Hellinger距离的语义关联度计算、基于混合度量的词聚类、基于多维Hellinger距离的视觉特征选择以及空间方向关系的形式化描述与模糊判定,由此来实现视觉特征和语言词汇的对应。进而,为了能对新图像特征值进行语言描述,提出了一种基于核心成分的视觉语义表征,基于这种表征方法提出了面向新图像特征值描述的复合词生成算法,该算法可生成训练数据中未出现到的复合词以描述训练集中未出现的新图像特征值。在此基础上,实现了一个为静态图像自动生成自然语言描述的系统。. 提出了一个基于视频信息的动词词汇语义习得模型ViMac-V。针对动词的特点,项目采用框架+论元的语言学结构来构建基于视频特征的动词语义,利用框架来组织视频情景中运动的各种认知属性,而论元则被框架支配来实现对具体运动属性的描述。项目首先基于视觉特征与词共现信息、词性信息以及最小编辑距离进行论元的词类划分,并利用二元语法模型进行动词框架的提取。进而,通过构建自组织神经网络组来实现动词语义与视频信息的关联。其中,基于学习矢量量化的框架激活机制将视频所凸显的反映运动信息的各属性结构与动词框架相关联;而对论元则通过SOM网络将其在视觉空间中范畴化。范畴化后的SOM网络连接了高维视频特征分布和论元词汇,再通过框架支配各个带词汇化标签的SOM子网络,组成不同的动词视觉语义。在此基础上,实现了一个为视频自动生成自然语言描述的系统。. 完成的ViMac和ViMac-V模型已经部署在机器人平台上。同时,也在模型车上实现了一个基于自然语言指令的车辆行驶控制演示系统,模型车能依据自然语言指令行驶。. 除了基于认知的语言接地的上述工作,基于语言意义习得的发展性,即语言意义是从儿童时起按某种特定顺序逐步习得的,视觉信息在语言发展中可以为儿童语言习得提供先验知识,本项目同时研究了基于儿童语言习得机理的语言习得计算模型,提出了一种阶段性儿童语言习得模型。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

王小捷的其他基金

批准号:61273365
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:11671405
批准年份:2016
资助金额:48.00
项目类别:面上项目
批准号:11301550
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

面向多媒体语义理解的视觉特征表示方法研究

批准号:61772275
批准年份:2017
负责人:李泽超
学科分类:F0605
资助金额:61.00
项目类别:面上项目
2

句子阅读中语义整合的神经机制

批准号:31100811
批准年份:2011
负责人:朱祖德
学科分类:C0907
资助金额:24.00
项目类别:青年科学基金项目
3

基于句子语义结构的统计机器翻译研究

批准号:61401295
批准年份:2014
负责人:李军辉
学科分类:F0113
资助金额:25.00
项目类别:青年科学基金项目
4

融合句子级结构与语义的神经机器翻译研究

批准号:61876120
批准年份:2018
负责人:李军辉
学科分类:F0606
资助金额:62.00
项目类别:面上项目