基于深度学习的带有相似性约束的机器人视觉语义联合表示模型研究

基本信息
批准号:61673115
项目类别:面上项目
资助金额:62.00
负责人:张立伟
学科分类:
依托单位:福州大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:胡步发,陈爱华,邹诚,朱明珠,颜培清,陈晨,谢发勤
关键词:
视觉语义联合表示词向量相似性约束深度学习
结项摘要

For mobile robot perception in dynamic environments, multimodal joint features are difficult to find since they are different regarding their data size and metrics. The aims of this project are to build word representation and to build deep learning based Multimodal Deep Boltzmann Machine model with similarity constraint.The robot performance will be improved by mapping model from visual space to semantic space.First,by transforming the task and experiences text information into vector,the similarity metric problem will be transformed to a linear programming problem.Second,the Bimodal Deep Boltzmann Machine model with similarity constraint will be built and trained to solve the joint representation problem.Finally,by adding similarity constraint,the visual information is projected into the semantic space so that robot performance will be improved and robust.The main advantages of our models are that 1) the text information can be transformed to vector in the semantic space and 2) it can be easily trained, compared by semantic similarity, and be jointly represented.The research will impact on robot learning, multi-source multimedia, commercial big data and so on.

在移动机器人感知领域,多模态联合表示由于数据维度和度量不同而难于寻找其联合特征。本项目以深度多模玻尔兹曼机以及词向量方法为理论基础,探讨如何利用相似性约束实现视觉和文本信息双模态联合表示,同时利用视觉到语义空间的映射模型,降低机器人执行任务过程中的不确定性,提高任务执行成功率和鲁棒性。首先,通过将文本的经验知识转化为词向量,将任务与经验知识之间的相似性问题转换为线性规划问题求解。其次,通过带有相似性约束的多模深度玻尔兹曼机模型,解决连续输入值情况下的视觉语义多模态联合表示问题。最后,通过构造高维图像空间到语义空间的映射模型,增加相似性约束,减少机器人对环境感知的不确定性,提高执行任务成功率和鲁棒性。该方法优点是将文本信息转换为向量空间中的向量,并可比较语义相似性,实现视觉语义信息联合表示。项目研究结果可以用于移动机器人平台,多源媒体,商业大数据领域的多模态联合表示。

项目摘要

在移动机器人感知领域,多模态联合表示由于数据维度和度量不同而难于寻找其联合特征。本项目针对视觉信息和文本信息的联合表示展开研究。..(1)利用词向量模型将文本信息转换为可以进行相似性衡量的词向量。进一步,可以将机器人的任务转换为优化问题求解。同时,将视觉的识别算法,与词向量的文本任务进行结合,增加相似性约束,减少机器人对环境感知的不确定性,提高执行任务成功率和鲁棒性。..(2)搭建实验场景,验证算法可行性。基于项目任务,我们搭建了“倒饮料”场景,并在仿真和真实情况下,基于PR2机器人进行了测试。类似地,我们建立了“清理餐桌”场景,其中规定机器人要按照一定用餐礼仪实现餐桌清理,如,机器人要识别是否客人用餐完毕,桌子上面是否有剩余餐具等等。桌子上标记有不同区域,使得我们能够测试机器人是否成功完成任务。..(3)基于改进的SiamRPN算法,在室内室外等典型场景实现算法验证。..(4)基于改进的YOLOv3物体识别算法,在Fetch机器人上实现目标物体识别、抓取、搬运、放下。..目前共发表SCI、EI论文10篇,出版专著2部,培养研究生5人,其中3人已经顺利毕业,2人在读。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
5

基于分形维数和支持向量机的串联电弧故障诊断方法

基于分形维数和支持向量机的串联电弧故障诊断方法

DOI:
发表时间:2016

张立伟的其他基金

批准号:61105130
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目
批准号:41601182
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:41871187
批准年份:2018
资助金额:60.00
项目类别:面上项目

相似国自然基金

1

基于深度特征语义感知视觉字典学习的联合图像分类及对象定位方法研究

批准号:61806028
批准年份:2018
负责人:谢昱锐
学科分类:F0604
资助金额:22.00
项目类别:青年科学基金项目
2

基于大数据深度语义表示学习的农业智能问答研究

批准号:31771677
批准年份:2017
负责人:陈雷
学科分类:C1301
资助金额:62.00
项目类别:面上项目
3

基于快速视觉注意模型和深度学习的视觉跟踪

批准号:61401463
批准年份:2014
负责人:黎万义
学科分类:F0117
资助金额:27.00
项目类别:青年科学基金项目
4

基于深度学习的层次化视觉注意模型研究

批准号:61202328
批准年份:2012
负责人:王威
学科分类:F0605
资助金额:24.00
项目类别:青年科学基金项目