移动云计算模式下的场景文本感知方法研究

基本信息
批准号:61203259
项目类别:青年科学基金项目
资助金额:24.00
负责人:朱远平
学科分类:
依托单位:天津师范大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:梁颖,王金伟,戴津,袁建亮,连高欣
关键词:
场景文字识别文本感知移动云计算文本检测
结项摘要

Smart mobile client pushes the demand on text sensing power whose core technique is natural scene text recognition. However, traditional OCR technique is unable to work well on serious degraded characters frequently found in natural scenes. This project will try to recognize degraded characters on grayscale space using convolutional neural network, which try to avoid the second degradation from binarization in traditional character recognition method. Then, recognition robustness will be expected. Meanwhile, to overcome the problem of weak computation power in mobile device, it plans to design character recognition based on mobile cloud computing. Making full use of new computation mode's advantages, new text detection and recognition method are designed to decrease computational load on mobile device. Furthermore, scene text recognition oriented data compression method will be developed to reduce data transmission. By this way, the practicability of mobile character recognition will be enhanced.

智能移动终端的广泛应用催生了人们利用移动终端感知周围场景视觉信息的迫切需求,赋予移动终端文本感知能力是其中重要组成部分,其核心就在于自然场景文字识别技术。针对场景文字中普遍存在退化严重的问题,传统方法不能胜任。本课题拟研究卷积神经网络在灰度字符空间上进行自然场景退化文字的识别,试图避免传统方法基于二值字符识别所带来的二次降质问题,进而提高场景文字识别鲁棒性。同时,为克服移动终端计算能力不足的问题,还将研究适合于移动云计算模式的场景文字识别系统。利用新计算模式的特点,研究新的文本检测和识别方法与流程,降低移动终端计算负荷,并通过面向场景文字识别的数据压缩方法减少数据传输量,最终提高移动终端识别文字的实用性。

项目摘要

为了提高移动终端文本感知能力和技术实用性,本项目在文档图像压缩、文本检测与抽取以及文字识别等方面开展了研究工作,并取得了一系列研究成果。其中,所提出的面向应用的ROI图像压缩方法,将应用相关的学习机制纳入图像压缩方法框架中,能显著改善特定应用下跨图像压缩质量的稳定性,对于提高移动云计算模式下的图像应用的实际性能具有现实意义。所提出的基于子结构学习的文本识别方法,通过引入子结构识别信息,增强了字符分割片段识别可靠性,显著提高了中文文本识别的性能,表现出优异的性能和对应用场景的技术推广性,是一条改善中文文本识别的新途径。所提出的基于多阶段特征的卷积神经网络字符识别方法,结合Lp-pooling参数优化,有效改善了场景文字的识别精度。这些研究成果,对于移动终端文字识别技术水平的整体改善具有积极意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
2

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
3

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
4

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

朱远平的其他基金

相似国自然基金

1

移动云计算中基于资源感知的动态负载迁移策略研究

批准号:61802181
批准年份:2018
负责人:张强
学科分类:F0204
资助金额:25.00
项目类别:青年科学基金项目
2

移动云计算环境下QoE驱动的HAS融合视频直播方法研究

批准号:61772414
批准年份:2017
负责人:张未展
学科分类:F0207
资助金额:65.00
项目类别:面上项目
3

移动云计算环境下协同资源迁移机制研究

批准号:61672278
批准年份:2016
负责人:李文中
学科分类:F0207
资助金额:65.00
项目类别:面上项目
4

移动云计算环境下密码计算可证安全负载迁移研究

批准号:61462033
批准年份:2014
负责人:谭作文
学科分类:F0206
资助金额:48.00
项目类别:地区科学基金项目