Smart mobile client pushes the demand on text sensing power whose core technique is natural scene text recognition. However, traditional OCR technique is unable to work well on serious degraded characters frequently found in natural scenes. This project will try to recognize degraded characters on grayscale space using convolutional neural network, which try to avoid the second degradation from binarization in traditional character recognition method. Then, recognition robustness will be expected. Meanwhile, to overcome the problem of weak computation power in mobile device, it plans to design character recognition based on mobile cloud computing. Making full use of new computation mode's advantages, new text detection and recognition method are designed to decrease computational load on mobile device. Furthermore, scene text recognition oriented data compression method will be developed to reduce data transmission. By this way, the practicability of mobile character recognition will be enhanced.
智能移动终端的广泛应用催生了人们利用移动终端感知周围场景视觉信息的迫切需求,赋予移动终端文本感知能力是其中重要组成部分,其核心就在于自然场景文字识别技术。针对场景文字中普遍存在退化严重的问题,传统方法不能胜任。本课题拟研究卷积神经网络在灰度字符空间上进行自然场景退化文字的识别,试图避免传统方法基于二值字符识别所带来的二次降质问题,进而提高场景文字识别鲁棒性。同时,为克服移动终端计算能力不足的问题,还将研究适合于移动云计算模式的场景文字识别系统。利用新计算模式的特点,研究新的文本检测和识别方法与流程,降低移动终端计算负荷,并通过面向场景文字识别的数据压缩方法减少数据传输量,最终提高移动终端识别文字的实用性。
为了提高移动终端文本感知能力和技术实用性,本项目在文档图像压缩、文本检测与抽取以及文字识别等方面开展了研究工作,并取得了一系列研究成果。其中,所提出的面向应用的ROI图像压缩方法,将应用相关的学习机制纳入图像压缩方法框架中,能显著改善特定应用下跨图像压缩质量的稳定性,对于提高移动云计算模式下的图像应用的实际性能具有现实意义。所提出的基于子结构学习的文本识别方法,通过引入子结构识别信息,增强了字符分割片段识别可靠性,显著提高了中文文本识别的性能,表现出优异的性能和对应用场景的技术推广性,是一条改善中文文本识别的新途径。所提出的基于多阶段特征的卷积神经网络字符识别方法,结合Lp-pooling参数优化,有效改善了场景文字的识别精度。这些研究成果,对于移动终端文字识别技术水平的整体改善具有积极意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
基于全模式全聚焦方法的裂纹超声成像定量检测
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
移动云计算中基于资源感知的动态负载迁移策略研究
移动云计算环境下QoE驱动的HAS融合视频直播方法研究
移动云计算环境下协同资源迁移机制研究
移动云计算环境下密码计算可证安全负载迁移研究