基于自动多阈值分割技术的复杂自然场景图像文本信息检测与分割

基本信息
批准号:61702118
项目类别:青年科学基金项目
资助金额:26.00
负责人:姜允志
学科分类:
依托单位:广东技术师范大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:Wei-Chang Yeh,林正春,梁鹏,林耿香,宋智华
关键词:
视觉注意模型文本检测文本分割自动多阈值分割粒子群算法
结项摘要

Text Information in complex natural scenery image is the key to understand the natural scene. At present, it is still a hard problem to deal with the images with the uneven illumination, complex background or discontinuous text edge to use text information detection and segmentation technology. This project is based on the automatic multi-threshold segmentation technique, visual attention model, Bayesian forecasting method and particle swarm optimization algorithms (PSOs); the main content are as followed: (1) we plan to design the accelerating operators for Particle Swarm Optimization (PSO), in order to improve the computational efficiency; (2) we research how the number of thresholds is selected automatically according to different natural scenes; design more efficient automatic threshold segmentation technology based on sampling mechanism and PSO to transform image enhancement, highlight the edge details of the text, eliminate uneven illumination, remove the background and noise of an image, etc. (3) we plan to propose improved visual attention models based on Itti model and other visual attention models, they will get more accurate and clear text bounds; (4) non-text regions can be removed according to the stroke-connected graph, and text information can be extracted effectively by using the geometrical feature analysis and a PSO threshold segmentation method. This study has important significance in theory and application of image search, image understanding, and so on.

目前场景文本信息提取技术尚存在对光照不均匀图像敏感、易受复杂背景干扰和依赖文本边缘信息是否完整等缺陷。本课题以自动多阈值分割技术和视觉注意模型为基础,结合贝叶斯预测方法和粒子群算法(PSO),研究内容为:基于对粒子群算法群体行为的动态统计、控制参数对优化结果的影响、优化过程的不同阶段对控制参数的变化需求的分析,探索粒子群算法控制参数随种群进化的历史信息而自适应调整的策略;基于PSO和人眼视觉采样机制,设计高效的自动多阈值分割方法对图像进行增强变换以增强文本边界细节、消除光照不均现象、去除图像背景和噪声等;基于Itti等视觉注意模型的最新研究进展,提出一种高效的针对图像文本检测的注意模型检测文本边界,采用提出的改进PSO对文本边界进行连通与优化以得到更准确和清晰的边界;基于提取的文本笔画宽度实现对文本候选区域的准确检测,利用笔画宽度连通图启发性规则和基于PSO的阈值分割提取文本信息。

项目摘要

研究基本按照原计划执行,研究内容的侧重点稍作调整。所做的工作主要是关于新的智能算法的研究和灰度图像分割、彩色图像分割,图像文本信息检测。.研究了粒子群算法中某些重要控制参数随种群进化情况和产生的历史信息而自适应的调整策略与理论分析,完善了贝叶斯型进化算法,并把它应用于彩色图像分割领域。一种基于梯度和静态步长策略的进化算法已经基本研究成功,并且成果应用于函数优化和彩色图像分割领域;其中,针对不同的应用问题设计相应的动态步长策略的研究也在进行中。此外,项目组还尝试使用混沌系统生成智能算法的种群,结合五行理论和粒计算思想研究如何设计智能算法的操作算子,以提高智能算法的搜索效率。该研究对推动新的智能算法的发展和智能算法求解效率的提高有一定的意义。.结合人眼视觉采样机制,研究如何有效获取带有文本信息的场景图像中的样本与样本优化策略,使得获取的样本更能代表实际图像情况。该研究也为图像自动多阈值分割问题中阈值数目自动选择的准确性和快速性问题提供一种解决方案。.针对带有文本信息的图像特点,基于ITTI等视觉注意模型的研究提出一种针对图像文本检测的视觉注意模型,试图通过该模型能高效地获得文本信息显著图和比较精确的文本边界,项目组针对此问题,反复研究测试,但其效果还需改善。.传统边界检测算法中所存在的检测模板中系数固定缺乏一定的可调性和阈值选取盲目性的缺点问题。针对这个问题,项目组正在反复试验研究一种最佳模板系数和边界优化阈值的自动选取算法以更好地解决文本边界优化问题。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
4

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
5

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018

姜允志的其他基金

相似国自然基金

1

基于全局阈值分割和局部聚类的自然图像超像素分割技术研究

批准号:61502065
批准年份:2015
负责人:龙建武
学科分类:F0210
资助金额:20.00
项目类别:青年科学基金项目
2

基于多信息融合的自然场景图像中的文本检测和识别方法研究

批准号:61305004
批准年份:2013
负责人:王大寒
学科分类:F0605
资助金额:25.00
项目类别:青年科学基金项目
3

面向复杂场景图像分割的多模态驱动型水平集方法研究

批准号:61672204
批准年份:2016
负责人:王晓峰
学科分类:F0210
资助金额:59.00
项目类别:面上项目
4

近景摄影测量中的自动图像分割技术

批准号:11071270
批准年份:2010
负责人:王美清
学科分类:A0504
资助金额:30.00
项目类别:面上项目