Text Information in complex natural scenery image is the key to understand the natural scene. At present, it is still a hard problem to deal with the images with the uneven illumination, complex background or discontinuous text edge to use text information detection and segmentation technology. This project is based on the automatic multi-threshold segmentation technique, visual attention model, Bayesian forecasting method and particle swarm optimization algorithms (PSOs); the main content are as followed: (1) we plan to design the accelerating operators for Particle Swarm Optimization (PSO), in order to improve the computational efficiency; (2) we research how the number of thresholds is selected automatically according to different natural scenes; design more efficient automatic threshold segmentation technology based on sampling mechanism and PSO to transform image enhancement, highlight the edge details of the text, eliminate uneven illumination, remove the background and noise of an image, etc. (3) we plan to propose improved visual attention models based on Itti model and other visual attention models, they will get more accurate and clear text bounds; (4) non-text regions can be removed according to the stroke-connected graph, and text information can be extracted effectively by using the geometrical feature analysis and a PSO threshold segmentation method. This study has important significance in theory and application of image search, image understanding, and so on.
目前场景文本信息提取技术尚存在对光照不均匀图像敏感、易受复杂背景干扰和依赖文本边缘信息是否完整等缺陷。本课题以自动多阈值分割技术和视觉注意模型为基础,结合贝叶斯预测方法和粒子群算法(PSO),研究内容为:基于对粒子群算法群体行为的动态统计、控制参数对优化结果的影响、优化过程的不同阶段对控制参数的变化需求的分析,探索粒子群算法控制参数随种群进化的历史信息而自适应调整的策略;基于PSO和人眼视觉采样机制,设计高效的自动多阈值分割方法对图像进行增强变换以增强文本边界细节、消除光照不均现象、去除图像背景和噪声等;基于Itti等视觉注意模型的最新研究进展,提出一种高效的针对图像文本检测的注意模型检测文本边界,采用提出的改进PSO对文本边界进行连通与优化以得到更准确和清晰的边界;基于提取的文本笔画宽度实现对文本候选区域的准确检测,利用笔画宽度连通图启发性规则和基于PSO的阈值分割提取文本信息。
研究基本按照原计划执行,研究内容的侧重点稍作调整。所做的工作主要是关于新的智能算法的研究和灰度图像分割、彩色图像分割,图像文本信息检测。.研究了粒子群算法中某些重要控制参数随种群进化情况和产生的历史信息而自适应的调整策略与理论分析,完善了贝叶斯型进化算法,并把它应用于彩色图像分割领域。一种基于梯度和静态步长策略的进化算法已经基本研究成功,并且成果应用于函数优化和彩色图像分割领域;其中,针对不同的应用问题设计相应的动态步长策略的研究也在进行中。此外,项目组还尝试使用混沌系统生成智能算法的种群,结合五行理论和粒计算思想研究如何设计智能算法的操作算子,以提高智能算法的搜索效率。该研究对推动新的智能算法的发展和智能算法求解效率的提高有一定的意义。.结合人眼视觉采样机制,研究如何有效获取带有文本信息的场景图像中的样本与样本优化策略,使得获取的样本更能代表实际图像情况。该研究也为图像自动多阈值分割问题中阈值数目自动选择的准确性和快速性问题提供一种解决方案。.针对带有文本信息的图像特点,基于ITTI等视觉注意模型的研究提出一种针对图像文本检测的视觉注意模型,试图通过该模型能高效地获得文本信息显著图和比较精确的文本边界,项目组针对此问题,反复研究测试,但其效果还需改善。.传统边界检测算法中所存在的检测模板中系数固定缺乏一定的可调性和阈值选取盲目性的缺点问题。针对这个问题,项目组正在反复试验研究一种最佳模板系数和边界优化阈值的自动选取算法以更好地解决文本边界优化问题。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
基于SSVEP 直接脑控机器人方向和速度研究
内点最大化与冗余点控制的小型无人机遥感图像配准
中国参与全球价值链的环境效应分析
基于多模态信息特征融合的犯罪预测算法研究
基于全局阈值分割和局部聚类的自然图像超像素分割技术研究
基于多信息融合的自然场景图像中的文本检测和识别方法研究
面向复杂场景图像分割的多模态驱动型水平集方法研究
近景摄影测量中的自动图像分割技术