文档图像信息提取已成为当前金融、统计、物流、数据加工等行业海量文档自动分析、处理与生产的关键内容之一。针对文档数量巨大、图像版面复杂、票据种类多、图像质量差异大、噪声干扰严重等特点,本项目提出了基于概率图模型的大量复杂文档图像信息提取方法及应用技术。首先,提出了半状态嵌入式条件随机场方法,以统一的概率图模型表示信息信息区域实体之间的相互结构关系,通过自动学习,引入"半状态"来建立稳定的区域状态间物理逻辑和语义逻辑关系。其次,结合多种正则化优化,构建基于稀疏学习的条件随机场特征选择方法,来选择稳定、互补、有效的特征。最后,提出了一种可行的大量复杂文档图像信息提取应用技术方案。本课题的研究成果在机器学习、模式识别、文字识别等方面具有较大的理论意义,对大规模文档图像分析与识别技术具有极其重要的实用价值,对我国数据加工产业、服务外包产业和信息化等发展具有较大的推动作用。
文档图像信息提取已成为当前金融与物流、数据加工、图像与视频检索等领域海量文档/图像自动分析、处理与生产的关键内容之一。针对文档数量巨大、图像版面复杂、噪声干扰严重等特点,本项目提出了基于概率图模型和尺度学习的大量复杂文档图像信息提取及文本检测方法及应用技术。一方面,针对大量金融票据图像,研制了基于条件随机场的票据文档图像信息提取方法,通过自动学习和正则化优化,以统一的条件随机场表示信息区域实体之间的相互结构关系,有效的进行文本区域的定位与提取。另一方面,针对复杂自然场景图像,研制了基于尺度学习的场景文本检测方法,通过最大稳定极值区域分析,以统一的自适应聚类与分类框架聚合文本候选块,鲁棒的进行文本的检测与提取。. 总的说来,通过3年的研究,本项目的技术成果主要包括以下方面。首先,提出了两大核心方法:基于条件随机场的票据图像信息提取方法,和基于尺度学习的场景文本检测方法。其次,研制了两大先进技术:大量金融票据图像信息提取技术,和复杂自然场景图像文本检测技术。. 同时,在本项目的资助下,项目组成员共发表24篇SCI/EI/ISTP期刊/会议学术论文,其中SCI论文4篇(含1篇业内顶级期刊IEEE Trans. Pattern Analysis and Machine Intelligence论文)。特别的,项目组研究团队在2013年国际文档分析与识别大会最受关注的Robust Reading Competition竞赛中,荣获“自然场景文本检测”、“网络图片文本检测”、和“网络图片文本提取”三项冠军。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
基于概率图模型的复杂行为识别
基于概率图模型的图像分割方法研究
网络上图像文档的信息提取与检测
融合概率图模型与深度学习的图像序列分类