基于概率图模型的大量复杂文档图像信息提取

基本信息

批准号：61105018

项目类别：青年科学基金项目

资助金额：26.00

负责人：殷绪成

学科分类：

依托单位：北京科技大学

批准年份：2011

结题年份：2014

起止时间：2012-01-01 - 2014-12-31

项目状态：已结题

项目参与者：周芳,黄小莉,李岩,许茜,纪振瑞,和田田,周文群,吴若凡,都二斌

关键词：

文档分析与识别条件随机场文档信息提取稀疏学习概率图模型

结项摘要

文档图像信息提取已成为当前金融、统计、物流、数据加工等行业海量文档自动分析、处理与生产的关键内容之一。针对文档数量巨大、图像版面复杂、票据种类多、图像质量差异大、噪声干扰严重等特点，本项目提出了基于概率图模型的大量复杂文档图像信息提取方法及应用技术。首先，提出了半状态嵌入式条件随机场方法，以统一的概率图模型表示信息信息区域实体之间的相互结构关系，通过自动学习，引入"半状态"来建立稳定的区域状态间物理逻辑和语义逻辑关系。其次，结合多种正则化优化，构建基于稀疏学习的条件随机场特征选择方法，来选择稳定、互补、有效的特征。最后，提出了一种可行的大量复杂文档图像信息提取应用技术方案。本课题的研究成果在机器学习、模式识别、文字识别等方面具有较大的理论意义，对大规模文档图像分析与识别技术具有极其重要的实用价值，对我国数据加工产业、服务外包产业和信息化等发展具有较大的推动作用。

项目摘要

文档图像信息提取已成为当前金融与物流、数据加工、图像与视频检索等领域海量文档/图像自动分析、处理与生产的关键内容之一。针对文档数量巨大、图像版面复杂、噪声干扰严重等特点，本项目提出了基于概率图模型和尺度学习的大量复杂文档图像信息提取及文本检测方法及应用技术。一方面，针对大量金融票据图像，研制了基于条件随机场的票据文档图像信息提取方法，通过自动学习和正则化优化，以统一的条件随机场表示信息区域实体之间的相互结构关系，有效的进行文本区域的定位与提取。另一方面，针对复杂自然场景图像，研制了基于尺度学习的场景文本检测方法，通过最大稳定极值区域分析，以统一的自适应聚类与分类框架聚合文本候选块，鲁棒的进行文本的检测与提取。. 总的说来，通过3年的研究，本项目的技术成果主要包括以下方面。首先，提出了两大核心方法：基于条件随机场的票据图像信息提取方法，和基于尺度学习的场景文本检测方法。其次，研制了两大先进技术：大量金融票据图像信息提取技术，和复杂自然场景图像文本检测技术。. 同时，在本项目的资助下，项目组成员共发表24篇SCI/EI/ISTP期刊/会议学术论文，其中SCI论文4篇（含1篇业内顶级期刊IEEE Trans. Pattern Analysis and Machine Intelligence论文）。特别的，项目组研究团队在2013年国际文档分析与识别大会最受关注的Robust Reading Competition竞赛中，荣获“自然场景文本检测”、“网络图片文本检测”、和“网络图片文本提取”三项冠军。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：

DOI：

发表时间：2020

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.11842/wst.20190724002

发表时间：2020

殷绪成的其他基金

批准号：61473036

批准年份：2014

资助金额：83.00

项目类别：面上项目

相似国自然基金

基于概率图模型的复杂行为识别

批准号：61572500

批准年份：2015

负责人：张一帆

学科分类：F0210

资助金额：66.00

项目类别：面上项目

基于概率图模型的图像分割方法研究

批准号：U1404606

批准年份：2014

负责人：杨关

学科分类：F0210

资助金额：30.00

项目类别：联合基金项目

网络上图像文档的信息提取与检测

批准号：60475006

批准年份：2004

负责人：吕岳

学科分类：F0304

资助金额：22.00

项目类别：面上项目

融合概率图模型与深度学习的图像序列分类

批准号：61702486

批准年份：2017

负责人：杨双

学科分类：F0605

资助金额：25.00

项目类别：青年科学基金项目

基于概率图模型的大量复杂文档图像信息提取

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于多色集合理论的医院异常工作流处理建模

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

殷绪成的其他基金

结合前馈和反馈机制的自然场景文本识别技术

相似国自然基金