基于概率图模型的大量复杂文档图像信息提取

基本信息
批准号:61105018
项目类别:青年科学基金项目
资助金额:26.00
负责人:殷绪成
学科分类:
依托单位:北京科技大学
批准年份:2011
结题年份:2014
起止时间:2012-01-01 - 2014-12-31
项目状态: 已结题
项目参与者:周芳,黄小莉,李岩,许茜,纪振瑞,和田田,周文群,吴若凡,都二斌
关键词:
文档分析与识别条件随机场文档信息提取稀疏学习概率图模型
结项摘要

文档图像信息提取已成为当前金融、统计、物流、数据加工等行业海量文档自动分析、处理与生产的关键内容之一。针对文档数量巨大、图像版面复杂、票据种类多、图像质量差异大、噪声干扰严重等特点,本项目提出了基于概率图模型的大量复杂文档图像信息提取方法及应用技术。首先,提出了半状态嵌入式条件随机场方法,以统一的概率图模型表示信息信息区域实体之间的相互结构关系,通过自动学习,引入"半状态"来建立稳定的区域状态间物理逻辑和语义逻辑关系。其次,结合多种正则化优化,构建基于稀疏学习的条件随机场特征选择方法,来选择稳定、互补、有效的特征。最后,提出了一种可行的大量复杂文档图像信息提取应用技术方案。本课题的研究成果在机器学习、模式识别、文字识别等方面具有较大的理论意义,对大规模文档图像分析与识别技术具有极其重要的实用价值,对我国数据加工产业、服务外包产业和信息化等发展具有较大的推动作用。

项目摘要

文档图像信息提取已成为当前金融与物流、数据加工、图像与视频检索等领域海量文档/图像自动分析、处理与生产的关键内容之一。针对文档数量巨大、图像版面复杂、噪声干扰严重等特点,本项目提出了基于概率图模型和尺度学习的大量复杂文档图像信息提取及文本检测方法及应用技术。一方面,针对大量金融票据图像,研制了基于条件随机场的票据文档图像信息提取方法,通过自动学习和正则化优化,以统一的条件随机场表示信息区域实体之间的相互结构关系,有效的进行文本区域的定位与提取。另一方面,针对复杂自然场景图像,研制了基于尺度学习的场景文本检测方法,通过最大稳定极值区域分析,以统一的自适应聚类与分类框架聚合文本候选块,鲁棒的进行文本的检测与提取。. 总的说来,通过3年的研究,本项目的技术成果主要包括以下方面。首先,提出了两大核心方法:基于条件随机场的票据图像信息提取方法,和基于尺度学习的场景文本检测方法。其次,研制了两大先进技术:大量金融票据图像信息提取技术,和复杂自然场景图像文本检测技术。. 同时,在本项目的资助下,项目组成员共发表24篇SCI/EI/ISTP期刊/会议学术论文,其中SCI论文4篇(含1篇业内顶级期刊IEEE Trans. Pattern Analysis and Machine Intelligence论文)。特别的,项目组研究团队在2013年国际文档分析与识别大会最受关注的Robust Reading Competition竞赛中,荣获“自然场景文本检测”、“网络图片文本检测”、和“网络图片文本提取”三项冠军。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

殷绪成的其他基金

批准号:61473036
批准年份:2014
资助金额:83.00
项目类别:面上项目

相似国自然基金

1

基于概率图模型的复杂行为识别

批准号:61572500
批准年份:2015
负责人:张一帆
学科分类:F0210
资助金额:66.00
项目类别:面上项目
2

基于概率图模型的图像分割方法研究

批准号:U1404606
批准年份:2014
负责人:杨关
学科分类:F0210
资助金额:30.00
项目类别:联合基金项目
3

网络上图像文档的信息提取与检测

批准号:60475006
批准年份:2004
负责人:吕岳
学科分类:F0304
资助金额:22.00
项目类别:面上项目
4

融合概率图模型与深度学习的图像序列分类

批准号:61702486
批准年份:2017
负责人:杨双
学科分类:F0605
资助金额:25.00
项目类别:青年科学基金项目