新疆民族多语种场景文本检测方法研究

基本信息

批准号：61603323

项目类别：青年科学基金项目

资助金额：17.00

负责人：周刚

学科分类：

依托单位：新疆大学

批准年份：2016

结题年份：2019

起止时间：2017-01-01 - 2019-12-31

项目状态：已结题

项目参与者：刘亚军,胡英,余银峰,石飞,程金盈

关键词：

层次组织有序传播多语种文本场景文本检测协同认知

结项摘要

According characteristics of Xinjiang, the project focuses on Xinjiang nationality multi-script scene text detection method research for the demand of multi-script character recognition and machine translation. Based on the human visual hierarchical cognitive mechanism, the project researches on the hierarchical organization and coordinating cognition for the multi-script text visual object, which combines the visual information and the task-based information, and apply to the multi-script scene text detection. Three contributions are given in this project: 1) combining the detection task and the scene images, the project organizes the multi-script scene text into multilayer visual representations. 2) Through the ordered propagation in multilayer cognition, the project provides a novel solution for the information transmission on the hierarchical visual objects. 3) The assumption on the cognitive consistency overcomes the problem of parameter estimation under complex ordered structures. The technology for the project has important practical application value for the research on the multi-ethnic text machine translation system and visual handle devices, and is necessary for economic prosperity，regional stability and national unity in Xinjiang.

本项目根据新疆地区特点，针对多民族文字自动识别和机器翻译需求，研究新疆民族多语种场景文本图像检测方法。在方法上引入人类视觉层次认知机理，研究民族多语种文本视觉对象的分层组织和协同认知，把底层视觉信息与检测任务先验结合，解决多语种文本对象的鲁棒检测问题。其主要特点：1）将文本检测任务与场景图像结合，实现多语种文本视觉对象的多层次表示；2）层次间的认知结果有序传播，统一了不同视觉尺度的认知信息传递；3）对认知一致性假设，有效克服了复杂组织结构下参数难以估计的问题。本项目技术对新疆民族文字机器翻译系统、文字翻译视觉手持设备等研发具有重要的实际应用价值，是繁荣新疆经济、加强地区稳定和维护民族团结所需要的文字信息处理技术。

项目摘要

本项目开展文字自动识别和机器翻译的相关研究。在方法上引入人类视觉层次认知机理，研究文本视觉对象的分层组织和协同认知。其主要研究内容有：1）提出文本视觉对象的层次组织生成方法。我们开展了后处理文本视觉对象组织研究，在多个候选回归框中通过排序滤波方法来获取具有相关性的回归框，并在高斯分布的假设前提下来融合这些回归框。我们的这种方法，不需要通过数据进行训练，也无需加入新的网络结构，可以直接嵌入到任何一种目标检测框架中。2）提出层次间的认知有序传播，实现不同层次之间的信息互通。通过研究注意机制，将不同通道的特征图进行信息传播，实现特征图之间的协同，保证了场景文本显著性特征的提取。3）提出认知协同计算方法，在优化和参数估计方面取得突破。我们研究了基于集成学习的文本分类算法，通过对五种基分类器进行两种集成学习框架的分析，发现集成学习的策略可以优化整体性能。4）采集标注场景文本图像数据库并开发相关标注软件。我们采集并精选了500幅图像进行标注，标注内容细化成不同语种、连通成分等等。后续研究中，为了降低标注的成本，我们研究了基于手机端的半自动标注方法。通过指尖划动的方式，只需要大致标注出首尾两个点获取图像中大致的文字区域，并通过半自动化分析的方式，即连通成分提取和分析进一步获取最终精确的文字区域。综上所述，本研究为探究文字自动识别和机器翻译奠定了一定的基础，并为层次认知模型提供了重要的启示。项目主要贡献有EI检索论文1篇，核心期刊论文1篇，录用国际会议论文1篇，软件著作权1项,培养两名在读硕士研究生。项目投入经费17万元，支出2.412583万元，各项支出与预算相符，剩余经费14.054884万元将用于计划后续支出。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：

发表时间：2019

DOI：10.16383/j.aas.c180673

发表时间：2021

DOI：10.7641/CTA.2018.70969

发表时间：2018

DOI：10.16066/j.1672-7002.2021.06.013

发表时间：2021

周刚的其他基金

批准号：51109194

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：51204103

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：11764009

批准年份：2017

资助金额：45.00

项目类别：地区科学基金项目

批准号：30973311

批准年份：2009

资助金额：31.00

项目类别：面上项目

批准号：51474139

批准年份：2014

资助金额：85.00

项目类别：面上项目

批准号：10904154

批准年份：2009

资助金额：23.00

项目类别：青年科学基金项目

批准号：81170972

批准年份：2011

资助金额：60.00

项目类别：面上项目

批准号：11174167

批准年份：2011

资助金额：60.00

项目类别：面上项目

批准号：81371147

批准年份：2013

资助金额：70.00

项目类别：面上项目

批准号：21674023

批准年份：2016

资助金额：68.00

项目类别：面上项目

批准号：31770091

批准年份：2017

资助金额：55.00

项目类别：面上项目

批准号：81771080

批准年份：2017

资助金额：56.00

项目类别：面上项目

批准号：10404016

批准年份：2004

资助金额：21.00

项目类别：青年科学基金项目

批准号：10774084

批准年份：2007

资助金额：33.00

项目类别：面上项目

批准号：30572041

批准年份：2005

资助金额：27.00

项目类别：面上项目

批准号：50903020

批准年份：2009

资助金额：20.00

项目类别：青年科学基金项目

批准号：51774198

批准年份：2017

资助金额：60.00

项目类别：面上项目

批准号：31500036

批准年份：2015

资助金额：23.00

项目类别：青年科学基金项目

批准号：51273045

批准年份：2012

资助金额：80.00

项目类别：面上项目

批准号：11772269

批准年份：2017

资助金额：56.00

项目类别：面上项目

相似国自然基金

维吾尔文自然场景文本检测与识别方法研究

批准号：61662082

批准年份：2016

负责人：刘战东

学科分类：F0605

资助金额：40.00

项目类别：地区科学基金项目

面向社交媒体的多语种文本情感分析方法研究

批准号：61806038

批准年份：2018

负责人：徐琳宏

学科分类：F0606

资助金额：25.00

项目类别：青年科学基金项目

基于跟踪的多方向场景文本检测

批准号：61806017

批准年份：2018

负责人：田澍

学科分类：F0605

资助金额：27.00

项目类别：青年科学基金项目

基于多信息融合的自然场景图像中的文本检测和识别方法研究

批准号：61305004

批准年份：2013

负责人：王大寒

学科分类：F0605

资助金额：25.00

项目类别：青年科学基金项目

新疆民族多语种场景文本检测方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

妊娠对雌性大鼠冷防御性肩胛间区棕色脂肪组织产热的影响及其机制

基于主体视角的历史街区地方感差异研究———以北京南锣鼓巷为例

二维FM系统的同时故障检测与控制

具有随机多跳时变时延的多航天器协同编队姿态一致性

组蛋白去乙酰化酶在变应性鼻炎鼻黏膜上皮中的表达研究

周刚的其他基金

弯曲河流时空演变数值模拟及自然裁弯机理研究

综放工作面非稳态脉冲粉尘团产生机理及逸散规律基础理论研究

Bi2Se3、Bi2Te3和Sb2Te3纳米膜的电声输运机制及热电性能的调控研究

B7-H1/PD-1信号对口腔扁平苔藓T细胞活化的负性调控效应研究

基于微观分子结构特性的煤尘润湿机理基础研究

热声过程的行驻波机理分析及实验研究

炎症相关性microRNA对口腔扁平苔藓CD4+T细胞功能的调控效应研究

衬底作用下石墨烯的缺陷和输运性质的理论研究

T细胞自噬在口腔扁平苔藓中的作用及其调控机制的研究

具有无色/彩色/近红外电致变色效应的二吡咯酮聚合物研究

魏氏柠檬酸杆菌外膜蛋白在钙离子促进生物被膜形成中的作用及其机制

Exosome介导的T细胞信息传递在口腔扁平苔藓免疫炎性反应中的作用及机制研究

纳米管线及其阵列电子输运和发射特性的理论研究

基于半导体纳米管线的晶体管等量子器件输运行为的理论研究

口腔扁平苔藓辅助性T细胞的极化及其免疫干预

含氮、硫杂环有机敏化染料的设计、合成及光电性能研究

综采工作面尘雾场离散颗粒流细观污染-凝并机理基础研究

一氧化氮在铜绿假单胞菌对异噻唑啉酮类杀菌剂抗性机制中的分子作用

具有抑制电荷复合功能的吡嗪类有机敏化染料的研制及其光伏性能研究

连续密度梯度复合弹体高超声速侵彻多层间隔钢靶机理

相似国自然基金