维吾尔文印刷文档图像中不良信息过滤关键技术研究

基本信息
批准号:61461049
项目类别:地区科学基金项目
资助金额:40.00
负责人:地里木拉提·吐尔逊
学科分类:
依托单位:新疆大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:地里木拉提·吐尔逊,尤努斯·艾沙,阿丽亚·艾孜子,摆雪刚,古丽恰西·哈列勒别克,杨柳,郑洁,塔什甫拉提·尼扎木丁
关键词:
光学字符识别文档图像信息内容安全印刷体维吾尔文不良信息过滤
结项摘要

Facing with the rapid growth of WEB data, how to collect and extract the useful information, how to do the information analysis and understanding, extraction, organization and processing, how to access to the latest information according to specific requirements, how to distinguish the useful information and the sensitive "harmful" information, how to manage the information transmission procedure going through the internet has gradually become the major challenges in current information science and technology. Especially the inside or outside "three forces" take the network as the main information delivering path to extrange ideas, so we must use modern means of science and technology to positioning, forensics, and monitoring the spread of harmful information, and the results of those have the important practical significance to national unity, social stability. This project will take the full investigation of English and Chinese sensitive information monitoring technology, and on the basis of deep learning the new theory, new method and new technology, then combining the Uyghur language characteristics with actual application requirements, will conduct the research of new theory and new technology for collecting Uighur document images from network and preprocessing (document images extraction from webpages, document image structure analysis), key technologies for Uyghur text area localization and extraction from document images ,and variable template matching based keyword detection algorithms ect.

面对迅速增长的WEB数据,如何搜集并从中发现信息,对信息进行分析和理解、提取、组织和处理、如何针对特定的需求获取最新的信息、如何区分有用的信息和不良"有害"信息、如何管理网络信息的传播逐渐成为当前信息科学与技术领域面临的一大挑战。尤其是境、内外"三股势力"将网络信息的传播方式作为内外勾结的主要渠道的今天,必须采用现代科技手段,加以监控不良信息的传播、定位和取证,这对我区民族团结、社会稳定、以及国家的长治久安具有重要的现实意义。本课题在充分调研中、英文不良信息监控技术的新理论、新方法和新技术的基础上,从维吾尔语语言文字特点出发,紧密结合实际应用需求,以理论研究和实证研究相结合的方法开展网页、微信、微博等诸多网络应用中出现的印刷体维吾尔文文档图像的获取,版面结构分析,复杂背景下的文档图像中文本区域定位与提取技术,以及在被分割的文本区域中搜索与匹配关键词语等关键技术研究。

项目摘要

本课题从维吾尔语语言文字的书写特点出发,紧密结合实际应用需求,在印刷体维吾尔文文档图像的预处理,版面结构分析,复杂背景下的文档图像中文本区域定位与提取技术,关键词语的搜索与匹配等关键技术方面开展了探索性研究,得到了初步的研究成果。这种采用现代科技手段加以监控不良信息的传播、定位和取证,对于我区民族团结、社会稳定、以及国家的长治久安具有重要的现实意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
2

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
3

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018
4

感应不均匀介质的琼斯矩阵

感应不均匀介质的琼斯矩阵

DOI:10.11918/j.issn.0367-6234.201804052
发表时间:2019
5

高压工况对天然气滤芯性能影响的实验研究

高压工况对天然气滤芯性能影响的实验研究

DOI:10.11949/0438-1157.20201260
发表时间:2021

地里木拉提·吐尔逊的其他基金

批准号:61263038
批准年份:2012
资助金额:45.00
项目类别:地区科学基金项目
批准号:61063023
批准年份:2010
资助金额:25.00
项目类别:地区科学基金项目

相似国自然基金

1

维吾尔文不良信息过滤关键技术的研究

批准号:61063043
批准年份:2010
负责人:帕力旦·吐尔逊
学科分类:F0205
资助金额:27.00
项目类别:地区科学基金项目
2

网络图像文档过滤中的若干关键问题研究

批准号:60475007
批准年份:2004
负责人:郭军
学科分类:F0605
资助金额:7.00
项目类别:面上项目
3

基于关键词多特征融合的维吾尔文文档图像检索

批准号:61563052
批准年份:2015
负责人:库尔班·吾布力
学科分类:F0304
资助金额:39.00
项目类别:地区科学基金项目
4

笔迹图像中关键词语过滤技术研究

批准号:61462080
批准年份:2014
负责人:卡米力·木依丁
学科分类:F0210
资助金额:47.00
项目类别:地区科学基金项目