维吾尔文不良信息过滤关键技术的研究

基本信息
批准号:61063043
项目类别:地区科学基金项目
资助金额:27.00
负责人:帕力旦·吐尔逊
学科分类:
依托单位:新疆大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:亚森·艾则孜,早克热·卡德尔,汪玉梅,万琼,盛国栋,阿不都热依木·热合曼,瓦依提·阿不力孜,努尔甫拉提·阿普提,梁建飞
关键词:
信息过滤不良信息最大熵编码维吾尔文
结项摘要

内容过滤是当前互联网信息安全的研究热点, 也是所面临的挑战之一。互联网迅速普及, 但其内容存在大量不良信息, 内容过滤就是对其进行筛选, 取其精华、去其糟粕, 是对传播的信息进行的审计行为。虽然最近几年维吾尔文信息技术得到了充足的发展空间。但是,维吾尔文不良信息过滤相关的技术未被得到重点研究,给境外不法分子利用互联网进行反动宣传留下了漏洞。本项目针对该问题,以真实网络信息作为研究对象,围绕维吾尔文不良信息过滤技术,对编码统一、被变形的单词、不良文本分类技术、利用敏感词组合过滤不良文本等基础技术进行深入研究,为研发维吾尔文不良信息过滤系统奠定基础。通过本项目构建100万次词人工校对的维吾尔文词法标注网络文本语料库,与公安部门合作构建维吾尔文不良信息语料库,研发维吾尔文不良信息检索过滤实验系统。

项目摘要

本项目中,围绕维吾尔文不良信息过滤系统所需要的相关技术,对维吾尔文网页收集与争化、语种识别、编码统一、拼写检查、候选词产生、文本分类、舆情控制等相关技术开展了研究,并取得了一些成绩。通过本项目的实施,构建100万次词人工校对的维吾尔文词法标注网络文本语料库,与公安部门合作构建维吾尔文不良信息语料库,研究与实现了统计和规则相结合的维吾尔文语种识别系统、维吾尔文四种文字相互转换系统,提出维吾尔文拼写检查方法、候选词产生算法,通过开源工具对文本分类及敏感信息过滤进行实验,研发维吾尔文不良信息检索过滤实验系统。通过本项目,为维吾尔文不良信息过滤、舆情监控等奠定了基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

DOI:
发表时间:2020
2

高压工况对天然气滤芯性能影响的实验研究

高压工况对天然气滤芯性能影响的实验研究

DOI:10.11949/0438-1157.20201260
发表时间:2021
3

多空间交互协同过滤推荐

多空间交互协同过滤推荐

DOI:10.11896/jsjkx.201100031
发表时间:2021
4

采用深度学习的铣刀磨损状态预测模型

采用深度学习的铣刀磨损状态预测模型

DOI:10.3969/j.issn.1004-132x.2020.17.009
发表时间:2020
5

环境信息披露会影响分析师盈余预测吗?

环境信息披露会影响分析师盈余预测吗?

DOI:
发表时间:2017

帕力旦·吐尔逊的其他基金

批准号:61562081
批准年份:2015
资助金额:40.00
项目类别:地区科学基金项目

相似国自然基金

1

维吾尔文印刷文档图像中不良信息过滤关键技术研究

批准号:61461049
批准年份:2014
负责人:地里木拉提·吐尔逊
学科分类:F0116
资助金额:40.00
项目类别:地区科学基金项目
2

维吾尔文命名实体识别关键技术研究

批准号:61262060
批准年份:2012
负责人:艾山·吾买尔
学科分类:F0211
资助金额:45.00
项目类别:地区科学基金项目
3

维吾尔文手写签名识别与验证的关键技术研究

批准号:61163028
批准年份:2011
负责人:库尔班·吾布力
学科分类:F0605
资助金额:52.00
项目类别:地区科学基金项目
4

维吾尔文网络社会集群行为感知的关键技术研究

批准号:61762085
批准年份:2017
负责人:刘淑娴
学科分类:F0205
资助金额:38.00
项目类别:地区科学基金项目