基于信息处理的维吾尔语语义分类与标注技术研究

基本信息
批准号:61063036
项目类别:地区科学基金项目
资助金额:27.00
负责人:玉素甫·艾白都拉
学科分类:
依托单位:新疆师范大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:阿不都热依木,比丽克孜,麦麦提艾力,努尔艾合买提,马木提江·艾尔肯,哈里克·亚库甫,匠格瓦尔·地汗,阿力木·木拉提
关键词:
标注技术信息处理维吾尔语语义分类体系
结项摘要

以语言学理论、本体理论、统计学理论为依据,采用语法语义规则与统计分析相结合的方法,在维吾尔语语法框架基础上,对词汇进行语义特征分类研究。对每一条维吾尔语词汇添加词性、语义信息、句子中可能的成分、格、时态、数、等级、人称、肯定或否定、义项信息等属性信息,制定维吾尔语语法语义相结合的语法语义标注标记集规范。提出维吾尔语语法语义标注与歧义词标注算法,利用规则、机器学习结合方法,设计与实现维语语义标注处理系统,逐渐建立维吾尔语真实文本语法语义标注语料库。解决制约计算机维吾尔语言分析、知识获取和推理、理解和生成过程中的主要瓶颈。在开发舆情分析、人机自动问答系统、信息抽取、机器翻译等领域有着广泛的应用。本项目是新疆科技维稳、新疆社会发展和国家安全工作中亟待解决的非常重要和紧迫的基础技术问题。此问题的解决对构建和谐、稳定社会、加强国家安全,提高信息处理工作的理论研究和实际应用水平都具有一定的理论和应用价

项目摘要

本项目根据维吾尔语独有特点,以语言学理论、本体理论、统计学理论、计算机科学理论为依据,采用语法语义规则与统计分析相结合的方法,在维吾尔语语法框架基础上,对词汇进行语义特征分类研究。经过研究,本课题组制定了维吾尔语语法语义相结合的语法语义标注标记集规范;提出了维吾尔语语法语义标注与歧义词标注算法;利用规则、机器学习结合方法,设计与实现了维吾尔语语义标注处理系统;并逐渐建立了维吾尔语真实文本语法语义标注语料库;解决了制约计算机维吾尔语言分析、知识获取和推理、理解和生成过程中的主要瓶颈问题。主要研究内容有:. 从语义角度深入研究维吾尔语词语分析。在研究现有的维吾尔语的词法分析、词性标注以及短语分析基础上,基于词汇语义的本体表示方法、语法语义结合的标注标记集编码描述方法,探讨基于语法语义结合维吾尔语词语的语义分类和描述需要,制定了语法语义相结合的标记集规范,优化了语法语义结合的标注方法,研究并实现对其词汇一级语法分析、语义分析及制定的标注标记集规范。在此基础上,利用规则和统计相结合方法,探索人机交互的维吾尔语语法语义标注处理的方法等理论问题。. 由原来的语法角度考虑词类分类方法改为语法语义相结合方法,增加颗粒度,提高机器描述能力和处理能力。在现代维吾尔语语信息处理领域中,是首次使用语法语义结合方法在词语、词干、词尾、短语以及句子等5个层面制定标记集规范。对词典上的10万条词干添加了语法、语义信息、格、时态、数、等级、人称、肯定或否定、义项信息、词汇来源等属性信息。完善了维吾尔语语法语义标注算法、实现了现代维吾尔语语法语义标注处理系统的功能。解决了现代维吾尔语词汇语法语义分类、编码符号描述、语法语义信息电子词典构建技术、歧义词标注算法等问题。. 本项目收集平面媒体、网络媒体、基础教育教材和有声媒体等语料,抽取四大媒体通用和典型的句子。从中抽取10万条通用和典型的句子,作为处理语料对象,并对其进行预处理、校对、整理后,研制《现代维吾尔语典型常用句候选表》,为下一步处理打下基础。. 项目创新之处是提出了语法语义标注角度词汇分类、语法语义信息词典的概念,制定了语法语义编码标记集,为语法语义系统提供了理论、技术支撑。本成果在开发舆情分析、人机自动问答系统、信息抽取、机器翻译等领域有着广泛的应用。对提高信息处理工作的理论研究和实际应用水平都具有一定的理论

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
3

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

DOI:
发表时间:2020
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015

玉素甫·艾白都拉的其他基金

批准号:60463005
批准年份:2004
资助金额:25.00
项目类别:地区科学基金项目
批准号:61262066
批准年份:2012
资助金额:48.00
项目类别:地区科学基金项目

相似国自然基金

1

维吾尔语框架语义角色自动标注技术研究

批准号:61163029
批准年份:2011
负责人:阿里甫·库尔班
学科分类:F0211
资助金额:49.00
项目类别:地区科学基金项目
2

基于自动选择标注对象的汉语时间语义信息处理方法研究

批准号:61100138
批准年份:2011
负责人:谭红叶
学科分类:F0211
资助金额:25.00
项目类别:青年科学基金项目
3

基于时空领域本体的语义标注技术研究

批准号:60603020
批准年份:2006
负责人:胡鹤
学科分类:F06
资助金额:7.00
项目类别:青年科学基金项目
4

基于语义的维吾尔语网络舆情分析关键技术研究

批准号:61662081
批准年份:2016
负责人:艾孜尔古丽·玉素甫
学科分类:F0211
资助金额:41.00
项目类别:地区科学基金项目