维吾尔语框架语义角色自动标注技术研究

基本信息
批准号:61163029
项目类别:地区科学基金项目
资助金额:49.00
负责人:阿里甫·库尔班
学科分类:
依托单位:新疆大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:吾买尔江·库尔班,夏迪娅·依布拉音,古丽米热·艾孜木,依布拉音·吾斯曼,阿布都书库尔·嘎依提,尼加提·阿不都肉苏力,安亚敏
关键词:
语义角色维吾尔语句义理解框架语义自动标注
结项摘要

维吾尔语框架语义角色自动标注技术是以真实语料为依据、以维吾尔语框架语义知识库为基础、以先语义后句法为路线,采取条件随机场模型建立维吾尔语框架语义角色标注模型。模型以词为基本标注单元,分别选择词、词性、词相对于目标词的位置、目标词及其组合为特征,针对每个特征设定若干可选的窗口,组合构成模型的各种特征模板,并采用统计正交表的特征模板优选方法,对基于阿拉伯字符的维吾尔语框架语义角色进行自动标注。并以为阶段性目标,进一步研究维吾尔语框架元素的分类体系、标注符号集、语义成分的依存关系、语义角色分解与自动识别技术,语义角色知识库的构建和自动标注等相关技术。最终实现,使计算机对维吾尔语语句有一个"浅层"的理解能力。以此将开展基于阿拉伯字符的维吾尔语框架语义角色基础上的句义理解,语信息检索系统、问答系统和机器翻译系统的研发,通过本项目的研究,使维吾尔语语义分析技术向智能化迈进。

项目摘要

课题组近四年来,“引进消化吸收再创新”的构建思路来研究了维吾尔语框架语义角色自动标注技术领域的研究。根据维吾尔语词汇的框架语义内容,并用维吾尔语词的真实语料做验证、修改和补充。维吾尔语框架语义角色自动标注技术的研究等领域进行试探性研究。.研究了维吾尔语源语言的框架语义知识库的语义角色的分类和标注标记符集、短语类型和标注符号集、句法功能的标注符号集、句标注规范的制定和句标注规范的制定的研究内容可以作为维吾尔语框架语义角色自动标注技术的基础。.本项目中我们初步研究了维吾尔语框架目标词识别的方法,维吾尔语框架网络语义知识库和目标词的特点分析的基础上,采用条件随机场模型对维吾尔语框架目标词识别进行了初步的探讨。.维吾尔语标注例句中目标词识别时,把识别问题看作为序列标注的问题来解决的,即用统计的方法来进行机构名识别。由于条件随机场模型不仅能够充分利用上下文信息作为特征,还能够任意增加更复杂的其他外部特征进行训练和推理,目前,它是自然语言处理领域使用比较广泛的序列标注模型之一。因此,本项目中我们采用条件随机场模型进行目标词识别。我们把词形、词性、词干、句法功能等作为特征,对不同的特征选择不同的窗口大小,制定一个最优模板来进行目标词识别。试验结果证明,采用条件随机场模型识别目标词时,以上特征的有效性还不错,F值达到了84.51%。.维吾尔语框架语义角色自动标注技术领域的试探性研究,为今后将进一步深入对维吾尔语框架语义角色自动标注技术,展开维吾尔语框架语义角色基础上的句义理解计算模型研究,研究与开发基于句义理解的信息检索,问答系统、信息抽取和机器翻译提供基础服务。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
2

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

DOI:
发表时间:2018
3

采用深度学习的铣刀磨损状态预测模型

采用深度学习的铣刀磨损状态预测模型

DOI:10.3969/j.issn.1004-132x.2020.17.009
发表时间:2020
4

创业者的工作家庭冲突① ———基于角色转型的视角

创业者的工作家庭冲突① ———基于角色转型的视角

DOI:
发表时间:2018
5

基于关系对齐的汉语虚词抽象语义表示与分析

基于关系对齐的汉语虚词抽象语义表示与分析

DOI:
发表时间:2020

阿里甫·库尔班的其他基金

批准号:60763006
批准年份:2007
资助金额:18.00
项目类别:地区科学基金项目

相似国自然基金

1

汉语框架语义角色自动标注技术研究

批准号:60873128
批准年份:2008
负责人:李济洪
学科分类:F0211
资助金额:35.00
项目类别:面上项目
2

汉语语义角色标注方法研究

批准号:60675034
批准年份:2006
负责人:秦兵
学科分类:F03
资助金额:24.00
项目类别:面上项目
3

基于信息处理的维吾尔语语义分类与标注技术研究

批准号:61063036
批准年份:2010
负责人:玉素甫·艾白都拉
学科分类:F0211
资助金额:27.00
项目类别:地区科学基金项目
4

基于整句层面的中文语义角色标注关键技术研究

批准号:61702209
批准年份:2017
负责人:杨海彤
学科分类:F0211
资助金额:25.00
项目类别:青年科学基金项目