项目提出建立面向信息处理的藏语语法属性库,目的是为藏语文本自动处理铺垫基础,为藏语语言工程领域储备精细的语言知识以及技术工具,以便解决藏语自动分词、句法分析、文本检索、语义计算、网络搜索引擎、机器翻译等深化研究必然面临的语法现象。项目内容包括1)建立各类句法成分标注集,如词类标注集、组块标注集、词格标注集、谓语语尾标注集等。2)研制带标注等关联应用工具的藏文语料工作平台,然后对大规模真实文本进行快速人工标注。3)编写句子分析算法模型,用已标注语料对算法模型进行训练,提高语料标注的速度以及扩大熟语料文本数量。4)在标注语料基础上精心研究每一个词项的属性,对词项进行全面的句法语义分析和语法属性赋值,并最终填写完成藏语语法属性库。本项目的意义在于能建立藏语自动处理的语法基础知识资源,符合当代自然语言处理词例化理论发展趋势,有助于对真实文本进行大规模自动处理,加快藏语分词和句法自动分析技术的发展。
{{i.achievement_title}}
数据更新时间:2023-05-31
扶贫资源输入对贫困地区分配公平的影响
出租车新运营模式下的LED广告精准投放策略
多元化企业IT协同的维度及测量
基于直观图的三支概念获取及属性特征分析
河流岸线开发适宜性及发展潜力研究
面向语言处理的藏语概念框架语义知识库构建研究
现代维语信息处理技术方法和信息库构造研究
藏语依存树库的构建
基于词典和格标记的现代藏语自动分词系统研究