项目提出建立面向信息处理的藏语语法属性库,目的是为藏语文本自动处理铺垫基础,为藏语语言工程领域储备精细的语言知识以及技术工具,以便解决藏语自动分词、句法分析、文本检索、语义计算、网络搜索引擎、机器翻译等深化研究必然面临的语法现象。项目内容包括1)建立各类句法成分标注集,如词类标注集、组块标注集、词格标注集、谓语语尾标注集等。2)研制带标注等关联应用工具的藏文语料工作平台,然后对大规模真实文本进行快速人工标注。3)编写句子分析算法模型,用已标注语料对算法模型进行训练,提高语料标注的速度以及扩大熟语料文本数量。4)在标注语料基础上精心研究每一个词项的属性,对词项进行全面的句法语义分析和语法属性赋值,并最终填写完成藏语语法属性库。本项目的意义在于能建立藏语自动处理的语法基础知识资源,符合当代自然语言处理词例化理论发展趋势,有助于对真实文本进行大规模自动处理,加快藏语分词和句法自动分析技术的发展。
{{i.achievement_title}}
数据更新时间:2023-05-31
黄河流域水资源利用时空演变特征及驱动要素
服务经济时代新动能将由技术和服务共同驱动
生物炭用量对东北黑土理化性质和溶解有机质特性的影响
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
不同交易收费类型组合的电商平台 双边定价及影响研究
面向语言处理的藏语概念框架语义知识库构建研究
现代维语信息处理技术方法和信息库构造研究
藏语依存树库的构建
基于词典和格标记的现代藏语自动分词系统研究