本项目是在语言学理论、统计学理论和计算语言学理论基础上,研究如何构造面向自然语言处理的现代维吾尔语短语信息库,预期提供一个规模适中的词语搭配或短语词汇化知识的信息库。该项目将采用计算语言学和统计学等结合的方法,研究用最优化的手段,全面、准确、规范建设短语知识的信息库。无论是对维吾尔语语言教学还是维吾尔语自然语言处理,词语搭配或词汇化短语的知识都是十分重要的资源。为了使之胜任处理大规模真实文本的任务,建立一个大规模的维吾尔语短语信息库的工作是十分必要的。该信息库建成之后,除了应用在语言理解、语言生成和机器翻译领域之外,还可以应用在信息检索、文本自动分类、自动文摘、维吾尔语自动校对和维吾尔语语句输入等应用领域。对提高少数民族的科学文化水平、信息处理的理论研究与实际应用都具有重大意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
面向云工作流安全的任务调度方法
TGF-β1-Smad2/3信号转导通路在百草枯中毒致肺纤维化中的作用
生物炭用量对东北黑土理化性质和溶解有机质特性的影响
煤/生物质流态化富氧燃烧的CO_2富集特性
面向汉语理解的短语信息库的构造
人机互助的通用现代维语语料库加工处理系统的研究
基于维语网络文本的事件抽取方法研究
维语实体指代消歧关键技术研究