本项目是在语言学理论、统计学理论和计算语言学理论基础上,研究如何构造面向自然语言处理的现代维吾尔语短语信息库,预期提供一个规模适中的词语搭配或短语词汇化知识的信息库。该项目将采用计算语言学和统计学等结合的方法,研究用最优化的手段,全面、准确、规范建设短语知识的信息库。无论是对维吾尔语语言教学还是维吾尔语自然语言处理,词语搭配或词汇化短语的知识都是十分重要的资源。为了使之胜任处理大规模真实文本的任务,建立一个大规模的维吾尔语短语信息库的工作是十分必要的。该信息库建成之后,除了应用在语言理解、语言生成和机器翻译领域之外,还可以应用在信息检索、文本自动分类、自动文摘、维吾尔语自动校对和维吾尔语语句输入等应用领域。对提高少数民族的科学文化水平、信息处理的理论研究与实际应用都具有重大意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于国产化替代环境下高校计算机教学的研究
基于综合治理和水文模型的广西县域石漠化小流域区划研究
非牛顿流体剪切稀化特性的分子动力学模拟
中国出口经济收益及出口外资渗透率分析--基于国民收入视角
岩石/结构面劣化导致巴东组软硬互层岩体强度劣化的作用机制
面向汉语理解的短语信息库的构造
人机互助的通用现代维语语料库加工处理系统的研究
基于维语网络文本的事件抽取方法研究
维语实体指代消歧关键技术研究