为实现大规模真实文本处理的战略目标,语料库语言学已成为当今自然语言处理的前沿课题。本项目在以下几个方面进行了较深入、系统的研究;①面向非受限文本的汉语自动分词及词性标注;②基于概率型上下文无关语法的汉语句法分析;③基于转换的汉语基本名词短语识别及其结构分析模型;④基于结构语义空间的汉语词义排歧模型;⑤从单语词典中获取定义原语方法及现代汉语定义原语的获取;⑥汉语语义关联网的构造,⑦信息处理用汉语文本分词规范和词性标准的制订;⑧关于语料库语文学的理论思考。并构造了相应的原型或实验系统,取得了有特色的成果。建立了1亿2千万字质量可靠的汉语生语料库及200万字经过分词和词性标准的汉语平衡语料库。
{{i.achievement_title}}
数据更新时间:2023-05-31
融合字符串特征的维吾尔语形态切分
新型非易失存储环境下事务型数据管理技术研究
A Fast Algorithm for Computing Dominance Classes
电场辅助样品前处理技术研究进展
基于模糊区域对比度增强的肺实质鲁棒分割
基于粗糙集的大规模语料库语言学知识发现模型研究
集成情境知识管理的理论、方法和工具研究
化工领域中专家系统工具的理论和方法研究
虚拟量仪理论和开发工具研究