为实现大规模真实文本处理的战略目标,语料库语言学已成为当今自然语言处理的前沿课题。本项目在以下几个方面进行了较深入、系统的研究;①面向非受限文本的汉语自动分词及词性标注;②基于概率型上下文无关语法的汉语句法分析;③基于转换的汉语基本名词短语识别及其结构分析模型;④基于结构语义空间的汉语词义排歧模型;⑤从单语词典中获取定义原语方法及现代汉语定义原语的获取;⑥汉语语义关联网的构造,⑦信息处理用汉语文本分词规范和词性标准的制订;⑧关于语料库语文学的理论思考。并构造了相应的原型或实验系统,取得了有特色的成果。建立了1亿2千万字质量可靠的汉语生语料库及200万字经过分词和词性标准的汉语平衡语料库。
{{i.achievement_title}}
数据更新时间:2023-05-31
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
固溶时效深冷复合处理对ZCuAl_(10)Fe_3Mn_2合金微观组织和热疲劳性能的影响
业务过程成批处理配置优化方法
基于近似L_0范数的电容层析成像敏感场优化算法
一种快速的数学形态学滤波方法及其在脉搏信号处理中的应用
基于粗糙集的大规模语料库语言学知识发现模型研究
集成情境知识管理的理论、方法和工具研究
化工领域中专家系统工具的理论和方法研究
虚拟量仪理论和开发工具研究