本项目研究可从客观语料库中获取语言结构知识的汉语句法分析方法。句子的结构表示为一棵树,这棵村从下往上表示字怎样结合成词,词怎样结合成词组和短语。我们用结合力度表示这种知识,并认为正确的结构是结合力度最大的树。我们建立了一个基于统计的模型,模型的核心是求结合力度最大的树的算法。使用句子分块及全枚举策略,基于词性同现及短语结合频率矩阵等,我们通过实验系统,证明这一模型是切实可行的。我们还发现了一个基于动态规划的算法,用这一算法代替句子分块和全枚举策略将大大改善模型的性能,因为理论分析证明这一算法具有多项式复杂性,从而使这一算法的提出具有较大的意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
服务经济时代新动能将由技术和服务共同驱动
卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比
固溶时效深冷复合处理对ZCuAl_(10)Fe_3Mn_2合金微观组织和热疲劳性能的影响
知识产权保护执法力度、技术创新与企业绩效 — 来自中国上市公司的证据
汉语语义知识获取与语义计算模型研究
汉语句法排歧知识的自动获取方法研究
汉语语义选择限制知识自动获取及其应用研究
面向汉语理解的短语信息库的构造