项目以粗糙集理论为基础,通过为形式自由的汉语文本构造一个离散的、可变粒度的语言信息表,建立一个可挖掘多种语言学知识的知识发现模型,在此基础上,通过粗糙集与统计方法的结合,寻找准确、高效的文本数据泛化与约简算法,最终建立起一个完整、实用的大规模语料库语言学知识发现理论体系和应用系统,为汉语自然语言处理打下坚实基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
服务经济时代新动能将由技术和服务共同驱动
卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比
固溶时效深冷复合处理对ZCuAl_(10)Fe_3Mn_2合金微观组织和热疲劳性能的影响
知识产权保护执法力度、技术创新与企业绩效 — 来自中国上市公司的证据
基于认知语言学原理的工艺知识发现方法研究
复合关系粗糙集模型及高效知识发现算法研究
基于大规模复杂结构知识库的知识发现机理、模型与算法研究
基于Web的大规模双语语料库挖掘及翻译知识自动获取