文本聚类是当前智能信息处理学科的前沿领域和最热门课题之一,融合了模式识别、机器学习、统计学等知识。由于电子邮件、WWW应用的普及,文本聚类在信息检索、邮件过滤和网页分类等领域有广阔的应用前景。现今中文文本聚类多是照搬英文聚类方法,没有结合中文特点。本项目提出基于语义的中文文本聚类方法,将中文语义特征引入文本聚类研究中。研究内容包括服务于聚类的中文语义词典建设研究、基于语义的文本表示模型研究、基于语义的文本相似度计算模型研究、基于语义的自适应高效文本聚类算法研究等。本项目的目标是通过对中文文本特点、特别是语义特点的研究,建立基于语义的文本聚类模型,解决中文文本聚类中存在的关键问题,能够准确高效的进行中文文本聚类处理。本项目不仅有利于推进中文文本聚类的发展,也将促进基于语义的自然语言处理研究在国内的有效开展。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究
气载放射性碘采样测量方法研究进展
文本语义模型和子空间聚类研究
基于复杂网络的中文文本语义相似度研究
社交媒体中文本情感语义计算理论和方法
面向中文文本的事件时空语义解析方法研究