基于语义的中文文本聚类研究

基本信息
批准号:60772081
项目类别:面上项目
资助金额:30.00
负责人:施水才
学科分类:
依托单位:北京信息科技大学
批准年份:2007
结题年份:2010
起止时间:2008-01-01 - 2010-12-31
项目状态: 已结题
项目参与者:肖诗斌,王洪俊,王弘蔚,孙丽华,卢献华,程涛,周强,李银松
关键词:
文本相似度文本表示方法文本聚类语义词典
结项摘要

文本聚类是当前智能信息处理学科的前沿领域和最热门课题之一,融合了模式识别、机器学习、统计学等知识。由于电子邮件、WWW应用的普及,文本聚类在信息检索、邮件过滤和网页分类等领域有广阔的应用前景。现今中文文本聚类多是照搬英文聚类方法,没有结合中文特点。本项目提出基于语义的中文文本聚类方法,将中文语义特征引入文本聚类研究中。研究内容包括服务于聚类的中文语义词典建设研究、基于语义的文本表示模型研究、基于语义的文本相似度计算模型研究、基于语义的自适应高效文本聚类算法研究等。本项目的目标是通过对中文文本特点、特别是语义特点的研究,建立基于语义的文本聚类模型,解决中文文本聚类中存在的关键问题,能够准确高效的进行中文文本聚类处理。本项目不仅有利于推进中文文本聚类的发展,也将促进基于语义的自然语言处理研究在国内的有效开展。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

EBPR工艺运行效果的主要影响因素及研究现状

EBPR工艺运行效果的主要影响因素及研究现状

DOI:10.16796/j.cnki.1000-3770.2022.03.003
发表时间:2022
2

基于铁路客流分配的旅客列车开行方案调整方法

基于铁路客流分配的旅客列车开行方案调整方法

DOI:
发表时间:2021
3

信息熵-保真度联合度量函数的单幅图像去雾方法

信息熵-保真度联合度量函数的单幅图像去雾方法

DOI:10.3724/SP.J.1089.2019.17435
发表时间:2019
4

四川盆地东部垫江盐盆三叠系海相钾盐成钾有利区圈定:地球物理和地球化学方法综合应用

四川盆地东部垫江盐盆三叠系海相钾盐成钾有利区圈定:地球物理和地球化学方法综合应用

DOI:10.19762/j.cnki.dizhixuebao.2021191
发表时间:2021
5

黄曲霉毒素B1检测与脱毒方法最新研究进展

黄曲霉毒素B1检测与脱毒方法最新研究进展

DOI:10.3969/j.issn.1000-4440.2021.03.031
发表时间:2021

施水才的其他基金

批准号:60272084
批准年份:2002
资助金额:28.00
项目类别:面上项目
批准号:61171159
批准年份:2011
资助金额:60.00
项目类别:面上项目

相似国自然基金

1

文本语义模型和子空间聚类研究

批准号:60905028
批准年份:2009
负责人:景丽萍
学科分类:F0603
资助金额:19.00
项目类别:青年科学基金项目
2

基于复杂网络的中文文本语义相似度研究

批准号:71373200
批准年份:2013
负责人:刘怀亮
学科分类:G0414
资助金额:56.00
项目类别:面上项目
3

社交媒体中文本情感语义计算理论和方法

批准号:61632011
批准年份:2016
负责人:秦兵
学科分类:F0211
资助金额:265.00
项目类别:重点项目
4

面向中文文本的事件时空语义解析方法研究

批准号:41401451
批准年份:2014
负责人:张春菊
学科分类:D0114
资助金额:25.00
项目类别:青年科学基金项目