基于语义的中文文本聚类研究

基本信息

批准号：60772081

项目类别：面上项目

资助金额：30.00

负责人：施水才

学科分类：

依托单位：北京信息科技大学

批准年份：2007

结题年份：2010

起止时间：2008-01-01 - 2010-12-31

项目状态：已结题

项目参与者：肖诗斌,王洪俊,王弘蔚,孙丽华,卢献华,程涛,周强,李银松

关键词：

文本相似度文本表示方法文本聚类语义词典

结项摘要

文本聚类是当前智能信息处理学科的前沿领域和最热门课题之一，融合了模式识别、机器学习、统计学等知识。由于电子邮件、WWW应用的普及，文本聚类在信息检索、邮件过滤和网页分类等领域有广阔的应用前景。现今中文文本聚类多是照搬英文聚类方法，没有结合中文特点。本项目提出基于语义的中文文本聚类方法，将中文语义特征引入文本聚类研究中。研究内容包括服务于聚类的中文语义词典建设研究、基于语义的文本表示模型研究、基于语义的文本相似度计算模型研究、基于语义的自适应高效文本聚类算法研究等。本项目的目标是通过对中文文本特点、特别是语义特点的研究，建立基于语义的文本聚类模型，解决中文文本聚类中存在的关键问题，能够准确高效的进行中文文本聚类处理。本项目不仅有利于推进中文文本聚类的发展，也将促进基于语义的自然语言处理研究在国内的有效开展。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.16796/j.cnki.1000-3770.2022.03.003

发表时间：2022

DOI：

发表时间：2021

DOI：10.3724/SP.J.1089.2019.17435

发表时间：2019

DOI：10.19762/j.cnki.dizhixuebao.2021191

发表时间：2021

DOI：10.3969/j.issn.1000-4440.2021.03.031

发表时间：2021

施水才的其他基金

批准号：60272084

批准年份：2002

资助金额：28.00

项目类别：面上项目

批准号：61171159

批准年份：2011

资助金额：60.00

项目类别：面上项目

相似国自然基金

文本语义模型和子空间聚类研究

批准号：60905028

批准年份：2009

负责人：景丽萍

学科分类：F0603

资助金额：19.00

项目类别：青年科学基金项目

基于复杂网络的中文文本语义相似度研究

批准号：71373200

批准年份：2013

负责人：刘怀亮

学科分类：G0414

资助金额：56.00

项目类别：面上项目

社交媒体中文本情感语义计算理论和方法

批准号：61632011

批准年份：2016

负责人：秦兵

学科分类：F0211

资助金额：265.00

项目类别：重点项目

面向中文文本的事件时空语义解析方法研究

批准号：41401451

批准年份：2014

负责人：张春菊

学科分类：D0114

资助金额：25.00

项目类别：青年科学基金项目

基于语义的中文文本聚类研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

EBPR工艺运行效果的主要影响因素及研究现状

基于铁路客流分配的旅客列车开行方案调整方法

信息熵-保真度联合度量函数的单幅图像去雾方法

四川盆地东部垫江盐盆三叠系海相钾盐成钾有利区圈定:地球物理和地球化学方法综合应用

黄曲霉毒素B1检测与脱毒方法最新研究进展

施水才的其他基金

WEB数据挖掘技术研究

网页内容真实性评价研究

相似国自然基金