文本自动分类中维数约简方法研究

基本信息
批准号:60663007
项目类别:地区科学基金项目
资助金额:25.00
负责人:王明文
学科分类:
依托单位:江西财经大学
批准年份:2006
结题年份:2009
起止时间:2007-01-01 - 2009-12-31
项目状态: 已结题
项目参与者:袁里驰,何明,杨小平,徐慧植,曾庆鹏,罗远胜,陶红亮,余俊英,曹瑛
关键词:
投影寻踪偏最小二乘维数约简Markov网络文本分类
结项摘要

随着网上电子文档数量的指数级增长,文本分类技术在信息检索、信息过滤及内容管理等应用中变得日益重要。文档特征的选择和提取是文本分类的必要前提,特征维数的增加将使样本统计特性的估计变得更加困难,从而降低分类器的泛化能力,呈现"过学习"现象。要避免这种现象,用于分类器训练的训练样本个数必须随着特征维数的增长而呈指数增长,从而造成人们所说的"维数灾难"。因此在文本分类问题研究中,维数约简是一个必不可少的步骤,有效的维数约简可以提高学习任务的效率、改善分类性能。本课题旨在应用偏最小二乘、投影寻踪等统计理论研究新的维数约简方法,在统一框架下进行文档词信息和类别信息的建模,提取对分类贡献较大的那些语义特征,实现消除噪音且降低维数的目的,在此基础上,研究新的特征选择方法;应用随机过程的理论,研究基于Markov网络的特征选择方法;并在理论上证明和实验上验证新的维数约简方法的有效性。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于一维TiO2纳米管阵列薄膜的β伏特效应研究

基于一维TiO2纳米管阵列薄膜的β伏特效应研究

DOI:10.7498/aps.67.20171903
发表时间:2018
2

氟化铵对CoMoS /ZrO_2催化4-甲基酚加氢脱氧性能的影响

氟化铵对CoMoS /ZrO_2催化4-甲基酚加氢脱氧性能的影响

DOI:10.16606/j.cnki.issn0253-4320.2022.10.026
发表时间:2022
3

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
4

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
5

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015

王明文的其他基金

批准号:61272212
批准年份:2012
资助金额:70.00
项目类别:面上项目
批准号:61373009
批准年份:2013
资助金额:58.00
项目类别:面上项目
批准号:60963014
批准年份:2009
资助金额:22.00
项目类别:地区科学基金项目
批准号:61462045
批准年份:2014
资助金额:45.00
项目类别:地区科学基金项目
批准号:61876074
批准年份:2018
资助金额:62.00
项目类别:面上项目

相似国自然基金

1

非负矩阵分解中维数约简问题的研究

批准号:61373001
批准年份:2013
负责人:赵金熙
学科分类:F0201
资助金额:58.00
项目类别:面上项目
2

面向多媒体排序学习的维数约简

批准号:61271325
批准年份:2012
负责人:冀中
学科分类:F0116
资助金额:70.00
项目类别:面上项目
3

面向高维信息的非线性维数约简问题研究

批准号:61303091
批准年份:2013
负责人:高小方
学科分类:F0605
资助金额:22.00
项目类别:青年科学基金项目
4

实值多变量维数约简研究及应用

批准号:61273299
批准年份:2012
负责人:张军平
学科分类:F0603
资助金额:76.00
项目类别:面上项目