大数据环境下基于特征本体学习的无监督文本分类方法研究

基本信息
批准号:71571064
项目类别:面上项目
资助金额:48.00
负责人:李岳峰
学科分类:
依托单位:湖北工业大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:黄炜,陈志刚,孙雨生,李总苛,余辉
关键词:
特征本体知识发现文本分类
结项摘要

With the explosion of Internet information resources, the urgent need for more efficient intelligent information processing technology to help people deal with large data. The main purpose of the study of this project is to automatically discover a body without features for text classification specified under the supervision of the (Feature Ontology), to handle large data sets classification. The research content is: (1) mining model for special text feature model -- to design an efficient mining of special characteristics of text used to describe the interesting topics in the document. (2) a suitable feature ontology learning method -- for a given feature set, the development of a learning feature ontology in the domain ontology method. (3) and one for the classification of non regulatory framework -- for each input document clusters, the development of a multi label classifier feature based on ontology to assign accurate concept sequence.

随着互联网信息资源的爆炸,当前迫切需要更高效的智能信息处理技术来帮助人们处理大数据。本项目的主要研究目的是自动发现一个用于无监督下特定的文本分类的特征本体 (Feature Ontology),来分类处理大数据集合。研究内容是:(1)挖掘专用文本特征的模型——设计一个有效的挖掘专用文本特征的模型用于描述文档中有趣的话题。(2)一种适用于特征本体的学习方法——针对给定的特征集,开发一个在领域本体中学习特征本体的方法。(3)一个用于分类的非监管框架——针对每个输入的文档集群,开发一个基于特征本体的多标记分类器来分配准确概念序列。

项目摘要

本项目按照研究计划完成了相关内容的研究工作,主要解决了自动发现一个用于无监督下特定文本分类的特征本体方法,来分类处理大数据集合。完成了挖掘专用文本特征的模型构建,并设计了一个有效的挖掘专用文本特征的模型用于描述文档中有趣的话题;提出了一种适用于特征本体的学习算法,实现在领域本体中学习特征本体;构建了一个用于分类的非监督学习框架,针对每个输入的文档集,提出基于特征本体的多标记分类器来分配准确概念序列。为当前迫切需要更高效的信息处理技术来处理大数据提文本供了参考,并将研究成果应用于网络敏感信息识别和网络反恐实践中。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于直观图的三支概念获取及属性特征分析

基于直观图的三支概念获取及属性特征分析

DOI:10.3778/j.issn.1673-9418.2104120
发表时间:
2

城市生活垃圾热值的特征变量选择方法及预测建模

城市生活垃圾热值的特征变量选择方法及预测建模

DOI:10.11936/bjutxb2021010011
发表时间:2021
3

TVBN-ResNeXt:解决动作视频分类的端到端时空双流融合网络

TVBN-ResNeXt:解决动作视频分类的端到端时空双流融合网络

DOI:10.16798/j.issn.1003-0530.2020.01.008
发表时间:2020
4

口腔扁平苔藓研究热点前沿的可视化分析

口腔扁平苔藓研究热点前沿的可视化分析

DOI:10.7507/1672-2531.202012076
发表时间:2021
5

泛"胡焕庸线"过渡带的地学认知与国土空间开发利用保护策略建构

泛"胡焕庸线"过渡带的地学认知与国土空间开发利用保护策略建构

DOI:10.15957/j.cnki.jjdl.2022.03.003
发表时间:2022

李岳峰的其他基金

相似国自然基金

1

大数据环境下基于生物医学本体的文献无监督分类方法研究

批准号:61702324
批准年份:2017
负责人:李美晶
学科分类:F0213
资助金额:23.00
项目类别:青年科学基金项目
2

基于半监督学习和集成学习的文本分类方法研究

批准号:61073133
批准年份:2010
负责人:鲁明羽
学科分类:F0607
资助金额:32.00
项目类别:面上项目
3

面向文本分类的迁移学习和半监督学习方法研究

批准号:61175053
批准年份:2011
负责人:唐焕玲
学科分类:F0603
资助金额:57.00
项目类别:面上项目
4

半监督文本情感分类方法研究

批准号:61003155
批准年份:2010
负责人:李寿山
学科分类:F0211
资助金额:20.00
项目类别:青年科学基金项目