大数据环境下基于特征本体学习的无监督文本分类方法研究

基本信息
批准号:71571064
项目类别:面上项目
资助金额:48.00
负责人:李岳峰
学科分类:
依托单位:湖北工业大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:黄炜,陈志刚,孙雨生,李总苛,余辉
关键词:
特征本体知识发现文本分类
结项摘要

With the explosion of Internet information resources, the urgent need for more efficient intelligent information processing technology to help people deal with large data. The main purpose of the study of this project is to automatically discover a body without features for text classification specified under the supervision of the (Feature Ontology), to handle large data sets classification. The research content is: (1) mining model for special text feature model -- to design an efficient mining of special characteristics of text used to describe the interesting topics in the document. (2) a suitable feature ontology learning method -- for a given feature set, the development of a learning feature ontology in the domain ontology method. (3) and one for the classification of non regulatory framework -- for each input document clusters, the development of a multi label classifier feature based on ontology to assign accurate concept sequence.

随着互联网信息资源的爆炸,当前迫切需要更高效的智能信息处理技术来帮助人们处理大数据。本项目的主要研究目的是自动发现一个用于无监督下特定的文本分类的特征本体 (Feature Ontology),来分类处理大数据集合。研究内容是:(1)挖掘专用文本特征的模型——设计一个有效的挖掘专用文本特征的模型用于描述文档中有趣的话题。(2)一种适用于特征本体的学习方法——针对给定的特征集,开发一个在领域本体中学习特征本体的方法。(3)一个用于分类的非监管框架——针对每个输入的文档集群,开发一个基于特征本体的多标记分类器来分配准确概念序列。

项目摘要

本项目按照研究计划完成了相关内容的研究工作,主要解决了自动发现一个用于无监督下特定文本分类的特征本体方法,来分类处理大数据集合。完成了挖掘专用文本特征的模型构建,并设计了一个有效的挖掘专用文本特征的模型用于描述文档中有趣的话题;提出了一种适用于特征本体的学习算法,实现在领域本体中学习特征本体;构建了一个用于分类的非监督学习框架,针对每个输入的文档集,提出基于特征本体的多标记分类器来分配准确概念序列。为当前迫切需要更高效的信息处理技术来处理大数据提文本供了参考,并将研究成果应用于网络敏感信息识别和网络反恐实践中。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

DOI:10.3864/j.issn.0578-1752.2019.03.004
发表时间:2019
2

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017
3

空气电晕放电发展过程的特征发射光谱分析与放电识别

空气电晕放电发展过程的特征发射光谱分析与放电识别

DOI:10.3964/j.issn.1000-0593(2022)09-2956-07
发表时间:2022
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比

卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比

DOI:10.13249/j.cnki.sgs.2020.08.003
发表时间:2020

李岳峰的其他基金

相似国自然基金

1

大数据环境下基于生物医学本体的文献无监督分类方法研究

批准号:61702324
批准年份:2017
负责人:李美晶
学科分类:F0213
资助金额:23.00
项目类别:青年科学基金项目
2

基于半监督学习和集成学习的文本分类方法研究

批准号:61073133
批准年份:2010
负责人:鲁明羽
学科分类:F0607
资助金额:32.00
项目类别:面上项目
3

面向文本分类的迁移学习和半监督学习方法研究

批准号:61175053
批准年份:2011
负责人:唐焕玲
学科分类:F0603
资助金额:57.00
项目类别:面上项目
4

半监督文本情感分类方法研究

批准号:61003155
批准年份:2010
负责人:李寿山
学科分类:F0211
资助金额:20.00
项目类别:青年科学基金项目