With the explosion of Internet information resources, the urgent need for more efficient intelligent information processing technology to help people deal with large data. The main purpose of the study of this project is to automatically discover a body without features for text classification specified under the supervision of the (Feature Ontology), to handle large data sets classification. The research content is: (1) mining model for special text feature model -- to design an efficient mining of special characteristics of text used to describe the interesting topics in the document. (2) a suitable feature ontology learning method -- for a given feature set, the development of a learning feature ontology in the domain ontology method. (3) and one for the classification of non regulatory framework -- for each input document clusters, the development of a multi label classifier feature based on ontology to assign accurate concept sequence.
随着互联网信息资源的爆炸,当前迫切需要更高效的智能信息处理技术来帮助人们处理大数据。本项目的主要研究目的是自动发现一个用于无监督下特定的文本分类的特征本体 (Feature Ontology),来分类处理大数据集合。研究内容是:(1)挖掘专用文本特征的模型——设计一个有效的挖掘专用文本特征的模型用于描述文档中有趣的话题。(2)一种适用于特征本体的学习方法——针对给定的特征集,开发一个在领域本体中学习特征本体的方法。(3)一个用于分类的非监管框架——针对每个输入的文档集群,开发一个基于特征本体的多标记分类器来分配准确概念序列。
本项目按照研究计划完成了相关内容的研究工作,主要解决了自动发现一个用于无监督下特定文本分类的特征本体方法,来分类处理大数据集合。完成了挖掘专用文本特征的模型构建,并设计了一个有效的挖掘专用文本特征的模型用于描述文档中有趣的话题;提出了一种适用于特征本体的学习算法,实现在领域本体中学习特征本体;构建了一个用于分类的非监督学习框架,针对每个输入的文档集,提出基于特征本体的多标记分类器来分配准确概念序列。为当前迫切需要更高效的信息处理技术来处理大数据提文本供了参考,并将研究成果应用于网络敏感信息识别和网络反恐实践中。
{{i.achievement_title}}
数据更新时间:2023-05-31
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
服务经济时代新动能将由技术和服务共同驱动
空气电晕放电发展过程的特征发射光谱分析与放电识别
多源数据驱动CNN-GRU模型的公交客流量分类预测
卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比
大数据环境下基于生物医学本体的文献无监督分类方法研究
基于半监督学习和集成学习的文本分类方法研究
面向文本分类的迁移学习和半监督学习方法研究
半监督文本情感分类方法研究