基于标记概念监督的多标记粒计算理论与算法研究

基本信息
批准号:61672331
项目类别:面上项目
资助金额:62.00
负责人:李德玉
学科分类:
依托单位:山西大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:翟岩慧,白鹤翔,李艳红,李华,路娟,张超,李旸,张少霞,王杰
关键词:
约简多标记数据粒计算标记概念标记排序
结项摘要

Multi-label data is a very important kind of data, which closely related to many fields such as text analysis, multimedia analysis, bioinformatics, social network, business intelligence and so on. Compared with single-label data, the multi-dimensionality, even high dimensionality of the label space aggravates the challenges to analyzing and processing multi-label data. Granular computing is a new computing paradigm, which takes data granules (or information granules) as the basic units of analysis and processing. It is one of the most active research fields in intelligent information processing. It has been proved to be a very important tool for modeling and analyzing largescale complex data. In allusion to the limitations of no making full use of label information in the existing studies on multi-label data, this project will model the concept structure of multi-lable data in label space by concept lattice theory, and conduct the research on theory and algorithms of granular computing for multi-label data supervised by the structure information of label concepts. The main contents of the project are summarized as follows: (1) Characterizing the structure information of label concepts; (2) Measuring the label correlation and the label concept correlation; (3) Minimal representation of label concepts in the feature space; (4) Feature reducing supervised by the label concept structure; (5) Designing effective multi-label ranking algorithms. The anticipative research results will not only provide some new approaches to analyzing and processing multi-label data, but also enrich granular computing theory by expanding the scope of data applications. Thus, it has a very important theoretical significance and application value for data mining and knowledge discovery.

多标记数据是密切关联于文本分析、多媒体分析、生物信息学、社会网络、智能商务等众多领域的重要数据类型。较之单标记数据,标记空间的多维、甚至高维性加剧了多标记数据分析与处理面临的挑战。粒计算是以数据粒(信息粒)为基本分析与处理单元的新型计算范式,是当前智能信息处理领域最活跃的研究方向之一,已被证明是大规模复杂数据建模、分析的重要工具。本项目针对目前多标记数据研究中对标记信息利用不够充分的问题,以概念格理论建模数据在标记空间中的概念结构,并在粒计算框架下,基于标记概念结构信息的监督,开展多标记数据的粒计算理论与算法研究。主要内容包括:(1)标记概念的结构信息刻画;(2)标记相关性度量;(3)标记概念的极小表示;(4)标记概念结构监督下的特征约简;(5)标记排序算法。项目成果既可丰富多标记数据分析的技术手段,又可通过拓展数据适用范围丰富粒计算理论,对数据挖掘和知识发现具有重要的理论意义和应用价值。

项目摘要

多标记数据是密切关联于文本分析、多媒体分析、生物信息学、社会网络、智能商务等众多领域的重要数据类型。本项目针对目前多标记数据研究中对标记信息利用不够充分的问题,以概念格理论建模数据在标记空间中的概念结构,并在粒计算框架下,基于标记概念结构信息的监督,开展多标记数据的粒计算理论与算法研究。在多标记数据特征选择和分类方面,提出了基于标记关系的模糊粗糙集模型、基于双空间模糊辨识关系的多标记特征选择方法、基于模糊不一致对的多标记属性约简方法、结合标记相关性的特征选择方法、基于可变最小贝叶斯风险的层次多标签分类方法,并对多标记特征选择算法进行了综述分析。在数据推理的逻辑基础方面,对决策蕴涵、概念规则和粒规则进行了比较研究,研究了可变决策表示、模糊决策蕴涵规范基以及逻辑型决策蕴涵。在模糊粗糙集理论方面,提出了基于双论域可调节犹豫模糊语言多粒度决策粗糙集的多粒度三支决策理论,研究了区间犹豫模糊多粒度三支决策及其在多属性群体决策中的应用、双论域二型模糊粗糙集的粒结构、基于区间值中智多粒度概率模型的多属性群决策以及二型模糊粗糙集的信任函数与似然函数。在理论成果应用方面,提出将主题建模与词嵌入相结合构造嵌入增强主题模型,提出了基于层次化兴趣社区的主题推荐方法、面向跨领域情感分类的多源领域适应联合学习方法、基于多层次语义融合表示的事实型隐式情感识别方法、面向方面抽取的融合关系嵌入式表示学习框架、基于词嵌入的社交网络群组用户画像建模方法。项目成果既可丰富多标记数据分析的技术手段,又可通过拓展数据适用范围丰富粒计算理论,对数据挖掘和知识发现具有重要的理论意义和应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

DOI:10.3724/ SP.J.1123.2019.04013
发表时间:2019
3

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
4

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
5

多空间交互协同过滤推荐

多空间交互协同过滤推荐

DOI:10.11896/jsjkx.201100031
发表时间:2021

李德玉的其他基金

批准号:60573074
批准年份:2005
资助金额:22.00
项目类别:面上项目
批准号:60970014
批准年份:2009
资助金额:31.00
项目类别:面上项目
批准号:10772019
批准年份:2007
资助金额:40.00
项目类别:面上项目
批准号:61272095
批准年份:2012
资助金额:81.00
项目类别:面上项目

相似国自然基金

1

多标记数据的粒计算理论与算法研究

批准号:61272095
批准年份:2012
负责人:李德玉
学科分类:F0201
资助金额:81.00
项目类别:面上项目
2

多标记数据的多粒度粗糙计算理论与算法研究

批准号:61806133
批准年份:2018
负责人:李华
学科分类:F0601
资助金额:22.00
项目类别:青年科学基金项目
3

基于粒计算的多模态多标记数据分类建模研究

批准号:61672272
批准年份:2016
负责人:林耀进
学科分类:F0607
资助金额:62.00
项目类别:面上项目
4

基于特征学习和标记关联的多标记学习算法研究

批准号:61563016
批准年份:2015
负责人:余鹰
学科分类:F0603
资助金额:39.00
项目类别:地区科学基金项目