面向大数据的粒计算理论与方法

基本信息
批准号:61432011
项目类别:重点项目
资助金额:350.00
负责人:梁吉业
学科分类:
依托单位:山西大学
批准年份:2014
结题年份:2019
起止时间:2015-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:胡清华,李德玉,钱宇华,白栓虎,李茹,王素格,谢宗霞,杨雅君,赵兴旺
关键词:
数据挖掘粒计算大数据知识表示与推理数据建模
结项摘要

Granular computing is an effective method in the field of intelligent information processing and complex problem solving. Exploring new theories and methods of granular computing for big data has important theoretical significance and application value. Aiming at the three characteristics of big data, i.e., scale, multi-modality and incremental, the project will carry out in-depth and systematic study from the data granulation, multi-granularity pattern discovery and integration, cross-granularity reasoning and application demonstration etc. Specifically, main contents of the project include: (1) Explore the multi-view granulation mechanism of big data, and give the basic strategies of data granulation and corresponding algorithms; (2) Study the knowledge representation, multi-granularity modeling and decision-making mechanisms of multi-modality information; (3) Build the reasoning mechanism of multi-granularity/ cross-granularity using uncertain decision-making flow chart, and propose the corresponding inference algorithms; (4) Based on the astronomical and micro-blog data, develop two typical application demonstrations including solar activity forecast system and micro-blog social recommendation system. Aiming at key scientific issues of data mining with big data, we will build a series of computing models and propose some efficient algorithms. These research results have important theoretical value for large data analysis and mining, and provide technology support for the rapid development of big data industry.

粒计算是智能信息处理领域中大规模复杂问题求解的有效方法,探索大数据分析的粒计算新理论与新方法具有重要的理论意义与应用价值。本项目针对大数据的规模性、多模态性以及增长性三个特点,从数据粒化、多粒度模式发现与融合、多粒度/跨粒度推理与应用示范等方面着手开展深入系统的研究。具体内容包括:(1)探求大数据的多视角粒化机理,给出数据粒化的基本策略和算法;(2)研究多模态信息的知识表示、多粒度建模与决策机制;(3)运用不确定决策流图构建多粒度/跨粒度推理机制,并提出相应的推理算法;(4)分别以天文数据、微博数据为载体,建立太阳活动预报系统和微博社会化推荐系统两个典型应用示范。本项目瞄准大数据挖掘中的关键科学问题,建立一系列计算模型与高效算法,研究成果对大数据的分析挖掘具有重要理论价值,也必将为我国大数据产业的快速发展提供技术支撑。

项目摘要

大数据呈现出的大规模性、多模态性与增长性等特征,使得传统的数据分析理论、方法与技术面临着可计算性、有效性与时效性等严峻挑战。项目围绕大数据环境下多粒度数据挖掘的核心挑战,重点在大数据的特征降维、基于聚类的信息粒化、多粒度知识发现、网络数据分析与挖掘等方面开展了理论研究,并在空间天气预报、基于新闻评论的舆情分析、智慧科技信息服务等领域进行了应用研究。具体地:(1)在大数据的特征降维方面,提出了面向混合数据、动态数据和多模态数据的一系列粗糙特征选择高效算法;拓展了基于多视角协同、子空间聚类、多视角标记等一系列特征降维方法。(2)在基于聚类的信息粒化方面,提出了符号数据、多视图数据和动态数据的高效聚类粒化算法;提出了基于样本稳定性、类簇质量评估以及信息熵理论的聚类集成高效算法。(3)在多粒度知识发现方面,建立了线性时间复杂度的局部粗糙建模方法;设计了大规模数据聚类、分类的多层次结构学习方法;提出了基于度量学习的多模态学习算法。(4)在网络数据分析与挖掘方面,提出了面向冷启动、多源、复杂拓扑信息环境的链接预测方法;提出了基于多粒度用户兴趣建模、社区专家的推荐算法;提出了面向评论、跨语言、非平衡文本的情感倾向分析算法。(5)在应用研究方面,研制了空间太阳活动预报系统、基于多粒度的森林火灾预报系统、面向新闻评论的舆情分析系统、智慧科技信息服务平台、文本情感分析技术资源开放与服务平台。项目研究成果系统地发展了数据建模的粒计算理论与方法体系,为大数据的分析与挖掘提供了技术支撑。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
5

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017

梁吉业的其他基金

批准号:60773133
批准年份:2007
资助金额:28.00
项目类别:面上项目
批准号:70971080
批准年份:2009
资助金额:26.00
项目类别:面上项目
批准号:70471003
批准年份:2004
资助金额:12.00
项目类别:面上项目
批准号:60275019
批准年份:2002
资助金额:22.00
项目类别:面上项目
批准号:61876103
批准年份:2018
资助金额:62.00
项目类别:面上项目
批准号:U1435212
批准年份:2014
资助金额:150.00
项目类别:联合基金项目
批准号:71031006
批准年份:2010
资助金额:150.00
项目类别:重点项目

相似国自然基金

1

面向大数据的粒计算理论与方法

批准号:U1435212
批准年份:2014
负责人:梁吉业
学科分类:F0607
资助金额:150.00
项目类别:联合基金项目
2

面向高维数据的粒计算理论与方法

批准号:61772323
批准年份:2017
负责人:魏巍
学科分类:F0607
资助金额:63.00
项目类别:面上项目
3

面向大数据降维的粒计算理论与鱼群优化方法研究

批准号:61573297
批准年份:2015
负责人:陈玉明
学科分类:F0608
资助金额:63.00
项目类别:面上项目
4

面向复杂数据的粒计算知识发现方法研究

批准号:61363047
批准年份:2013
负责人:黎敏
学科分类:F0607
资助金额:45.00
项目类别:地区科学基金项目