基于云计算的海量数据挖掘

基本信息
批准号:61035003
项目类别:重点项目
资助金额:230.00
负责人:史忠植
学科分类:
依托单位:中国科学院计算技术研究所
批准年份:2010
结题年份:2014
起止时间:2011-01-01 - 2014-12-31
项目状态: 已结题
项目参与者:高阳,陈松灿,周菁,谭晓阳,杨育彬,商琳,窦全胜,刘俊,施智平
关键词:
分布式处理云计算并行挖据算法按需服务海量数据挖掘
结项摘要

本项目深入研究基于云计算的海量数据挖掘理论和关键技术:(1)研究面向海量数据挖据的云计算模式,提出云计算与主体(agent)计算相结合的模式,提高云处理单元的自主性和协作性;(2)研究云计算模式下海量数据预处理的方法和算法,基于本体的语义特点,提出异构海量数据集成的方法;(3)研究云平台上的并行分布海量数据挖据方法和算法,提出新颖的集成学习算法、汇集学习算法和语义关联学习算法;(4)利用语义Web服务和自治计算的研究成果,研究云计算的按需服务,提出具有特色的按需服务的云自治计算模式。在上述研究成果的基础上,针对电信、互联网搜索引擎等特定应用领域,研制具有国际先进水平的基于云计算的海量数据挖掘引擎原型系统。本项目研究力求在理论上有突破、方法和技术上有创新。在基于云计算的海量数据挖掘领域培养出具有国际竞争力的人才,在国际学术论坛上有更高的可见度,提升我国在海量数据挖掘技术领域的国际影响力。

项目摘要

云计算和大数据是当前极其活跃的研究领域。本项目主要研究基于云计算的海量数据挖掘理论和关键技术,在海量数据挖掘方法和算法、海量数据预处理方法和算法、云计算与智能体计算相结合的模式、云服务自适应的资源分配等方面取得创新成果如下:. 1.提出了利用数据内在结构的海量数据挖掘算法。利用数据内在结构的特征,提出了一个统一的能充分利用数据内在结构的、大规模稀疏学习特征挖掘框架;构建了结构正则化的SVM算法。发表在IEEE TNN上的相关论文已被引27次。. 2.提出了海量视频图像数据挖掘方法。针对计算机视觉应用中,视频与图像数据的特征复杂、异构、动态等特点,我们着重研究了多表示、多层次的特征学习与融合方法,有效支持医学诊断与视频异常检测等应用;为了克服训练图像关键词较少问题,提出了混合生成式和判别式模型的图像语义标注方法HGDM;提出了一种基于感知粒度计算的深度图像去雾方法。相关文章发表在IJNS、CVPR、JMLR、CVIU等国际期刊与会议上。. 3.提出了跨领域迁移学习算法和拓展典型相关分析方法。提出了基于生成模型的迁移学习分类算法CD-PLSA,该方法可同时处理多个源领域、多个目标领域的学习问题,而且考虑了这些由源领域知识得到的子分类器在目标领域上预测的一致性;提出了一种内省学习方法克服负迁移学习问题;基于特征映射迁移学习思想,提出了一种跨领域典型相关性分析CD-CCA算法。. 4.提出了维度约简和数据稀疏化方法。通过研究决策粗糙集模型中的风险损失和模型建立所需阈值参数之间的关系,将决策粗糙集中的属性约简问题转换成优化问题。针对图像数据固有的树型结构,采用最小堆挖掘出具有继承特性的特征。. 5. 提出云服务自适应的资源分配和任务调度方法。在海量数据挖掘云服务中,系统资源的分配、任务调度执行不再是单一整体的、集中式的优化问题,而是面向多层次用户的、分布式的优化问题。基于强化学习和多智能体技术,提出了云服务的资源分配和任务调度方法。. 6. 研制了大数据挖掘云引擎系统CBDME。该系统在云计算环境下实现跨域、异构、动态大数据的集成、分析、挖掘,以满足行业实际应用的需要。CBDME已应用于舆情分析、视频推荐、跨媒体检索等。开发了并行海量数据挖掘算法工具箱DoDo,并已应用于电信业务数据分析和推荐增值业务。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
3

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
4

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017
5

物联网中区块链技术的应用与挑战

物联网中区块链技术的应用与挑战

DOI:10.3969/j.issn.0255-8297.2020.01.002
发表时间:2020

史忠植的其他基金

批准号:69583008
批准年份:1995
资助金额:10.00
项目类别:专项基金项目
批准号:90604017
批准年份:2006
资助金额:48.00
项目类别:重大研究计划
批准号:69373003
批准年份:1993
资助金额:6.00
项目类别:面上项目
批准号:90104021
批准年份:2001
资助金额:30.00
项目类别:重大研究计划
批准号:60435010
批准年份:2004
资助金额:170.00
项目类别:重点项目
批准号:68673055
批准年份:1986
资助金额:2.00
项目类别:面上项目
批准号:60073019
批准年份:2000
资助金额:15.00
项目类别:面上项目
批准号:68880302
批准年份:1988
资助金额:3.50
项目类别:专项基金项目
批准号:60775035
批准年份:2007
资助金额:26.00
项目类别:面上项目

相似国自然基金

1

基于云计算的海量数据挖掘关键技术研究

批准号:61035004
批准年份:2010
负责人:李涓子
学科分类:F0305
资助金额:230.00
项目类别:重点项目
2

基于云计算平台Hadoop的海量数据聚类研究

批准号:61105052
批准年份:2011
负责人:赵卫中
学科分类:F0603
资助金额:22.00
项目类别:青年科学基金项目
3

云平台上基于海量医学图像并行数据挖掘的计算机辅助诊断技术研究

批准号:61562010
批准年份:2015
负责人:陈梅
学科分类:F0202
资助金额:38.00
项目类别:地区科学基金项目
4

基于云计算的海量网络数据管理与搜索技术

批准号:61073189
批准年份:2010
负责人:雷景生
学科分类:F0207
资助金额:33.00
项目类别:面上项目