WEB信息融合粒化与聚合技术研究

基本信息
批准号:61379109
项目类别:面上项目
资助金额:75.00
负责人:张祖平
学科分类:
依托单位:中南大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:张昊,袁鑫攀,陈科文,GAUDENCE,陈海林,王鲁达,邹力耕,阳洁,洪鹏
关键词:
信息检索信息提取粒计算数据融合信息聚合
结项摘要

The project aims to realize the display of effective information identically and credibly based on moderate granulation and multidimensional aggregation of information, which is to address the problems of flood of results and difficulty in distinguishing and extracting information. The project intends to introduce b minwise similarity measure algorithms, GPU-based parallel computing models, MapReduce framework for cloud computing and services to construct some models for information granulation, display, feature measures and trust computing. We plan to conduct effective information purification treatments such as clean and reliable markers from the perspective of source of information. In order to address the problems of the demand characteristics of shallow and deep integration, we plan to devise methods to map granulation models and multi-layer fusion. We intend to provide multidimensional multi-granularity and multi-layer fusion technologies to solve the problem of intermiscibility and unity of the extraction results. In order to improve the availability and commodity of our research, the project will consider information syndication of scientific fellows as the research objects.

项目旨在通过对信息进行适度粒化与多维聚合,实现对有效信息的同一、可信与显现,以突破各类强大的WEB搜索引擎海量搜索结果淹没、真假难辨、提取困难等难题。 项目针对信息的海量性与计算的复杂性,拟引进b位minwise相似性度量算法、基于GPU并行计算模式及MapReduce云计算与服务框架,结合Web信息粒化与表示模型、信息源的特征度量与可信计算模型,从信源的角度对信息进行有效的去重、清洗及可信标记等静化处理;针对浅层与深度融合的需求特征,研究多维度、多粒度的粒层映射关系模型与多层融合方法,解决搜索结果的统一性与相容性问题,提供对象级、主题级及词级等多级融合技术。 项目将以科技工作者信息为对象开展研究,以验证研究的有效性和实用性。

项目摘要

人类社会已经开始迈入”人-机-物”融合的一体化智能时代,其中Web信息资源广泛存在,看似取之不尽、用之不竭,其获取与充分利用已成为社会发展的良好契机迫切需求与动力,但Web信息资源由于其海量性及相互关系的复杂性使其取之与用之普遍存在很高的技术门槛,如何充分利用Web信息资源已成为信息领域的重大挑战。.项目主要研究Web信息的度量与融合技术,旨在通过不同维度的信息粒化方法缩小信息搜索返回的结果集,从而提高信息搜索的效率与速度,最终提高Web信息获取的准确率和有效性;另一方面,通过对不同来源的、各个分散的Web信息进行聚合处理,用以大大减少搜索的结果集的数量,进而降解低搜索的复杂性。.项目组经过四年的研究,在Web信息的度量与融合方法及技术、信息的粒化及分类聚类的计算方面取得了一定的研究进展,基本上按照项目的研究进展规划,实现了项目申请时提出的研究目标。.针对信息粒化与信源质量在度量中存在的问题,我们研究了形式概念分析(Formal Concept Analysis)的核心数据结构—形式概念格,利用概念格有效地对外部世界进行层次化、结构化的粒化分析,用以解决信息粒化的基础理论问题。我们通过证明概念格更新过程中的相关命题,提出了三个概念格更新的高效算法。理论和实验分析都证明,这两个算法在数据海量时与现有的典型算法相比有着很明显的优势,研究成果发表了在3篇Expert Systems with Applications与Knowledge-Based Systems期刊论文上。.项目组还研究了基于熵的信息度量模型与方法响应了用于建立多层次多粒度的Web信息提取模型;引进了b位minwise相似性度量算法的扩展与基于Hadoop的大数据平台与GPU并行计算相结合的计算模式,有效提高了计算性能,面向自动文摘的技术及面向科技工作者的实体识别与基于主题的文档聚类及相似性比对、面向模板的信息提取与报告的生成响应了面向不同层级的信息融合与基于实证的研究手段。发表论文23篇,其中SCI论文8篇,EI论文11篇,其它论文4篇(含会议论文),申请发明专利10项,获授权6项。培养博士研究生6人,其中留学博士3人,培养硕士研究生28人,其中留学硕士4人。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
3

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

DOI:
发表时间:2020

张祖平的其他基金

批准号:60970095
批准年份:2009
资助金额:30.00
项目类别:面上项目

相似国自然基金

1

面向Web信息的知识融合关键技术研究

批准号:61272205
批准年份:2012
负责人:刘清堂
学科分类:F0607
资助金额:80.00
项目类别:面上项目
2

Web信息检索中搜索结果个性化和多样化算法的融合技术研究

批准号:61502501
批准年份:2015
负责人:窦志成
学科分类:F0211
资助金额:20.00
项目类别:青年科学基金项目
3

信息物理融合的Web对象可视检索技术研究

批准号:61170034
批准年份:2011
负责人:寿黎但
学科分类:F0202
资助金额:57.00
项目类别:面上项目
4

Web信息过滤的智能化方法与协作技术研究

批准号:60073030
批准年份:2000
负责人:张福炎
学科分类:F0214
资助金额:15.00
项目类别:面上项目