Spatial big data is the fundamental source in the information world. The emerging problems of massive volume, bad quality, and sparse value, makes it difficult to take full advantage of the data value, which brings new tasks for spatial data mining. In this project, the basic problems of data pollution and value inequality will be focused on for developing novel techniques for data cleaning and clustering, in the context of spatial big data. (1) Focusing on the issues of massive volume and bad quality, new techniques on data cleaning will be proposed to improve the quality of spatial data, avoiding the change from big data to big garbage in advance. (2) Concentrating on the issues of massive volume and sparse value, new methods on data clustering will be proposed to group spatial data under their values, implementing the big value of big data. (3) Big data from disasters is taken as an example to testify the usefulness of the proposed techniques, so that the value of spatial big data achieves the disaster prevention and mitigation.
空间大数据是信息世界的基础性资源,因为体量巨大、真实质差、价值密度低等问题,导致难以发挥数据价值,而带给空间数据挖掘新的任务。本项目在空间大数据的环境下,立足数据污染和价值不均等基础问题,研究空间大数据挖掘的关键技术。 (1)面向空间大数据的体量巨大、真实质差的问题,研究新的数据清理技术,提高数据质量,预防大数据变成大垃圾; (2)面向空间大数据的体量巨大、价值密度低的问题,研究新的数据聚类技术,根据价值密度聚集数据,实现大数据的大价值; (3)以灾害大数据为例应用,提高技术成果的实用性,让大数据实现减灾防灾的价值。
数据是国家资源,空间数据挖掘是充分利用数据的基础方法。本项目研究提出了数据场聚类、开集聚类、智能最大信息系数等关键技术,解决了空间大数据聚类的基础难题,深化了空间数据挖掘理论,获得国内外空间数据挖掘同行的高度认可和跟踪研究。完成了既定任务,部分成果超出预期。. 发表学术论文23篇(SCI收录13篇,EI收录23篇(与SCI重录13篇)),获Wiley Top Accessed Article in 2017, IGI Global 5th Annual InfoSci-Journals Excellence in Research Awards、RSPSoc 2017 Poster Paper Prize Merit Award、GSKI 2017 Best Paper、中国电子学会CJE 2015-2018年最受关注论文。. 出版专著2本(国家“十三五”重点图书1本,Springer Nature高影响力著作1本),获第五届中华优秀出版物奖图书奖,入选Springer Nature2018年日历中的12本经典著作,工信部“十二五”规划教材1本。主编会议论文集2本。. 国家发明技术专利授权2项,申请3项。. 建设“数据科学与智能”创新团队。培养教授1名,副教授2名,出站博士后1名,在站博士后2名,毕业博士研究生4名,在读博士研究生8名,毕业硕士研究生13名。获得中国指挥与控制学会青年科学家奖、中国人工智能学会吴文俊人工智能科学技术奖创新奖二等奖等。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多源数据驱动CNN-GRU模型的公交客流量分类预测
混采地震数据高效高精度分离处理方法研究进展
多源数据挖掘的关键技术研究
蒙医方剂数据挖掘关键技术研究
基于轨迹数据的用户意图挖掘关键技术研究
基于云计算的海量数据挖掘关键技术研究