The popularization of information technology makes the government possess and manages the complicated government big data. It is of great theoretical and practical significance to analyze the big data so as to help the government realize scientific and efficient governance. However, as the government big data are large-scale, wide distribution, multi-modal, dynamic, massive and poor uniformity, it is challenging for traditional shallow machine learning techniques to do well on these big data. Therefore, the project aims to study the key technologies for the analysis and prediction of government big data based on deep learning, including 1) the features extraction and semantic description methods of multi-modal government big data based on data puzzle; 2) deep learning analysis and prediction technology for science policy decision-making; 3) the decision-making and real-time policy evaluation technology based on data wisdom; 4) this project also intends to implement the above research contents in the unemployment rate and agricultural policy decision-making two demonstration applications based on the platform of Tianhe II. This study is expected to provide theoretical and key technologies for the realization of scientific, efficient, interpretable and accurate government decision-making, and achieve digitized and intelligent processes of government decision-making and evaluation systems based on government big data.
信息化技术的普及使得政府拥有和管理着庞杂的政务大数据,如何分析这些大数据以帮助政府实现科学高效的治理具有重要的理论和实际意义。然而由于政务大数据呈现出规模巨大、分布广泛、模态多样、动态演变、整齐度差等一系列特性,使得基于传统浅层机器学习的数据分析技术并不能很好的应用于这些大数据。因此,本项目拟研究深度学习支持的政府治理大数据分析与预测关键技术,具体包括1)基于数据拼图的多模态政府治理大数据的特征提取与语义描述方法研究;2)面向政府治理科学决策的深度学习分析和预测技术研究;3)基于数据众智的决策与实时政策评估技术研究;4)基于天河二号平台,实现上述研究内容在失业率和农业政策决策等领域的示范应用。本项目研究的展开可望为基于大数据的数字化、智能化政府决策过程和评估理论体系,为实现科学、高效、可解释和精准的政府决策提供理论和关键技术。
政务大数据呈现出大规模、多模态等复杂特性,利用深度学习技术处理政务大数据,帮助政府实现科学高效的数据治理具有重要的理论和实际意义。课题组在基金的支持下,按照(1)多模态政府治理大数据特征提取与语义描述、(2)面向政府治理科学决策的深度学习分析和预测技术、(3)基于数据众智的决策与政策评估三个内容依次开展深度学习支持的政府治理大数据分析与预测研究。具体的,针对政务大数据的多模特性,提出了基于注意力机制的对抗哈希网络多模态数据表示;构建了支持解释性的推理文本生成模型,为辅助政府决策提供可解释的建议;建立了基于动态数据的传导型零样本深度学习预测模型,把握政务数据的动态性,做出更精准的预测;提出了基于深度增强网络的预测模型,进一步加强预测准确性;提出了基于多智能体的策略梯度的深度学习决策模型,辅助政务决策。示范应用方面,开发了一个新闻事件真实性预测系统,系统在事实检测排行榜上获得第一名并持续了九个月之久。项目建设期内,在国际、国内高水平学术会议(如,NeurIPS、ACL、CVPR、AAAI、IJCAI等)和期刊(如,IEEE TKDE、 TCSV、TIST、计算机学报)上共发表了72篇研究论文,其中CCF A类22篇,CCF B类29篇。申请中国专利13项,PCT专利2项。获国家科学技术进步二等奖1项(2019,董启文,排名第9),高等学校科学研究优秀成果奖二等奖1项(2019,董启文,排名第3),广东省科学技术进步奖一等奖1项(2021,印鉴,排名第1),上海市科学技术进步一等奖1项(2020,董启文,排名第5),培养国家级青年人才1人。3名在读博士生获得微软学者称号,博士生获得2019、2020、2021年腾讯广告算法大赛冠军,硕士生获得腾讯犀牛鸟精英人才培养计划一等奖。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
硬件木马:关键问题研究进展及新动向
卫生系统韧性研究概况及其展望
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
货币政策与汇率制度对国际收支的影响研究
政府治理大数据行为知识图谱关键技术研究
面向大数据分析的自学习网络关键技术研究
大数据机器学习与数据分析统一编程计算模型与关键技术研究
基于深度学习的非结构化大数据分析算法研究