The big data phenomenon brings new opportunities and challenges to credit scoring. Internet data, which collects a broad range of information about customers in various aspect, could improve the accuracy of credit scoring model and assess creditworthiness of customers who have little or no credit history. However, due to its volume, variability, and velocity, it was impossible to analyze and extract useful information from the big data using traditional credit scoring models. It is one of the urgent needs of current credit reference system to collect and analyze credit related internet data by combining big data technology, data mining, and decision making theories. The objectives of this project include: investigate how to collect, transform, and integrate various types of social data; study decision making theories and methods that can be applied to large datasets; build credit scoring models that incorporate new valuable data sources from the internet. The results of this project will help solve issues in big data-based credit scoring, such as variable selection and information integration, and expand the horizon of decision making methods to large scale databases.
大数据时代给信用评估带来了新的机遇和挑战:互联网大数据为信用评分模型提供了全新的信息,而多源异构、海量动态的大数据给传统的信用评分模型带来了巨大挑战。如何应用大数据技术、数据挖掘算法、决策理论和方法,开展信用大数据的采集和挖掘,与信用风险评估有效结合,提高信用评估的准确性和灵活性,是我国现阶段征信系统发展的迫切需求。本项目着重研究信用评估相关的多源异构海量数据的整合和挖掘方法,探索大规模决策理论与方法,构建大数据环境下的社会信用评估方法和信用风险预警模型。本研究将有助于解决信用大数据中多源异构、高维复杂、信息融合等问题,在理论上拓展决策理论在处理大数据问题上的局限性,实现灵活多样、准确快速的大数据信用评价。申请团队在信用评估、数据挖掘、多目标决策等领域具备坚实的理论与实践经验,申请人入选汤森路透全球高被引科学家,爱思唯尔中国高被引学者,长江学者特聘教授,获国家杰出青年科学基金项目资助。
大数据时代下多源异构的海量数据信息为信用风险评估提供了新的研究视角,但是嘈杂的数据信息给数据挖掘和分析工作带来了巨大挑战。为了解决信用大数据中多源异构、高维复杂和信息融合等问题,本项目重要研究了多源异构海量数据的整合和挖掘方法、探索了大规模决策理论与方法,并基于相关理论和方法分析构建了大数据环境下的社会信用评估方法和信用风险预警模型。本项目主要研究成果如下:(1)解决了大数据背景下由于数据动态变化、决策边界复杂导致的线性不可分问题,并构建了基于大规模数据集的距离度量学习模型和成对比较方法;(2)分析了金融数据环境下的信用风险预测与欺诈检测方法,并提出了一种针对金融数据的集成聚类检测、优化和解释方法;(3)提出了基于群体决策背景下的信息集结、共识达成和阈值衡量方法,拓展了现有决策理论与方法研究;(4)构建了网络借贷背景下的决策共识达成模型与信用评估方法,将数据挖掘、决策理论与信用风险评估有效结合,实现了灵活多样、准确快速的大数据信用评价。本项目在相关领域的国内外期刊发表论文19篇,其中SCI检索16篇,SSCI检索 8篇,5篇论文入选美国ISI Web of Science 基本科学指标ESI高引用论文,1篇入选热点论文。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
黄河流域水资源利用时空演变特征及驱动要素
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
生物炭用量对东北黑土理化性质和溶解有机质特性的影响
面向金融大数据的信用风险度量与决策分析
大数据背景下基于联邦学习的小微企业信用风险评估研究
信用风险评估理论、方法及其应用研究
基于在线多源冲突数据融合分类方法的信用评级研究