面向互联网信贷的基于多源大数据的个人信用评分关键技术

基本信息
批准号:71671178
项目类别:面上项目
资助金额:48.00
负责人:刘莹
学科分类:
依托单位:中国科学院大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:吴开超,霍冰,崔荔蒙,崔红元,房月静,吴林志,魏广顺,杨家骏,向超
关键词:
互联网金融风险预测数据挖掘信用评分大数据
结项摘要

Internet banking is an important industry in the big data era. However, as the big data techniques are still at the beginning stage, China's Internet banking is not optimistic. Particularly, as the risk identification capability is low in Internet credit industry, the financial risk is high. Therefore, this proposal will focus on design and development of a multi-source data based credit scoring model for Internet credit. A multi-source data based personal identification model will be proposed which will change the methodology from account-based model to entity-based model. A financial risk based correlation detection method will be proposed for dimensionality reduction/feature selection for big data. Furthermore, a multi-source data based hybrid credit scoring model will be proposed and implemented, which will contribute to the credit scoring research and technology as well as big data.In order to make it capable to process TB-scale data, we will propose a parallel credit scoring model. This proposal will implement the proposed credit scoring model and a big data collection platform for Internet credit industry. Eventually,case studies will be conducted on real applications, where the feasibility and the effectiveness will be evaluated and reported. Therefore, the outcome of the proposed project will contribute to the progress of China's big data technology and Internet finance.

互联网金融是互联网+时代的重要产业。然而,由于基于互联网大数据的管理与决策技术还处在起步阶段,我国的互联网金融水平较低。尤其是互联网信贷行业,由于对互联网上借贷人的信用风险的评估能力较低,导致存在较大金融风险。因此,本项目将致力于多源大数据驱动的面向互联网信贷的个人信用评分模型的研究。通过提出基于多源大数据的个人身份识别模型,改变目前业界以账户为自然人的评分模式,全面地掌握并反映出借贷人的信用风险;提出一种基于风险相关性判别的大数据特征提取方法;建立融合多源数据的混合信用评分模型。这将是信用评分理论和技术体系的创新和贡献。面对TB级的互联网信贷数据,为解决模型的可扩展性和性能问题,将研究分布式/并行式的信用评分计算方法。本项目将实现评分模型原型和信贷大数据采集平台,并在真实的产业平台上展开应用研究,检验其有效性和可行性。本项目的研究成果将为我国的大数据科技和互联网金融产业发展做出贡献。

项目摘要

随着互联网+时代的到来,互联网金融正在我国蓬勃发展。然而,目前我国的网贷经营状况不佳。坏账的积聚已成为网络信贷的罪魁祸首。究其原因,缺乏对借贷方的信用风险评分,风险控制不良。.目前,国内外在网络信贷个人信用评分方面的研究刚刚起步。虽然对互联网信贷信用展开了研究,但还有很多问题亟待解决。.首先,着力于互联网信贷个人用户身份识别问题的研究。鉴于互联网信贷数据的来源多样化,包括文本、网页、图像挖掘等,类型复杂、非结构化,很难确定其所包含的核心内容、主题、以及情感倾向,本项目研究了文本主题提取技术、领域专业词汇生成技术、领域词汇本体生成算法,以及基于深度学习的领域术语自动生成模型。.然后,针对图像类的信贷数据,着重研究了如何从多源异构的互联网信贷数据中提取出与信贷风险最相关的特征,提出了一系列基于深度学习的小目标特征提取模型、小目标检测和识别模型。.接下来,将多源、多类型的数据融合,研究了基于图挖掘的风险预测模型、基于迁移学习的个人信用评分模型,以及基于注意力机制和因子分解机的信用评分模型。.所提出的各种模型,在公开的图像检测识别数据集、文本分类数据集、信用风险预测数据集上取得了优于其它模型的成绩。.然后,为了解决互联网信贷公司与传统商业银行数据不共享、各互联网信贷公司之间数据资源也不共享的壁垒问题,本项目实现了多源大数据个人信用评分模型软件原型,将底层数据打通,实现数据共享。.最后,在国内、国外的信用风险公开数据集上,本项目所研究的个人信用评分模型取得了很好的效果;同时,在真实的应用(考拉征信个人信用评分)中取得了较高的K-S指标。.本项目共发表论文18篇,其中7篇SCI检索,9篇EI检索;共形成2个软件著作权。.本项目所研究的面向互联网信贷的信用评分模型促进了不同学科的融合,不但能够提高互联网金融风险管控水平和效率,还将具有广阔的应用前景和商业价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
3

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
4

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
5

敏感性水利工程社会稳定风险演化SD模型

敏感性水利工程社会稳定风险演化SD模型

DOI:10.16265/j.cnki.issn1003-3033.2021.04.003
发表时间:2021

刘莹的其他基金

批准号:60873253
批准年份:2008
资助金额:30.00
项目类别:面上项目
批准号:51679130
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:31770214
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:41875153
批准年份:2018
资助金额:62.00
项目类别:面上项目
批准号:81901394
批准年份:2019
资助金额:20.50
项目类别:青年科学基金项目
批准号:60303006
批准年份:2003
资助金额:23.00
项目类别:青年科学基金项目
批准号:50975157
批准年份:2009
资助金额:40.00
项目类别:面上项目
批准号:51878202
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:71802109
批准年份:2018
资助金额:19.00
项目类别:青年科学基金项目
批准号:31400911
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目
批准号:39580007
批准年份:1995
资助金额:8.00
项目类别:专项基金项目
批准号:61202321
批准年份:2012
资助金额:24.00
项目类别:青年科学基金项目
批准号:21576264
批准年份:2015
资助金额:65.00
项目类别:面上项目
批准号:51508113
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:81400247
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:31601434
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:51308142
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:20873003
批准年份:2008
资助金额:34.00
项目类别:面上项目
批准号:61202085
批准年份:2012
资助金额:22.00
项目类别:青年科学基金项目
批准号:81501036
批准年份:2015
资助金额:17.50
项目类别:青年科学基金项目
批准号:21776285
批准年份:2017
资助金额:64.00
项目类别:面上项目
批准号:31070784
批准年份:2010
资助金额:30.00
项目类别:面上项目
批准号:51508384
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:50545035
批准年份:2005
资助金额:8.00
项目类别:专项基金项目
批准号:81301189
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:21573012
批准年份:2015
资助金额:67.00
项目类别:面上项目
批准号:81501537
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:51275268
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:51209125
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:81400157
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:81560455
批准年份:2015
资助金额:37.00
项目类别:地区科学基金项目
批准号:31570819
批准年份:2015
资助金额:62.00
项目类别:面上项目
批准号:20473001
批准年份:2004
资助金额:22.00
项目类别:面上项目
批准号:21306098
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:30870959
批准年份:2008
资助金额:30.00
项目类别:面上项目
批准号:31801097
批准年份:2018
资助金额:20.00
项目类别:青年科学基金项目
批准号:61772307
批准年份:2017
资助金额:68.00
项目类别:面上项目
批准号:41005067
批准年份:2010
资助金额:22.00
项目类别:青年科学基金项目
批准号:20773002
批准年份:2007
资助金额:8.00
项目类别:面上项目
批准号:71103013
批准年份:2011
资助金额:19.00
项目类别:青年科学基金项目
批准号:50275071
批准年份:2002
资助金额:25.00
项目类别:面上项目
批准号:31100160
批准年份:2011
资助金额:10.00
项目类别:青年科学基金项目
批准号:51165031
批准年份:2011
资助金额:54.00
项目类别:地区科学基金项目
批准号:30600738
批准年份:2006
资助金额:20.00
项目类别:青年科学基金项目
批准号:21877003
批准年份:2018
资助金额:63.00
项目类别:面上项目
批准号:60424003
批准年份:2004
资助金额:1.60
项目类别:专项基金项目
批准号:41175112
批准年份:2011
资助金额:60.00
项目类别:面上项目

相似国自然基金

1

个人信用评分模型设计

批准号:70141015
批准年份:2001
负责人:方兆本
学科分类:G01
资助金额:6.00
项目类别:专项基金项目
2

大数据环境下面向互联网金融的个人信用深度挖掘与评价研究

批准号:61702053
批准年份:2017
负责人:张在美
学科分类:F06
资助金额:26.00
项目类别:青年科学基金项目
3

面向多源异构征信大数据的信用评分理论、方法与应用研究

批准号:71901179
批准年份:2019
负责人:唐静静
学科分类:G0112
资助金额:18.00
项目类别:青年科学基金项目
4

面向多源空间相关大数据的数据清洗系统关键技术研究

批准号:61702183
批准年份:2017
负责人:曹文治
学科分类:F0204
资助金额:23.00
项目类别:青年科学基金项目