基于图的特征选择学习算法及其在P2P借贷信用风险评估中的应用研究

基本信息
批准号:61602535
项目类别:青年科学基金项目
资助金额:21.00
负责人:崔丽欣
学科分类:
依托单位:中央财经大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:白璐,徐素秀
关键词:
人工智能P2P借贷特征选择图核函数
结项摘要

The P2P lending industry show explosive growth, at the same time, problems such as borrower defaults and platform collapse also emerge in an endless stream. Therefore, designing effective feature selection algorithms for P2P credit risk analysis is of tremendous significance. A huge amount of P2P data has been accumulated and these data are often high-dimensional and their interrelationships are very complex. In this proposal, we aim to develop effective feature selection algorithms to conduct precise P2P credit risk evaluation. We first investigate the feature representation method based on graph theory, and then develop novel kernel methods to calculate similarities among different features. These help us to obtain global information embedded in features. Then, we focus on the feature subset selection problem, and develop a new optimization approach based on particle swarm optimization to automatically determine the size of the feature subset and select the most informative and less redundant features. Our proposal achieves a breakthrough in the field of using feature selection techniques to conduct credit risk assessment of the P2P lending industry. It is of great significance and importance to the advancement of credit risk assessment of the P2P lending theory and applications.

P2P借贷行业呈现爆发性增长的同时,借款人违约、平台跑路、倒闭等问题也层出不穷。设计有效的特征选择学习算法是P2P借贷信用风险评估的关键。P2P借贷数据具有海量、高维、关联关系十分错综复杂的特点,这已成为P2P借贷信用风险评估研究的难点和瓶颈。本项目主要研究基于特征选择学习算法的P2P借贷信用风险评估问题。首先研究基于图的特征表示方法,进而提出新颖的图核函数计算特征与特征之间的相似度,以反映数据的全局信息。其次,研究特征子集的搜索问题,设计新颖的基于粒子群优化算法的全局搜索算法;该算法可自动确定特征子集特征个数,并搜寻最有益、冗余度最低的特征子集。本项目的研究有助于实现特征选择学习算法在P2P信用风险评估领域的突破,具有重要的学术意义和实用价值。

项目摘要

为实现基于图的特征选择学习算法在P2P借贷信用风险评估领域的突破,本项目专注于使用基于图的特征选择等机器学习算法进行金融数据分析,并解决了本项目提出的三个重要问题。这些问题包括:1)现有特征表示方法并没有充分反映样本包含的全部信息,也没有考虑特征与特征之间的复杂交互特征现象,从而大大限制了特征选择学习算法的应用范围;2)现有方法无法有效计算具有复杂相关关系的特征之间的相似度,且在解决特征子集搜索问题上,存在无法自动确定最优特征子集个数以及未在搜索过程中充分考虑特征与特征之间复杂相关性特征的缺陷;3)现有研究缺乏使用基于图的特征选择算法进行P2P借贷信用风险评估的理论与方法。本项目使用基于图数据的机器学习与模式识别方法,特别是基于图的特征选择,图核函数等展开了金融数据分析的工作,对相关新理论与新方法进行了深入研究。在本项目的支持下,课题组成员在国内外重要学术期刊、会议发表论文29篇。其中,期刊论文包括国际顶级或重要期刊IEEE Transactions on Cybernetics、Pattern Recognition、Neurocomputing、Pattern Recognition Letters等;会议论文包括ECML-PKDD、ICDM、ICPR、IEEE BigData等。组织国际会议1st ICPR Workshop on Pattern Recognition in Intelligent Financial and Risk Management一次。在国际模式识别领域著名期刊《Pattern Recognition》上组织了Special Issue on Graph-based Methods for Large Scale Financial and Business Data Analysis。本项目研究成果可为金融决策人员与相关从业人员提供重要的支持,具有重要的学术价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
2

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
3

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
4

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

DOI:10.3864/j.issn.0578-1752.2019.03.004
发表时间:2019
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

崔丽欣的其他基金

相似国自然基金

1

基于能量学习的特征选择方法及其应用研究

批准号:61073114
批准年份:2010
负责人:李云
学科分类:F0605
资助金额:32.00
项目类别:面上项目
2

基于多模态社会关系的P2P借贷用户信用评估模型研究

批准号:71601106
批准年份:2016
负责人:韩潇
学科分类:G0112
资助金额:17.50
项目类别:青年科学基金项目
3

基于信号理论与社会学习理论的P2P网络借贷模式研究

批准号:71572166
批准年份:2015
负责人:蔡舜
学科分类:G0209
资助金额:50.00
项目类别:面上项目
4

信用风险评估理论、方法及其应用研究

批准号:70171005
批准年份:2001
负责人:薛锋
学科分类:G0104
资助金额:13.00
项目类别:面上项目