The P2P lending industry show explosive growth, at the same time, problems such as borrower defaults and platform collapse also emerge in an endless stream. Therefore, designing effective feature selection algorithms for P2P credit risk analysis is of tremendous significance. A huge amount of P2P data has been accumulated and these data are often high-dimensional and their interrelationships are very complex. In this proposal, we aim to develop effective feature selection algorithms to conduct precise P2P credit risk evaluation. We first investigate the feature representation method based on graph theory, and then develop novel kernel methods to calculate similarities among different features. These help us to obtain global information embedded in features. Then, we focus on the feature subset selection problem, and develop a new optimization approach based on particle swarm optimization to automatically determine the size of the feature subset and select the most informative and less redundant features. Our proposal achieves a breakthrough in the field of using feature selection techniques to conduct credit risk assessment of the P2P lending industry. It is of great significance and importance to the advancement of credit risk assessment of the P2P lending theory and applications.
P2P借贷行业呈现爆发性增长的同时,借款人违约、平台跑路、倒闭等问题也层出不穷。设计有效的特征选择学习算法是P2P借贷信用风险评估的关键。P2P借贷数据具有海量、高维、关联关系十分错综复杂的特点,这已成为P2P借贷信用风险评估研究的难点和瓶颈。本项目主要研究基于特征选择学习算法的P2P借贷信用风险评估问题。首先研究基于图的特征表示方法,进而提出新颖的图核函数计算特征与特征之间的相似度,以反映数据的全局信息。其次,研究特征子集的搜索问题,设计新颖的基于粒子群优化算法的全局搜索算法;该算法可自动确定特征子集特征个数,并搜寻最有益、冗余度最低的特征子集。本项目的研究有助于实现特征选择学习算法在P2P信用风险评估领域的突破,具有重要的学术意义和实用价值。
为实现基于图的特征选择学习算法在P2P借贷信用风险评估领域的突破,本项目专注于使用基于图的特征选择等机器学习算法进行金融数据分析,并解决了本项目提出的三个重要问题。这些问题包括:1)现有特征表示方法并没有充分反映样本包含的全部信息,也没有考虑特征与特征之间的复杂交互特征现象,从而大大限制了特征选择学习算法的应用范围;2)现有方法无法有效计算具有复杂相关关系的特征之间的相似度,且在解决特征子集搜索问题上,存在无法自动确定最优特征子集个数以及未在搜索过程中充分考虑特征与特征之间复杂相关性特征的缺陷;3)现有研究缺乏使用基于图的特征选择算法进行P2P借贷信用风险评估的理论与方法。本项目使用基于图数据的机器学习与模式识别方法,特别是基于图的特征选择,图核函数等展开了金融数据分析的工作,对相关新理论与新方法进行了深入研究。在本项目的支持下,课题组成员在国内外重要学术期刊、会议发表论文29篇。其中,期刊论文包括国际顶级或重要期刊IEEE Transactions on Cybernetics、Pattern Recognition、Neurocomputing、Pattern Recognition Letters等;会议论文包括ECML-PKDD、ICDM、ICPR、IEEE BigData等。组织国际会议1st ICPR Workshop on Pattern Recognition in Intelligent Financial and Risk Management一次。在国际模式识别领域著名期刊《Pattern Recognition》上组织了Special Issue on Graph-based Methods for Large Scale Financial and Business Data Analysis。本项目研究成果可为金融决策人员与相关从业人员提供重要的支持,具有重要的学术价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
拥堵路网交通流均衡分配模型
内点最大化与冗余点控制的小型无人机遥感图像配准
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
基于能量学习的特征选择方法及其应用研究
基于多模态社会关系的P2P借贷用户信用评估模型研究
基于信号理论与社会学习理论的P2P网络借贷模式研究
信用风险评估理论、方法及其应用研究