With the advent of the Internet and “big data”, personal credit transactions in China has experienced a rapid growth and therefore, personal credit evaluation has become a hot topic in management science,especially in financial risk management. In the environment of big data, it should be an important issue that how to make full use of diverse data, especially the unstructured data, to better and improve the theory and methods in personal credit evaluation. The existing methods for credit evaluation are not appropriate for the massive, multidimensional, isomerism and asynchronous data stream brought by the Internet. Grounded on the theory of management and data science, this project includes data mining for unstructured credit information, fusion modeling with unstructured futures and default risk discrimination under multidimensional data streams. Finally, the proposed theoretical framework and corresponding results will be implemented in practice, improving the accuracy of personal credit evaluation in the age of big data. In conclusion, this project will explore the theory and method of personal credit evaluation based on unstructured data. It will facilitate the development of management, data science and other related disciplines. Besides, this project has a strong practicality and potential application values. The related research results will have a significant meaning to personal credit industry and financial regulatory authorities both theoretically and practically.
随着互联网和大数据时代的到来,国内的个人信用交易不断壮大,个人信用评价问题逐渐成为管理学特别是金融风险管理研究的热点前沿。在大数据环境下,如何充分利用多元化的数据,尤其是非结构化数据,进一步完善和改进个人信用评价理论与方法,是一个重要的管理科学问题。而现有的信用评价方法不能完全适应互联网发展带来的海量、多维、异构、异步数据流。本课题将以管理学、数据科学作为理论支撑,对于互联网带来的非结构化信用信息进行挖掘与提炼;对非结构化的信用特征进行融合建模;对多维数据流下的违约风险进行判别。最终将所构建的理论框架与成果应用于产业实践之中,提高大数据环境下个人信用评价的精确度。总之,本项目探索基于非结构化数据的个人信用评价理论与方法,将对管理学、数据科学及相关学科产生有益的促进;另外本课题具有较强的实践性,相关研究成果将为国内个人征信行业及金融监管部门提供理论与方法支撑。
个人信用评价是我国信用制度体系的重要组成部分,是管理科学中的重点研究问题之一。大数据时代中,如何在个人信用评价中充分利用丰富的非结构化数据资源、提高信用评价的准确性,对于维护金融秩序、刺激国民经济的发展等都具有重要意义。本项目以基于非结构化数据的个人信用评价为研究主题,进行管理学、数据科学交叉的前沿探索,并具体从三个方面展开研究:非结构化信用信息的数据模型、非结构化信用特征的融合建模、多维数据流下的违约风险判别。在项目过程中取得了一系列重要成果,包括:针对大规模网络数据建模,提出双模网络自回归模型、带有分组结构的空间自回归模型,并提出相应的特征筛选方法,从而在网络数据上实现信息利用全面、计算高效的统计推断,将个人信用评价拓展到网络分析的视角中;对复杂高维数据的建模分析,形成基于fused惩罚的稀疏主成分分析方法、基于独立成分分析技术的半参数模型、基于Kolmogorov-Smirnov统计量的快速迭代聚类方法、改进的GARCH-Ito分组因子模型等多个具有创新性的成果,覆盖多种非结构化数据的应用场景,从而在个人信用评价中引入丰富的可利用数据资源,并为信息提炼提供行之有效的解决方案;此外,本研究结合提出的模型方法,在近似计算、增量计算、子抽样方法等方面取得突破,加速模型计算,进一步提升研究成果对于实际征信实践的应用价值。本项目在国内外优秀学术期刊发表学术论文14篇,在国内外重要学术会议报告11次,并举办全国性学术会议2次,小型研讨会数十次,培养博士后、博士和硕士研究生20余人,并结合应用实践转化产出2项开源软件包,完成预期的研究目标。本项目研究成果有助于全方位挖掘非结构化数据,为我国个人征信行业及金融监管部门提供数据驱动的决策支持。同时本项目提出的模型方法也可应用于更多一般情形下非结构化数据上的机器学习、统计推断,为多种数据科学研究提供帮助。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
硬件木马:关键问题研究进展及新动向
低轨卫星通信信道分配策略
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
大数据环境下面向互联网金融的个人信用深度挖掘与评价研究
基于深度学习的非结构化大数据分析算法研究
大数据环境下基于量子计算的非结构化数据关键问题的研究
结构化与非结构化数据双向驱动的智能专利价值评估系统