With the development of big data and information technology, insurance companies have collected more and more individual claim data, which can improve the prediction accuracy of unpaid claims liabilities and hence benefit the enterprise risk management. From the perspective of individual claim, the project originates from the C-ROSS to develop the theory of individual claims reserving models and conduct the empirical analysis. The project implements several machine learning algorithms, including cluster analysis, principal components analysis, decision trees, neural networks, etc. More specifically, this project will first apply the unsupervised learning methods to extract driving risk factors from telematics big data, apply the Poisson process to predict the number of incurred but not reported claims in workers’ compensation, and apply the time series models to predict the changes of individual claims features in workers’ compensation. Then this project will establish the individual claims reserving models for both car insurance and workers’ compensation with supervised learning methods. Finally, the bootstrap and HMC will be used to analyze the parameter uncertainty and prediction uncertainty of the individual claims reserving models to simulate the predictive distribution of unpaid claims.
随着大数据和信息技术的发展,保险公司搜集了越来越多的个体赔案信息,使用这些个体赔案信息有助于更加准确地评估未决赔款准备金,提高保险公司的风险管理水平。本项目结合我国保险业偿付能力监管的现实需求,从个体赔案的视角,以机器学习理论为基础,综合聚类分析、主成分分析、决策树、神经网络等模型与方法的最新发展,对非寿险个体准备金评估模型进行理论研究和实证分析。具体而言,本项目首先用无监督学习方法从车联网大数据中提取个体保单的驾驶行为风险因子,用泊松过程预测工伤保险中已发生未报案案件数,用时间序列模型预测个体工伤保险赔案信息的变化;然后,基于有监督学习方法分别建立个体车险准备金评估模型和个体工伤保险准备金评估模型;最后,使用Bootstrap和汉密尔顿蒙特卡洛模拟分析准备金评估模型的参数不确定性和预测不确定性,进而得到未决赔款的预测分布,为准确计算保险公司的准备金风险和偿付能力充足率奠定基础。
经过信息技术的不断发展,保险公司收集到的个体保单和个体赔案数据变得越来越详细。因此,可以利用数据科学的相关技术来挖掘其中的价值,优化准备金评估模型和费率厘定模型,从而提高保险公司负债评估以及费率厘定的科学性和准确性。.在子课题一中,研究了车联网数据的预处理,并进行了探索性分析。研究表明,车联网数据可能带来相关隐私问题。此外,提出了两种从车联网数据中提取驾驶行为风险因子的方法:一种基于速度-加速度热力图,另一种基于单个行程的驾驶行为时间序列数据。研究表明,低速行驶下急刹车是最危险的驾驶行为。最后,研究了驾驶行为风险因子对准备金评估和保险定价的影响。研究表明,传统的精算风险因子和驾驶行为风险因子都是获得最佳保险损失预测所必需的,这两种风险因子是互相补充的关系而非替代的关系。.子课题二使用的关键数据是国内某保险公司收集的大约2000辆汽车连续3年的车联网数据、保单数据和理赔数据。应用前景体现在:基于车联网数据,提高保险公司准备金评估的精度,提升保险公司的风险管理能力;基于车联网数据,开发更加“公平”的费率厘定系统,通过优惠折扣吸引更安全的驾驶员。.在子课题二中,研究了个体赔案支付历史与结案的关联,及其对个体准备金评估的影响。研究表明,它们之间存在较强的关联,如果忽略此关系,会造成准备金评估的显著错误,且导致更大的预测不确定性。此外,利用自然语言处理技术挖掘了理赔案件描述文本,并建立了个体准备金评估模型。研究表明,引入理赔案件的主题特征变量,可以提升个体赔案最终赔款的预测精度。最后,研究如何改进传统的过离散泊松准备金评估模型,提出了基于双泊松分布的准备金评估模型。研究表明,灵活的离散度建模可以显著提高准备金预测分布估计的准确性。.子课题二使用的关键数据是Kaggle中的公开数据集Actual Loss Predicton。应用前景体现在:提出的文本数据挖掘方法可以对赔案描述文本进行主题建模,进而提高准备金评估的准确性;通过选取合适的损失函数,对期望和离散度联合建模,这种方法可以拓展到基于机器学习的准备金评估中,进而量化机器学习预测的不确定性。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
低轨卫星通信信道分配策略
非寿险定价与索赔准备金评估的分层模型研究
Solvency II 框架下非寿险准备金风险度量与控制研究
基于机器学习构建胃癌风险评估模型的研究
非寿险经验费率模型研究