Positive sequential pattern (PSP) mining is one of the most effective ways to detect medical insurance frauds. As an important supplement to PSP's research,negative sequential pattern (NSP) mining also takes into account non-occurring events. Thus it can provide more comprehensive decision-making information for medical insurance fraud detection. Therefore, NSP mining has important academic significance and practical value. This project will study on key techniques of NSP mining and their applications in medical insurance fraud detection. There are three aspects in details. 1) Probing into a loose negative sequence constraint mechanism that can mine more NSPs so as to provide more comprehensive information for decision-making, but also can avoid NSPs' number explosion. By means of looking for an efficient method to generate negative sequential candidate pattern (NSCP) and a rapid method to calculate NSCP's support to adapt to the loose constraint mechanism, a high performance NSP mining algorithm can be got. 2)Looking for an efficient mechanism for pattern selection from large numbers of positive and negative sequential patterns so as to make up for the imperfection that PSP may mislead decision-making, and to make decision correctly. 3) Exploring a method to convert medical transactional data to sequential data format, and a method to extract normal patterns and fraud patterns in knowledge base of medical insurance fraud detection. By constructing a model for medical insurance fraud detection and developing a software system, this project can provide more comprehensive decision-making information for detecting medical insurance frauds efficiently.
正序列模式(PSP)挖掘是检测医保欺诈的有效方法之一,作为其研究的重要补充,负序列模式(NSP)挖掘还考虑了未发生的事件,能够为医保欺诈检测提供更全面的决策信息,有重要学术意义和实用价值。本项目对NSP挖掘的关键技术及其在医保欺诈检测中的应用方法进行研究。具体为:1)探讨一种宽松负序列约束机制,既能得到数量更多的NSP以提供更全面的决策信息,又能避免NSP数量爆炸问题;寻找一种宽松约束机制下负序列候选模式的有效生成方法及其支持度的快速计算方法,以得到一个高效的NSP挖掘算法。2)探索一种从大量的正负序列模式中选取决策模式的机制,以弥补正序列模式可能误导决策的不足,为正确决策提供保障。3)探索从医保事务数据到医保序列数据的转换方法,以及医保欺诈检测知识库中正常模式和欺诈模式的提取方法。在此基础上,构建一个医保欺诈检测模型,开发相应软件系统,为有效检测欺诈提供更全面的决策支持。
本项目在项目期间主要针对负序列模式挖掘技术在医保欺诈检测中的应用研究进行了深入探索。研究方法得当,研究进度稳定,研究内容丰富,研究成果有效,不仅完成了项目申请书中提出的研究内容,而且在一定程度上扩展了研究内容,主要成果包括:.1)研究重复负序列模式挖掘技术,对重复负序列模式进行了定义,并提出了一种不需要重复扫描数据库的高效重复负序列模式挖掘算法e-RNSP。.2)研究了可决策的正负序列模式的选取方法,其中包含了对正负序列模式挖掘的讨论分析,目前可决策的知识挖掘以及兴趣方法应用在正负关联规则中选取兴趣的正负频繁项集的讨论分析。.3)针对负序列模式挖掘算法e-NSP的不足,项目组提出了一种更加快速地挖掘负序列模式的方法f-NSP。.4)放宽对负序列模式生成方法的约束,提出了一个不仅可以从正频繁模式,而且可以从非频繁正序列中挖掘负序列模式的方法e-NSPFI。.5)针对高效用负序列模式挖掘问题,提出了带负利润项的高效用序列模式挖掘算法HUSPNIV。.6)构建出医保欺诈检测模型,开发并使用了相应软件系统来对医保欺诈的检测提供了良好的决策。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
基于全模式全聚焦方法的裂纹超声成像定量检测
基于间隙约束的序列模式挖掘关键技术及其在特征提取中的应用
可决策的组合高效用序列模式挖掘关键技术研究
模式识别技术及其在光纤检测中的应用研究
基于辨别性模式的时间序列分类及其在可穿戴设备中的应用研究