面向金融大数据的半监督聚类集成挖掘关键技术研究

基本信息
批准号:61572225
项目类别:面上项目
资助金额:66.00
负责人:王丽敏
学科分类:
依托单位:吉林财经大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:于卓熙,吴春国,冯由玲,孙亮,崔立芝,刘颖,祝志川,姬强,陶兴
关键词:
半监督学习聚类集成群智能收敛性金融大数据
结项摘要

The financial big data mining is a challenging research project with clear application prospect in fields like financial risk control, financial management and decision optimization, business innovation. Financial data are massive, high-dimensional and nonlinear, whereas available data mining methods are usually complex computation and with weak adaptability. Some researches on key techniques based on financial data clustering ensemble mining are carried out. The investigations were based on semi-supervised theory. The main contents including: (1) some strategies such as weight operator, distance measurement and multi-group intelligent evolution were developed to propose a self-adaptive intelligent weighted similarity measuring method. (2) Based on singular value decomposition and stable threshold, novel semi-supervised clustering models combined with multiple strategies are established. (3) The diversity clustering factor and measure method are both proposed, so the design of ensemble function in ensemble model is also obtained. (4)The novel models and technologies are established based on semi-supervised theory, clustering methods and ensemble technologies, which have some advantages such as robustness, accuracy, parallelism. In addition, the mathematical proof of convergence is also carried out. The objective of this project is to solve the core problems influencing the data mining performance in financial field, and provide theoretical and technical supports for financial data mining, intelligent information processing,financial management and decision-making.

金融大数据挖掘是一个具有挑战性的研究课题,在金融风险防控、金融管理与决策优化、业务创新等方面具有明确的应用前景。针对金融数据海量、高维、非线性等特点和现有挖掘方法存在的计算复杂度高、普适性差等问题,本项目拟结合半监督学习理论,开展金融数据聚类集成挖掘的关键技术研究。主要内容包括:(1)分别构造赋权算子、距离测度和多群体智能进化等策略,提出自适应智能赋权相似度度量方法。(2)分别构造奇异值分解、稳定阈值等策略,提出融合多种策略的半监督聚类新模型。(3)构建差异性基聚类因子和差异性度量方法,实现集成模型中共识函数的设计。(4)在此基础上,融合半监督理论、聚类方法和集成技术,构建具有鲁棒性、精确性和并行性的半监督聚类集成新模型与新技术,并对其收敛性进行数学证明。本项目拟解决影响金融数据挖掘性能的核心问题,可望为金融数据挖掘、智能信息处理、金融管理与决策提供理论与技术支持。

项目摘要

金融数据具有海量、高维和非线性等特点。金融数据挖掘作为金融数据分析与处理的重要技术,目前已经成为国内外研究的热点,并成为独具特色的研究分支。聚类是数据挖掘的关键技术之一,是本项目研究的重要手段。本项目针对传统聚类算法密度峰值聚类算法、仿射传播聚类算法等进行了理论改进研究与应用研究。考虑到传统聚类算法存在的弊端,通过引入布谷鸟搜索算法、蝙蝠优化算法、萤火虫优化算法等若干具有快速全局搜索优势的群智能优化方法,提出了若干具有仿生智能特征的新的聚类方法,如基于蝙蝠优化的再聚类算法,基于萤火虫优化的近邻传播聚类算法等。通过引入万有引力理论、半监督学习理论、加权相似度理论等思想,提出了一系列改进的混合聚类模型,如基于万有引力理论的近邻传播聚类算法,基于加权相似度的自适应近邻传播聚类算法等。通过采用改进相似度、簇类中心等若干策略,提出了一系列具有更优聚类精度的聚类算法,有效提升了传统聚类模型的聚类性能,如基于改进距离函数的近邻传播聚类算法,基于截断距离和簇中心点自动选择策略的密度峰值聚类算法。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

DOI:10.13465/j.cnki.jvs.2020.09.026
发表时间:2020
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

物联网中区块链技术的应用与挑战

物联网中区块链技术的应用与挑战

DOI:10.3969/j.issn.0255-8297.2020.01.002
发表时间:2020
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

王丽敏的其他基金

批准号:61202306
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:30900022
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:31670045
批准年份:2016
资助金额:59.00
项目类别:面上项目
批准号:81301918
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:31270108
批准年份:2012
资助金额:80.00
项目类别:面上项目

相似国自然基金

1

半监督聚类集成的关键技术研究

批准号:61003142
批准年份:2010
负责人:王红军
学科分类:F0607
资助金额:18.00
项目类别:青年科学基金项目
2

面向企业流程行为大数据的半监督聚类关键技术研究

批准号:61702213
批准年份:2017
负责人:王楠
学科分类:F06
资助金额:28.00
项目类别:青年科学基金项目
3

面向高维数据集成降维的半监督聚类方法研究

批准号:61105048
批准年份:2011
负责人:曾洪
学科分类:F0603
资助金额:24.00
项目类别:青年科学基金项目
4

基于衍生距离数学模型的半监督聚类集成研究

批准号:61572199
批准年份:2015
负责人:余志文
学科分类:F0201
资助金额:65.00
项目类别:面上项目