结构性数据中属性重要性评价及其统计推断

基本信息
批准号:11001019
项目类别:青年科学基金项目
资助金额:17.00
负责人:胡丹
学科分类:
依托单位:北京师范大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:郭小娟,王杰亮,殷允强,胡凯,朱童
关键词:
结构性数据统计推断属性重要性评价
结项摘要

结构性数据(属性间存在时间和因果关系的数据)在自然、社会科学领域中几乎无处不在,结构性数据的属性重要性评价是模型构建、分析和决策的关键。然而,现有属性重要性评价方法在研究中均采用属性并行式模式,效应分析过程中"结构性"的遗漏直接导致了"间接效应"的缺失,从而使研究结果产生较大偏倚,被领域专家所质疑,亟需提出适合于结构性数据的属性重要性评价方法。本项目针对此需求展开研究:1)结构性数据有向结构图的构建;2)基于有向图的结构神经网络模型和Rough-效用结构模型的构建与分析;3)结构神经网络模型和Rough-效应结构模型中的属性重要性评价;4)结构模型中各子效应及属性重要性度量的统计推断。项目研究成果可为结构性数据中系统机理的揭示和客观真实的效应评价提供理论和方法支撑;相关度量的统计推断研究对弥补智能数据分析方法数理基础薄弱的问题具有借鉴意义;而结构性数据的普遍存在使研究成果有广泛应用前景。

项目摘要

结构性数据在各个领域中普遍存在,充分利用属性间的结构性进行属性的关联性分析和重要性评价至关重要。本项目打破传统属性重要性评价中采用的属性并行式模式,通过结构性神经网络模型、分层混合神经网络及模糊推理神经网络的构建,深入开展属性关联分析和重要性评价研究。同时从多角度展开属性依赖度和重要性度量的统计推断研究,首次解决了传统数据挖掘领域中度量无法进行区间估计的问题,丰富了智能数据分析的理论基础,并为智能数据分析和经典的统计数据分析搭建了桥梁。本项目研究基本按照研究计划进行,主要成果为:1)首次提出了残差型结构神经网络模型。通过残差神经元的引入,分解和展现了输入属性对输出属性的直接效应和间接效应。在残差型结构神经网络中,提出了基于权积法和偏导法的属性重要性评价方法。2)首次实现了粗糙集理论中属性依赖度和重要性度量的区间估计和显著性检验。提高了依赖度和重要度的鲁棒性,对相关度量统计推断研究具有重要的参考意义。本项目分别从多项分布的极大似然估计和Kolmogorov-Smirnov匹配度检验两个角度研究了依赖度和重要性的统计推断问题。提出了依赖度固定值检验基础算法(BFToDD)和基于极大似然估计与卡方匹配度检验的依赖度固定值检验算法(FToDD1),进一步得到了依赖度区间估计显式表达式和区间估计极限定理。首次提出具有不同非零元列联表的匹配度检验算法,提出基于K-S检验的列联表匹配度检验基础算法(EGoFTCT)。进一步地,在充分考虑列联表行列变换对算法结果影响的基础上,提出了列联表匹配度检验优化算法(AGoFTCT)。通过将依赖度变换为符合条件的列联表,提出了基于K-S检验的依赖度固定值检验算法(HToDD-ks)和依赖度域估计算法(REoDD-ks)。最后,结合属性重要性的本质意义,提出了属性重要性的显著性检验及域估计算法(SIoID)。3)针对基于包含度定义的属性依赖度和重要性度量,深入分析依赖度确定值与列联表元素约束间的关系,提出了基于包含度的依赖度显著性检验算法(STDDid)。4)深入研究了分层混合模糊神经网络,提出了基于Lasso函数的分层混合模糊神经网络,并基于偏导法研究了该模型下属性的重要性评价。5)构建了简化的模糊推理神经网络(spFINN),首次提出了输入变量敏感性分析的spFINNSI方法,该方法对模糊神经网络中的属性重要性评价具有重要的借鉴意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

混采地震数据高效高精度分离处理方法研究进展

混采地震数据高效高精度分离处理方法研究进展

DOI:10.3969/j.issn.1000-1441.2020.05.004
发表时间:2020

胡丹的其他基金

批准号:11004131
批准年份:2010
资助金额:19.00
项目类别:青年科学基金项目
批准号:31670036
批准年份:2016
资助金额:67.00
项目类别:面上项目
批准号:11504006
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:81904136
批准年份:2019
资助金额:21.00
项目类别:青年科学基金项目
批准号:11471213
批准年份:2014
资助金额:60.00
项目类别:面上项目
批准号:81501725
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:71904040
批准年份:2019
资助金额:19.00
项目类别:青年科学基金项目
批准号:81302673
批准年份:2013
资助金额:24.00
项目类别:青年科学基金项目
批准号:30772368
批准年份:2007
资助金额:30.00
项目类别:面上项目
批准号:81401051
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:91630208
批准年份:2016
资助金额:150.00
项目类别:重大研究计划
批准号:31870032
批准年份:2018
资助金额:59.00
项目类别:面上项目
批准号:81670304
批准年份:2016
资助金额:57.00
项目类别:面上项目
批准号:11471045
批准年份:2014
资助金额:65.00
项目类别:面上项目

相似国自然基金

1

加权网络数据建模及其统计推断

批准号:11401239
批准年份:2014
负责人:晏挺
学科分类:A0403
资助金额:22.00
项目类别:青年科学基金项目
2

临床数据交叉设计下的复杂等效性评价及统计推断

批准号:11661081
批准年份:2016
负责人:王顺芳
学科分类:A0403
资助金额:36.00
项目类别:地区科学基金项目
3

纵向数据分析中的有效统计推断方法及其应用

批准号:11271347
批准年份:2012
负责人:张伟平
学科分类:A0403
资助金额:50.00
项目类别:面上项目
4

复杂数据的统计建模,推断及其应用

批准号:10231030
批准年份:2002
负责人:何书元
学科分类:A0402
资助金额:105.00
项目类别:重点项目