In the application process of data mining technology for business intelligence, 'business understanding' and 'data understanding' are accomplished by the data-mining analysts, who will try to understand the intelligent data analysis demands from business prospective, and translate them into data mining theme and tasks. The intentional manipulation causes a blockage in the process of engineering for data mining application and the normalization of business intelligence..The project focuses on the obstacle in data mining engineering application process, and research on thoughts modeling and analytical theme discovery technology. The aim of the research is to propose a systematic method for automatically discovering data mining analytical theme, task and data collection strategy, by simulating the thinking pattern of decision makers..The research includes following issues:.(1) Thought unit modeling technology, which raises formally representation for thoughts unit and the relationship between them..(2) Thought analytical theme discovery method, which includes thought sequence identification algorithm, thought sequence clustering method, and extraction method of feature sequence for thought theme etc..(3) Logical structure analysis for thought analytical theme..(4) Thought analytical theme drift detection and update method, which puts forward monitoring index of theme drift, and update the current thought theme incrementally.
商务智能数据挖掘应用过程中"业务理解"和"数据理解"阶段任务(即确定数据挖掘分析主题及任务)缺乏工程化解决方法,阻碍了数据挖掘的工程化应用进程,影响商务智能工程化实践。.本项目针对数据挖掘工程化应用过程中上述障碍问题,研究面向业务决策人员的思维建模及分析主题发现技术。旨在模拟决策人员思维模式,给出主动确定数据挖掘主题、任务及相关数据组织策略的结构化方法。研究内容包括:.(1)思维单元的结构化建模技术,形式化表示思维单元及其之间的联系。.(2)思维分析主题发现方法,包括思维序列抽取、思维序列聚类和分析主题特征序列提取等子问题。.(3)思维分析主题逻辑结构识别方法。.(4)思维分析主题漂移检测及更新方法,检测思维分析主题漂移现象,并对其进行增量式更新。
针对商务智能数据挖掘应用过程中"业务理解"和"数据理解"阶段的任务,即数据挖掘分析主题及数据挖掘任务的确定问题,研究、建立工程化解决方法。在项目计划中,明确的研究内容有:(1)思维单元及其结构化建模技术,形式化表示思维单元及其之间的联系。(2)思维分析主题发现方法,包括思维序列抽取、思维序列聚类和分析主题特征序列提取等子问题。(3)数据挖掘任务确定方法。.本项目研究,到目前为止,取得以下研究进展:. (1)提出了思维序列构建方法。原始数据由大量散乱残缺的思维碎片组成,不能直接支持思维主题发现和思维模式发现的计算。思维流程发现必须首先将原始数据(概念对)转化为层次分明且信息完整的中间数据。思维序列构建是思维流程发现的第一步。思维序列构建将这些杂乱无序的思维碎片链接成为思维序列,使思维信息初步有序,为思维主题发现和思维模式发现奠定了基础。. (2)建立了思维(分析)主题发现方法。基于分析问题聚类的思维主题发现方法分为思维序列聚类和思维主题构建两部分。.思维序列聚类不断将思维序列与现有的分析问题的特征比较,将思维序列融入与其特征最为相近的分析问题,并更新融合之后的分析问题的分析特征。思维序列聚类将思维序列集聚集成分析问题集。.根据分析问题特征向量计算思维主题相似度,利用层次聚类法聚集思维主题。思维主题聚集完成之后,思维主题构建算法对思维主题进行概念层次结构分析和问题结构分析,给出思维主题的基本结构。. (3)提出了思维主题的更新算法。思维主题的更新算法在现有的思维主题的基础上采用增量更新的方法,通过更新思维序列集、更新分析问题和重新聚合思维主题三步,完成思维主题的更新。. (4)提出了数据挖掘任务发现方法。提出并论证了数据挖掘任务的判定定理,给出了基于概念网络的数据挖掘任务发现算法。特别说明:该部分研究成果已形成论文,将在2017年7月在日本举行的物流与信息服务科学国际学术会议上发表。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于分形L系统的水稻根系建模方法研究
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
面向智能计算系统的记忆与思维的研究
面向智能计算系统的记忆与思维的研究
面向Online-to-Offline智能商务的大数据融合与应用
面向智能电子商务的Web挖掘理论与技术研究