In order to overcome the bottleneck of traditional representations of vague concepts in the application of semantic analysis of high dimensional data, this proposal tries to study a representation of vague concepts referred as latent semantic cell clusters (LSCC), which has property of locality preserving and semantic reconstruction. Latent semantic cell uses prototype of vague concept as its nucleus, and its activation mechanism is as follows: firstly if closer between semantic nucleus and stimulation then higher the activation degree of latent semantic cell, secondly LSCC can linearly reconstruct the stimulation using the activation distribution. The main contents of this proposal involve the following: (1) study of models of activation computation of LSCC, including the activation model based on linear programming, the activation model based on quadratic programming, and the robustness analysis of these two models. (2) study of forming mechanism and optimization methods for LSCC, including unsupervised and supervised optimization methods for LSCC. (3) study of isomorphic LSCC and dual LCSS, including the isomorphic transformation preserving semantic reconstruction relationship and its linear version. (4) study of inference systems based on LSCC, including maching learning of orthopairs of latent semantic cells and estimating methods for density function of boundary of semantic cells. LSCC is the main contribution of this proposal, it tries to depict the mathematical essence of semantic vagueness, it also has potential applications in concept learning, classification, dimensionality reduction and data clustering etc.
本项目针对传统含糊概念表示在高维数据语义分析方面的瓶颈问题,试图建立一种具有近邻保持与语义重构特性的含糊概念表示模型- - 隐语义细胞簇。隐语义细胞以概念的原型作为其细胞核,其激活机制的原理可概括为:如果细胞核同外界刺激邻近程度高,则其激活程度高;并且簇内的隐语义细胞能根据激活程度线性重构外界刺激。 主要研究内容涉及:(1) 隐语义细胞簇的激活计算模型研究。包括基于线性规划与二次规划的激活计算模型研究,以及激活计算模型鲁棒性分析研究。(2) 隐语义细胞簇形成机制及优化方法研究。包括无监督与有监督的优化方法研究。(3) 同构隐语义细胞簇及对偶隐语义细胞簇研究。包括保语义重构关系的数据同构变换及其线性化模型。(4) 基于隐语义细胞簇的推理系统研究。包括隐语义细胞邻对的学习以及语义细胞边界密度函数的估计方法。隐语义细胞簇在高维数据语义分析,特别在含糊概念学习、分类、数据降维与聚类等方面有重要应用。
含糊概念表示作为人工智能的基础科学问题,在大数据时代再次受到大量研究人员的关注。经典的含糊概念表示方法如模糊集理论以渐进的隶属函数来刻画概念的含糊性,新兴的量子概率模型将含糊概念看成是希尔伯特空间上的量子态,这些方法都能很好的刻画概念的含糊性,部分体现了从数据到概念的抽象加工过程。但人脑概念认知还有一些其他的重要特性,如从概念到实例的具象推理过程。本项目综合考虑概念认知的两个重要特性,从数据到概念和从概念到实例,系统研究基于原型理论与语义重构的含糊概念表示方法,提出并建立了独具特色的模糊语义细胞模型,提出了基于模糊语义细胞模型的从数据到概念的抽象方法以及从概念到实例的模糊语义重构方法。一些重要的研究结果包括:.(1)语义细胞认知结构与计算模型的研究。我们区分了两种语义细胞,一种是模糊语义细胞模型,一种是普通语义细胞模型。它们都由一个三元组来表示,分别对应概念的原型、距离测度、以及概念边界的确定或不确定分布。.(2)语义细胞模型数字特征的研究。语义细胞作为概念表示的一种最小单元,具有概念原型、期望粒度、模糊熵等重要数字特征。这是传统的模糊集理论难于刻画的概念宏观特征。.(3)基于单个语义细胞模型的概念学习方法研究。我们提出概念归纳的基本原则,包括最大覆盖度原则,最小期望粒度原则,最大模糊熵原则。并基于这些原则的综合应用提出了模糊语义细胞模型归纳学习方法。.(4)基于语义重构的概念边界分布学习方法研究。引入近邻保持关系,将隶属函数与原型巧妙的结合在一起,采用线性组合的思想来表示实例。由此发展出了新型的模糊语义细胞学习方法。.这些研究成果为进一步研究复杂概念的抽象机制奠定了基础,为实现大数据到大知识的发现和应用提供了理论指导和方法论。特别的,模糊语义细胞模型还适合稀疏数据的概念学习以及概念更新、合并和生成。这些特性将为模糊语义细胞模型的广泛应用铺平道路。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
监管的非对称性、盈余管理模式选择与证监会执法效率?
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
针灸治疗胃食管反流病的研究进展
卫生系统韧性研究概况及其展望
基于语义网络的传统针灸概念体系表示及应用研究
面向网页检索应用的汉语语义概念图表示方法研究
基于球调和分析理论的信号稀疏表示与重构算法
基于本体的复杂产品功能语义表示与智能分解研究