本项研究针对网络信息处理中遇到的大规模真实文本的浓缩问题,采用“规则加例外”的优化策略,进行海量信息的分类和聚类,达到用少量精炼的浓缩信息概括原始海量数据的效果和目的。具体取得了如下的成果:根据认知心理的原理建立规则加例外的粗糙集计算模型;将规则加例外的模型拓展到知识粒度计算;设计了基于知识粒度的、具有较高泛化能力的分类算法;遵循拟物的思想提出了基于引力势场拓扑结构的实数变量的聚类算法;借鉴局部优化的思想将规则加例外的策略用于名义尺度变量的聚类;提出了文本聚类的权重迭代策略。通过本项目的研究。揭示了海量数据浓缩的优化本质,并积累了结构化和非结构化数据的分类、聚类和规则提取等数据浓缩操作的实用算法,在网络信息服务中得到了初步的应用。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
一种改进的多目标正余弦优化算法
多相机地理视频运动目标浓缩方法研究
面向超大规模FPGA的高效并行布线方法研究
基于太阳模拟器的真实辐照度与真实准直角模拟方法研究
细粒土的真实抗剪强度的测试方法