标引是给出能反映文献特征的表示过程,在检索系统中,标引处于承上启下的地位。随着科学技术尤其是网络的迅速发展,产生了大量的信息用传统的手工标引方法已不能满足需求,这时就迫切的需要对大量信息进行自动标引。而本项目提出了基于语义分析和统计的自动主题标引方法,将中文语义分析引入自动主题标引的研究中。研究内容包括服务于自动主题标引的语义词典建设研究、基于语义词典扩展的潜在语义索引文本表示模型研究、基于潜在语义索引的关键词权重计算模型研究、高效子串归并算法研究、基于语义分析的标引词后处理研究等。本项目的目标是通过对中文语义特点的研究,建立基于语义和统计的自动主题标引模型,解决中文自动主题标引中存在的关键问题,能够对文本准确高效的进行自动主题标引。本项目不但有助于大量信息的管理和检索,对社会信息化建设起到重要的作用;还能带动自然语言处理领域相关技术的发展,具有重要的研究和应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
采用深度学习的铣刀磨损状态预测模型
基于关系对齐的汉语虚词抽象语义表示与分析
热塑性复合材料机器人铺放系统设计及工艺优化研究
基于语义分析的评价对象-情感词对抽取
基于统计和语义分析的中英文自动文摘的研究
基于程序转换和语义分析的编程题自动评分方法研究
基于抽象语义切片和后向求精分析的静态分析警报自动确认研究
基于图像语义分析的自动人脸替换研究