本申请旨在研究一种面向多语言智能文本信息处理的基于主题语义空间的文本表示机制TDR。该机制在保持LSI"语义扩充,能解决一义多词问题"的基础上,利用双语译词对之间的词义限制来解决"一词多义"问题,并设计一套概率模型和学习方法将蕴含在文本集合中的主题有意识地合理地分离出来,构建基于主题的语义空间,进而在这个主题语义空间上进行词义消歧、文本表示和文本间相似度计算。理论上,与LSI相比,利用TDR构建出的语义空间能够更加准确地反映词语和词语、词语和文本、文本和文本之间相对于文本主题的语义关联,从而有效地解决文本表示中的"语言障碍"、"一词多义"、"一义多词"等问题,为文本相似度判断提供可靠的依据。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
物联网中区块链技术的应用与挑战
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
人工智能技术在矿工不安全行为识别中的融合应用
基于主题形式概念分析的文本处理关键技术研究
基于带有通配符序列模式和主题模型的短文本表示研究
多语言环境下文本情感语义计算关键技术研究
基于元信息关联网络的半结构短文本主题语义建模研究