互联网上的信息类型和信息量快速膨胀,但作为互联网海量信息中最基本的类型- - 文本信息的组织和检索效率仍难以令人满意。迄今为止,网上文本信息的组织非常混乱,获取和利用的方式比较简单。由于计算机不可能象人类一样理解和使用文本信息,所以必须把文本表示为某种计算机能够处理的方式,以便更好的挖掘和使用这些信息。. 文本集特征提取就是一种文本表示方法,通过对文本的分词,词条过滤,并使用语义映射处理同义词和多义词,将词条映射为特征,再通过某种算法计算特征值,根据某种标准选择若干特征,构建一个特征向量空间,使每个文本都可以表示为该空间中的一个向量。. 提取的文本特征可用于文本集的分类和聚类,或用于信息提取系统中,以便于更好的组织和利用文本信息。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于直观图的三支概念获取及属性特征分析
基于直觉模糊二元语义交互式群决策的技术创新项目选择
城市生活垃圾热值的特征变量选择方法及预测建模
泛"胡焕庸线"过渡带的地学认知与国土空间开发利用保护策略建构
基于小波高阶统计量的数字图像来源取证方法
小样本集成预报方法的研究及其应用
基于Web语料的维吾尔文重复模式识别算法及应用研究
基于连体段的维吾尔文识别应用研究
天文光谱特征提取及其应用研究