互联网上的信息类型和信息量快速膨胀,但作为互联网海量信息中最基本的类型- - 文本信息的组织和检索效率仍难以令人满意。迄今为止,网上文本信息的组织非常混乱,获取和利用的方式比较简单。由于计算机不可能象人类一样理解和使用文本信息,所以必须把文本表示为某种计算机能够处理的方式,以便更好的挖掘和使用这些信息。. 文本集特征提取就是一种文本表示方法,通过对文本的分词,词条过滤,并使用语义映射处理同义词和多义词,将词条映射为特征,再通过某种算法计算特征值,根据某种标准选择若干特征,构建一个特征向量空间,使每个文本都可以表示为该空间中的一个向量。. 提取的文本特征可用于文本集的分类和聚类,或用于信息提取系统中,以便于更好的组织和利用文本信息。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
高压工况对天然气滤芯性能影响的实验研究
空气电晕放电发展过程的特征发射光谱分析与放电识别
多空间交互协同过滤推荐
小样本集成预报方法的研究及其应用
基于Web语料的维吾尔文重复模式识别算法及应用研究
基于连体段的维吾尔文识别应用研究
天文光谱特征提取及其应用研究