基于文本观点挖掘的多对象评级理论与方法研究

基本信息
批准号:61175067
项目类别:面上项目
资助金额:60.00
负责人:王素格
学科分类:
依托单位:山西大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:李茹,谷波,李艳红,李顺勇,暴艳,张梦笑,张杰,李亚红,薛宾
关键词:
潜在分析技术观点句抽取对象/方面评级语义角色标注文本观点挖掘
结项摘要

本项目面向观点挖掘领域多对象/方面评级的现实迫切需求,在建立大规模真实产品评论文本语料库与本体知识库的基础上,借助于计算语言学、统计数据建模、机器学习等理论与方法,系统地开展多对象/方面评级的建模、分析与计算的新理论与关键技术研究。具体内容包括:(1)基于多层次语言粒度的观点句抽取;(2)基于上下文语义特征的观点句-对象/方面共指关系挖掘;(3)基于汉语框架网的比较句语义角色标注及其情感倾向分析;(4)基于潜在分析技术的多对象/方面评级;(5)基于评论文本时序性的对象/方面评级演化趋势分析。并研制一个基于Web的面向汽车产品评论的多品牌评级系统。本项研究不仅在解决基于观点挖掘的多对象评级领域中的基础理论、关键技术问题方面有着重要的科学意义,同时也在企业产品信誉分析、大众消费行为指导等方面具有潜在应用价值。

项目摘要

本项目面向观点挖掘领域多对象/方面评级的现实需求,在建立大规模真实产品评论语料库与本体知识库的基础上,借助于计算语言学、统计数据建模、机器学习等理论与方法,系统地开展多对象/方面评级的建模、分析与计算的新理论与关键技术研究。主要研究内容与创新点包括:在不同语言粒度上的观点句抽取;基于上下文语义特征的共指关系缺省项识别;基于序列模式的比较句识别与比较要素抽取;利用依存语法与语义隐式关系,实现了对象和方面的抽取,建立了对象方面的评级模型。探索了时序性文本的情感演化方法。构建了多个应用系统,建立了丰富的语料库资源和词汇资源。.面向观点句识别,采用字与词的语言粒度表示,提出了增强字向量和BootStrapping集成学习方法。使用词法和依存句法融合特征,提出了高效的共指关系缺省项识别方法和比较句缺省观点对象识别与补充方法。根据汉语比较句的特点,构建了比较模式挖掘算法,实现了比较句识别及要素抽取。建立产品性能的非完备信息系统,通过特征降维处理,实现了产品对象情感评级;提出了基于观点袋模型和语言学规则的多级情感分类方法。针对汽车产品评论文本具有多方面性能,提出基于多标记学习的汽车评论文本多方面性能识别方法;利用主动学习方法,实现了汽车评论的情感倾向演化分析。基于期望水平和两个簇分布的不相似性度量的近似密度函数,提出了一种簇分布差异阈值的选择方法,进而建立了概念漂移检测算法。针对评论文本情感分析具有领域依赖性、非平衡性和语言多样性,综合运用SMOTE和BootStrapping方法,提出了一种跨领域文本情感分类的目标领域数据标注方法;利用评论文本的分布密度,提出了BRC裁剪算法,实现了非平衡样本的平衡化处理;利用多种语言自身表达的独特性和语言间的关联性,提出了策略融合的跨语言文本情感倾向判别框架。建立了COAE2012-COAE2013比较句识别、比较要素抽取的评测语料库,为比较观点挖掘研究提供了公共数据集。建立了COAE2014-COAE2015观点要素识别语料库,为对象/方面的细粒度观点要素抽取的相关研究提供了公共研究数据集,有力地支持了文本情感分析技术的发展。.利用以上研究成果,构建了基于Web 评论文本的企业产品分析系统、文本情感分析技术与资源开放平台等一系列软件,为文本情感分析的相关应用提供了软件支持。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

王素格的其他基金

批准号:61573231
批准年份:2015
资助金额:64.00
项目类别:面上项目
批准号:60875040
批准年份:2008
资助金额:30.00
项目类别:面上项目

相似国自然基金

1

融合网络特征的文本观点挖掘

批准号:61170156
批准年份:2011
负责人:王挺
学科分类:F0211
资助金额:56.00
项目类别:面上项目
2

面向热门争议话题的基于社交网络文本与结构的层次观点挖掘研究

批准号:61772132
批准年份:2017
负责人:周德宇
学科分类:F0211
资助金额:65.00
项目类别:面上项目
3

基于回答集语义的观点挖掘方法研究

批准号:61702279
批准年份:2017
负责人:刘倩
学科分类:F0211
资助金额:25.00
项目类别:青年科学基金项目
4

文本观点倾向性分析和挖掘关键技术研究

批准号:60873091
批准年份:2008
负责人:朱靖波
学科分类:F0211
资助金额:30.00
项目类别:面上项目