基于FrameNet的中文评价词汇本体构建与观点挖掘研究

基本信息
批准号:71403154
项目类别:青年科学基金项目
资助金额:21.00
负责人:由丽萍
学科分类:
依托单位:山西大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:贾君枝,白旭云,赵国荣,刘荟
关键词:
框架文本挖掘情感倾向分析语义观点挖掘
结项摘要

Because of the low quality of lexicon knowledge base and the lack of semantic understanding in the current semantic-based opinion mining research, this project proposed a FrameNet-based Chinese affective lexicon ontology construction method and an ontology and deep semantic analysis based opinion mining method. The study includes: 1) building semantic frames for Chinese affective lexical units, expressing semantic relations between the words through Ontology, which has such qualities as highly scientific semantic description ability, fine-grained classification and strong representing ability etc.; 2) through the method of combining TCRF (tree CRFs) statistical model and the rule base, achieving automatic annotation of frame semantic elements and sentimental attributes, so that getting deep understanding of argument structures within sentences; 3) developing an opinion mining system with the affective lexicon ontology and automatic frame elements annotation as key technologies, which could automatically extract topics, opinions, opinions holders, sentimental attributes etc., with high processing accuracy, strong semantics analysis and reasoning ability. The study team has a good foundation of many years of cooperation and has accumulated wealthy study achievements in terms of Chinese FrameNet construction and automatic semantic annotation in common areas, with many available Chinese text analysis tools, so the project has strong viability.

本项目针对目前基于语义的观点挖掘研究中词汇知识库质量不高、系统语义理解能力不足的问题,提出基于FrameNet词典资源的中文评价词汇本体构建方法以及基于本体和深层语义分析的观点挖掘方法。研究内容包括:1)构建中文评价词汇的语义描述框架,通过本体表达词汇之间的语义关联,该词汇本体在框架语义理论和FrameNet的支撑下,具备语义描述科学、语义分类细化、表示能力强等特点。2)通过TCRF(树条件随机场)统计模型和规则库相结合的方法,实现框架语义元素以及情感属性的自动标注,达到对句子内部论元结构的深层理解。3)以评价词汇本体和框架元素自动标注为关键技术,开发一个观点挖掘系统,自动提取文本中的主题、观点、观点持有者、情感属性等,系统将具有较高的处理精度、较强的语义分析及语义推理能力。项目团队在通用领域汉语框架的构建和自动语义标注方面积累了丰富的成果和多项可用的中文文本分析工具,项目可行性较强。

项目摘要

【主要研究内容】本项目针对目前观点挖掘研究中词汇知识库质量不高、语义理解能力不足的问题,提出基于FrameNet的中文评价词汇本体构建方法以及基于本体和深层语义分析的观点挖掘方法。具体包括:设计基于框架的中文评价语义表示模型,构建中文评价语义词典、评价语义标注语料库、评价属性知识库等语义资源;利用语义词典和语义标注语料库进行评价知识抽取,构建评价本体知识库,并通过与外部语义资源的开放和互联,利用知识图谱工具构建中文评价知识图谱;以评价知识本体为数据来源,结合VIKOR多属性法对顾客评价进行测算;实现基于评价知识本体的个性化观点挖掘。【重要结果】基于框架的评价语义表示模型由文本层、概念层和本体层构成,其文本跨度小、语义表示粒度细,并支持概念语义推理。评价词汇知识库以框架为词语分类依据,共构建了73个框架,涉及520个评价词,描述了词语的情感值信息;评价词典对领域内语料的覆盖面达到93.9%。采用基于词典和模式匹配规则的方法,标注了大规模顾客评论文本,构建了中文评价语义标注语料库,含评论短语4.5万余个;经测试,评价语义标注的正确率达到83.9%,召回率达到71.2%。中文评价知识本体具有语义知识共享和开放互联能力,是机器可读、可理解的语义资源。利用评价本体获得了手机商品和酒店服务评价属性和权重,利用VIKOR多属性法有效测量了顾客评价。基于评价本体实现了基于概念的观点挖掘和跨实体、跨属性的综合性观点挖掘,满足用户个性化和智能化检索需求。【科学意义】本研究为情感分析领域的语义资源匮乏问题提供了有效的解决方案;为智能化商品评价信息检索、情感问答和个性化推荐提供了关键资源支持;为顾客满意和顾客价值等相关研究领域提供了新的数据分析方法和有效的计算模型;为文本挖掘进入语义层面和情感领域、实现智能化商业服务做了有益的探索。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

由丽萍的其他基金

批准号:41506145
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目

相似国自然基金

1

WEB2.0环境下基于本体学习的观点挖掘研究

批准号:70903047
批准年份:2009
负责人:余传明
学科分类:G0414
资助金额:19.00
项目类别:青年科学基金项目
2

基于词汇语义网络的中文深层语义分析

批准号:61872402
批准年份:2018
负责人:邵艳秋
学科分类:F0211
资助金额:64.00
项目类别:面上项目
3

中文领域本体学习及半自动构建方法研究

批准号:71201032
批准年份:2012
负责人:于娟
学科分类:G0112
资助金额:19.00
项目类别:青年科学基金项目
4

基于回答集语义的观点挖掘方法研究

批准号:61702279
批准年份:2017
负责人:刘倩
学科分类:F0211
资助金额:25.00
项目类别:青年科学基金项目