商品评论信息的可信度会对用户购买决策产生重大影响,已有研究主要从用户行为、心理感知等方面,研究影响用户对评论信息信任程度的因素,但缺乏对评论信息可信度的定量分析研究。本申请将结合文本挖掘、信息组织等方法,从商品评论信息的文本语义出发,拟在申请者前期对评论信息倾向性分析研究的基础上,探索有效的评论信息可信度定量分析模型。进行如下三方面研究:1.从虚假商品评论信息的发布动机和行为出发分析其特征规律;2.结合领域本体和条件随机场模型进行可信度特征的选择及其特征库的构造,并据此构造规则集进行评论信息可信度文本特征词的自动抽取研究;这是研究重点。3.在上述基础上,设计基于领域本体的评论信息可信程度计算规则,提出基于Jena推理机的文本可信程度语义推理计算算法,并通过该计算方法得到商品评论信息可信度分析结果。这是研究的难点。本项目旨在为意见挖掘提供可信的信息资源,为虚假评论信息的审核过滤提供有效方法。
商品评论信息的可信度会对用户购买决策产生重大影响,已有研究主要从用户行为、心理感知等方面,研究影响用户对评论信息信任程度的因素,但是缺乏对评论信息可信度的定量分析研究。本课题结合了文本挖掘、信息组织、统计学等方法,从商品评论信息的文本语义出发,探索商品评论信息可信度定量分析模型,具体的研究包括以下三个方面:1.从虚假商品评论信息产生的动机、表现的行为和发布的渠道三个角度分析其特征规律,研究发现虚假评论信息产生的动机一般分为推销、诋毁、干扰和无意义四类,表现的行为为造假和隐藏,并在此基础上,从评论信息的内容、评论信息的来源以及评论者自身三个维度进行了评论信息可信度特征的分析;2.将领域本体和CRFs模型结合起来进行可信度特征的选择与特征词的自动抽取:首先通过商品评论信息可信度影响因素实证分析,验证了课题组所选各个可信度特征的有效性,之后分别通过商品评论信息领域本体构建与完善、基于CRFs模型和本体的评价词集构建,基于Jena推理的隐性商品评论对象抽取、基于CRFs模型的显性评价对象以及情感极性特征的自动识别来完成了评论信息可信度特征词的自动抽取,实验结果表明课题组所提方法的有效性和优越性,该部分为研究的重点;3.在上述基础上,针对商品评论信息可信度的计算进行了定性和定量两方面的研究。首先,课题组提出了基于SVM模型的垃圾评论识别方法,成功地过滤了商品评论信息中的垃圾评论;之后采用CRFs模型和领域本体相结合的方法对商品评论信息的可信度进行了四级评估研究,依据实验结果对“人工效用评价”提出了改进建议:最后为了对商品评论信息的可信度进行更为准确的量化计算,又在可信度特征分析的基础上,设计了可信度特征的计算规则,并提出了基于SVR模型的商品评论可信度计算方法,并通过该计算方法得到商品评论信息可信度分析结果。这是本研究的难点。本项目将研究过程中提出的情感倾向性分析与评价对象抽取方法应用到了NLP&CC2013、COAE2013和COAE2014等公开的中文倾向性测评的任务中,取得了不错的结果,验证了本文所提出的方法的有效性。之后依托于本项目的研究成果,开发了“手机商品评论信息抓取与分析”应用系统,参与“2014年(第7届)中国大学生计算机设计大赛”,取得了良好的成绩,为垃圾评论的识别、商品评论信息可信度分析提供了有效的方法。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
基于评论数据的大规模商品属性级观点知识挖掘与管理
基于网络文本语义的信息隐藏方法研究
享乐性与实用性商品的个性化推荐策略与技术研究——基于用户评论大数据驱动的商品特征挖掘
基于在线评论文本挖掘的线上线下服务补救:以网络零售为例