面向大规模网络评论文本的产品知识库构建关键技术研究

基本信息
批准号:61502493
项目类别:青年科学基金项目
资助金额:20.00
负责人:徐立恒
学科分类:
依托单位:中国科学院自动化研究所
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:王炳宁,陈玉博,刘树林,纪国良,郝彦超
关键词:
知识库构建网络评论观点挖掘
结项摘要

With the rapid develop of Web 3.0, knowledgebase construction, serves as an important technology for supporting intelligence systems, receives much attention. Constructing domain-specific knowledgebase could help to achieve the goal of setting up vertical search engines and making machines to be able to learn and inference. This research aims to study the problem of product knowledgebase construction. The schema of product knowledgebase is quite complicated and requires real-time update, which makes conventional knowledgebase construction method infeasible to create product knowledgebase. At the same time, contents of most current knowledgebase are certain and object knowledge. However, for products, customers’ opinions are valuable information, which are indispensable for a product knowledgebase. Therefore, this research aims to build product knowledgebases with customers’ opinions, which uses large-scale online reviews as the data source. The key problems include: (i) Using large-scale online reviews to automatically build up product feature schema; (ii) Exploiting probabilistic fine-grained opinion mining methods with deep semantic comprehension; (iii) Filtering out fake reviews based on latent factor analysis; (iv) Integrating the constructed product knowledgebase to our vertical search engine to test and verify its effectiveness.

随着Web3.0迅速崛起,构建结构化知识库作为智能知识服务的重要支撑手段,受到广泛关注。构建特定领域的知识库有助于实现垂直搜索、机器的学习和推理等智能化目标。本申请主要研究产品领域知识库构建的关键技术。产品领域知识库具有知识框架繁杂、更新迅速等特点,使得传统人工构建知识框架方法不适用于产品知识库构建。同时,目前主流知识库主要内容是客观性、确定性的知识。然而,在产品领域,用户对产品的主观性看法具有重要参考价值。因此,主观信息是产品领域知识库不可或缺的重要内容。针对上述特点,本申请以大规模网络评论语料为知识来源,以构建融合观点信息的产品知识库为目标,研究:1)面向大规模网络文本的产品属性框架自动构建方法;2)基于深度语义理解的概率化产品主观信息挖掘方法;3)基于潜在意图分析的虚假评论过滤方法;4)将所构建的产品知识库应用于垂直语义搜索引擎,对以上关键技术进行验证与测试。

项目摘要

随着Web3.0迅速崛起,构建结构化知识库作为智能知识服务的重要支撑手段,受到广泛关注。构建特定领域的知识库有助于实现垂直搜索、机器的学习和推理等智能化目标。本申请主要研究产品领域知识库构建的关键技术。产品领域知识库具有知识框架繁杂、更新迅速等特点,使得传统人工构建知识框架方法不适用于产品知识库构建。同时,目前主流知识库主要内容是客观性、确定性的知识。然而,在产品领域,用户对产品的主观性看法具有重要参考价值。因此,主观信息是产品领域知识库不可或缺的重要内容。针对上述特点,本申请以大规模网络评论语料为知识来源,以构建融合观点信息的产品知识库为目标,研究:1)面向大规模网络文本的产品属性框架自动构建方法;2)基于深度语义理解的概率化产品主观信息挖掘方法;3)基于潜在意图分析的虚假评论过滤方法;4)将所构建的产品知识库应用于垂直语义搜索引擎,对以上关键技术进行验证与测试。主要研究成果包括:国际顶级期刊和会议论文1,译著一部,专著1部、章节一章,申请国家发明专利2项,获得2018年度中国中文信息学会“钱伟长中文信息处理科学技术奖一等奖”。本课题研究成果将对情感分析、知识图谱等领域的研究提供技术参考。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015
3

基于FTA-BN模型的页岩气井口装置失效概率分析

基于FTA-BN模型的页岩气井口装置失效概率分析

DOI:10.16265/j.cnki.issn1003-3033.2019.04.015
发表时间:2019
4

桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究

桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究

DOI:10.5846/stxb202009292521
发表时间:2021
5

基于图卷积网络的归纳式微博谣言检测新方法

基于图卷积网络的归纳式微博谣言检测新方法

DOI:10.3785/j.issn.1008-973x.2022.05.013
发表时间:2022

徐立恒的其他基金

相似国自然基金

1

面向中文网络评论的产品特征挖掘方法研究

批准号:71001023
批准年份:2010
负责人:李实
学科分类:G0112
资助金额:16.10
项目类别:青年科学基金项目
2

面向Deep Web的大规模知识库自动构建方法研究

批准号:61170020
批准年份:2011
负责人:崔志明
学科分类:F0202
资助金额:57.00
项目类别:面上项目
3

面向非结构化文本的大规模事件信息抽取关键技术研究

批准号:61806201
批准年份:2018
负责人:陈玉博
学科分类:F0606
资助金额:26.00
项目类别:青年科学基金项目
4

基于短文本的知识库自动更新关键技术研究

批准号:61472040
批准年份:2014
负责人:宋丹丹
学科分类:F0607
资助金额:84.00
项目类别:面上项目