With the rapid develop of Web 3.0, knowledgebase construction, serves as an important technology for supporting intelligence systems, receives much attention. Constructing domain-specific knowledgebase could help to achieve the goal of setting up vertical search engines and making machines to be able to learn and inference. This research aims to study the problem of product knowledgebase construction. The schema of product knowledgebase is quite complicated and requires real-time update, which makes conventional knowledgebase construction method infeasible to create product knowledgebase. At the same time, contents of most current knowledgebase are certain and object knowledge. However, for products, customers’ opinions are valuable information, which are indispensable for a product knowledgebase. Therefore, this research aims to build product knowledgebases with customers’ opinions, which uses large-scale online reviews as the data source. The key problems include: (i) Using large-scale online reviews to automatically build up product feature schema; (ii) Exploiting probabilistic fine-grained opinion mining methods with deep semantic comprehension; (iii) Filtering out fake reviews based on latent factor analysis; (iv) Integrating the constructed product knowledgebase to our vertical search engine to test and verify its effectiveness.
随着Web3.0迅速崛起,构建结构化知识库作为智能知识服务的重要支撑手段,受到广泛关注。构建特定领域的知识库有助于实现垂直搜索、机器的学习和推理等智能化目标。本申请主要研究产品领域知识库构建的关键技术。产品领域知识库具有知识框架繁杂、更新迅速等特点,使得传统人工构建知识框架方法不适用于产品知识库构建。同时,目前主流知识库主要内容是客观性、确定性的知识。然而,在产品领域,用户对产品的主观性看法具有重要参考价值。因此,主观信息是产品领域知识库不可或缺的重要内容。针对上述特点,本申请以大规模网络评论语料为知识来源,以构建融合观点信息的产品知识库为目标,研究:1)面向大规模网络文本的产品属性框架自动构建方法;2)基于深度语义理解的概率化产品主观信息挖掘方法;3)基于潜在意图分析的虚假评论过滤方法;4)将所构建的产品知识库应用于垂直语义搜索引擎,对以上关键技术进行验证与测试。
随着Web3.0迅速崛起,构建结构化知识库作为智能知识服务的重要支撑手段,受到广泛关注。构建特定领域的知识库有助于实现垂直搜索、机器的学习和推理等智能化目标。本申请主要研究产品领域知识库构建的关键技术。产品领域知识库具有知识框架繁杂、更新迅速等特点,使得传统人工构建知识框架方法不适用于产品知识库构建。同时,目前主流知识库主要内容是客观性、确定性的知识。然而,在产品领域,用户对产品的主观性看法具有重要参考价值。因此,主观信息是产品领域知识库不可或缺的重要内容。针对上述特点,本申请以大规模网络评论语料为知识来源,以构建融合观点信息的产品知识库为目标,研究:1)面向大规模网络文本的产品属性框架自动构建方法;2)基于深度语义理解的概率化产品主观信息挖掘方法;3)基于潜在意图分析的虚假评论过滤方法;4)将所构建的产品知识库应用于垂直语义搜索引擎,对以上关键技术进行验证与测试。主要研究成果包括:国际顶级期刊和会议论文1,译著一部,专著1部、章节一章,申请国家发明专利2项,获得2018年度中国中文信息学会“钱伟长中文信息处理科学技术奖一等奖”。本课题研究成果将对情感分析、知识图谱等领域的研究提供技术参考。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
城市轨道交通车站火灾情况下客流疏散能力评价
基于FTA-BN模型的页岩气井口装置失效概率分析
桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究
基于图卷积网络的归纳式微博谣言检测新方法
面向中文网络评论的产品特征挖掘方法研究
面向Deep Web的大规模知识库自动构建方法研究
面向非结构化文本的大规模事件信息抽取关键技术研究
基于短文本的知识库自动更新关键技术研究