The very fast development of knowledge in big data environment has presented the characteristics of dynamics, complexity and heterogeneity, forming an open, complicatedly related, and dynamically evolved knowledge network. This phenomenon brings great developing opportunities as well as challenges in knowledge computing. How can we dig out useful information has become a hot topic, both in academic and industrial world. We propose the concept of open knowledge network, which is an open, dynamic, scalable knowledge computing architecture. Through the investigations of presentation, calculability and predictability in open knowledge network, we can explore the methods of ad hoc updating and merging, and the methods of sequential deduction and prediction. Last but not least, we will testify our research findings by designing and developing a (prototype) system of knowledge evolution in open knowledge network. Our findings will provide efficient theoretical supports for the knowledge discovery, merging, deduction and prediction of network big data.
网络大数据环境下的知识规模急剧增长,同时,呈现出动态、复杂、异质等特点的知识互相关联,形成了一个开放的、复杂关联、动态演化的知识网络,这给网络大数据的价值利用带来机遇的同时也给知识的计算的理解带来了巨大的挑战。如何从中挖掘有价值的知识并为用户服务,已成为国内外学术界和工业界的一个研究热点。本项目提出开放知识网络的概念,它是指一个开放的,动态的,可增量的知识计算体系。通过研究开放知识网络的表示、可计算性和可预测性等重要基础科学问题,探索开放知识网络中知识的自适应更新与融合方法,时序推断与预测方法。最后通过研发面向电子商务的开放知识计算与推荐(原型)系统,在实际应用中验证研究成果,从而为网络大数据中开放知识的发现、融合、推断、预测以及深度价值利用提供有效科学的理论依据和指导。
网络大数据环境下的知识规模急剧增长,同时,呈现出动态、复杂、异质等特点的知识互相关联,形成了一个开放的、复杂关联、动态演化的知识网络,这给网络大数据的价值利用带来机遇的同时也给知识的计算的理解带来了巨大的挑战。如何从中挖掘有价值的知识并为用户服务,已成为国内外学术界和工业界的一个研究热点。目前尚没有系统的模型和分析方法,已有研究工作大多从局部展开。.本项目针对网络大数据的特点,提出开放知识网络的概念, 即一套开放的,动态的,可增量的知识计算体系,主要研究内容与成果有:1)研究了局部自适应的开放知识网络表示方法,提出了跨开放知识网络的表示学习方法,设计了开放知识网络快速构建体系,并应用该体系从网络大数据中(包括网页百科,论坛文本等等),自动提取知识并构建开放知识网络;2)研究了开放知识网络自适应更新的模式和方法,最小化代价的迭代更新机制,提出了基于表示学习和自学习的实体对齐方法和开放知识网络分类体系的自动构建方法。以百度、豆瓣等不同网络数据源为例,对实体信息进行表示学习,利用自学习机制进行对齐,采用分类体系自动构建方法挖掘不同知识源属性的上下位关系,最终实现不同网络数据源的融合、更新;3)对开放知识网络的推断的可计算性进行分析,提出了一种层次约束的知识图谱关系推断方法和层次化类别约束的主题实体推断方法,并在此基础上提出了一种可行的开放知识网络的主题实体和关系联合推断框架,同时,研究了开放知识网络的时空演化的形成机制、典型演化模式及演化规律,建模开放知识网络的时空演化过程,提出了一种文档级别的基于上下文信息的开放知识网络演化事件检测方法;4)最终设计并实现了“开放知识计算系统”,进一步通过真实的百度百科、豆瓣百科等数据验证了研究成果,构建了融合多种网络数据源的开放知识网络。形成了33篇学术论文,相关领域的顶级SCI 期刊(如:IEEE/ACM Trans.等) 和相关领域的重要国际会议上(如:AAAI,WWW,SIGKDD,CIKM, WSDM等)发表论文13篇;已出版专著1本;申请发明专利6项。.本项目通过开放知识计算建模,深入研究开放知识计算的理论框架,分析了开放知识网络的分布式表示,知识的自适应更新与多目标融合方法,并揭示了开放知识信息同步和异步的演化规律,最后搭建试验验证系统,进一步通过实际数据验证研究成果,从而为网络大数据中的知识挖掘和事件的演化与预测提供理论
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
跨社交网络用户对齐技术综述
开放知识网络的知识演化分析模型与方法研究
面向炼铁高炉的动态数据与先验知识协同驱动的可计算建模研究
面向开放网络数据的多元关系抽取、表示与推理研究
面向开放域知识网络的实体语义关系抽取方法研究