面向大规模Web资源的事件知识流动与演化机理研究

基本信息
批准号:61471232
项目类别:面上项目
资助金额:83.00
负责人:骆祥峰
学科分类:
依托单位:上海大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:刘福岩,戴东波,张俊,刘洋,宣俊宇,刘维东,王欣芝,井进彪,马奇辰
关键词:
事件演化网络事件网络服务知识流动
结项摘要

Based on the Association linked Network (ALN), this project proposes a Three level Association semantic Link Network (TALN) for a web event or a domain, including general knowledge attribute level, concept knowledge attribute level and word knowledge attribute level. On the one hand, the TALN can reveal and express the hierarchy of the knowledge. On the other hand, its scale can be kept not increasing with the large scale web resources because of the limited number of keywords in a domain, and this relative small and stable scale will significantly reduce the computational complexity when meeting a large scale data. An internal force to push the evolution of micro-knowledge attribute is defined and measured through the topology of TALN, uncertainty, credibility, hot degree, and so on; an external force is also defined and measured based on the interaction between TALN and domain knowledge. Then, the combination of two forces, internal one and external one, is investigated for studying the evolution of macro-knowledge attributes. The disorder of macro-knowledge attributes is measured based on information entropy and perfect power law distribution as the force of pushing the evolution of macro-knowledge attributes. After that, the velocity, acceleration and direction are measured by the comparison between the TALN at different times on different or same levels. At last, our proposed models and theories will be applied to a promising application scenario, web events or resources searching by their flow and evolution potentials.

以关联语义链网络为基础,基于大规模Web资源词汇数目有限性及知识的层次性,提出事件及领域背景知识的"全局知识属性-概念知识属性-词汇知识属性"三层关联语义链网络(TALN)模型及构造方法,以避免对大规模Web资源的直接计算。基于事件TALN的网络拓扑结构及知识属性的不确定性、可信度与热点度等参数,计算事件微观知识属性承受的内部力;基于领域TALN及被激活背景知识属性的参数,计算知识属性承受的外部力。然后,探讨这两种力对事件微观知识属性流动和演化过程共同作用的机理。继而,基于信息熵与完美无标度网络,探讨事件知识宏观流动和演化过程的无序性,度量事件知识整体流动与演化过程的动力;基于相邻时刻事件TALN中拓扑结构的变化,获取事件知识宏观流动与演化速度、加速度及方向向量。最后,把上述研究应用到新型语义搜索和最具流动与演化潜力事件和资源的搜索与推荐中;以缓解资源大规模性与人认知能力有限性之间的矛盾。

项目摘要

为了实现大规模Web资源的语义计算。1)提出了关键词微观层次关联语义链网络(KALN)表达模型、构造及优化方法;面向网页资源,提出了Web事件知识的网站-网页-关键词三层ALN模型;2)面向科技文献资源,提出了“领域背景知识ALN-文本知识碎片ALN-文本连通语义ALN”三层ALN的知识表达模型与构造方法等;为了在大规模网页资源中发现Web事件和话题,提出了基于文本图语义表达的Web事件子话题挖掘模型;面向科技文献资源,提出了Semantic LDA话题发现模型;上述研究形成了不同类型的"全局知识属性-概念知识属性-词汇知识属性"网络。 实验证明,提出的模型在事件话题和主题挖掘中具有较好效果。..为了获取事件知识流动与演化速度、加速度及方向。本项目基于关键词微观层次的KALN,1) 提出了Web事件内部知识的语义金字塔结构,以对Web事件知识流动与演化过程机理进行分析,以突显不同层次语义不确定性对Web事件知识流动与演化过程的影响。2) 基于关键词微观层次KALN信息熵等参数的计算,探索了Web事件知识语义的不确定性的上界和下界的计算方法,形成了Web事件知识语义的不确定性空间,并将Web事件状态映射到这个空间中,以度量该事件在不同时刻所受到的内部演化动力模型。3) 基于人类记忆过程和‘锚’理论,我们对社会环境和Web事件之间的交互过程进行模拟,量化了社会环境对Web事件演化过程的影响,即外部演化动力的计算。4) 提出了内外部力对事件知识流动和演化过程共同作用的机理。5) 提出了基于选择性注意与KL散度的事件知识内部结构度量及知识流动与演化预测方法,通过构建前沿知识/主题知识流动与演化方向的判定模型,可发现领域主题知识流动与演化的速度、加速度及方向等。.为了验证本项目的研究成果可用于新型网络资源语义搜索、推荐及最具有活力话题搜索与推荐等知识服务等,面向300万专利、100万TP类科技文献,近百万网页,我们开发了专利科技文献创新知识发现平台,科技论文搜索与推荐服务平台及基于Web事件语义金字塔的网页推荐平台等。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

DOI:
发表时间:2020
4

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

DOI:10.3799/dqkx.2020.083
发表时间:2020
5

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015

骆祥峰的其他基金

批准号:60402016
批准年份:2004
资助金额:21.00
项目类别:青年科学基金项目
批准号:91746203
批准年份:2017
资助金额:240.00
项目类别:重大研究计划
批准号:91324005
批准年份:2013
资助金额:15.00
项目类别:重大研究计划
批准号:61071110
批准年份:2010
资助金额:35.00
项目类别:面上项目
批准号:90612010
批准年份:2006
资助金额:29.00
项目类别:重大研究计划
批准号:91024012
批准年份:2010
资助金额:35.00
项目类别:重大研究计划

相似国自然基金

1

面向Deep Web的大规模知识库自动构建方法研究

批准号:61170020
批准年份:2011
负责人:崔志明
学科分类:F0202
资助金额:57.00
项目类别:面上项目
2

面向社会事件的跨模态知识构建、演化与推理

批准号:61872424
批准年份:2018
负责人:鲍秉坤
学科分类:F0211
资助金额:64.00
项目类别:面上项目
3

大规模网络资源环境下基于关联知识流的Web知识供给模式及其应用研究

批准号:61071110
批准年份:2010
负责人:骆祥峰
学科分类:F0102
资助金额:35.00
项目类别:面上项目
4

面向舆情知识图谱的演化图数据事件查询与分析技术

批准号:61802160
批准年份:2018
负责人:王章辉
学科分类:F0202
资助金额:24.00
项目类别:青年科学基金项目