As a representative knowledge graph embedding method, the translation-based model (TransE) aims to embed the semantic information of a knowledge base into low-dimensional vector spaces. Because real-world data usually change over time, it is of great significance to study the online updating problem of TransE. However, existing studies mainly focus on static data, and the online updating of TransE has not drawn much attention. This proposal intends to study the online updating of translation-based models from the perspective of dynamic optimization. More specifically, main research contents include: (1) the translation-based models for dynamic data, including the study of optimization functions that do not depend on negative samples to reduce the impact of the expired data on the model; (2) the incremental processing of dynamic data from the perspective of dynamic optimization to avoid re-training the model; (3) the grouping strategy of large-scale optimization problem, so as to decompose the updating problem of translation-based models into several sub-problems to further save the updating time; and (4) constructing a prototype system for dynamic social networks to provide in-depth studies and further improvement of these research contents. This proposal provides a new solution to the updating of the translation-based models, and can contribute to the research on evolutionary dynamic optimization algorithms with practical values.
翻译模型是代表性的知识表示学习模型,旨在将知识库中的语义信息映射到低维的向量空间中。由于实际数据通常具有动态特征,因此研究模型的在线更新问题具有重要意义。然而,已有工作主要面向静态数据,针对动态数据的研究尚处于起步阶段。本项目拟从动态优化的角度研究翻译模型的在线更新问题,主要研究内容包括:(1)面向动态数据的翻译模型,包括研究不依赖于负样本的优化函数以减少数据过期对模型的影响,研究面向动态数据的复杂关系模型,以及研究如何降低模型的更新频率;(2)基于演化算法,从动态优化的角度研究动态数据的增量式处理方法,避免重新训练模型;(3)研究大规模优化问题的分组策略,以将翻译模型的更新问题分解为若干子问题,使得可以进一步减少模型的更新时间;(4)以动态社交网络为例构建原型系统并以此完善和深化研究工作。本项目为面向动态数据的知识表示学习提供新的理论探索,并为研发具有实用价值的演化算法作出有意义的尝试。
知识表示学习旨在将知识库中的语义信息映射到低维的向量空间中。由于实际数据通常具有动态特征,因此研究面向动态数据的模型更新问题具有重要意义。然而,已有工作主要面向静态数据,针对动态数据的研究尚处于起步阶段。本项目以翻译模型这一代表性的知识表示学习模型为切入点,从动态优化的角度,研究面向动态数据的复杂模型。具体研究内容包括:面向动态数据的知识表示学习模型建模,基于演化算法的表示学习模型更新方法,问题的分解策略研究,以及知识表示学习应用研究。在本项目的支持下,项目负责人以第一作者或者学生第一、本人第二/通讯发表学术论文11篇,包括IEEE/ACM Transactions论文2篇,Pattern Recognition、Knowledge-Based Systems、Journal of Database Management 论文各1篇,CCF推荐的国际学术会议论文3篇,以及CCF推荐的A类中文期刊论文1篇;并且申请专利9项。本项目为面向动态数据的知识表示学习提供了新的方法探索,并为研发具有实用价值的演化算法做出了有意义的尝试。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
智能煤矿建设路线与工程实践
药食兼用真菌蛹虫草的液体发酵培养条件优化
现代优化理论与应用
机电控制无级变速器执行机构动态响应特性仿真研究
面向辅助翻译的多模型融合方法研究
面向动态数据认知的知识发现理论模型与方法
面向领域的多粒度动态海量数据挖掘理论模型与方法
面向大数据、少资源、跨领域汉葡机器翻译方法研究与实现