With the rapid development of Internet,the Web has evolved into a glabal multilingual information space. The multilingual nature of Web poses new challenges for semantic information interaction and sharing. Building large-scale crosslingual ontology knowledge bases is crucial for automaticly crosslingual information processing by computers. Existing crosslingual knowledge bases suffer some problems, including imbalanced number of instances among different languages, small number of crosslingual links, and insufficient Chinese stractural information.To solve these problems, this project aims to build large scale Chinese-English crosslingual ontology knowledge base from Wiki resources.Specifically, four topics are to be investigated in this project: (1) heterogeneous Chinese Wiki resources matching and alignment; (2) crosslingual links discovering across the Wiki resources; (3) crosslingaul ontology construction; (4) crosslingual information extraction from Wiki resources. Based on the above research topics, a large scale Chinese-English crosslingual knowledge base can be built, which may greatly benifit corsslingual information proccessing applications.
随着互联网的快速发展,原来由英文信息占主导地位的Web已经发展成为全球化、多语言的信息空间。多语言的Web环境为语义信息交互与共享带来了新的挑战。构建大规模的跨语言本体知识库对于实现计算机跨语言信息的自动处理有着十分重要的作用。现有的跨语言知识库存在不同语言之间实例数量不平衡、跨语言链接少和中文结构化信息贫乏的缺点。针对这些问题,本课题以基于Wiki资源构建中英文跨语言本体知识库为目标,拟从四个方面展开研究:(1)异构中文Wiki资源的匹配与合并;(2)中英文Wiki资源的跨语言链接发现;(3)中英文跨语言本体自动构建;(4)面向Wiki资源的跨语言结构化信息抽取。基于上述研究获得的中英文跨语言本体知识库,可为中英文跨语言信息共享与处理提供有效支持。
本项目以基于Wiki资源构建大规模中英文跨语言本体知识库为目标,对涉及到的关键问题进行了研究。项目组研究并提出了结合概念标注的增量式跨语言链接发现方法,解决了构建知识库时跨语言链接缺失的问题;研究并提出了多策略组合和基于半监督学习的本体匹配方法,可解决跨语言、异构本体的匹配问题,为建立中英文跨语言本体提供基础;研究并提出了Wiki中新实体关系发现方法,可有效地丰富结构化信息,扩大本体知识库的规模。. 本项目的研究工作进展顺利,基本达到预期研究目标,取得了良好的研究成果。项目组在国内外重要的学术会议和期刊上发表论文8篇,其中SCI检索3篇,EI检索5篇,包括IJCAI、ISWC等重要国际会议和Knowledge-based Systems等国际期刊论文。. 项目在执行期间,培养毕业硕士生2名,培养在读硕士生4名。项目组成员积极参加国内外学术交流活动,完成大会特邀报告1人次,参加学术会议共7人次,完成会议论文分组报告3人次、墙报展示2人次。. 近年来,基于大规模知识库的信息检索、智能问答等已成为研究的热点问题,产业界也出现了许多正在改变人们生活方式的相关产品。项目组将结合最新学术和产业前沿,以本项目为基础,进一步研究跨语言知识库的扩展、补全技术、以及知识库在各个领域的应用。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
中外学术论文与期刊的宏观差距分析及改进建议
环境信息披露会影响分析师盈余预测吗?
基于可信语义Wiki的知识库构建方法与应用研究
基于语义网络的肾系疾病古籍本体知识库构建及方证规律挖掘
面向语言处理的藏语概念框架语义知识库构建研究
基于语言知识库的统计翻译模型研究