More advanced and intelligent big data processing needs semantic technologies urgently. However, current big data platforms lack the capability of processing data semantics. The principal goal of the project is to develop a semantic computing framework geared toward typical characteristics of big data applications, and foster its application in particular domains such as biomedical informatics. Specifically, we consider three main problems including: a) How to balance the expressiveness of data semantics and scalability of data parallelism? b) How to discover deep semantic relations from multi-scale big data? c) How to enable real time semantic interaction with big data? The research consists of four sub-topics including: a) Semantic model for big data; b) Cross-boundaries and multi-scale semantic discovery from big data; c) Elastic and scalable engine for big semantic graph storage and query interactions; d) Applications in biomedical knowledge discovery and biomedical semantic network processing. The key innovations of the project lie in three aspects: a) A light-weight semantic model for big data; b) Multi-scale semantic discovery for big data; c) Evolvable storage and real time query engine for big semantic graph.
大数据的智能处理迫切需要语义技术的支持,然而现有的大数据技术平台都相对缺乏数据语义的处理能力。本项目主要目标是研究面向大数据的语义计算框架,并推动其在生物医学大数据等领域的应用。具体主要围绕三个科学问题:a)怎样平衡数据的语义表达和弹性可扩展的数据处理能力?b)怎样实现跨边界跨尺度的大数据语义挖掘与知识发现?c)怎样实现更加智能的大数据自然语义交互。并拟开展四个方面的研究,包括:a)研究面向大数据特征的语义表达框架;b)研究跨边界、跨尺度的大数据语义发现方法;c)研究弹性可扩展的语义大图处理引擎及高实时的语义交互技术;d)结合生物医学和健康领域的大数据处理开展应用创新研究。同时,形成三个方面的关键技术创新:a)轻语义表达模型;b)跨尺度语义挖掘;c)可演化语义大图存储与实时语义交互。随着图模型在大数据应用中日益重要,本项目的研究有助于提升在大数据核心技术领域的竞争力。
大数据的智能处理迫切需要语义技术的支持,然而现有的大数据技术平台都相对缺乏数据 语义的处理能力。本项目主要目标是研究面向大数据的语义计算框架,并推动其在生物医 学大数据等领域的应用。具体主要围绕三个科学问题:a)怎样平衡数据的语义表达和弹性 可扩展的数据处理能力?b)怎样实现跨边界跨尺度的大数据语义挖掘与知识发现?c)怎样 实现更加智能的大数据自然语义交互。并拟开展四个方面的研究,包括:a)研究面向大数 据特征的语义表达框架;b)研究跨边界、跨尺度的大数据语义发现方法;c)研究弹性可扩 展的语义大图处理引擎及高实时的语义交互技术;d)结合生物医学和健康领域的大数据处 理开展应用创新研究。同时,形成三个方面的关键技术创新:a)轻语义表达模型;b)跨尺 度语义挖掘;c)可演化语义大图存储与实时语义交互。随着图模型在大数据应用中日益重 要,本项目的研究有助于提升在大数据核心技术领域的竞争力。本项目所取得主要成果在于弹性语义图处理和大数据语义发现两个方面。弹性语义图处理对于大规模的知识图谱的处理性能比较关键,特别是在流式语义数据情况下更具挑战。本项目重点在流式语义图的弹性处理方面取得了研究成果。此外,大数据的语义发现对于从粗糙的大数据中抽取和构建大规模的知识图谱至关重要,本项目也在从文本大数据中抽取语义关系等方面取得了一定的研究成果。随着知识图谱和语义计算技术在搜索、问答和大数据分析等领域得到越来越多的应用,本项目所研究的有关大规模的语义图谱处理引擎,以及大数据语义发现等技术在医疗、电商、金融等多个领域都具备较好的应用前景。本项目总共发表相关学术论文 23篇,获得授权专利7项,培养博士生4名,硕士生8名,本科生15名。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
服务经济时代新动能将由技术和服务共同驱动
中外学术论文与期刊的宏观差距分析及改进建议
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
基于粒计算的多元时序数据语义建模、算法及应用研究
面向弱标记数据的粒计算方法及应用研究
面向语义出版的科技文献资源描述框架研究
面向语义Web的Ontology计算与语义推理技术研究