随着用户信息需求的日益精确化,信息检索研究正向细粒度和语义(关联)化发展,实体检索作为这一趋势的重要方向之一,是信息检索领域研究的一个新兴热点。本课题试图采用语言模型等信息检索建模方法,利用网络信息格式化抽取、命名实体识别、自然语言处理等相关技术,对实体检索的核心问题进行研究,拟提出通用实体检索模型框架,并建立以实体为中心的查询处理和检索结果组织方案,最后构建面向通用实体的检索原型系统。.鉴于实体检索问题的通用性,本研究尝试构建的实体检索模型和框架对细粒度语义信息检索方法和通用模型的构建具有较强的理论价值和实例参考意义;研究中构建的实体检索原型系统在数字图书馆建设、搜索引擎开发及专业领域实体检索等方面亦具有较大的实用价值。
随着用户对检索结果的要求越来越精确和具体,信息检索研究正向细粒度和语义(关联)化发展,实体检索作为其中的发展方向,是当前信息检索研究和关注的焦点之一。.本项目组成员通过四年时间的努力,围绕本项目的预期成果的目标,按照既定的研究工作方案,实现了成员间实质性合作,基本完成了预期目标。采用语言模型等信息检索建模方法,利用网络信息格式化抽取、命名实体识别、自然语言处理等相关技术,对实体检索的核心问题进行研究,重点关注自然语言查询域中查询类别的自动识别与建模方法研究、基于用户行为的实体检索需求分析与查询意图分析研究、文档与实体关系建模及基于机器学习的实体文档关系自动识别研究、中文实体检索数据集构建以及基于统计语言模型的通用实体检索框架研究。.围绕上述问题,在国际信息检索顶级会议SIGIR、ECIR和英文杂志等发表文章6篇,在行业权威期刊、核心期刊发文二十余篇,构建专家实体检索数据集1个、武汉大学中文实体数据集1个、学术实体标注数据集1个,开发WHU-ES检索平台一个、软件工具4个,并获软件著作权两项,申请专利一个。科研成果具有较强的理论价值和实例参考意义:开发的相关软件工具现已应用于中国科学技术信息研究所承担的国家科技支撑计划项目“电动汽车技术预测与决策支持系统开发”以及“上市公司年报数据库建设及服务系统研发”项目中,并取得了预期效果。科研论文中提出的数据采集算法与信息检索模型在武汉大学边沿与海洋研究院、湖北省科技信息研究院(网络与资源研究中心)、湖北省标准化研究院等多个科研院所和企事业单位得到广泛应用。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
货币政策与汇率制度对国际收支的影响研究
基于分层语言模型的蒙古语跨语言检索的Rerank方法研究
基于语言模型的图像数据库自动语义标注及多模式检索研究
基于多语用户模型的个性化跨语言信息检索研究
一种具有通用描述能力和动态特性的元建模语言研究