基于语言模型的通用实体检索建模及框架实现研究

基本信息
批准号:71173164
项目类别:面上项目
资助金额:45.00
负责人:陆伟
学科分类:
依托单位:武汉大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:吴丹,王晓光,吴佳鑫,魏泉,严冠湘,韩曙光,张晓娟,陈英傑
关键词:
实体检索检索模型查询表示语言模型
结项摘要

随着用户信息需求的日益精确化,信息检索研究正向细粒度和语义(关联)化发展,实体检索作为这一趋势的重要方向之一,是信息检索领域研究的一个新兴热点。本课题试图采用语言模型等信息检索建模方法,利用网络信息格式化抽取、命名实体识别、自然语言处理等相关技术,对实体检索的核心问题进行研究,拟提出通用实体检索模型框架,并建立以实体为中心的查询处理和检索结果组织方案,最后构建面向通用实体的检索原型系统。.鉴于实体检索问题的通用性,本研究尝试构建的实体检索模型和框架对细粒度语义信息检索方法和通用模型的构建具有较强的理论价值和实例参考意义;研究中构建的实体检索原型系统在数字图书馆建设、搜索引擎开发及专业领域实体检索等方面亦具有较大的实用价值。

项目摘要

随着用户对检索结果的要求越来越精确和具体,信息检索研究正向细粒度和语义(关联)化发展,实体检索作为其中的发展方向,是当前信息检索研究和关注的焦点之一。.本项目组成员通过四年时间的努力,围绕本项目的预期成果的目标,按照既定的研究工作方案,实现了成员间实质性合作,基本完成了预期目标。采用语言模型等信息检索建模方法,利用网络信息格式化抽取、命名实体识别、自然语言处理等相关技术,对实体检索的核心问题进行研究,重点关注自然语言查询域中查询类别的自动识别与建模方法研究、基于用户行为的实体检索需求分析与查询意图分析研究、文档与实体关系建模及基于机器学习的实体文档关系自动识别研究、中文实体检索数据集构建以及基于统计语言模型的通用实体检索框架研究。.围绕上述问题,在国际信息检索顶级会议SIGIR、ECIR和英文杂志等发表文章6篇,在行业权威期刊、核心期刊发文二十余篇,构建专家实体检索数据集1个、武汉大学中文实体数据集1个、学术实体标注数据集1个,开发WHU-ES检索平台一个、软件工具4个,并获软件著作权两项,申请专利一个。科研成果具有较强的理论价值和实例参考意义:开发的相关软件工具现已应用于中国科学技术信息研究所承担的国家科技支撑计划项目“电动汽车技术预测与决策支持系统开发”以及“上市公司年报数据库建设及服务系统研发”项目中,并取得了预期效果。科研论文中提出的数据采集算法与信息检索模型在武汉大学边沿与海洋研究院、湖北省科技信息研究院(网络与资源研究中心)、湖北省标准化研究院等多个科研院所和企事业单位得到广泛应用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
5

货币政策与汇率制度对国际收支的影响研究

货币政策与汇率制度对国际收支的影响研究

DOI:
发表时间:2022

陆伟的其他基金

批准号:51574279
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:50804022
批准年份:2008
资助金额:20.00
项目类别:青年科学基金项目
批准号:81673018
批准年份:2016
资助金额:61.00
项目类别:面上项目
批准号:51671146
批准年份:2016
资助金额:60.00
项目类别:面上项目
批准号:31560652
批准年份:2015
资助金额:42.00
项目类别:地区科学基金项目
批准号:U1933112
批准年份:2019
资助金额:37.00
项目类别:联合基金项目
批准号:30901348
批准年份:2009
资助金额:27.00
项目类别:青年科学基金项目
批准号:91859110
批准年份:2018
资助金额:70.00
项目类别:重大研究计划
批准号:71673211
批准年份:2016
资助金额:51.00
项目类别:面上项目
批准号:31570081
批准年份:2015
资助金额:25.00
项目类别:面上项目
批准号:71473183
批准年份:2014
资助金额:66.00
项目类别:面上项目
批准号:50901052
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:51071109
批准年份:2010
资助金额:40.00
项目类别:面上项目

相似国自然基金

1

基于分层语言模型的蒙古语跨语言检索的Rerank方法研究

批准号:61063017
批准年份:2010
负责人:侯宏旭
学科分类:F0211
资助金额:8.00
项目类别:地区科学基金项目
2

基于语言模型的图像数据库自动语义标注及多模式检索研究

批准号:60403018
批准年份:2004
负责人:周向东
学科分类:F0202
资助金额:21.00
项目类别:青年科学基金项目
3

基于多语用户模型的个性化跨语言信息检索研究

批准号:61300129
批准年份:2013
负责人:周栋
学科分类:F0211
资助金额:27.00
项目类别:青年科学基金项目
4

一种具有通用描述能力和动态特性的元建模语言研究

批准号:60973041
批准年份:2009
负责人:刘淑芬
学科分类:F0203
资助金额:29.00
项目类别:面上项目