基于词语相似关系的统计数据平滑研究

基本信息
批准号:60572159
项目类别:面上项目
资助金额:24.00
负责人:宋柔
学科分类:
依托单位:北京语言大学
批准年份:2005
结题年份:2008
起止时间:2006-01-01 - 2008-12-31
项目状态: 已结题
项目参与者:荀恩东,石嘉明,罗智勇,樊太志,王洁,尚英,颜伟,张瑞朋,胡克力
关键词:
相似关系语料库数据稀疏
结项摘要

语料库统计方法是支持下一代网络自然语言处理功能的关键技术,但这一方法有许多基础性问题尚无深入研究,以致相关应用系统的性能提高受到很大局限,其中尤以数据稀疏问题为甚。缓解数据稀疏问题的平滑方法中,常用的插值方法不适合估计低频词预测问题,阶次回退法存在本质的矛盾,词类平滑方法过于粗糙。本课题深入分析了语料库统计方法的需求和汉语的实际,创性地利用词语相似关系进行平滑,并采用线性邻接属性计算相似度,需要研究相似度计算、同形异质词认定与排歧以及利用相似度的平滑算法。这些方法将集成到本项目组已经取得的关于线性文法的成果中去,改善语料库统计方法的性能,支持下一代网络的文本信息处理功能。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
3

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
4

混采地震数据高效高精度分离处理方法研究进展

混采地震数据高效高精度分离处理方法研究进展

DOI:10.3969/j.issn.1000-1441.2020.05.004
发表时间:2020
5

基于关系对齐的汉语虚词抽象语义表示与分析

基于关系对齐的汉语虚词抽象语义表示与分析

DOI:
发表时间:2020

宋柔的其他基金

批准号:60272055
批准年份:2002
资助金额:22.00
项目类别:面上项目
批准号:69273042
批准年份:1992
资助金额:6.00
项目类别:面上项目
批准号:61672175
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:60141001
批准年份:2001
资助金额:8.00
项目类别:专项基金项目
批准号:61171129
批准年份:2011
资助金额:62.00
项目类别:面上项目
批准号:69882001
批准年份:1998
资助金额:18.00
项目类别:专项基金项目
批准号:69472015
批准年份:1994
资助金额:8.00
项目类别:面上项目
批准号:69682001
批准年份:1996
资助金额:14.50
项目类别:专项基金项目
批准号:68973027
批准年份:1989
资助金额:3.00
项目类别:面上项目
批准号:60872121
批准年份:2008
资助金额:30.00
项目类别:面上项目

相似国自然基金

1

中文词语信息结构关系的自动辨识

批准号:60372064
批准年份:2003
负责人:董强
学科分类:F0113
资助金额:20.00
项目类别:面上项目
2

汉语词语接续关系的柔性系统及其应用研究

批准号:69682001
批准年份:1996
负责人:宋柔
学科分类:F0113
资助金额:14.50
项目类别:专项基金项目
3

基于非完全相似和相关关系的框架节点性能研究

批准号:51178192
批准年份:2011
负责人:王湛
学科分类:E0804
资助金额:65.00
项目类别:面上项目
4

基于国际编码标准的藏文词语排序算法研究

批准号:61163013
批准年份:2011
负责人:边巴旺堆
学科分类:F0201
资助金额:30.00
项目类别:地区科学基金项目