基于词语相似关系的统计数据平滑研究

基本信息

批准号：60572159

项目类别：面上项目

资助金额：24.00

负责人：宋柔

学科分类：

依托单位：北京语言大学

批准年份：2005

结题年份：2008

起止时间：2006-01-01 - 2008-12-31

项目状态：已结题

项目参与者：荀恩东,石嘉明,罗智勇,樊太志,王洁,尚英,颜伟,张瑞朋,胡克力

关键词：

相似关系语料库数据稀疏

结项摘要

语料库统计方法是支持下一代网络自然语言处理功能的关键技术，但这一方法有许多基础性问题尚无深入研究，以致相关应用系统的性能提高受到很大局限，其中尤以数据稀疏问题为甚。缓解数据稀疏问题的平滑方法中，常用的插值方法不适合估计低频词预测问题，阶次回退法存在本质的矛盾，词类平滑方法过于粗糙。本课题深入分析了语料库统计方法的需求和汉语的实际，创性地利用词语相似关系进行平滑，并采用线性邻接属性计算相似度，需要研究相似度计算、同形异质词认定与排歧以及利用相似度的平滑算法。这些方法将集成到本项目组已经取得的关于线性文法的成果中去，改善语料库统计方法的性能，支持下一代网络的文本信息处理功能。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2017

DOI：10.12202/j.0476-0301.2020285

发表时间：2021

DOI：10.19818/j.cnki.1671-1637.2021.05.022

发表时间：2021

DOI：10.3969/j.issn.1000-1441.2020.05.004

发表时间：2020

DOI：

发表时间：2020

宋柔的其他基金

批准号：60272055

批准年份：2002

资助金额：22.00

项目类别：面上项目

批准号：69273042

批准年份：1992

资助金额：6.00

项目类别：面上项目

批准号：61672175

批准年份：2016

资助金额：62.00

项目类别：面上项目

批准号：60141001

批准年份：2001

资助金额：8.00

项目类别：专项基金项目

批准号：61171129

批准年份：2011

资助金额：62.00

项目类别：面上项目

批准号：69882001

批准年份：1998

资助金额：18.00

项目类别：专项基金项目

批准号：69472015

批准年份：1994

资助金额：8.00

项目类别：面上项目

批准号：69682001

批准年份：1996

资助金额：14.50

项目类别：专项基金项目

批准号：68973027

批准年份：1989

资助金额：3.00

项目类别：面上项目

批准号：60872121

批准年份：2008

资助金额：30.00

项目类别：面上项目

相似国自然基金

中文词语信息结构关系的自动辨识

批准号：60372064

批准年份：2003

负责人：董强

学科分类：F0113

资助金额：20.00

项目类别：面上项目

汉语词语接续关系的柔性系统及其应用研究

批准号：69682001

批准年份：1996

负责人：宋柔

学科分类：F0113

资助金额：14.50

项目类别：专项基金项目

基于非完全相似和相关关系的框架节点性能研究

批准号：51178192

批准年份：2011

负责人：王湛

学科分类：E0804

资助金额：65.00

项目类别：面上项目

基于国际编码标准的藏文词语排序算法研究

批准号：61163013

批准年份：2011

负责人：边巴旺堆

学科分类：F0201

资助金额：30.00

项目类别：地区科学基金项目

基于词语相似关系的统计数据平滑研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

论大数据环境对情报学发展的影响

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

多源数据驱动CNN-GRU模型的公交客流量分类预测

混采地震数据高效高精度分离处理方法研究进展

基于关系对齐的汉语虚词抽象语义表示与分析

宋柔的其他基金

线性文法及其在智能信息处理中的应用

面向篇章处理的汉语电子词典和语法库的设计方法研究

NT小句复合体模型的理论和应用研究

面向语言信息智能接口的线性文法研究

基于广义话题的汉语篇章结构研究

现代汉语通用分词系统研究

智能型校对系统的理论与技术研究

汉语词语接续关系的柔性系统及其应用研究

结构模式处理的计算模型

汉语跨标点句句法分析方法研究

相似国自然基金