中英可比语料库与体育术语自动抽取的探索性研究

基本信息

批准号：60572132

项目类别：面上项目

资助金额：22.00

负责人：孙广范

学科分类：

依托单位：中国电子信息产业发展研究院

批准年份：2005

结题年份：2008

起止时间：2006-01-01 - 2008-12-31

项目状态：已结题

项目参与者：王建平,李峻,单玉秋,莫海峰,何宏彬,谢逢时,孙桂明

关键词：

向量相似计算方法相关度上下文向量机器翻译可比语料库

结项摘要

进入21世纪以来，可比语料库(comparable corpus)的研究在我国自然语言处理和计算语言学界还是一个空白。根据90年代国际语料库语言学的研究与发展，认为可比语料库的导入将克服平行语料库抽取语言知识中，受本国语言表达框架影响而产生的噪音和翻译腔,从而使基于语料库语言学的术语自动抽取的研究进入一个崭新的阶段。从机器翻译应用出发，建立国际性体育赛事领域（奥运会以及类似的国际性比赛）的汉英可比语料库，结合汉语和英语的特点，研究从汉英可比语料库中自动提取中英体育术语词汇（包括当代新出现的体育术语词汇）的算法和模型，将促进我国语料库语言学的发展，缩小我国的语料库语言学的研究与国际先进水平的差距。同时，本项目的研究成果将直接用于北京2008年奥运会跨语言信息交流应用平台建设，具有深远的社会效益和国际影响。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.3724/SP.J.1089.2019.17435

发表时间：2019

DOI：10.7500/aeps20191122006

发表时间：2020

DOI：

发表时间：2018

DOI：

发表时间：2018

DOI：10.7510/jgjs.issn.1001-3806.2020.06.018

发表时间：2020

孙广范的其他基金

批准号：69702002

批准年份：1997

资助金额：12.00

项目类别：青年科学基金项目

批准号：60872118

批准年份：2008

资助金额：29.00

项目类别：面上项目

相似国自然基金

汉英平行语料库翻译知识提取系统研究－自动提取术语、术语搭配及词组块

批准号：60372106

批准年份：2003

负责人：袁琦

学科分类：F0113

资助金额：26.00

项目类别：面上项目

基于三元组可比语料库的语言自动剖析技术应用研究

批准号：61172102

批准年份：2011

负责人：肖健

学科分类：F0113

资助金额：63.00

项目类别：面上项目

可比语料库质量量化与提升方法研究

批准号：61300144

批准年份：2013

负责人：李波

学科分类：F0211

资助金额：23.00

项目类别：青年科学基金项目

机器翻译系统中英汉双语语料库对齐技术的应用基础研究

批准号：60272090

批准年份：2002

负责人：单玉秋

学科分类：F0113

资助金额：7.00

项目类别：面上项目

中英可比语料库与体育术语自动抽取的探索性研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

信息熵-保真度联合度量函数的单幅图像去雾方法

基于暂态波形相关性的配电网故障定位方法

相关系数SVD增强随机共振的单向阀故障诊断

山西省大气PM2.5 污染时空分布特征∗

基于粒子群优化算法的级联喇曼光纤放大器

孙广范的其他基金

实用化机器翻译系统中智能型规则系统实现方法的研究

基于汉英双向树串模型的统计机器翻译研究

相似国自然基金