跨语言文本自动分类关键技术研究

基本信息
批准号:60803050
项目类别:青年科学基金项目
资助金额:19.00
负责人:代六玲
学科分类:
依托单位:北京理工大学
批准年份:2008
结题年份:2011
起止时间:2009-01-01 - 2011-12-31
项目状态: 已结题
项目参与者:刘万春,张晓丹,赵育民,李奇,汤继良
关键词:
信息检索文本挖掘跨语言文本分类
结项摘要

文本分类是文本挖掘的关键性和基础性问题之一。日益加快的全球一体化进程对跨语言的文本分类技术提出了迫切的需求。虽然目前研究者们已经进行了大量的文本分类相关研究工作,但是针对的跨语言文本分类问题的研究比较匮乏,限制了跨文本挖掘的发展和应用。本项目将针对多语言环境下跨语言文本分类的关键问题进行深入研究。具体研究内容包括:(1)基于特征概念的文本表示方法和特征概念的提取方法;(2)跨语言的文本相似度计算方法和类别判定方法;(3)中英跨语言分类测试语料集合的建立,实现原型系统,对算法进行评价和改进。通过本项目的研究,不仅能突破跨语言文本分类的难题,还可为跨语言的信息检索和文本挖掘提供有效的基础算法,使更大范围和更深层次的跨语言应用成为可能。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
2

信息熵-保真度联合度量函数的单幅图像去雾方法

信息熵-保真度联合度量函数的单幅图像去雾方法

DOI:10.3724/SP.J.1089.2019.17435
发表时间:2019
3

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

DOI:10.7498/aps.68.20181682
发表时间:2019
4

骨外器官来源外泌体对骨骼调控作用的研究进展

骨外器官来源外泌体对骨骼调控作用的研究进展

DOI:10.13376/j.cbls/2021092
发表时间:2021
5

城市生活垃圾热值的特征变量选择方法及预测建模

城市生活垃圾热值的特征变量选择方法及预测建模

DOI:10.11936/bjutxb2021010011
发表时间:2021

代六玲的其他基金

相似国自然基金

1

中文文本自动分类关键技术研究

批准号:60573187
批准年份:2005
负责人:孙茂松
学科分类:F0211
资助金额:26.00
项目类别:面上项目
2

面向英汉双向跨语言图像检索的文本分析关键技术研究

批准号:61170095
批准年份:2011
负责人:张玥杰
学科分类:F0211
资助金额:57.00
项目类别:面上项目
3

跨语言文本复制检测研究

批准号:60903123
批准年份:2009
负责人:鲍军鹏
学科分类:F0211
资助金额:19.00
项目类别:青年科学基金项目
4

跨语言敏感事件抽取关键技术研究

批准号:61672368
批准年份:2016
负责人:洪宇
学科分类:F0211
资助金额:62.00
项目类别:面上项目