中文文献自动分类技术研究

基本信息
批准号:69673011
项目类别:面上项目
资助金额:10.00
负责人:刘开瑛
学科分类:
依托单位:山西大学
批准年份:1996
结题年份:1999
起止时间:1997-01-01 - 1999-12-31
项目状态: 已结题
项目参与者:郑家恒,高敏,单永明,周晓强,吕国英,张培年,刘静
关键词:
中文文献分类汉语主题词表语料库方法
结项摘要

中文文献自动分类系统是一个智能软件系统。我们采用语料库和人工智能相结合的方法。首先抓住中文文本自动分词中的岐义切分和专有名词识别的研究。建立了岐义字段库,近8万条。填补了国内空白。在国内,首次使用了中国姓氏和中国地名用字使用度,采用基于统计信息和基于词汇/词性规则的算法,使自动分词的正确率达到96%左右,达到了实用化要求。其次,我们提出了一种基于词的三维加权自动分类方法。该方法基于《中国档案分类法》的分类体系,在对文本的归类判定中,考虑了类别词的频度、出现位置和专指度等因素,并辅以规则进行控制和调整。开发了“金融档案自动分类系统”和“财政公文自动分类系统”,分类正确率达到85%,正在向实用化过渡。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

DOI:10.3969/j.issn.1002-0268.2020.03.007
发表时间:2020
2

气载放射性碘采样测量方法研究进展

气载放射性碘采样测量方法研究进展

DOI:
发表时间:2020
3

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021
4

基于混合优化方法的大口径主镜设计

基于混合优化方法的大口径主镜设计

DOI:10.3788/AOS202040.2212001
发表时间:2020
5

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

DOI:
发表时间:2020

刘开瑛的其他基金

批准号:69373041
批准年份:1993
资助金额:6.00
项目类别:面上项目
批准号:68973013
批准年份:1989
资助金额:1.80
项目类别:面上项目

相似国自然基金

1

中文文本自动分类关键技术研究

批准号:60573187
批准年份:2005
负责人:孙茂松
学科分类:F0211
资助金额:26.00
项目类别:面上项目
2

基于多样化特征表达的生物文献自动分类研究

批准号:60903093
批准年份:2009
负责人:兰曼
学科分类:F0213
资助金额:17.00
项目类别:青年科学基金项目
3

中文自动口语摘要技术研究

批准号:61170197
批准年份:2011
负责人:吴及
学科分类:F0211
资助金额:55.00
项目类别:面上项目
4

中文新闻广播故事自动分割技术研究

批准号:60802085
批准年份:2008
负责人:谢磊
学科分类:F0117
资助金额:20.00
项目类别:青年科学基金项目