基于大规模语料库的汉语词语自动聚类研究

基本信息
批准号:69973015
项目类别:面上项目
资助金额:12.00
负责人:王晓龙
学科分类:
依托单位:哈尔滨工业大学
批准年份:1999
结题年份:2002
起止时间:2000-01-01 - 2002-12-31
项目状态: 已结题
项目参与者:付国宏,徐志明,关毅,王平,刘秉权,白晓华,李建华,孙玉琦,陈清才
关键词:
词语聚类自然语言处理语言模型
结项摘要

The project is based on probability of Chinese character or word N-gram cooccurence on large scale corpora. The contents of research is about key techniques of automatic Chinese word classification, including statistical regularities of Chinese words, word sense similarity, and algorithm of automatic word classification based on large vocabulary. The object of research is to construct a class-based staticacal language model. The research is meaningful theoretically and pratically for natural language processing. In the article, outline of project, its execution, main results, cultivation of person, and using of outlay are treated. Work in future is predicted.

本项目以基于大规模语料库的汉语字、词的不同元数尤其是三元以上的同现概率统计为基础,研究有关汉语词语自动聚类关键技术,包括汉语构词统计规律、基于上下文的词语相似度的计算方法、面向大词表的词语自动聚类算法,进而构造一个基于类的统计语言模型。本项目的实施对人工智能、自然语言处理等领域具有重要的科学意义和应用前景。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

王晓龙的其他基金

批准号:41171024
批准年份:2011
资助金额:65.00
项目类别:面上项目
批准号:61272383
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:60973076
批准年份:2009
资助金额:30.00
项目类别:面上项目
批准号:40801197
批准年份:2008
资助金额:22.00
项目类别:青年科学基金项目
批准号:11871400
批准年份:2018
资助金额:48.00
项目类别:面上项目
批准号:20804055
批准年份:2008
资助金额:18.00
项目类别:青年科学基金项目
批准号:69075013
批准年份:1990
资助金额:2.78
项目类别:面上项目
批准号:11401472
批准年份:2014
资助金额:22.00
项目类别:青年科学基金项目
批准号:69003301
批准年份:1990
资助金额:3.50
项目类别:青年科学基金项目
批准号:90612005
批准年份:2006
资助金额:32.00
项目类别:重大研究计划
批准号:61573118
批准年份:2015
资助金额:64.00
项目类别:面上项目
批准号:51171202
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:51775538
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:60435020
批准年份:2004
资助金额:190.00
项目类别:重点项目
批准号:31801460
批准年份:2018
资助金额:27.00
项目类别:青年科学基金项目
批准号:60175020
批准年份:2001
资助金额:19.00
项目类别:面上项目
批准号:60373100
批准年份:2003
资助金额:8.00
项目类别:面上项目
批准号:41702135
批准年份:2017
资助金额:27.00
项目类别:青年科学基金项目

相似国自然基金

1

基于词语独异性特征的大规模词义标注语料库自动构建研究

批准号:60703063
批准年份:2007
负责人:吴云芳
学科分类:F0211
资助金额:20.00
项目类别:青年科学基金项目
2

基于语料库的汉语短语自动切分方法研究

批准号:69303010
批准年份:1993
负责人:白栓虎
学科分类:F0211
资助金额:5.50
项目类别:青年科学基金项目
3

大规模汉语历时语料库建设及词汇语义变迁研究

批准号:61472017
批准年份:2014
负责人:胡俊峰
学科分类:F0211
资助金额:80.00
项目类别:面上项目
4

基于Web的大规模双语语料库挖掘及翻译知识自动获取

批准号:60603095
批准年份:2006
负责人:吕雅娟
学科分类:F0211
资助金额:26.00
项目类别:青年科学基金项目