大规模概率主题模型的高性能求解

基本信息
批准号:61003117
项目类别:青年科学基金项目
资助金额:19.00
负责人:李文波
学科分类:
依托单位:中国科学院软件研究所
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:张大鲲,张振中,江雪,张苇如,张立强
关键词:
大规模文本处理概率主题模型并行计算
结项摘要

概率主题模型是一类重要的文本建模方法,建立在统计学基础上,突出的优点是具清晰的模型语义、丰富的表达能力。在信息检索、文本挖掘、自然语言处理等领域中的应用表明,概率主题模型是一种非常有效的手段。然而,由于概率主题模型求解算法一般都具有较高的复杂度并且是基于串行设计的,不利于在大规模文本处理任务中应用。所以,本项目的研究目标是:探索和挖掘概率主题模型的可并行性,系统性地研究和建立概率主题模型的可扩展求解算法并应用到大规模文本处理任务中。具体的研究内容包括:1.研究针对主题规模具有可扩展性的高性能算法,关键问题是主题集分解算法;2.研究支持数据规模和主题规模协同扩展的高性能算法,关键问题是模型子空间分解算法;3.研究基于GPGPU众核平台的并行算法,关键问题是面向GPGPU硬件架构和编程模型的计算任务的映射方法;4.大规模概率主题模型在信息检索和文本分类等领域中的应用。

项目摘要

概率主题模型是一类重要的文本建模方法,建立在统计学基础上,突出的优点是具清晰的模型语义、丰富的表达能力。在信息检索、文本挖掘、自然语言处理等领域中的应用表明,概率主题模型是一种非常有效的手段。然而,由于概率主题模型求解算法一般都具有较高的复杂度并且是基于串行设计的,不利于在大规模文本处理任务中应用。所以,本项目的研究目标是:探索和挖掘概率主题模型的可并行性,系统性地研究和建立概率主题模型的可扩展求解算法并应用到大规模文本处理任务中。..项目执行期内,我们对以下方面的具体内容进行了研究和开发:.一)高性能求解算法方面:1.研究出针对数据规模具有可扩展性的高性能算法;2.研究出支持数据规模和主题规模协同扩展的细粒度高性能算法。.二)研发主题模型的高性能求解系统:主要包含LDA和CTM两个典型模型,以及并行、分布式、并行分布混合式三种高性能计算模式。.三)大规模概率主题模型的示范应用:文本可视化表示和自动文本分类。..相关研究取得8篇学术论文、申请4项专利、5项软件著作权和1本译著等等学术成果。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

李文波的其他基金

相似国自然基金

1

基于概率主题模型的词义计算及应用研究

批准号:61373056
批准年份:2013
负责人:金澎
学科分类:F0211
资助金额:73.00
项目类别:面上项目
2

大规模时变区域覆盖优化建模及其高性能求解

批准号:41271400
批准年份:2012
负责人:张彤
学科分类:D0114
资助金额:75.00
项目类别:面上项目
3

基于多模态概率主题模型的实体相关文本可视化

批准号:61172143
批准年份:2011
负责人:袁媛
学科分类:F0117
资助金额:60.00
项目类别:面上项目
4

基于PAM概率主题模型的本体概念及层次结构学习研究

批准号:61105047
批准年份:2011
负责人:王俊丽
学科分类:F0603
资助金额:24.00
项目类别:青年科学基金项目