基于自编码机的半监督特征表示学习方法研究

基本信息
批准号:61906060
项目类别:青年科学基金项目
资助金额:22.00
负责人:朱毅
学科分类:
依托单位:扬州大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
半监督文本挖掘迁移学习特征表示学习自编码机
结项摘要

The effective expression of information determines the quality of information task. Feature representation learning aims at mapping original data into low-dimensional feature vector space for more efficient knowledge discovery and data mining tasks. Due to the large amount of labeled data required in applications is intractable, it is of great significance to improve the performance of feature representation learning by combining semi-supervised learning with a large amount of unlabeled data that is available. The auto-encoder is an unsupervised neural network which has achieved excellent performance in feature representation learning. This project intends to conduct the research on auto-encoder-based semi-supervised feature representation learning methods. Firstly, this project studies the construction of the semi-supervised auto-encoder model, including the integration and optimization method of the semi-supervised multi-layer auto-encoder model. Secondly, this project studies how to fuse and optimize the feature representation obtained by multi-layer integrated auto-encoder model learning in the mapping vector space. Based on this, the objective function strategy of feature representation learning method about transfer learning is studied to improve the performance of model. Finally, taking the classification of sentiment comment text as an example, the prototype system is constructed to improve the research work. This project provides a new theoretical exploration for semi-supervised feature representation learning and makes a meaningful attempt to develop knowledge representation learning algorithms with practical value.

信息的有效表达决定了信息任务的完成质量。特征表示学习旨在将原始数据映射到低维特征向量空间中以进行更有效的知识发现任务。由于在实际应用领域中标记数据需要大量的人力,因此,利用少量标记信息结合容易获得的大量无标签数据进行半监督学习成为提高特征表示学习性能的重要途径。自编码机是无监督的神经网络模型,已在特征表示学习领域获得突破性进展。本项目拟基于自编码机研究半监督特征表示学习方法,首先研究半监督自编码机模型的构建方法,包括半监督多层自编码机模型的集成和优化策略。其次,研究在映射特征向量空间内,如何融合和优化自编码机集成模型学习得到的特征表示。基于此,研究特征表示学习方法在面向迁移学习任务时的目标函数表示问题,以提升特征表示向量的表现。最后,以情感评论文本分类为例构建原型系统并以此完善和深化研究工作。本项目为半监督特征表示学习提供新的理论探索,为研发具有实用价值的知识表示学习系统作出有意义的尝试。

项目摘要

特征表示学习旨在将原始数据映射到低维特征向量空间中以进行更有效的知识发现任务,利用少量标记信息结合容易获得的大量无标签数据进行半监督学习成为提高特征表示学习性能的重要途径。本项目从半监督自编码机模型的构建、融合和优化多源特征、跨领域特征应用和自编码机、提示学习等前沿思想出发,深入研究了半监督特征表示学习方法,并在迁移学习、个性化推荐、短文本分类等方面开展了相关应用研究。该项目取得了较好的研究成果,完成的创新工作总结如下:.(1)提出了一种堆叠卷积稀疏的半监督自编码机模型,以完成高层特征表示学习。具体来说,首先通过堆叠稀疏自编码机结合Softmax回归,完成了半监督特征表示学习的自编码机模型构建。在真实数据上进行实验,相对已有的算法,实验结果显示该模型具有更好的结果。.(2)为了解决多自编码机架构中多源特征的融合和优化问题,提出了一种基于集成自编码机的特征表示学习方法,并应用在无监督领域自适应中。通过真实的数据进行实验,实验结果显示该算法具有更好的性能。.(3)面对个性化推荐中,基于用户的特征和基于物品的特征具有不同特点的问题,提出一种基于协同自编码机的个性化推荐算法。具体来说,通过两种不同的自编码机模型分别学习基于用户和基于物品的不同特征以实现推荐。在公开数据集上的实验证明了方法的有效性。.(4)开展了面向情感评论文本分类和个性化推荐方面的应用研究,建立了面向具体任务的有效算法,促进了相关应用的发展。.上述工作已在国内外学术期刊和会议上发表8篇论文,其中7篇期刊论文,1篇会议论文;申请发明专利8项;培养硕士研究生5人。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

DOI:10.13465/j.cnki.jvs.2020.09.026
发表时间:2020
2

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

朱毅的其他基金

批准号:81130002
批准年份:2011
资助金额:300.00
项目类别:重点项目
批准号:30440003
批准年份:2004
资助金额:10.00
项目类别:专项基金项目
批准号:91439000
批准年份:2014
资助金额:100.00
项目类别:重大研究计划
批准号:31101263
批准年份:2011
资助金额:24.00
项目类别:青年科学基金项目
批准号:91539000
批准年份:2015
资助金额:150.00
项目类别:重大研究计划
批准号:81730014
批准年份:2017
资助金额:294.00
项目类别:重点项目
批准号:91739000
批准年份:2017
资助金额:150.00
项目类别:重大研究计划
批准号:91639000
批准年份:2016
资助金额:160.00
项目类别:重大研究计划
批准号:81672471
批准年份:2016
资助金额:55.00
项目类别:面上项目
批准号:21706091
批准年份:2017
资助金额:24.00
项目类别:青年科学基金项目
批准号:92139000
批准年份:2021
资助金额:186.00
项目类别:重大研究计划
批准号:81101802
批准年份:2011
资助金额:20.00
项目类别:青年科学基金项目
批准号:11204155
批准年份:2012
资助金额:24.00
项目类别:青年科学基金项目
批准号:30630032
批准年份:2006
资助金额:150.00
项目类别:重点项目
批准号:81202735
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:91839000
批准年份:2018
资助金额:200.00
项目类别:重大研究计划
批准号:11871299
批准年份:2018
资助金额:52.00
项目类别:面上项目
批准号:91339000
批准年份:2013
资助金额:200.00
项目类别:重大研究计划
批准号:30200368
批准年份:2002
资助金额:15.00
项目类别:青年科学基金项目
批准号:30971063
批准年份:2009
资助金额:32.00
项目类别:面上项目
批准号:30570713
批准年份:2005
资助金额:35.00
项目类别:面上项目
批准号:30470631
批准年份:2004
资助金额:21.00
项目类别:面上项目
批准号:81860875
批准年份:2018
资助金额:36.00
项目类别:地区科学基金项目

相似国自然基金

1

一般多视图核机的监督和半监督学习方法的研究

批准号:61906101
批准年份:2019
负责人:谢锡炯
学科分类:F0603
资助金额:20.00
项目类别:青年科学基金项目
2

有监督和半监督多视图特征学习方法与应用研究

批准号:61702280
批准年份:2017
负责人:吴飞
学科分类:F0605
资助金额:25.00
项目类别:青年科学基金项目
3

基于多粒度的半监督学习方法

批准号:61876103
批准年份:2018
负责人:梁吉业
学科分类:F0601
资助金额:62.00
项目类别:面上项目
4

基于稀疏表示和流形理论的半监督分类研究

批准号:11426159
批准年份:2014
负责人:古楠楠
学科分类:A0602
资助金额:3.00
项目类别:数学天元基金项目