基于自编码机的半监督特征表示学习方法研究

基本信息

批准号：61906060

项目类别：青年科学基金项目

资助金额：22.00

负责人：朱毅

学科分类：

依托单位：扬州大学

批准年份：2019

结题年份：2022

起止时间：2020-01-01 - 2022-12-31

项目状态：已结题

项目参与者：

关键词：

半监督文本挖掘迁移学习特征表示学习自编码机

结项摘要

The effective expression of information determines the quality of information task. Feature representation learning aims at mapping original data into low-dimensional feature vector space for more efficient knowledge discovery and data mining tasks. Due to the large amount of labeled data required in applications is intractable, it is of great significance to improve the performance of feature representation learning by combining semi-supervised learning with a large amount of unlabeled data that is available. The auto-encoder is an unsupervised neural network which has achieved excellent performance in feature representation learning. This project intends to conduct the research on auto-encoder-based semi-supervised feature representation learning methods. Firstly, this project studies the construction of the semi-supervised auto-encoder model, including the integration and optimization method of the semi-supervised multi-layer auto-encoder model. Secondly, this project studies how to fuse and optimize the feature representation obtained by multi-layer integrated auto-encoder model learning in the mapping vector space. Based on this, the objective function strategy of feature representation learning method about transfer learning is studied to improve the performance of model. Finally, taking the classification of sentiment comment text as an example, the prototype system is constructed to improve the research work. This project provides a new theoretical exploration for semi-supervised feature representation learning and makes a meaningful attempt to develop knowledge representation learning algorithms with practical value.

信息的有效表达决定了信息任务的完成质量。特征表示学习旨在将原始数据映射到低维特征向量空间中以进行更有效的知识发现任务。由于在实际应用领域中标记数据需要大量的人力，因此，利用少量标记信息结合容易获得的大量无标签数据进行半监督学习成为提高特征表示学习性能的重要途径。自编码机是无监督的神经网络模型，已在特征表示学习领域获得突破性进展。本项目拟基于自编码机研究半监督特征表示学习方法，首先研究半监督自编码机模型的构建方法，包括半监督多层自编码机模型的集成和优化策略。其次，研究在映射特征向量空间内，如何融合和优化自编码机集成模型学习得到的特征表示。基于此，研究特征表示学习方法在面向迁移学习任务时的目标函数表示问题，以提升特征表示向量的表现。最后，以情感评论文本分类为例构建原型系统并以此完善和深化研究工作。本项目为半监督特征表示学习提供新的理论探索，为研发具有实用价值的知识表示学习系统作出有意义的尝试。

项目摘要

特征表示学习旨在将原始数据映射到低维特征向量空间中以进行更有效的知识发现任务，利用少量标记信息结合容易获得的大量无标签数据进行半监督学习成为提高特征表示学习性能的重要途径。本项目从半监督自编码机模型的构建、融合和优化多源特征、跨领域特征应用和自编码机、提示学习等前沿思想出发，深入研究了半监督特征表示学习方法，并在迁移学习、个性化推荐、短文本分类等方面开展了相关应用研究。该项目取得了较好的研究成果，完成的创新工作总结如下：.（1）提出了一种堆叠卷积稀疏的半监督自编码机模型，以完成高层特征表示学习。具体来说，首先通过堆叠稀疏自编码机结合Softmax回归，完成了半监督特征表示学习的自编码机模型构建。在真实数据上进行实验，相对已有的算法，实验结果显示该模型具有更好的结果。.（2）为了解决多自编码机架构中多源特征的融合和优化问题，提出了一种基于集成自编码机的特征表示学习方法，并应用在无监督领域自适应中。通过真实的数据进行实验，实验结果显示该算法具有更好的性能。.（3）面对个性化推荐中，基于用户的特征和基于物品的特征具有不同特点的问题，提出一种基于协同自编码机的个性化推荐算法。具体来说，通过两种不同的自编码机模型分别学习基于用户和基于物品的不同特征以实现推荐。在公开数据集上的实验证明了方法的有效性。.（4）开展了面向情感评论文本分类和个性化推荐方面的应用研究，建立了面向具体任务的有效算法，促进了相关应用的发展。.上述工作已在国内外学术期刊和会议上发表8篇论文，其中7篇期刊论文，1篇会议论文；申请发明专利8项；培养硕士研究生5人。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：10.3969/j.issn.1001-1978.2022.02.019

发表时间：2022

DOI：

发表时间：2016

DOI：10.1360/SSM-2020-0035

发表时间：2020

DOI：10.13191/j.chj.2017.0028

发表时间：2016

朱毅的其他基金

批准号：81130002

批准年份：2011

资助金额：300.00

项目类别：重点项目

批准号：30440003

批准年份：2004

资助金额：10.00

项目类别：专项基金项目

批准号：91439000

批准年份：2014

资助金额：100.00

项目类别：重大研究计划

批准号：31101263

批准年份：2011

资助金额：24.00

项目类别：青年科学基金项目

批准号：91539000

批准年份：2015

资助金额：150.00

项目类别：重大研究计划

批准号：81730014

批准年份：2017

资助金额：294.00

项目类别：重点项目

批准号：91739000

批准年份：2017

资助金额：150.00

项目类别：重大研究计划

批准号：91639000

批准年份：2016

资助金额：160.00

项目类别：重大研究计划

批准号：81672471

批准年份：2016

资助金额：55.00

项目类别：面上项目

批准号：21706091

批准年份：2017

资助金额：24.00

项目类别：青年科学基金项目

批准号：92139000

批准年份：2021

资助金额：186.00

项目类别：重大研究计划

批准号：81101802

批准年份：2011

资助金额：20.00

项目类别：青年科学基金项目

批准号：11204155

批准年份：2012

资助金额：24.00

项目类别：青年科学基金项目

批准号：30630032

批准年份：2006

资助金额：150.00

项目类别：重点项目

批准号：81202735

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：91839000

批准年份：2018

资助金额：200.00

项目类别：重大研究计划

批准号：11871299

批准年份：2018

资助金额：52.00

项目类别：面上项目

批准号：91339000

批准年份：2013

资助金额：200.00

项目类别：重大研究计划

批准号：30200368

批准年份：2002

资助金额：15.00

项目类别：青年科学基金项目

批准号：30971063

批准年份：2009

资助金额：32.00

项目类别：面上项目

批准号：30570713

批准年份：2005

资助金额：35.00

项目类别：面上项目

批准号：30470631

批准年份：2004

资助金额：21.00

项目类别：面上项目

批准号：81860875

批准年份：2018

资助金额：36.00

项目类别：地区科学基金项目

相似国自然基金

一般多视图核机的监督和半监督学习方法的研究

批准号：61906101

批准年份：2019

负责人：谢锡炯

学科分类：F0603

资助金额：20.00

项目类别：青年科学基金项目

有监督和半监督多视图特征学习方法与应用研究

批准号：61702280

批准年份：2017

负责人：吴飞

学科分类：F0605

资助金额：25.00

项目类别：青年科学基金项目

基于多粒度的半监督学习方法

批准号：61876103

批准年份：2018

负责人：梁吉业

学科分类：F0601

资助金额：62.00

项目类别：面上项目

基于稀疏表示和流形理论的半监督分类研究

批准号：11426159

批准年份：2014

负责人：古楠楠

学科分类：A0602

资助金额：3.00

项目类别：数学天元基金项目

基于自编码机的半监督特征表示学习方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

TRPV1/SIRT1介导吴茱萸次碱抗Ang Ⅱ诱导的血管平滑肌细胞衰老

氧化应激与自噬

现代优化理论与应用

血管内皮细胞线粒体动力学相关功能与心血管疾病关系的研究进展

朱毅的其他基金

不同流体剪切力对血管内皮细胞损伤与保护的机制研究

血管内皮中ATP结合夹转运蛋白A1的表达及调控

血管稳态与重构的调控机制

萝卜硫素调控MicroRNA抑制肝癌细胞侵袭能力机制研究

血管稳态与重构的调控机制

湍流剪切力在血管内皮细胞激活整合素alpha5-YAP通路的机制及其意义

血管稳态与重构的调控机制

血管稳态与重构的调控机制

MUC4介导NK细胞分离失能及其促胰腺癌转移、吉西他滨耐药的研究

石墨烯-卤氧化铋-石墨烯夹心结构复合材料的可控制备及其光催化活性增强机制的研究

血管稳态与重构的调控机制

NIDO-αVβ3途径介导胰腺癌MUC4抗原特异性CTL凋亡的研究

二维蜂窝晶格中的非线性波动

血管内皮炎症反应和脂质转运异常在动脉粥样硬化发病中的作用

电针"足三里"对脊髓损伤结肠动力障碍大鼠per2基因生物钟效应的研究

血管稳态与重构的调控机制

拓扑光学材料中边缘态的计算与分析

血管稳态与重构的调控机制

隔药灸治疗溃疡性结肠炎的疗效评价及凋亡基因调控机理

可溶性表氧化物水解酶在血管内皮细胞中的转录后调节

内皮细胞膜亚结构caveolae与代谢综合征血管病变

流动剪切力对血管内皮中ATP结合夹转运蛋白A1调控的分子机制

基于多组学研究电针对脊髓损伤排便障碍大鼠结肠5-HT系统的微生态调节机制

相似国自然基金