基于多域离散数据的深度学习

基本信息
批准号:61702327
项目类别:青年科学基金项目
资助金额:26.00
负责人:张伟楠
学科分类:
依托单位:上海交通大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:汪军,任侃,曹雪智,邱霖,周志明,曲彦儒,蔡涵,钮敏哲
关键词:
深度神经网络卷积神经网络数据挖掘多域离散数据有监督逐层预学习
结项摘要

Deep learning has achieved great success in cognitive pattern recognition tasks such as image and speech recognition by leveraging the capacity of deep neural network and the big data. However, on more widely data mining applications such as recommender systems and computational advertising etc., the advantages of deep learning have not been obviously revealed yet. The reason is the data type of most data mining tasks is multi-field categorical and sequential discrete data, on which few deep learning models are proposed to work. Therefore, this project aims to study the capability of deep learning models working on multi-field categorical and sequential discrete data. The main contributions are summarized as follows. (1) To design the end-to-end neural network architecture specifically working on multi-field categorical and sequential discrete data in order to address the problem of learning representation and mining inter-field data interaction patterns and thus improve the prediction performance. (2) Based on the studied neural network architecture, to propose efficient learning algorithm and automatic hyperparameter search methods to reduce the model complexity and get the model learning process accelerated and hands-free. (3) To deploy the proposed neural network model and learning algorithm onto at least two real-world large-scale-data intelligent applications, including editor article recommendation and user ad click prediction, to evaluate the efficacy and robustness of the solution. Overall, the output of this project would provide useful and insightful guidelines for the deep learning solutions for the various intelligent systems based on multi-field discrete data.

深度学习通过构建深层的神经网络模型结合大数据训练从而在图像和语音识别等感知任务中取得卓越的模式识别和预测效果。而深度学习的优势还并未明显体现在更多数据挖掘领域,例如推荐系统和计算广告等应用中,原因是这些问题的数据大多是多域的类别型或序列型的离散数据,之前少有神经网络模型直接工作在此类数据上。因此,本项目拟对基于多域离散数据的深度学习模型的有效性进行分析,具体包括:(1)设计面向此类数据的端到端神经网络架构,解决多域离散数据的表示及其交互模式的自动挖掘,提高深度学习模型的预测精准性。(2)基于新型神经网络架构,提出快速学习算法和超参数搜索算法,减低模型计算复杂度,提高模型的收敛效率和自动化程度。(3)将提出的模型和学习算法在至少两个大数据场景中落地实践,包括编辑稿件推荐和用户广告点击预测,并探讨模型的有效性和鲁棒性。研究成果将为深度学习在基于多域离散数据上的多种智能应用提供有益参考和借鉴。

项目摘要

本项目主要对基于多域离散数据的深度学习模型的有效性进行分析并提出新型深度学习模型。项目首先设计面向此类数据的端到端神经网络架构,解决多域离散数据的表示及其交互模式的自动挖掘,提高深度学习模型的预测精准性。其次,基于新型神经网络架构,提出快速学习算法和超参数搜索算法,减低模型计算复杂度,提高模型的收敛效率和自动化程度。此外,将提出的模型和学习算法在至少两个大数据场景中落地实践。在项目期2018年至2020年,项目组在本项目研究方向发表国际学术论文47篇,其中CCF-A类论文36篇;申请5项技术发明专利;培养了8名研究生;开源工程代码8项以上到Github。项目研究产出的深度学习模型落地在华为手机应用市场推荐系统平台和阿里巴巴广告推荐平台上,皆取得了令人满意的效果,提升了平台的业务指标。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于铁路客流分配的旅客列车开行方案调整方法

基于铁路客流分配的旅客列车开行方案调整方法

DOI:
发表时间:2021
2

基于多色集合理论的医院异常工作流处理建模

基于多色集合理论的医院异常工作流处理建模

DOI:
发表时间:2020
3

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于改进LinkNet的寒旱区遥感图像河流识别方法

DOI:10.6041/j.issn.1000-1298.2022.07.022
发表时间:2022
4

基于腔内级联变频的0.63μm波段多波长激光器

基于腔内级联变频的0.63μm波段多波长激光器

DOI:10.3788/CJL201946.0801003
发表时间:2019
5

结直肠癌免疫治疗的多模态影像及分子影像评估

结直肠癌免疫治疗的多模态影像及分子影像评估

DOI:10.13609/j.cnki.1000-0313.2022.04.019
发表时间:2022

张伟楠的其他基金

相似国自然基金

1

基于深度学习的多源多模态城市大数据融合建模

批准号:61772342
批准年份:2017
负责人:彭敦陆
学科分类:F0202
资助金额:62.00
项目类别:面上项目
2

基于深度学习的文本和语音多模态数据挖掘研究

批准号:61672301
批准年份:2016
负责人:裴志利
学科分类:F0605
资助金额:62.00
项目类别:面上项目
3

基于多源遥感数据融合与深度学习的湿地提取方法研究

批准号:41901379
批准年份:2019
负责人:车向红
学科分类:D0113
资助金额:24.00
项目类别:青年科学基金项目
4

基于深度学习框架的多媒体大数据表示学习

批准号:61402479
批准年份:2014
负责人:程斌
学科分类:F0210
资助金额:26.00
项目类别:青年科学基金项目