基于行列式点过程的多元化建模的关键技术研究

基本信息
批准号:61702145
项目类别:青年科学基金项目
资助金额:28.00
负责人:乔卯英
学科分类:
依托单位:杭州电子科技大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:刘同亮,高飞,谭敏,李攀鹏,黄迪,郑光剑,孙可嘉,吴炜晨
关键词:
机器学习方法子空间学习无监督学习聚类算法概率图模型
结项摘要

Extracting succinct but diverse summaries from tons of data is ubiquitously important in real-world applications nowadays big data era, such as ranked items from search engine, video summaries, and text clustering analysis. However, many machine learning algorithms have not explicitly encoded the property of diversity, which can be used to alleviate their potential problems, such as overlapping among model component counterparts, model redundant, incomplete coverage over data space. To address these issues, this proposal devotes to establishing a diversity-modeling framework based on determinantal point processes. Specifically, the framework is instantiated with three diversified traditional models: (1) Diversified principal component analysis mixtures (PCAM) model; (2) diversified latent Dirichlet allocation (LDA) model; (3) diversified non-negative matrix factorization. Experiments over real-world datasets, including USPS handwritten digits, text corpora, gene expression dataset, will be conducted to verify the effectiveness of the proposed diversified models. This proposed research will contribute to the pattern recognition area by introducing an innovative scheme for new model designs.

从浩如烟海的数据中提取简洁而又具多元化的信息在现实生活中的应用无所不在,比如搜索引擎排序、图像视频总结、文本聚类等。然而,许多现有的机器学习算法缺乏对多元性的显式建模,使之潜在的缺陷比如模型组件之间的重叠性、冗余性以及覆盖数据空间的不全面性等不能很好的被缓解。为了解决这些问题,本项目力求建立基于行列式点过程的多元化建模框架,并以此为基础对传统机器学习模型进行多元化扩展学习,具体以三个传统模型为示例:(1)多元化的混合主成分分析模型(PCAM);(2)多元化的隐狄利克雷分布模型(LDA);(3)多元化的非负矩阵分解模型(NMF)。拟通过现实数据如手写字体、语料库、基因表现等来验证提出模型的有效性。本项目的研究有助于为设计新型的机器学习算法提供依据,为该领域的蓬勃发展做出贡献。

项目摘要

从浩如烟海的数据中提取简洁而又具多元化的信息在现实生活中的应用无所不在,比如搜索引擎排序、图像视频总结、文本聚类等。然而,许多现有的机器学习算法缺乏对多元性的显式建模,使之潜在的缺陷比如模型组件之间的重叠性、冗余性以及覆盖数据空间的不全面性等不能很好的被缓解。为了解决这些问题,本项目建立了基于行列式点过程的多元化建模框架,并以此为基础对多种传统机器学习模型进行多元化扩展学习。..首先,在多元化建模相关的混合主成分分析模型(PCAM)、多元化的隐狄利克雷分布模型(LDA)和多元化的非负矩阵分解模型(NMF)及应用方面基本完成了所有预设目标。具体而言,在混合主成分分析模型方面,基于贝叶斯框架,提出了一种基于互斥混合模型的指数主成分分析算法。在隐狄利克雷分布模型方面,提出将节点度的幂律分布引入到随机块模型中,从而提高现有模型的建模能力。在非负矩阵分解模型方面,提出一种结合极大化似然和多样化先验的非负矩阵分解算法,可以精确提取内在组件。然后,在多元化应用方面,针对异构多边网络,提出了一种信息传递式网络结构,用于精确检测社交群体。最后,在多元化信息表示方面,针对图像多元性分析和多模态图像表示等问题,进行了大量探索,提出了多种图像预测模型和图像生成模型。..通过这些研究工作,我们实现了多元化建模和表征学习,并在社交网络分析、图像质量评价和图像风格转换等任务中取得了国际领先的效果。依托相关成果,发表10余篇高质量学术论文,并申请了6项发明专利。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019

乔卯英的其他基金

相似国自然基金

1

基于行列式点过程的海量数据摘要关键技术研究

批准号:61562091
批准年份:2015
负责人:李劲
学科分类:F0607
资助金额:38.00
项目类别:地区科学基金项目
2

点集曲面建模的关键技术研究

批准号:60873175
批准年份:2008
负责人:庞明勇
学科分类:F0209
资助金额:22.00
项目类别:面上项目
3

基于点云的复杂曲面物体3D建模关键技术研究

批准号:41261094
批准年份:2012
负责人:张梅
学科分类:D0115
资助金额:48.00
项目类别:地区科学基金项目
4

行列式点过程的概率分析

批准号:11371317
批准年份:2013
负责人:苏中根
学科分类:A0211
资助金额:55.00
项目类别:面上项目