基于大数据挖掘与深度学习的中国书法仿写与智能创作的算法研究

基本信息
批准号:61876150
项目类别:面上项目
资助金额:62.00
负责人:徐颂华
学科分类:
依托单位:西安交通大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:王劲,徐麟,杨燕,王培圆,骞杨钰儿,宫子农
关键词:
中国书法智能仿写中国书法智能生成大数据挖掘与深度学习人工智能与中国书法艺术计算机美术
结项摘要

Chinese calligraphy is the gem of Chinese traditional art. The effort to design and produce the machine intelligence for automatic processing, deep analysis, and intelligent creation of artistic images in general, and Chinese calligraphic works in particular, is one of the most challenging grand problems in artificial intelligence research. The proposed research aims to leverage big data mining and deep learning methodologies to investigate a series of intelligent algorithm design, modeling and optimization problems in the visual thinking domain that are essential to the activities of computational imitation and generation of Chinese calligraphic works. At the present big-data era, conducting the aforementioned artificial intelligence research for Chinese calligraphy is also beneficial for protecting and advancing traditional Chinese culture, utilizing the timely opportunities offered by the One Belt One Road initiative of the nation. The key distinguishing feature of this proposed study lies in its integrative approach to jointly utilize the power of classical image processing techniques and the potential of contemporary artificial intelligence in its investigation of multiple key scientific problems, which are concerned with a collection of visual thinking modeling, reasoning, algorithm design and optimization tasks undertaken for facsimileing, imitating, and generating Chinese calligraphy artwork via the computational vehicles of big data mining, analysis, and deep learning. The proposed study will sequentially conduct the following main research tasks, including intelligently identifying and extracting strokes from images of Chinese calligraphic artwork, learning representations for shapes and topological structures in calligraphic images, modeling the beauty of calligraphic writings for computational evaluation, machine appreciation and determination of calligraphic writing styles, and ultimately developing the computational intelligence capable of generating realistic imitation of calligraphic artwork for any Chinese characters and using any given writing style as well as the computational intelligence capable of creating aesthetic, novel, and consistent Chinese calligraphic artwork with high performance.

书法是中国传统文化中的瑰宝;而对以书法作品为代表的艺术作品图像进行计算机处理与深度分析,进而实现自动创作的机器智能也是人工智能研究中最具挑战性的核心问题之一。本课题将以大数据挖掘与深度学习为手段,研究计算机书法仿写与创作中一系列形象思维领域内的智能算法设计、建模与优化的问题。在当今大数据的时代,对中国书法艺术开展智能化的研究,也有利于保护与弘扬中国传统文化,并在"一带一路"的时代契机下,促进中华民族的伟大复兴。本课题的特色在于结合经典图像处理与当代人工智能技术,研究中国书法中临摹、仿写与创作过程中所涉及到的多个形象思维建模、推理、算法设计与优化的关键科学问题,先后开展对书法作品图像的智能笔划提取、书写形态与汉字结构的表达学习、书写美观度的评价建模、书写风格的机器鉴赏判定,最终实现以任意书写风格对任意汉字生成逼真的仿写效果,并能自动创作出风格美观、新颖与统一的书法作品的计算智能。

项目摘要

汉字书法是中华文明的瑰宝。近年来,人工智能在汉字理解、仿写与创作中取得了诸多鼓舞人心的创新成果。然而,传统算法在泛化性、鲁棒性及多样性上表现欠佳;而当代深度学习模型对数据依赖严重。具体而言,目前深度学习算法存在以下四个关键挑战:..1)中国书法的书写自由度高、形态变化多样;上述复杂视觉信息蕴含在高维特征空间中,难以被常规机器学习算法有效捕捉并形成可解释的统一形状表达。.2)不少汉字书法作品因年代久远而遭受各类污损,影响了可供机器学习样本的质量与数量。.3)经典书法作品数量与覆盖的汉字数目有限,造成了可供机器学习的中国书法样本整体数量不多,难以充分训练大数据学习算法。.4)书法作品中汉字内容与风格强耦合,共同决定了最终书写形态,加剧了算法对训练样本的依赖性。..针对上述四个瓶颈问题,本课题分别开展了以下的研究内容:..1)提出了以汉字骨架作为汉字书法作品的生成与统一表达的可解释的先验,并设计了智能骨架提取算法,可通过对少量训练数据的学习实现对风格各异、形态迥异的汉字书法的大规模、高质量地骨架提取。.2)提出了基于视觉Transformer网络的退化文档智能修复模型,可基于小样本学习,有效修复低质量文档,提升可供机器学习的书法样本的质量与数量。.3)探索了基于缺失数据填充的汉字书法样本增广新途径,并提出了基于像素块和分位数的缺失数据填充新模型,显著提高了缺失数据推断填充的准确度。.4)提出了基于深度自编码网络的正交非负矩阵分解模型,利用矩阵分解模型解耦数据潜在表征,可实现对汉字内容与风格的精准鲁棒解耦,降低模型对数据的依赖性。..以上算法显著增强了对汉字的视觉感知智能。在此基础上,课题进一步提出了基于上述视觉感知智能的新一代汉字智能仿写与生成模型;较之现有同类方法,可显著提升算法仿写与生成的质量。最后,课题将汉字视觉感知和生成模型迁移应用至跨领域的多个医学视觉感知和分析诊断任务中,验证了本课题提出智能模型的泛化性与通用性。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021
5

物联网中区块链技术的应用与挑战

物联网中区块链技术的应用与挑战

DOI:10.3969/j.issn.0255-8297.2020.01.002
发表时间:2020

徐颂华的其他基金

相似国自然基金

1

基于深度学习的文本和语音多模态数据挖掘研究

批准号:61672301
批准年份:2016
负责人:裴志利
学科分类:F0605
资助金额:62.00
项目类别:面上项目
2

大数据下基于深度学习的机电设备智能诊断理论与方法研究

批准号:61673311
批准年份:2016
负责人:雷亚国
学科分类:F0301
资助金额:63.00
项目类别:面上项目
3

大尺度分布式深度学习框架在隐写分析上的应用

批准号:61402295
批准年份:2014
负责人:谭舜泉
学科分类:F0205
资助金额:26.00
项目类别:青年科学基金项目
4

中国书法字识别算法研究

批准号:61379073
批准年份:2013
负责人:吴江琴
学科分类:F0209
资助金额:73.00
项目类别:面上项目