分享自:

绘画艺术图像的计算美学: 研究前沿与展望

期刊:自动化学报DOI:10.16383/j.aas.c200358

这篇文档属于类型b,即一篇综述性学术论文。以下是针对该文档的学术报告:

本文由鲁越、郭超、林懿伦、卓凡和王飞跃共同撰写,分别来自中国科学院自动化研究所复杂系统管理与控制国家重点实验室、中国科学院大学人工智能学院以及中央美术学院。该论文于2020年11月发表在《自动化学报》上,题为《绘画艺术图像的计算美学:研究前沿与展望》。文章系统地综述了绘画艺术图像计算美学的研究现状,并对其未来发展进行了展望。

第一,绘画艺术图像计算美学的背景与意义
绘画艺术是人类艺术创作的重要组成部分,而计算美学(computational aesthetics)则是利用机器模拟人类审美过程的研究领域。计算美学的核心目标是通过算法和模型,实现对绘画图像的自动化分析和美学评价。这一领域结合了机器学习、美学、心理学等多学科知识,具有重要的科学价值和应用价值。随着大规模绘画图像的数字化,计算美学在艺术欣赏、艺术史研究以及机器模仿人类感性行为等方面展现了广阔的前景。

第二,绘画艺术图像计算美学的研究框架
本文首次从人类审美的感知、认知和评价三个关键过程出发,将绘画艺术图像的计算美学研究归纳为三个主要方面:属性识别(attribute recognition)、内容理解(content understanding)和美学评价(aesthetic judgment)。
1. 属性识别:属性识别是计算美学的基础,涉及对绘画的题材、风格、作者、年代等信息的识别。属性识别可以建模为模式分类问题,其核心在于特征提取。特征提取方法分为基于手工特征(manual features)和基于自动特征(automatic features)两种。手工特征包括颜色、纹理、结构和高阶语义特征,而自动特征则通过深度学习模型实现端到端的特征提取与分类。
2. 内容理解:内容理解是对绘画语义的进一步解析,包括物体识别与检测(object recognition and detection)以及内容描述(content description)。物体识别与检测任务通过弱监督学习和迁移学习等方法,利用有限的标注数据实现绘画中物体的定位与分类。内容描述任务则通过自然语言生成技术,对绘画内容进行文字描述。
3. 美学评价:美学评价是计算美学的核心任务,涉及对绘画图像的美感和情感的评价。美学评价可以细分为美感评价(aesthetic evaluation)和情感评价(emotional evaluation)。美感评价通常基于图像的构图、色彩、复杂度等特征,而情感评价则关注图像所传达的情绪和感受。

第三,绘画艺术图像计算美学的关键技术
1. 属性识别
- 手工特征方法:常用的手工特征包括颜色矩(color moment)、灰度共生矩阵(gray-level co-occurrence matrix, GLCM)、SIFT特征(scale-invariant feature transform)等。这些特征通过组合和优化,能够有效区分不同风格的绘画。
- 自动特征方法:深度学习方法如AlexNet、VGGNet、ResNet等在绘画属性识别中得到了广泛应用。数据增强(data augmentation)、迁移学习(transfer learning)和多任务学习(multi-task learning)等技术显著提升了模型的性能。
2. 内容理解
- 物体识别与检测:弱监督学习和迁移学习是解决标注数据不足的关键技术。CycleGAN等风格迁移方法被用于生成伪标签,提升模型在绘画图像上的检测性能。
- 内容描述:内容描述任务通常基于图像生成文字的技术,如基于注意力机制的编码器-解码器模型(encoder-decoder with attention mechanism)。
3. 美学评价
- 美感评价:美感评价通常基于图像的全局和局部特征,如构图、色彩分布和复杂度。深度学习方法通过端到端的训练,能够自动提取这些特征并进行评价。
- 情感评价:情感评价关注图像所传达的情绪,通常结合心理学和情感计算的理论,利用深度学习模型进行情感分类。

第四,绘画艺术图像计算美学的数据集与性能对比
本文梳理了绘画属性识别、内容理解和美学评价的常用数据集,包括WikiArt、Painting-91、BAM等。其中,WikiArt数据集是应用最广泛的数据集,包含超过8万张绘画图像,标注了风格、题材、作者等信息。在典型方法的性能对比中,基于自动特征的方法(如ResNet、InceptionV3)在大规模数据集上表现优异,而手工特征与自动特征的融合方法进一步提升了模型的性能。

第五,绘画艺术图像计算美学的未来展望
本文指出,绘画艺术图像计算美学的未来发展主要集中在以下几个方面:
1. 跨学科融合:进一步结合心理学、艺术学等学科的理论,提升计算美学模型的解释性和准确性。
2. 数据与标注的扩展:构建更大规模、更丰富标注的绘画数据集,特别是针对中国画等非西方绘画艺术的数据集。
3. 模型优化与创新:探索更高效的深度学习模型,如基于图神经网络(graph neural networks)的绘画分析模型,以及结合生成对抗网络(generative adversarial networks, GANs)的美学评价模型。
4. 应用场景拓展:将计算美学技术应用于艺术教育、文化遗产保护、艺术市场分析等领域,推动其实际应用。

第六,本文的意义与价值
本文首次从人类审美的全过程出发,系统梳理了绘画艺术图像计算美学的研究框架,并对属性识别、内容理解和美学评价三个方面的关键问题进行了深入分析。文章不仅总结了现有研究的方法和成果,还提出了未来的研究方向,为该领域的进一步发展提供了重要的理论指导和实践参考。本文的综述框架和研究展望对于推动计算美学在艺术领域的应用具有重要的学术价值和实际意义。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com