绘画艺术图像的计算美学: 研究前沿与展望

鲁越 郭超 林懿伦 卓凡 王飞跃

Lu Yue, Guo Chao, Lin Yi-Lun, Zhuo Fan, Wang Fei-Yue. Computational aesthetics of fine art paintings: The state of the art and outlook. Acta Automatica Sinica, 2020, 46(11): 2239−2259 doi: 10.16383/j.aas.c200358
绘画艺术图像的计算美学: 研究前沿与展望

doi: 10.16383/j.aas.c200358

    鲁越:中国科学院自动化研究所复杂系统管理与控制国家重点实验室博士研究生. 主要研究方向为机器学习, 小样本学习, 计算美学和风格迁移.E-mail: luyue2016@ia.ac.cn

    郭超:中国科学院自动化研究所复杂系统管理与控制国家重点实验室博士研究生. 主要研究方向为机器学习, 强化学习, 计算美学, 机器艺术创作和三维结构认知.E-mail: guochao2014@ia.ac.cn

    林懿伦:中国科学院自动化研究所复杂系统管理与控制国家重点实验室助理研究员. 主要研究方向为社会计算,智能交通系统, 深度学习和强化学习. E-mail: yilun.lin@ia.ac.cn

    卓凡:中央美术学院副教授. 主要研究方向为智慧(产品)设计, 传统造物方式与现代设计(美学)转型.E-mail: zhuofan@cafa.edu.cn

    王飞跃:中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任, 中国科学院大学中国经济与社会安全研究中心主任, 青岛智能产业技术研究院院长. 主要研究方向为平行系统的方法与应用, 社会计算, 平行智能以及知识自动化. 本文通信作者. E-mail: feiyue.wang@ia.ac.cn

Computational Aesthetics of Fine Art Paintings: The State of the Art and Outlook

  • 摘要: 绘画艺术是人类艺术创作的重要组成部分, 绘画艺术图像的计算美学是利用机器实现可计算的人类审美过程, 其在大规模绘画的自动化分析和机器对感性的计算建模上具有重要的应用价值和科学意义. 针对其交叉学科的特点, 本文首次从人类审美的感知、认知和评价三个关键过程出发, 将绘画艺术图像的计算美学研究完整地归纳为属性识别、内容理解和美学评价三方面研究内容, 对其中的问题建模、数据获取和前沿方法等关键科学问题进行了归纳总结, 并对绘画计算美学的三方面研究内容进行了对比、思考和展望.
  • 图  1  本文对绘画艺术图像计算美学研究的梳理框架及其研究示例1

    Fig.  1  Framework and examples for computational aesthetics of fine art paintings

    图  2  绘画艺术图像计算美学的文献数量趋势及作者合著网络

    Fig.  2  Trend of literature quantity and author collaboration network for computational aesthetics of fine art paintings

    图  3  绘画属性识别任务的研究示例和研究方法

    Fig.  3  Research examples and methods for attribute recognition of fine art paintings

    图  4  基于手工特征的绘画属性识别方法的常用特征

    Fig.  4  Common features for manual features based painting attribute recognition method

    图  5  基于自动特征的绘画属性识别方法的关键技术

    Fig.  5  Common features for automantic features based painting attribute recognition method

    图  6  国画属性识别数据库的作者词云和绘画样例

    Fig.  6  Word cloud of authors and painting examples for Chinese painting attribute recognition database

    图  7  绘画内容理解的研究示例和关键技术

    Fig.  7  Research examples and key methods for painting content understanding

    表  1  不同手工特征下的绘画属性识别正确率 (%)

    Table  1  Painting attribute recognition accuracy for different manual features (%)

    表  2  不同分类器下的绘画属性识别正确率 (%)

    Table  2  Painting attribute recognition accuracy for different classifiers (%)

    文献任务数据集数据/类别朴素贝叶斯树形分类器支持向量机多层感知机K 近邻
    表  3  不同网络结构下的绘画艺术图像属性识别正确率 (%)

    Table  3  Painting attribute recognition accuracy for different sturcture of neural networks (%)

    V*: VGG, R#: ResNet
    表  4  不同初始化方式下的绘画属性识别错误率[20] (%)

    Table  4  Painting attribute recognition error rate for different initialization methods[20] (%)

    表  5  不同预训练数据集下的绘画属性识别的性能

    Table  5  Painting attribute recognition performance for different pre-trained dataset

    预训练数据集ImageNetPlaces + ImageNetLaMemDeepSentFlickrStyle
    预训练图片数 (张)120 万350 万6 万12698 万
    预训练类别1000 类1183 类[0, 1]*[0, 1]*20 类
    风格识别正确率 (%)54.256.352.655.850.7
    题材识别正确率 (%)77.277.675.977.475.5
    作者识别正确率 (%)76.379.172.578.771.4
    [0, 1]*: 0到1的连续等级范围
    表  6  单任务与多任务学习的绘画属性识别的性能[73] (%)

    Table  6  Painting attribute recognition performance for sigle-task and multi-task learning[73] (%)

    错误率下降率 7.7324.1028.5720.13
    表  7  绘画属性识别任务的公开数据集

    Table  7  Datasets for painting attribute recognition

    大规模Pandora18k[78]2017WikiArt1.8 万绘画艺术
    大规模TICC Printmaking[79]2017荷兰国立博物馆5.8 万绘画艺术
    大规模WikiArt[41]2015WikiArt8.1 万绘画艺术
    大规模Rijks2014[80]2014荷兰国内博物馆11.2 万绘画艺术
    大规模OmniArt[73]2017三个博物馆*43.2 万绘画艺术及摄影
    大规模Art500k[81]2017三个博物馆*55.4 万绘画艺术
    丰富标注SemArt[82]2018网络艺术博物馆2.1 万绘画艺术
    丰富标注iMet2019[83]2019大都会艺术博物馆15.6 万艺术品
    丰富标注iMet2020-2020大都会艺术博物馆16.8 万艺术品
    丰富标注BAM[84]2017Behance2500 万绘画及平面设计等
    三个博物馆*: 包括荷兰国立博物馆、网络艺术博物馆、大都会艺术博物馆
    表  8  绘画属性识别数据集的标注信息

    Table  8  Labeling information for painting attribute recognition dataset

    大规模TICC Printmaking
    表  9  典型的绘画属性识别方法在WikiArt数据集上的性能比较

    Table  9  Performance comparison for typical painting attribute recognition methods in WikiArt dataset

    序号任务年份文献方法简介分类器数据量类别数正确率 (%)
    2风格2016[86]利用 AlexNet 迁移学习800002754.50
    3风格2016[87]利用 CaffeNet 迁移学习800002255.90
    4风格2018[68]在扩增自然数据集上预训练 ResNet860872756.43
    5风格2016[75]Deep feature、Gram、余弦相似度距离SVM824422558.19
    8题材2016[86]利用 AlexNet 迁移学习650001074.14
    9题材2017[53]利用 ResNet 迁移学习794342661.15
    10题材2018[68]在扩增自然数据集上预训练 ResNet960141077.16
    11题材2015[43]颜色、SIFT, GIST、GLCMSVM1800684.56
    12题材2015[41]GIST、Classeme、PiCoDes、Deep featureSVM636911060.28
    14作者2016[86]利用 AlexNet 迁移学习200002376.11
    15作者2017[88]利用 ResNet 迁移学习171005777.70
    16作者2018[68]在扩增自然数据集上预训练 ResNet203202381.94
    17作者2015[41]GIST、Classeme、PiCoDes、Deep featureSVM185992363.06
    表  10  绘画物体识别与检测任务的公开数据集

    Table  10  Datasets for object recognition and detection in paintings

    Paintings 数据集[103]862910
    BAM 数据集[84]6.0 万5
    表  11  绘画内容描述任务的公开数据集

    Table  11  Datasets for content description of paintings

    表  12  典型的绘画内容理解方法及其性能

    Table  12  Typical painting content understanding methods and performances

    [89]物体检测通过风格迁移和伪标签生成进行弱监督学习Watercolor2k0.543 (mAP)
    [84]物体识别利用ResNet-50网络进行迁移学习BAM 数据集0.9512 (ACC)
    [96]描述检索利用自编码器来对齐图像和文字的隐空间EsteArtworks0.427 (Rcall@10)
    [101]描述生成利用卷积网络提取特征, 循环神经网络生成描述自建数据集0.970 (CIDEr)
    [102]视觉问答利用卷积网络提取特征, 循环神经网络生成结果Artpedia0.504 (ACC)
    表  13  公开的绘画美感和情感数据集

    Table  13  Database for emotion and aesthetic of paintings

    美感国画美感数据库[109]5115920气势美、清幽美和生机美上的 9 个等级
    美感JenAestheticsβ[112]2814从丑到美 4 个等级
    美感JenaAesthetics[137]162910020美感的 100 个等级
    情感国画情感数据库[109]5113920愉悦度、唤醒度、优势度上的 9 个等级
    情感ArtPhoto 绘画[113]8078气愤、激动、害怕等 8 种情感
    情感Affective 抽象绘画#[113]228814气愤、激动、害怕等 8 种情感
    情感MART 抽象绘画[121]500720消极到积极的 7 个等级
    情感WikiArt Emotions[136]410520害怕、快乐、爱、悲伤等情感
    标注/张*: 每张图片的标注次数; Affective 抽象绘画#: 我们对文献 [113] 的抽象绘画数据集的命名
    表  14  典型的绘画美学评价方法及其性能

    Table  14  Typical painting aesthetic judgment methods and performances

    文献任务方法数据集图片数/类别数性能指标 (ACC)
