首页»行业  »   视觉识别  »   正文

人工智能系统可以调整图像的对比度、大小和形状

人工智能系统可以调整图像的对比度、大小和形状

人工智能(AI)和艺术并没有你想象的那么对立。事实上,自动系统已经在与艺术家合作,创作节日歌曲、在佳士得拍卖的油画作品,以及制作彩色标识。现在,一名软件开发人员利用人工智能的生成能力来操纵图像中的对比度、颜色和其他属性。

OpenAI学者项目的毕业生霍莉•格林(Holly Grimm)在Arxiv.org网站上发表的一篇预印本论文中描述了她的工作。

Grimm人工智能模型的基础是生成对抗网络(GAN),这是一个由数据产生器和甄别器组成的两部分神经网络,甄别器试图区分生成器的合成样本和真实样本。Grimm选择了CycleGAN作为她的架构选择,CycleGAN是最近演示的一种在两个图像分布之间学习转换的方法。

“CycleGAN的图像到图像的转换采用了一组图像,并试图使它看起来像另一组图像,”Grimm在博客中解释说。训练数据是未配对的,这意味着数据集中的图像之间不需要精确的一对一匹配。他说:“这是一种非常有趣的东西,被用来……让马看起来像斑马,让苹果看起来像橙子。”

为了制作她的模型,格林输入了一个在开源ImageNet数据库上训练过的ResNet50算法,并将其与一个在视觉艺术百科全书WikiArt的“apple2orange”数据集上的500幅图像上训练过的CycleGAN算法结合起来。这个系统被她称为“艺术构图属性网络”(Art Composition Attributes Network,简称ACAN),她学会了在制作照片的同时改变八种不同的构图属性:纹理、形状、大小、颜色、对比度、重复、原色和色彩和谐。

人工智能系统可以调整图像的对比度、大小和形状

在测试中,ACAN成功地将主要为橙色的图像转换为互补颜色为蓝色和青色的新图像,以及从其他图像提取形式、颜色和纹理。在一些生成的样本中,重构照片中的对象与源图像中的对象几乎没有相似性——这是对对比度、大小和形状进行调整的结果。

格里姆写道:“即使只有500幅图像的小样本,在ACAN的帮助下,CycleGAN似乎也能够区分出8种艺术构图特征。”

她转向了诸如属性激活映射(attribute.on mapping)之类的未来工作技术,该映射使用热映射来突出图像的元素,并揭示网络“看到”每个属性的内容,以及颜色和谐嵌入,这可以帮助神经网络学习色轮上的颜色之间的关联。

该组织表示,OpenAI的学者计划于9月份开始了第一堂课,该计划向“来自该领域代表团体的人群”开放。 OpenAI总部位于旧金山,由伊隆•马斯克(Elon Musk)、里德•霍夫曼(Reid Hoffman)和彼得•泰尔(Peter Thiel)等科技名人支持。OpenAI计划在未来几个月发布一份针对首批初创企业的案例研究,以“帮助其他企业在自己的公司推出类似的举措”。

欢迎关注ATYUN官方公众号,商务合作及内容投稿请联系邮箱:bd@atyun.com

发表评论