首页»行业  »   视觉识别  »   正文

基于深度学习方法可加快生成更清晰且逼真的图像

基于深度学习方法可加快生成更清晰且逼真的图像

蒙特卡罗计算方法是游戏和电影中生成的许多逼真图像的基础。它自动模拟复杂的灯光和相机物理,从不同的图像特征和场景的样本生成高质量的效果图。但是渲染的过程很慢,可能需要几个小时甚至几天的时间才能生成一张图像,而且通常结果仍然是像素化的,或者是有噪声的。

麻省理工学院,Adobe和阿尔托大学的全球计算机科学家团队开发了一种新方法,通过使用基于深度学习的方法在很短的时间内生成更高质量的图像和场景设计,从而大大减少了图像中的噪声。

该方法可以生成更清晰的图像,有效地捕捉来自样本特征的复杂细节,包括复杂的照明组件,如阴影、间接照明、运动模糊和景深。

Adobe的研究科学家Gharbi表示:“算法可以通过非常少的样本通过嘈杂的输入图像生成干净的图像,并且可以在迭代场景设计时生成快速渲染的预览。”

该团队的工作重点是所谓的“去噪”,它基本上保留了图像的细节,并删除了任何有损其锐度的东西。

在以前的工作中,计算机科学家已经开发出一些方法,通过取样本图像和相邻像素中的像素的平均值来平滑噪点,有几部电影实际上已经在制作中使用了它,然而,如果图像太嘈杂,通常后处理方法无法恢复清晰锐利的图像。通常用户仍然需要平均每像素数百个样本才能获得质量合理的图像,这是一项繁琐,耗时的工作处理。

类似的是在图形软件程序中编辑照片的过程。如果用户不使用原始的原始文件,修改后的照片很可能不会生成清晰、清晰、高分辨率的最终图像。一个类似但更复杂的问题是图像去噪。

为此,研究人员的新计算方法涉及直接使用蒙特卡罗样本,而不是大多数信息已经丢失的平均噪声图像。与处理图像或视频的典型深度学习方法不同,研究人员演示了一种新型卷积网络,可以学习直接从原始蒙特卡罗样本集中去除渲染,而不是从简化的基于像素的表示中去除。

基于深度学习方法可加快生成更清晰且逼真的图像

关键部分是一个新颖的内核预测计算框架,它将单个样本(颜色和纹理)“拼接(Splat)”到附近的像素上,以锐化图像的整体构图。在传统的图像处理中,内核用于模糊或锐化。Splatting是一种解决运动模糊或景深问题的技术,可以更轻松地平滑样本的像素化区域。

算法为每个样本生成一个2D内核,这是一种更自然的后处理方式。该团队使用随机场景生成器训练他们的网络,并在各种逼真场景上广泛测试他们的方法,包括各种照明场景,如间接和直接照明。该方法可以在非常低的样本数下提供更清晰的输出,以前的方法通常很难做到这点。

在未来的工作中,研究人员打算使他们的方法扩展到更多的样本特征,并探索实施去噪图像的帧到帧平滑性的技术。

欢迎关注ATYUN官方公众号,商务合作及内容投稿请联系邮箱:bd@atyun.com

发表评论