那个短命的一键“脱衣”软件，我在GitHub搜到了相关技术… | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

所以，能动手就别吵吵了

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

常用工具

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

Adobe最新推出的AI图片生成工具

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

那个短命的一键“脱衣”软件，我在GitHub搜到了相关技术…

2019年08月06日由 sunlei 发表 431270 0

前段时间，美国一名程序员开发的一款DeepNude的应用横空出世，绰号为“AI X光“。

只需要给它一张照片，即可借助神经网络技术，自动“脱掉”衣服。原理虽然门槛很高，但是应用起来却毫不费力，因为对于使用者来说，无需任何技术知识，一键即可获取。

从网上给出的生成结果来看，效果确实可以以假乱真

此前，名为deepfakes的 AI 换脸技术就曾在网上引发热议，遭到个平台的抵制，这款利用 AI 创建女性裸体的低俗软件，同样也招来一片骂声：

百度前首席科学家吴恩达也在推特上评价了这款应用，他认为这是人工智能最令人作呕的应用之一。

庆幸的是，这款软件在上线几个小时候，DeepNude就下线了，创建者给出的理由是：流量过高！可能会被滥用。该团队还警告称不要在网上分享这款应用，否则会违反相关服务条款。

就这样，DeepNude 的闹剧结束了。

话说回来，这样一个软件是如何创建的呢？

我在Github上搜索到一个关于DeepNude使用的图像生成和图像修复相关技术项目（由yuanxiaosc创建），这个仓库包含DeepNude的pix2pixHD(由英伟达提出)算法，更重要的是DeepNude背后的通用的Image-to-Image理论与实践研究。

Image-to-Image Demo

这一部分提供一个试玩的 Image-to-Image Demo：黑白简笔画到色彩丰富的猫、鞋、手袋。DeepNude 软件主要使用了Image-to-Image技术，该技术理论上可以把你输入的图片转换成任何你想要的图片。

在左侧框中按照自己想象画一个简笔画的猫，再点击process按钮，就能输出一个模型生成的猫。

体验地址：https://affinelayer.com/pixsrv/

DeepNude的技术堆栈

Python + PyQt

pytorch

深度计算机视觉

Image-to-Image Theoretical Research

这一部分阐述DeepNude相关的人工智能/深度学习理论（特别是计算机视觉）研究，

1. Pix2Pix

Pix2Pix是伯克利大学研究提出的使用条件对抗网络作为图像到图像转换问题的通用解决方案。（Github地址：https://github.com/phillipi/pix2pix）

2、Pix2PixHD

从语义图上获得高分辨率图片。语义图是一幅彩色图片，图上的不同色块代表不同种类物体，如行人、汽车、交通标志、建筑物等。Pix2PixHD将一张语义图作为输入，并由此生成了一张高分辨率的逼真的图像。之前的技术多数只能生成粗糙的低分辨率的图片，看起来也不真实。而这个研究却生成了2k乘1k分辨率的图像，已经很接近全高清的照片。（Github地址：https://github.com/NVIDIA/pix2pixHD）

3. CycleGAN

CycleGAN使用循环一致性损失函数来实现训练，而无需配对数据。换句话说，它可以从一个域转换到另一个域，而无需在源域和目标域之间进行一对一映射。这开启了执行许多有趣任务的可能性，例如照片增强，图像着色，样式传输等。您只需要源和目标数据集。

使用CycleGAN神经网络模型实现照片风格转换、照片效果增强、照片中风景季节变换、物体转换四大功能。

4. Image Inpainting 图像修复

在演示视频中，只需用工具将图像中不需要的内容简单涂抹掉，哪怕形状很不规则，NVIDIA的模型能够将图像“复原”，用非常逼真的画面填补被涂抹的空白。可谓是一键P图，而且“毫无ps痕迹”。该研究来自Nvidia的Guilin Liu等人的团队，他们发布了一种可以编辑图像或重建已损坏图像的深度学习方法，即使图像穿了个洞或丢失了像素。这是目前2018 state-of-the-art的方法。

事实上，可能不需要Image-to-Image。我们可以使用GAN直接从随机值生成图像或从文本生成图像：

1.Obj-GAN

微软人工智能研究院（Microsoft Research AI）开发的新AI技术Obj-GAN可以理解自然语言描述、绘制草图、合成图像，然后根据草图框架和文字提供的个别单词细化细节。换句话说，这个网络可以根据描述日常场景的文字描述生成同样场景的图像。

效果

模型

2.StoryGAN

微软新研究提出新型GAN——ObjGAN，可根据文字描述生成复杂场景。他们还提出另一个可以画故事的GAN——StoryGAN，输入一个故事的文本，即可输出连环画。

当前最优的文本到图像生成模型可以基于单句描述生成逼真的鸟类图像。然而，文本到图像生成器远远不止仅对一个句子生成单个图像。给定一个多句段落，生成一系列图像，每个图像对应一个句子，完整地可视化整个故事。

效果

现在用得最多的Image-to-Image技术应该就是美颜APP了，所以我们为什么不开发一个更加智能的美颜相机呢~

技术无罪，错的是滥用技术的人，时代的发展需要技术的进步做为支撑，但更应该防止技术的不正当使用。希望以上这些技术，大家都能把它们用到正道上。

本文综合自：https://github.com/yuanxiaosc/DeepNude-an-Image-to-Image-technology、程序猿等。

标签：

行业神经网络

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 DataRobot：人工智能道德规范，通过遵循伦理实践来建立信任（一）

下一篇谷歌自动重建整个果蝇大脑，公开展示完整图像及其交互界面

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

Adobe最新推出的AI图片生成工具

AI艺术和创意辅助平台

本周热门

更多资讯 »

热门企业

更多企业 »

热门职位

更多职位 »

深度学习软件工程师

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市

广告

写评论取消

回复取消