使用Google的Quickdraw创建MNIST样式数据集

2018年06月01日由 xiaoshan.xiang 发表 544984 0

对于那些运行深度学习模型的人来说，MNIST是无处不在的。手写数字的数据集有许多用途，从基准测试的算法（在数千篇论文中引用）到可视化，比拿破仑的1812年进军更为普遍。数字如下所示：

使用Google的Quickdraw创建MNIST样式数据集

它经久不衰的主要原因是缺乏替代品。在这篇文章中，我想介绍另一种方法，就是Google的QuickDraw数据集。2017年QuickDraw数据集应用于Google的绘图游戏Quick，Draw。该数据集由5000万幅图形组成。图纸如下所示：

使用Google的Quickdraw创建MNIST样式数据集

构建您自己的QuickDraw数据集

我想了解您如何使用这些图纸并创建自己的MNIST数据集。Google使每个图纸变为可用的28x28灰度位图文件，这些可以作为MNIST 28x28灰度位图图像的替代品。并且Google已经将数据集公开。所有数据都位于Google的云端控制台中，但是对于这些图像，您需要使用numpy_bitmaps的这个链接。

使用Google的Quickdraw创建MNIST样式数据集

您应该到达一个允许您下载任何类别图像的页面。然后选择类别，我选择眼镜，脸，铅笔和电视机。通过脸这个类别可以知道精细的绘画可能更难学习，您应该选择其他有趣的类别。

使用Google的Quickdraw创建MNIST样式数据集

接下来的挑战是获得这些.npy文件并使用它们。这是一个简短的python gist ，我用来阅读.npy文件并将它们组合起来创建一个可以用来替代MNIST的含有80,000个图像的数据集。它们以hdf5格式保存，这种格式是跨平台的，经常用于深度学习。

使用Google的Quickdraw创建MNIST样式数据集

用QuickDraw代替MNIST

我使用这个数据集代替MNIST。在Keras 教程中，使用Python中的自动编码器进行一些工作。下图显示了顶部的原始图像，并使用自动编码器在底部显示重建的图像。

使用Google的Quickdraw创建MNIST样式数据集

接下来我使用了一个R语言的变分自编码器的数据集。以下是导入数据的代码片段：

library(rhdf5)

x_test <- t(h5read("x_test.h5", "name-of-dataset"))

x_train <- t(h5read("x_train.h5", "name-of-dataset"))

y_test <- (h5read("y_test.h5", "name-of-dataset"))

y_train <- (h5read("y_train.h5", "name-of-dataset"))

这是使用自定义的quickdraw数据集的可视化的潜在空间。

使用Google的Quickdraw创建MNIST样式数据集

本文为编译文章，作者Rajiv Shah，原网址为

http://projects.rajivshah.com/blog/2017/07/14/QuickDraw/

标签：

谷歌数据集学习人工智能教程 MNIST

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇如何用R语言进行深度学习？

下一篇在Keras中展示深度学习模式的训练历史记录

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

优化 LLM 提示的成本、延迟和性能的 4 种技术