MNSIT(手書き数字のデータセット)のデータをダウンロードし確認する方法

スポンサーリンク

カテゴリ:MNIST
Python バージョン:Python2.7
Tensorflowバージョン:Tnsorflow 1.0
OSバージョン:Ubuntu 16.04.2


はじめに


MNSIT(手書き数字のデータセット)は初心者向けに提供されている手書きイメージのデータです。0から9までの様々な手書き数字のイメージが大量に提供されています。
ダウンロードして何個準備されているか確認する手順を紹介します。

手順


(1)ダウンロード
Pythonインタープリタ上から以下を実行します。


from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

Extracting MNIST_data/train-images-idx3-ubyte.gz
Extracting MNIST_data/train-labels-idx1-ubyte.gz
Extracting MNIST_data/t10k-images-idx3-ubyte.gz
Extracting MNIST_data/t10k-labels-idx1-ubyte.gz


(2)個数をカウントする
個数をカウントします。


mnist.train.images.shape
(55000, 784)


トレーニングデータが総数55000個あることが分かります。


(3)n番目のトレーニングデータを確認

以下は100番目のデータを確認するコマンドです。


mnist.train.images[100]


(4)トレーニングデータに対する正解

トレーニングデータに対する正解を表示します。55000個の回答が0〜9で入っています。

mnist.train.labels.shape
(55000, 10)


(5)n番目のトレーニングデータに対する正解

n番目のトレーニングデータに対する正解を表示します。
以下の例では 5 番目のトレーニングデータの答えが 8 であることが分かります。

mnist.train.labels[5]
array([ 0., 0., 0., 0., 0., 0., 0., 0., 1., 0.])



スポンサーリンク

[Tensorflow FAQ]

[Tensorflow トップへ]


このページは独学で学習した結果をメモした結果です。内容に不備・誤りがある可能性があります。 また今後仕様が変更となり記述が不正確になる可能性もあります。あくまでも自己責任で本ページを参考にしてください。 本サイト内掲載されている情報は、著作権法により保護されています。いかなる場合でも権利者の許可なくコピー、配布することはできません。