Neural Network with Julia 〜Kaggleの文字認識(DeepLearning)の前処理〜

今回もNeural NetworkをJuliaで実装する方法についてご紹介します。

こんにちは、今回もNeural NetworkをJuliaで実装していきます。

先日、Neural Networkの練習として、Kaggle(https://www.kaggle.com)を紹介していただきました。今回はデータだけ与えられた状態でどのようにスタートして識別器を作っていくのかの一連のプロセスを実装していきたいと思います。

1. 用いるデータ

今回用いるデータは、以下のページからダウンロードしました。

https://www.kaggle.com/c/street-view-getting-started-with-julia

コンペティションの題名は「First Step with Julia」となっており、Neural Networkをはじめてする人のためのよいたたき台となると思います。

今回の目標は以下のようなGoogle Street の写真から書かれているラベルの文字を認識することです。

このような画像のセットがたくさんある

2. Neural Networkを行うための前処理

Neural Networkを行うためにチェックすべきポイントです。ケースバイケースなのですが、必要となる場合も多いようです。

文字認識などの場合は画像をグレースケールに

カラー画像をグレースケールにすると1/3の情報量でよいことになります。これにより、調整するべきパラメータも減り、計算もはやくなります。

ラベルの統一

今回の例では英単語が入っています。何かと問題が起きるのはいやなので、それぞれ数字にラベル付けしましょう。

大文字から順番に

list = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghi......'

としておいて、ラベルAならば0を出力という設定にしておくと後々良さそうです。

画像の大きさを揃える

Networkに入れる前に画像の大きさがまちまちだと困ります。なので、大きさを全て揃える必要があります。

今回の例では画像の大きさがバラバラになっているので、大きさを(32,32)に統一するようにしました。

3. 実装したプログラム

画像データをNeural Networkに用いるデータにするため、pythonでhdf5形式のファイルを書き出しました。処理として、グレースケールにしたあと、大きさを統一し、またラベルを数字に変換しています。hdf5形式のファイルはデータのロードなどが高速でとても便利なようですよ。

19 件

関連する記事こんな記事も人気です♪

Neural Network with Julia 〜Kaggleの文字認識(DeepLearning)の前処理〜

1. 用いるデータ

このような画像のセットがたくさんある

2. Neural Networkを行うための前処理

文字認識などの場合は画像をグレースケールに

ラベルの統一

画像の大きさを揃える

3. 実装したプログラム

関連する記事こんな記事も人気です♪

Juliaで学ぶ画像処理〜cifar-datasetsでニューラルネットワークpart2〜

LP-tech2周年記念#人気記事のまとめ＃第10位〜第6位

U-Net：セグメンテーションに特化したネットワーク

pythonによるtensorflow〜deepdreamによる画像変換〜

Deep learningで画像認識③〜ネオコグニトロンとは？〜

この記事のキーワードキーワードから記事を探す

この記事のキュレーター

週間ランキング

画像解析入門⑦ Image Jによる画像処理

シリーズ３．ImageJマクロ言語を用いた画像解析～①輝度の統計量～

細胞の移動量を調査

2値化処理による粒子解析

細胞種を機械学習で判別する！

おすすめの記事

細胞種を機械学習で判別する！

人気のキーワード

IMACEL Academy -人工知能・画像解析の技術応用に向けて-| エルピクセル株式会社

Neural Network with Julia 〜Kaggleの文字認識(DeepLearning)の前処理〜

1. 用いるデータ

このような画像のセットがたくさんある

2. Neural Networkを行うための前処理

文字認識などの場合は画像をグレースケールに

ラベルの統一

画像の大きさを揃える

3. 実装したプログラム

関連する記事 こんな記事も人気です♪

Juliaで学ぶ画像処理〜cifar-datasetsでニューラルネットワークpart2〜

LP-tech2周年記念#人気記事のまとめ＃第10位〜第6位

U-Net：セグメンテーションに特化したネットワーク

pythonによるtensorflow〜deepdreamによる画像変換〜

Deep learningで画像認識③〜ネオコグニトロンとは？〜

この記事のキーワード キーワードから記事を探す

この記事のキュレーター

週間ランキング

画像解析入門⑦ Image Jによる画像処理

シリーズ３．ImageJマクロ言語を用いた画像解析～①輝度の統計量 ～

細胞の移動量を調査

2値化処理による粒子解析

細胞種を機械学習で判別する！

おすすめの記事

細胞種を機械学習で判別する！

人気のキーワード

IMACEL Academy -人工知能・画像解析の技術応用に向けて-| エルピクセル株式会社

関連する記事こんな記事も人気です♪

この記事のキーワードキーワードから記事を探す

シリーズ３．ImageJマクロ言語を用いた画像解析～①輝度の統計量～