U-Net：セグメンテーションに特化したネットワーク

今回は，University of Freiburg, Germany の Thomas Brox が主宰する研究室で考案された U-Net と呼ばれるネットワークを紹介します．

この U-Net は，画像のセグメンテーションに特化していて，2015年の ISBI では「the Dental X-Ray Image Segmentation Challenge」と「the Cell Tracking Challenge」の2部門で優勝しています(https://bit.ly/2Qu2CVz)．

U-Net は，全層畳み込みネットワーク (Fully Convolution Network，以下 FCN) の 1 種類です．U-Net が一般的な FCN と異なる点として，畳み込まれた画像を decode する際に，encode で使った情報を活用している点が挙げられます．具体的には，図中のグレーの矢印によって，情報を渡しています．この工夫によって，より精度の高い，ピクセル単位での分類が可能になっています．

データセット

今回は次のデータセットを用いて，U-Net の実装を行います．Carvana Image Masking Challenge (https://www.kaggle.com/c/carvana-image-masking-challenge/data)

そして今回，実装する U-Net によって以下のような結果が返ってきます．キレイに車の領域を囲む mask 画像を生成できていることが分かります．

出力

実装

まずは，必要なライブラリをインポートします．今回の実装では Pytorch を用います．

import sys
import os
from optparse import OptionParser
import numpy as np

import torch
import torch.backends.cudnn as cudnn
import torch.nn as nn
import torch.nn.functional as F
from torch import optim
import torchvision.transforms as transforms
from torch.autograd import Function, Variable

from tqdm import tqdm
import pydensecrf.densecrf as dcrf
import random
from PIL import Image
import matplotlib.pyplot as plt
%matplotlib inline

ライブラリのインポート.py

次に，プログラム内で使用する変数を定義します．

args = {}
args['dir_img'] = 'data/train/'
args['dir_mask'] = 'data/train_mask/'
args['dir_img_test'] = 'data/test/'
args['dir_checkpoint'] = 'checkpoint/'
args['val_percent'] = 0.05
args['scale'] = 0.5
args['n'] = 2
args['batch_size'] = 2
args['epoch'] = 5
args['threshold'] = 0.5

変数の定義.py

画像の読み込みおよび，バッチ化を行う関数を定義します．

def to_cropped(args, ids, dir, suffix):
    
    for id, pos in ids:
        img = Image.open(dir + id + suffix)

        w = img.size[0]
        h = img.size[1]
        newW = int(w * args['scale'])
        newH = int(h * args['scale'])

        img = img.resize((newW, newH))    
        img = img.crop((0, 0, newW, newH))
        img = np.array(img, dtype=np.float32)
        
        h = img.shape[0]
        if pos == 0:
            img = img[:, :h]
        else:
            img = img[:, -h:]
        
        yield img

        
def get_img_mask(args, ids):
    img = to_cropped(args, ids, args['dir_img'], '.jpg')
    img = map(lambda x: np.transpose(x, axes=[2, 0, 1]), img)
    img = map(lambda x: x/255, img)

    mask = to_cropped(args, ids, args['dir_mask'], '_mask.gif')

    return zip(img, mask)


def batch(iterable, batch_size):
    
    b = []
    for i, t in enumerate(iterable):
        b.append(t)
        if (i + 1) % batch_size == 0:
            yield b
            b = []

    if len(b) > 0:
        yield b

関数の定義.py

データセットの読み込みを行います．

ids_all = [f[:-4] for f in os.listdir(args['dir_img'])]
ids_all = [(id, i) for i in range(args['n']) for id in ids_all]
random.shuffle(ids_all)
n = int(len(ids_all) * args['val_percent'])
ids = {'train': ids_all[:-n], 'val': ids_all[-n:]}

len_train = len(ids['train'])
len_val = len(ids['val'])

データセットの読み込み.py

U-Net の定義を行います．

24 件

U-Net：セグメンテーションに特化したネットワーク

データセット

出力

実装

関連する記事こんな記事も人気です♪

About IMACEL Academy

Deep learningで画像認識③〜ネオコグニトロンとは？〜

pythonによるtensorflow〜インストール、サンプルの実行〜

Neural Network with Julia 〜Kaggleの文字認識(DeepLearning)の前処理〜

Deep learningで画像認識②〜視覚野と畳み込みニューラルネットワーク〜

この記事のキーワードキーワードから記事を探す

この記事のキュレーター

週間ランキング

シリーズ３．ImageJマクロ言語を用いた画像解析～①輝度の統計量～

画像解析入門⑦ Image Jによる画像処理

シリーズ３．ImageJマクロ言語を用いた画像解析～②二値化処理-1～

ImageJインストール（Mac）#ImageJの初心者から中級者まで#

画像処理におけるフーリエ変換④〜pythonによるフィルタ設計〜

おすすめの記事

細胞種を機械学習で判別する！

人気のキーワード

IMACEL Academy -人工知能・画像解析の技術応用に向けて-| エルピクセル株式会社

U-Net：セグメンテーションに特化したネットワーク

データセット

出力

実装

関連する記事 こんな記事も人気です♪

About IMACEL Academy

Deep learningで画像認識③〜ネオコグニトロンとは？〜

pythonによるtensorflow〜インストール、サンプルの実行〜

Neural Network with Julia 〜Kaggleの文字認識(DeepLearning)の前処理〜

Deep learningで画像認識②〜視覚野と畳み込みニューラルネットワーク 〜

この記事のキーワード キーワードから記事を探す

この記事のキュレーター

週間ランキング

シリーズ３．ImageJマクロ言語を用いた画像解析～①輝度の統計量 ～

画像解析入門⑦ Image Jによる画像処理

シリーズ３．ImageJマクロ言語を用いた画像解析～②二値化処理-1～

ImageJインストール（Mac）#ImageJの初心者から中級者まで#

画像処理におけるフーリエ変換④〜pythonによるフィルタ設計〜

おすすめの記事

細胞種を機械学習で判別する！

人気のキーワード

IMACEL Academy -人工知能・画像解析の技術応用に向けて-| エルピクセル株式会社

関連する記事こんな記事も人気です♪

Deep learningで画像認識②〜視覚野と畳み込みニューラルネットワーク〜

この記事のキーワードキーワードから記事を探す

シリーズ３．ImageJマクロ言語を用いた画像解析～①輝度の統計量～