まだまだ微妙なものが多いですが、このアルゴリズムではこんなもんでしょう。 GANにも色々な種類があるので今後もっと勉強していきたいです。
最近tfganというものができました。
tensorflowで楽にGANができるそうです。
2017年12月末の今の時期ではこの記事ぐらいしか情報がなくまだ私にはtfganを応用した画像生成ができていません。
この記事通りにやるとすぐにGANで画像を生成することができました。
今後もっと勉強したいと思います。
応用例
GANで何ができるのか、他に何を生成できるのかを調べました。
GANを使うと画像を再生成できますがこれは何に使えるのでしょうか?
一つには、少ない画像データを水増しすることができるのではないかと期待されています。
医療系の画像など入手しにくいものをGANで生成して訓練データとして用いることができればかなりいいと思います。
とはいえ現状まだここまでの精度は出せていなさそうですが。
GANで画像が生成できるということは動画も生成できるでしょう。
それをMITがやったそうです。
画像から1.5秒先の未来を予測して動画を生成するというものです。
ゴルフ場や海、列車の未来の動きを作っています。
そして、それとは別にワシントン大学が作ったオバマの動画がこちらです。
Synthesizing Obama: Learning Lip Sync from Audio
このように今後はフェイクニュースが簡単に作れるようになりそうで信用できません。
他にはこちらの動画をみてください。
CycleGAN Face-off 直播換臉
リアルタイムで人を他の人に変えています。
めちゃめちゃやばい技術ですGANは。
感想
GANはとても面白いと思いました。
今は2Dの生成ですが今後3Dの生成もできるようになればCGの生成もできるようになりそう。
ということは映画を簡単に作れるようになりそうです。
過去のデータから3D空間を生成し、役者も生成し、声まで生成することができそうです。
逆にしばらくAIができそうにないことは言葉の意味理解だと思います。
映像は作れてもしばらくは物語を作ることはできないのではないかと思います。
僕らはAIにできない物語の生成やトップ1%以内の技術力を持たないと仕事ができなくなるかもしれません。
そのうち匂いの再生成や味の再生成、感覚の再生成もセンサーが発達したりしてデータが取れるようになればできそうです。
逆に悪用されると最悪な技術だと思います。
やっていないことや言っていないことを生成されたりしそうです。
僕らはAIをやっていく上で倫理観を持ってやっていきましょう。