Chainerで作る
コンテンツ自動生成AI
プログラミング入門
著者 坂本俊之
発行 2017年12月22日
サイズ A5, 264頁
ISBN 978-4863542341
価格 3,420円(本体)
またまたChainerの本を紹介する。
Chainerに限らないのだが、ディープラーニングの本というと、画像の分類、判定の紹介が圧倒的に多い気がする。
それも、ほとんど同じデータを使っていることが多い。
本書は、そういう本ではなく、ディープラーニングの入門書ではあるのだが、AIを使って何か自動生成するプログラムの紹介が中心である。
画像の場合、自然言語(日本語)の場合、それらの組み合わせを紹介している。
これだけやろうとすると、単にPythonとChainerをインストールするだけでは不足である。
計算量が増えるので、GPUを使えるように、CUDAのインストールも必要である。
その他にも、いろいろインストールするのだが、省略する。
この分野ではソフトウェアのバージョンアップが頻繁に行われており、デバイスドライバからさまざまなツール類まで、バージョンを合わせておかないとインストールできても実行時にバージョン不整合のエラーが出ることがある。
実際、以前Chainerをインストールしたままの状態で実行しようとしたらダメで、バージョンアップが必要になった。
それで、エラーに対応する部分だけをインストールしたら、今度はバージョン不整合が出てしまったのだ。
結局、Chainer, CUDA, デバイスドライバ関係を全部消して入れなおした。
全体で2GBを超えていたが、今の時代、この程度は軽々とインストールできてしまう。
さて、本書の内容をざっと紹介しよう。
画像関係の説明を読むのは飽きているので、ざっと読み飛ばした。
超画像処理といって、粗い画像から、より画素数の多い鮮明な画像を作る方法が紹介されていた。
画像の自動生成では、贋作の作り方、つまりある画家の作品だと言い張れるような画像の作り方が紹介されていた。
さらに、さまざまな特徴の画像に変換する方法が紹介されていた。
でも、簡単なプログラムで行っているので、その成果については、まあまあという程度である。
自然言語処理では、MeCab で形態素解析を行ったものに対して、簡単なディープラーニングだけで文章の自動生成を試みていた。
使っているテキストがWikipediaの「不思議の国のアリス」、「鏡の国のアリス」、「地下の国のアリス」だけなので、とても量が少ないが、これは量を増やすと計算に時間がかかり過ぎるようになるので、短いデータで行っているとのこと。
文章の自動生成は、単語の並び順だけから作ったものと、MeCabで与えられる品詞まで考慮したものとがある。
機械翻訳は、本格的なコーパスを利用すると、GPUを使ってもすごく時間がかかるので、特別に短いけれども学習効果が高いように調整されたコーパスが用意されていて、それで単純な日本語から英語に翻訳できるかの実験が紹介されている。
そして、最後に、画像のキャプションの自動生成があった。
これら全てに対して、プログラムやデータが用意されていて、ダウンロードできるようになっている。
Chainerの環境をちゃんとインストールできれば、プログラムの実行自体は非常に簡単なはずである。
本には、プログラムについても一通りの説明があるのだが、きちんとした説明は本書のレベルを超えるので省略ということが多く、技術的な背景を本書だけで理解するには無理がある。
本書は、色々なコンテンツ自動生成を体験してみるための本であって、この本の説明にしたがって実際に動かしてみて、コンテンツの自動生成とはどんなことなのかをちょっと体感するのがねらいのようである。
ということで、サクッと試して、もっとやりたければ、本格的に説明している書籍、論文などに進むべきだろう。