読者です 読者をやめる 読者になる 読者になる

二次元画像を拡大したいと思ったことはありませんか?

うまくできましたか? ボヤけたり、ギザギザになったりしませんでしたか?

waifu2xをお試しください。



(ブラウザの処理に影響されないようクリックで拡大おねがいします)

waifu2xは、二次元画像を2倍に拡大するソフトウェアです。多くの二次元画像についてスゴイ級のクオリティで拡大できます。

waifu2xは、最新鋭の人工知能技術 Deep Convolutional Neural Networks を使って開発されました。
waifu2xの人工知能は、次の問に答えます。

  • いまから与える画像はある画像を半分に縮小したものである。縮小される前の画像を求めよ。

画像を拡大するのではなく、縮小される前の状態に戻します。
縮小されてないオリジナル画像を与えた場合も、やはり縮小される前の画像を答えます。
その画像は本来存在しないものですが、waifu2xはそれを想像で創ります。

二次元画像のJPEG劣化に悩まされていませんか?

JPEGノイズが気になりますか? Google画像検索を使ってもノイズのある画像しか見つかりませんでしたか?

waifu2xをお試しください。




(ブラウザの処理に影響されないようクリックで拡大おねがいします)

waifu2xは、二次元画像のJPEGノイズを取り除くソフトウェアです。多くの二次元画像についてスゴイ級のクオリティでノイズを除去できます。
waifu2xは、最新鋭の人工知能技術 Deep Convolutional Neural Networks を使って開発されました。
waifu2xの人工知能は、次の問に答えます。

  • いまから与える画像はある画像を任意の圧縮率でJPEG圧縮したものである。JPEG圧縮される前の画像を求めよ。

ノイズを取り除くのではなく、画像をJPEG圧縮される前の状態に戻します。
JPEG圧縮される前の画像がインターネット上に存在しない場合も、やはりJPEG圧縮される前の画像を答えます。
JPEG非可逆圧縮と呼ばれる一度圧縮してしまうと元の状態には戻せない形式ですが、waifu2xは二次元画像の知識を使って逆変換を行います。

waifu2xはなんだかスゴそうです。でも完璧ですか?

waifu2xは実際スゴイですが、完璧ではありません。



(ブラウザの処理に影響されないようクリックで拡大おねがいします)

画像を見て、髪飾りに注目してください。

waifu2xの出力では、髪飾りに数珠めいた模様が刻まれています。他の資料で確認したところ、初音ミクの髪飾りにそのような模様はありません。
waifu2xは、縮小される前の画像には髪飾りに数珠めいた模様があったと解釈して、その模様を復元しましたが、それは間違いだったということです。
waifu2xは、多くのケースでよい改変を行いますが、勘違いで余計なことをしてしまうことがあります。

より悪い例としてマンガのスクリーントーンがあります。
waifu2xは、マンガのスクリーントーンを謎めいた模様に変換することがあります。
ただその謎めいた模様を半分に縮小すると、不思議なことに元のスクリーントーンに戻ります。



(ブラウザの処理に影響されないようクリックで拡大おねがいします)

waifu2xは、我々人間の感覚からすると間違っているように見える変換を行うことがありますが、検証してみると間違ってはいません。
「縮小される前の画像」をどのように想像するか、waifu2xと我々人間の間で感覚の相違があるようです。この溝は今のところ埋められていません。

こういったリスクがあることもあり、waifu2xは特に画像の色合いを変えないように制限されています。代償としてヤバイ級のJPEG劣化で虹色に変化してしまった部分は修復できません。

参考

waifu2xは、SRCNN[1]にインスパイアされて開発されました。細かい違いはたくさんありますが、大まかな枠組みはSRCNNです。
初音ミクの画像は、piapro[2]よりCC BY-NCで公開されているものを使用しています。
マンガのテクスチャはスクリーントーン風にワンダラー&SAI用テクスチャー素材[3]から引用しています。

アクセス

waifu2xは以下のURLから利用できます。

waifu2x.udp.jp

現在サーバーが1台しかなく、なかなか重い処理(1件あたり1〜5秒程度)なので、多くの方が同時に試すとレスポンスが返ってこなくなるかもしれません。
レスポンスが返ってこない場合は、少し時間をあけて試してください。

またソースコードgithubで公開されています。

waifu2x - github.com

waifu2xのコードはLuaJIT/Torch7を使って開発されました。

Public AMI

EC2用の環境構築済みのイメージを公開しています。

Public AMI

追記

Firefoxだと"画像を保存"で変換後の画像が保存できていないようです。
CTRL+Sか、ALTキーを押して、ファイル→ページを保存(Save Page As..) だと保存できるようです。