waifu2xの更新(1)

学習済みモデルファイルを更新しています。 まだ今後の準備のためにソースコードを更新するついでに手元のモデルを更新しただけなので、そのうちまた更新されます。デモサーバーには反映しているので少し変換結果が変わっています。 サードパーティのローカ…

二次元画像を拡大したいと思ったことはありませんか?

うまくできましたか? ボヤけたり、ギザギザになったりしませんでしたか?waifu2xをお試しください。 (ブラウザの処理に影響されないようクリックで拡大おねがいします)waifu2xは、二次元画像を2倍に拡大するソフトウェアです。多くの二次元画像についてスゴ…

イルルカの感想

ゲームしたいストレスで、e-ショップを見てたらドラゴンクエストモンスターズ2 イルとルカの不思議なふしぎな鍵があったのでやりました。 ドラクエ好きでもモンスターズシリーズはやっていない人が多い気がしますが、イルルカは前作のテリーと違って普通の広…

National Data Science Bowl 10位

プランクトン画像分類コンペこと National Data Science Bowl が終わりました。 Description - National Data Science Bowl | Kaggle結果はタイトル通り10位(1049チーム中)でした。賞金2000万円が1円も貰えなかったショックで毎日15時間くらい寝ています。感…

Avazuが終わった

Avazu Click-Through Rate Predictionが終わりました。長かった。期間が長すぎる!! と言っても、僕は始めて1週間目くらいにプランクトン分類が始まったため、そっちばかりでほとんどやっていなかったのですが、ついに終わりました。 結果は72th/1604。一応、…

Torch7の分かりにくい話

Facebookがtorchの拡張を公開したこともあり、torchを使ってみている方も出始めたようなので、自分がtorchで使う上で分かりにくかったことやハマったことなどを上げていきます。 ある程度使っている方を前提としています。ひどいことをたくさん書きますが、t…

Torch7で最近傍探索のベンチマーク

最近、Torch7で最近傍探索を繰り返し行いたかったけど、すごく遅いのでは??という不安があったのでk-NN(k=1)でベンチマークしてみた。 設定 MNISTをk-NN(k=1)で評価する 尺度はコサイン類似度とする テストを全件評価してかかった時間を計測する 環境 Inte…

プランクトンの画像分類コンペが開催されています!

Kaggleでプランクトンの画像分類モデルの良さを競うコンペが開催されています。 Description - National Data Science Bowl | KaggleComputer VisionやDeep Learningに興味のある方、自分の力を試してみたい方、手頃なサンドバックが欲しい方などは参加され…

Kaggle CIFAR-10の話

以前、Kaggle CIFAR-10 に参加していると書きましたが、これが2週間ほど前に終わりました。コンペはまだ Validating Final Results の状態なのですが、2週間たっても終わらず、いつ終わるのか謎なのと、多分結果は変わらないと思うので先に書きます。CIFAR-1…

lbpcascade_animefaceをgithubに置きました

見る前からスター !lbpcascade_animeface · GitHub OpenCV用のアニメ顔検出器 lbpcascade_animeface をgithubに置きました。 内容は2011年から変わっていません。 妙なブログ記事ではなく参照しやすくなったのではないかと思います。 全宇宙に拡散するため…

AfSIS 反省会

Kaggleで行われていたAfrica Soil Property Prediction Channgleに参加して、結果は1233チーム中148位だった。 反省会です!!ちなみに参加していなかった人には何を言っているか全く分からないと思いますのでご了承ください。今回のコンペは、yag_aysさんも書…

CNNで各層にzero paddingを入れる意味

いろいろなCNNの実装を見ていると、畳み込み層の前にzero padding(Torch7だとSpatialZeroPadding)を入れているものが多くて、自分も使っているのですが、これにどんな意味があるのが正直良く分かっていないので、詳しい文献などあれば紹介してください。以上…

Torch7で複雑なモデルを書くときに便利な技

Torch7はnnに用意されている部品を組み合わせることで複雑なモデルを作れて便利なのですが、複雑なモデルは入力ベクトル(orテンソル)を様々形に変換しながら実行するので、どの時点でどのサイズになっているか分からなくて書くのが難しいというのがあります…

CIFAR-10でstate of the artのスコアが出せる、インターネットに落ちている中で最強のコード

DecMeg2014をやっているときにCUDA使いて〜と思うことがあったので、最近、GTX760というGPUを購入して、Kaggle PlaygroundのCIFAR-10(有名な物体認識のデータセット)で試していたのですが、CIFAR-10のstate of the artである0.912を微妙に超える精度(0.9173)…

Kaggle Masterになりました

ビッグデータを世界の天才たちが紐解くKaggle における上位プレーヤーの称号 Kaggle Master を得ました。 Kaggle Masterを得るには、1. 2つの公開コンペで上位10%に入る 2. そのうち1つは10位以内に入るという条件があるのですが、4月に終った Large Scale…

最近のautomakeでmake checkの挙動を戻す方法

開発環境をUbuntu 13.10にアップグレードしたら、自分が作っているライブラリのビルドでmake checkしたときの挙動が変わっていた。どうもautomakeのバージョンが上がったせいで挙動が変わってしまったようだ。 これまでは、テストプログラムがなんかいろいろ…

L4D2の特殊感染者BOTのプレイスタイルをカスタマイズしてみた

@キモト L4D2のAI改造試したけど、なんかいろいろ方法考えた上でFakeClientのキー入力を書き換えることでBotの動きを制御する方法が簡単でいいのではと思った。server.soのdisassemble読んでExtension書くのはつらいし、いろんなcvarを参照しながらTeleportE…

類似検索を更新した

よくなったけど俺以外には違いが分からない気がする。花: http://flowers.libotama.so/アニメ顔: http://animeface3.libotama.so/やってることは前のままだけど、特徴点検出の閾値からVLADの次元、LMCAの学習アルゴリズムに至るまで、ざまざまなところに勘で…

そろそろ本気出す!!

一時のテンションは一瞬で消えたのと、3月の後半まではいろいろ忙しかったというのもあって完全に活動停止状態だったけど、ここ1週間くらいはゲームして本読んで寝るというクソみたいな生活を送っており危機感飽きてきたのでインターネット活動に戻ってこよ…

計量学習を用いた画像検索エンジンとアニメ顔類似検索v3について

まだgithubにはpushしていないのですが、さいきょうの組み込み型画像検索エンジンotamaに計量学習を用いて与えられたデータにあった画像間の距離関数を学習してそれを使って検索するというドライバを入れたので、先行的なデモとしてアニメ顔類似検索v3を作っ…

Ubuntu12.10でBorderlands2をする

Borderlands2もLinuxのWineで動くので紹介します。 WineとSteamのインストールについてはUbuntu 12.10でL4D2をする (Wine) - デーを見てください。 以下の内容は上の記事通りにwinetricksからsteamを入れていることとして書かれています。まずBorderlands2の…

こまめに日記を書きたい

昔は、開発日記とか、日々のムカついた事とか、自分の精神状態の報告とか、まあいろいろとちょっとしたことを書いていたのに、最近はまとめしか書かなくなってきてて、でも、やっぱり書いたほうがいいと思うので、もう少し気軽にやっていることの途中経過と…

Ubuntu 12.10でL4D2をする (Wine)

SteamのLinux Betaが出たらしいです。僕は2週間くらい前にベータのアンケートみたいなやつに答えたのですが、特に何も来てなくて試せていません。試せていませんが、がんばってほしいですね。試せていませんが。 ただ僕は、Ubuntu 12.04の頃からWine経由でL…

はてなブログに移行した

ダイアリーから記事をインポートしてリダイレクトの設定もできるようになっていたので移行しました。 6月くらいからできていたらしい。 はてなブログがリリースされた時に出来なくてアホカと思ったまま興味を失っていたので気づかなかった。ベータ版だったか…

表紙を写すと本のレビューが読めたりするHTML5アプリを作ってみた

最近のブラウザはgetUserMediaという機能でJavaScriptからカメラを操作してリアルタイムに動画を読んだりできるようなので、画像認識のデモ的なものを作ってみた。表紙検索 PCのGoogle Chrome、Opera、AndroidのOpera Mobileの場合 動画が読めるといっても実…

組み込み型お手軽全文検索エンジンのRubyライブラリを作って2ちゃんねるQ&A検索の全文検索エンジンを置き換えた

2ちゃんねるQ&A検索(非公式) の全文検索は pg_trgm を使っていたのですが、だんだんとデータが増えてくるとPostgreSQLの共有メモリを増やさないと検索がタイムアウトするようになってきて、最近ではVPSのメモリのほとんどをPostgreSQLに割り当ててもクソ重…

BimyouSegmenter: Rubyだけで書かれた微妙なサイズの分かち書きソフトウェア

BimyouSegmenterはRubyだけで書かれた微妙なサイズの日本語分かち書きソフトウェアです。 約150Kバイトの微妙なサイズのソースコードで、青空文庫にある太宰治、宮沢賢治、夏目漱石、夢野久作作品であれば、MeCab+ipadicによるの分かち書きの結果と94%くらい…

nekoneko_genで20newsgroupを試してみた

文書分類では、20newsgroupsというデータセットがよく使われるようなので、英語テキストの対応をしながら試してみました。http://people.csail.mit.edu/jrennie/20Newsgroups/これは20種類のニュースグループに投稿された約2万件のドキュメントを含むデータ…

ネコでもテキスト分類器のRubyライブラリが生成できる便利ツールを作った

あまり細かいことは気にせずテキスト分類器のRubyライブラリを1コマンドで自動生成する便利ツールを作りました。 いろいろ迷走している間に。 gem install nekoneko_genでインストールできます。なにをするものなのか、ちょっと分かりにくいので、例で説明し…

キャプチャつなぎ職人になる方法

本来何と呼ぶ者なのか知らないので、知っている方がいたら教えてほしいのですが。 2ちゃんねるなどを見ていると、アニメのスクロールシーンの画面キャプチャを謎の技術でつなげている人がいます。たとえば、次の4つの画像 (http://www.nicovideo.jp/watch/1…