github contest 日記 (8/20)




寝てもk-NNされてるベクトルになってる夢とか見てうなされるので、夜中からやっていたら50%越え&6位まであがった。

変更点

author_recommender.pl

ソートをリポジトリのランキングではなく、ユーザがwatchしている各リポジトリとの類似度の最大値で行うようにした。
類似度は、リポジトリをwatchしているユーザを軸にした2値変数ベクトルから計算。
単体での正解率は16.37%→19.04%

forkbase_recommender.pl

author_recommender.plを同じ変更。正解率は変わらず。

name_recommender.pl

ユーザがwatchしているリポジトリと名前が部分一致するリポジトリの中からオススメを生成するものを追加。
単体での正解率は21.0%。

その他

name_recommender.plは、これいれたら爆上げで60%いっただろワロスと思いながら追加したら、0.07%しか上がらなかった。
結合の重みを調節したらもうちょっと上がるんじゃないかと思っているので、自動で最適化しようと思って、ローカルテスト環境を作った。
SVDは次元増やしたけど、あまり変わらず、さらに増やすとメモリに入らなくなったので、とりあえず消した。jeremybarnesさんがSVDLIBC使っているようなので(僕もこれ使ってる)、あとで参考にしようと思ってる。