2007-11-11から1日間の記事一覧

今週はグロ画像のブラックリストを作りたい

2ちゃんねるのログを収集するものの通信部分とクラスにセットするところだけできた。 あとは取ってきたデータをDBに突っ込む処理を作って(DBはローカルVistaにPostgreSQL+Ludiaで環境をつくた)、なんかいろいろとクエリを発行します。 まずはグロ画像のMD…

LWP::UserAgentでgzip,deflateエンコーディングを使うときに文字コード変換が原因でデコードに失敗することについて

タイトルがアレですが、LWPでContent-Encodingがgzipのコンテンツを展開するときに、コンテンツのcharsetに合わせた文字コード変換が動いてしまって、そのときに変換できない文字があるとundefを返すので困った! という話です。 LWP::UserAgentというか、HT…