スパマーは本当にウェブページ上のE-Mailアドレスを収集しているのか?

ここ数年、ウェブページにメールアドレスを直接記述しない風潮があります。これは、スパムメール送信先アドレスを収集する走査プログラム(ロボット)にメールアドレスを収集されないようにするためです。
ですが、本当にそんなロボットがいるのでしょうか? と妄想してみます。

まず、実際そのようなロボを開発して、メールアドレスを収集することを考えてみます。
私が作るとすれば、まずターゲットを絞るところから初めます。そしてターゲットとなるのは、メル友募集掲示板など、メールアドレスが多く記載されている可能性が高いサイトです。なので、まずそういうサイトのURLリストを作って、そこを起点に走査すると効果的に収集できるのではないか? ということで、一般のサイトやブログは対象外にします。
別の方法として既存の検索ロボットを使って収集すること考えます。
これは、J-Klein氏のユーザ名の収集と利用にあるように、『http://mydomain.or.jp/~myname/』というサイトが存在する場合は『mydomain.or.jp』に『myname』というユーザが存在し、そのユーザのメールアドレスは『myname@mydomain.or.jp』である可能性が高いという予測に基づく方法で、直接メールアドレスが記載されていなくても、メールアドレスが予測可能なドメインが把握できれば簡単に収集できます。

上記2つの方法は、効率的にウェブ上からメールアドレスを収集する方法ですが、一般のサイトやブログを対象としていません。逆に、全世界のウェブページを走査する前提のロボットは、とんでもなく効率が悪いか、とんでもなく維持費用がかかるので、あまり現実的ではありません。


また『メールアドレス収集する』ことを目標に考えると、ウェブから収集することがそもそも効率の悪い方法ではないかとも思えます。
たとえば、誰でも簡単にメーリングリストを立ち上げられるサイトを作って、そこに登録されたメールアドレスを使ったり、そういうサイトが販売しているアドレスを買って、さらに転売したほうが効率も儲けも多い気がします。みなさんも、怪しげなアフィリエイトプログラムや出会い系サイトやSNSに登録したメールアドレスにスパムメールが多く届くようになったと感じた経験はないでしょうか。
また、そのような危ない橋を渡らずともWinnyで流失している個人情報のつまったエクセルファイルを悪用する方法なども考えられます。


ここまで考えると、一般のサイトやブログをわざわざ走査してまでメールアドレスを回収する必要はないと思えるわけです。
本当に収集しているのでしょうか? >業者

どこからアドレスが漏れているのか把握する

スパム業者にアドレスを漏らすアドレス販売業者を特定しようとする場合、さまざなサービスにたくさんのアドレスを登録してみる方法がありますが、フリーメールといえどもたくさん取得するのは面倒ですし、もしかしたらドメインによっては販売価格が異なり、hotmail.comは安いから業者に渡らないなど妙なルールがあるかもしれません。
そこで、メールアドレスは大文字小文字を識別しないというプロトコルを活用して、次のようにします。

  • 大文字小文字をバラけさせて登録する

たとえば、『myname@mydomain.or.jp』の場合、『Myname@mydomain.or.jp』『MyName@mydomain.or.jp』『MYname@mydomain.or.jp』『myname@Mydomain.OR.JP』などのパターンがあります。これらはすべて同一のメールアドレスとして認識され、『myname@mydomain.or.jp』のメールボックスに届けられますが、メールヘッダーの送信先アドレスは大文字小文字が異なった状態で届くので、プログラムで振り分けることができます。

これは某コモンジョに書かれていた方法です。
ということで、業者はメールアドレスDBへアドレスを保存する際には、全て小文字に変換してから保存するようにしないとすぐバレます。\(^o^)/

あとがき

んー、なんとなくWizardBibleのノリ
最近は学術的な内容が増えてきていて、気軽に読めないので、技術を持ちつつ、根拠のない怪しげな思想や電波もカバーする方々はふるってご投稿ください(宣伝)。