2009年04月06日
whois.hansode.org(46/n) - ドメイン名を収集する手段の進化その後
- 第1世代
- 思いつく有名所を調べる
- すぐに限界が訪れる…
- 第2世代
- 3文字、4文字を調べる
- 無意味な文字列も含まれてて、あまり有用情報ではない
- 第3世代
- ネームサーバからドメイン名を取得していく
- そこそこ意味のあるドメイン名を取得出来る
- しかし、やがて限界が訪れる
- 第4世代
- IPアドレスの逆引きホスト名からドメイン名を取得していく
- ホスティング用のIPアドレスレンジの場合、逆引きにサービス中のホスト名が設定されている
- かなり価値のあるドメイン名を取得出来る
- これもまた、やがて限界が訪れる
- 第5世代(現在巡回中)
- feedを利用すれば鮮度のあるFQDNを収集可能
- ソーシャルブックマークのfeed
- 各種まとめサイトのfeed
この土日にfeedから収集するクローラーを書き終えた。
微増ながらも、FQDNとドメイン名の増加していくのが分かる。