[BOT] NOBODY:PLACEで確認しているbot一覧。 [BOT] NOBODY:PLACEで確認しているbot一覧。

-
引っ越し以来、bot類の訪問が止んでいたんだけど、DNSが安定したせいもあるのか、
再び訪れるロボット類が増えてきました。というわけで、後学のためにもメモ。
何かわかる度に追記していく形で。
(2005/02/23 第3弾 UP)

とりあえずは基本の方々。

Yahoo! Slurp
知らない人はいないYahoo!のクローラー。
Googlebot/2.1
同じく超有名、Googleのクローラー。
ichiro/1.0
以前取り上げたとおり、gooの新クローラー。 以前までは、『gazz』って名前でしたが。うちのサイトの総チェックも終わった模様。


そして、最近見かける方々。

CaptainNAMAAN/0.01
『電脳卸』を運営している、株式会社 ウェブシャークの放っているbot、らしい。 何の理由でこのサイトに来ているかは不明。
※どうやら、NAMAAN っていう検索サイトがあるらしい。新興勢力。ウェブシャークとの関連は不明。
SKY WATCH のminamiさんによると、NAMAANのIPはウェブシャークのものと一致する、とのこと。やっぱそうなんかなーてかクローラーの説明くらい付けろよ…遮断するぞ。

blogWatcher_Spider/0.1
blogWatcher のクローラー。東京工業大の研究所が開発、運用しているblog/日記を網羅的に収集ツール…らしい。
lmspider
Scansoftのクローラー。何しに来てるかはよく分からん。
fast-search-engine(名無し)
Fast-Search-Engineのクローラー。検索サイトかな…
ia_archiver
Internet Archiveの方。便利なときもあるけど、過去の自分が残されてるってなんだか気持ち悪い。…と思ったけど、よく見ると、alexa(Amazonの検索サイト)から来てる。どっちだ…? ※AlexaにAmazonが参入した、というのが正解っぽい。てことは、A9に流用されるってことか?

Technoratibot/0.6
Technoratiって検索サイトの方。有名なんですか?(初耳)
EmeraldShield.Com WebBot
Emerald Shield っていう会社の、WEBフィルター生成用botと思われ。
DTS Agent
SPAM系のメールアドレス収集用botらしい。かなりしつこいとのこと。遮断必須だな。 情報:robotはぢきについて - DTS Agent

ask jeeves/teoma
ASK Jeeves のプログラムを使った検索サイトのクローラー?多分アメリカ。
1.0
やっぱり来てました。謎でも有名UA。これってなんのUAだったっけかなぁ…忘れた。
Updated.com
検索サイト、updated.comのクローラー。知らん。

RSSアグリゲーターな方々。

Rojo
SNS?Rojoからの来訪。

正体不明の方々。

Java/1.4.2
多分、サイト自動収集ツール。正直うっとおしいので、使ってる方は他の手段を考えてください。まだ個人サイトでは制限までは考えていませんが。
[ 2005-02-16 ] 初稿
[ 2005-02-20 ] SKY WATCH さんからのTBを反映
[ 2005-02-20 ] 精査したところさらにいくつか発見→追加
追加が増えたので、日付を更新。
[ 2005-02-21 ] と、ともったけど、アクセスログを精査したら結構とんでもないことになってることが
発覚したので、詳細版として新たにエントリ作成の予定。なので、日付を元に戻す。

記事をアップして更新ping を飛ばすと各社のボットがアクセスにきます。 当たり前の話ですが、中には変な動作をするボットもあるわけで…。 以前から「Captai...

COMMENTS
お世話様です。
「CaptainNAMAAN」ですが、うちのエントリに『NAMAAN』の管理人さんからコメントがついてまして。
『NAMAAN』サイト上にボットについての説明を追記したとのこと。簡単にですが追記されてましたのでご報告。
http://www.namaan.net/news/
UA名には相変わらずなんの説明もありませんが(笑)、一歩前進。