[BOT] Bots on NOBODY:PLACE vol.35 - 2007/5 [BOT] Bots on NOBODY:PLACE vol.35 - 2007/5
- [ bot ][ botreport ]
BOT/CRAWLER
UA: semanticdiscovery/2.0(http://www.semanticdiscovery.com/robot.html) robotsに関するドキュメントがしっかりして、クローラーとしてはちゃんとしてるんだけど、これ…何のために収集してるんだろ?そこがよく分からん。データ集めて売ってる会社なのかなぁ。
UA: Mail.Ru/1.0 IP: 194.186.55.208
『mail.ru』自体は、ロシアのメールサービスらしいです。なぜこのクローラーがそう名乗ってるかは分かりませんが。IP自体は、きちんと、Mail.Ruのものみたいなんですけど、何せドキュメントがないし、あってもロシア語じゃ読めないし、どうしようもないねー
ま、サイトはメールだけじゃなく、ポータルっぽい感じになってるんで、その検索エンジンのクローラーかな、とぞ思う。
VadixBotUA: VadixBot なんでしょうかねぇ。robots.txtを形だけちらっと見て、そのままページにアクセスし、お帰りになってます。どっかの検索エンジンかなぁ。ちなみにIPは、Road Runnerというポータルサイトのものなので、それ関連の何らかのサービスかなと思う。
UA: spider tspyyp@tom.com 中国のポータルサイト、TOM.COMのクローラーだと思う。確信はないけど。基本的には関係ないけど、IPは、深圳大学、都市管理委員会(?)のもの。
UA: fc2bots (http://fc2.com/) 何の目的のクローラーかは分かりませんが、FC2のサービスの一部なんでしょうなぁ。アクセス先は、エントリファイルです。
tb_sendUA: tb_send/1.0 UAを見れば大体想像尽きますが、SPAMトラックバックを撒くソフトウェアですね。一応見に行きましたが、なんかもう貧相すぎて悲しくなる営業をしてるサイトでしたね。どうせ作るのなら、ちゃんとブログで手を入れてやっててくれりゃいいのに、テンプレ作って、それに営業文を載せたペライチのページに飛ばすだけの、作った人間の無能さ加減が分かるサイトでしたよ。それで金稼げるんだから良いよねぇ。
SERVICE
UA: gooblogsearch/2.0 (http://help.goo.ne.jp/contact/) UA、HOSTから見て、gooのブログ検索で間違いなし。http://blog.goo.ne.jp/XMLRPCにPingを送ることも出来るらしい。
UA: Tumblr/1.0 RSS syndication (+http://www.tumblr.com/) (support@tumblr.com) シンプルなブログサービス「Tumblr」。その、RSS取得用クローラーかなー。
UA: Mozilla/4.0 (compatible; airproxy/0.4.9) 『airproxy は、画像を減色・縮小するフリーの HTTP プロキシサーバです。airproxy を使用すると PHS や 携帯電話などの低速回線でも快適にウェブブラウズができるようになります。』とのこと。
UA: LeapTag/0.8.3.trunk.r3960 win32 (compatible; Mozilla 4.0; MSIE 5.5; robot@yoriwa.com) Blogにも対応した、NewsReaderとのこと。ダウンロード、ってあるから、ソフトウェアなんだろうな。カリフォルニア州サンノゼのLeapTag Inc.によるリリース。
WORDIAN Document FilterUA: WORDIAN Document Filter なんだろう。よく分からないけど、『WORDIAN』という名前の総合辞典があるらしい。それを利用した翻訳サービス、とかかなぁ…と想像してみるものの、よくわからん。しかもなぜか、画像にアクセス来てる罠。ただ、同じIP(from韓国)のアクセスがその前後にあり、それは普通の人間のアクセスっぽい感じで、UAは典型的なWindows XP。以上を考えると、やはりこれは翻訳サービスの中の一部で、ページの先読みとかなにがしかの機能に使われる部分のUAが洩れてる…みたいな感じかなぁ。根拠はログ以外には特になし。
UA: httpRead/1.0 (written by H.Tsujimura) 観測気球の方、のようです。H.Tsujimuraさん。このUAについては、[観] Memo Leaves: ココログとrdfに出てきます。
UA: www.blogpet.net ブログペット。何のために?とかは不明。
GM RSS PanelUA: Mozilla/5.0 (compatible) GM RSS Panel ブラウザと同時にRSSにアクセスしてるから、FireFox Add-OnのRSS Reader Panel(現Sage)かなぁと思ったけど、こういうUAを吐くかどうかは確信が持てないので、保留。うむー
UA: Gungho/0.05 Gunghoはゲーム会社のガンホー…ではなくて、多分リンク先のクローラーフレームワーク。で、アクセス元を考えると、このアクセスはこちらかなぁという気も。
UNKNOWN
alpha LinkCheckerUA: alpha LinkChecker/1.0 なんでしょうかねぇ。IPは逆引き不能で、『株式会社リクルート』。ふつうにページ(と言うかディレクトリ)にアクセスしてきてるので、文字通りリンクチェッカー何ではと思いますが…謎。検索しようにも、この文字列じゃ難しいしね。
UA: URL Check Program ADDR: heart1.coara.or.jp
株式会社コアラは、九州のインターネットプロバイダらしい。サイトはなんかサービスが見づらいけど、URLをチェックするって言うと、まー…フィルタリングのサービス的な何かかなぁという気がする。詳細は不明。
himitsuno-CRAWLUA: himitsuno-CRAWL0.1 IP: 43.244.130.57
いや、全然秘密になってないから。
NEETUA: NEET そ、そうですか…
総括
今月はまた随分と色んなUAがいらっしゃってますねぇ…なんとなく、RSSへのアクセスが増えてるような気がします。




