UserAgent調査
- これまでの足跡
- 
アクセス解析を眺めてみると様々な環境でアクセスされていたようです。
 ここは、アクセスログに残されたちょっと変わったUserAgentをぶった切ってみるページです。
 ぶった切りコーナーなせいかやや口が悪く、人によっては不快に感じるかもしれないけど勘弁ね(笑)
 あえて主観のみで意見を述べているので、お前の考えは間違っている!というツッコミはしないでください。
 もしかしたらあなたの大好きなUserAgentが貶されているかもしれないけど、大きな心で見てやってね♪
 このページは見る人もあまりいないと思われるので、今後は更新されたとしても更新履歴では報告しませんw
 リンク先が見れなくなっているものが多いけど昔作ったページだから仕方がないよね。
 
- あなたの環境
- 
    とりあえずあなたの閲覧環境からどうぞ。
 AUTH_TYPE
 /useragent.php
 
 CONTENT_LENGTH
 
 
 CONTENT_TYPE
 
 
 GATEWAY_INTERFACE
 CGI/1.1
 
 HTTP_ACCEPT
 */*
 
 HTTP_FORWARDED
 
 
 HTTP_REFERER
 
 
 HTTP_USER_AGENT
 Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)
 
 HTTP_X_FORWARDED_FOR
 
 
 PATH_INFO
 
 
 HTTP_TE
 
 
 PATH_TRANSLATED
 
 
 QUERY_STRING
 
 
 REMOTE_ADDR
 216.73.216.163
 
 REMOTE_HOST
 
 
 REMOTE_IDENT
 
 
 REMOTE_USER
 
 
 REQUEST_METHOD
 GET
 
- ダウンローダー
- 
【 WeBoX 】     WeBoX 0.99 WeBoX 0.99
 今までウンザリするほどやってきたダウンローダー様。
 バージョンは様々だが、その時点での最新版でアクセスしてくる人が多い。
 某所に2007年6月に来襲した大分のOCNユーザーのダウンローダー10万連打事件にもこれが使われていました。
 ページを保存する時にはJavaScriptを解釈できないみたいで、フレームをJSで記述していたりするとあえなく撃沈。
 まあ、IEの右クリックメニューに登録して目的のページだけを保存するようにすれば成功するかもしれないね。
 弾かれてもブラウザーのキャッシュからページを拾ってきて保存したりと、かなりしつっこいw
 
 >閉鎖予定のサイトをまとめて保存
 誰にも見せたくなくて閉鎖するんだから大きなお世話なんだぜ…。
 【 Website Explorer 】  Website Explorer/0.9.9.9 Website Explorer/0.9.9.9
 WeBoXほどではないが、これも利用者は多い。
 「ウェブサイトの構造を探査・解析し、情報を階層表示する」というソフト。
 どのファイルをいつ更新したかまで分かってしまうみたいで、調査される側としてはストーキングされてるみたいで気分が悪い。
 有料版だとUserAgentの偽装もできるらしいけど…うん、まあそのなんだ。頑張ってください。
 【 パッケージ名なしダウンローダー 】 Java/1.6.0_03 Java/1.6.0_03
 このUserAgentからは判断しにくいかもしれないがダウンローダーでした。
 これ以外にも「Java/○○○○」みたいなのはたまに来ているけど、もしかして皆ダウンローダー様!?
 こいつぁ油断できませんなあ。
 【 FaEdit 】 FaEdit/2.0.4 FaEdit/2.0.4
 更新チェックやWebページの保存ができる…というものらしいです。
 【 Nekosogi 】  Nekosogi Ver3 ⇔ Mozilla/4.0 (compatible; MSIE 5.0; Windows 98; DigExt) Nekosogi Ver3 ⇔ Mozilla/4.0 (compatible; MSIE 5.0; Windows 98; DigExt)
 ホームページから欲しいファイルのみを根こそぎGetするそうです。強盗ですかw
 UserAgentを偽装する機能が付いていて、本名のほかにWin98のIE5を装ってきます。
 【 WebCapture 】 Mozilla/3.0 (compatible; WebCapture 2.0; Windows) Mozilla/3.0 (compatible; WebCapture 2.0; Windows)
 名前からしてなんとなくダウンローダーっぽいかな…。
 WebCaptureでググったら英語のページが引っかかったけど、よく分かりません。
 今時Mozilla/3.0ってプロキシぐらいしか吐かないと思ってたw
 【 WebAuto 】 WebAuto/3.41 (WinNT; I) WebAuto/3.41 (WinNT; I)
 事前に登録したURLを自動的に巡回してページを保存するそうです。
 連続アクセスでサーバーに大打撃を与えたりしないだろうね…。
 これを使ってきた人は非常に少ないのですが、原因はシェウェアだからだろうか?
 【 GetHTML 】  Pockey/4.10.0(Win32; GUI; ix86) Pockey/4.10.0(Win32; GUI; ix86)
 Pockey-GetHTML/5.0.0 (Win32; GUI; ix86)
 多分2つとも同じやつじゃないかな。
 数年前はかなりの頻度で来襲してきたけど、最近はこれが来るのは稀になりました。
 【 ダウンロードNinja 】  Download Ninja 4.0 Download Ninja 4.0
 結構前に来ていたダウンローダー。
 来襲する前に.htaccessで弾いていたはずだがダウンロードが上手くいっていたっぽい。
 が、試しに体験版でウチをダウンロードしたら、保存は出来るもののディレクトリ構成が無茶苦茶になっていたw
 保存されたページもなんだかオカシイ。なんじゃこりゃ。
 【 Getweb 】 Mozilla/4.0 (compatible; Getweb! 3.12b) Mozilla/4.0 (compatible; Getweb! 3.12b)
 2003年に販売とサポートを終了したらしいけど、最近になってやってきたw
 それにしてもダウンローダーって、GetとかHTMLってつけるのが大好きだよね。
 【 Web Downloader 】 Web Downloader/6.9 Web Downloader/6.9
 英語版がオリジナル?
 ああそういえば「Web」とか「Download」も頻出ワードになってますね。
 こうなるとダウンローダーの名付けテンプレとかがどこかにあるんじゃないかと勘ぐってしまうなあ。
 【 WebStripper 】 WebStripper/2.67 WebStripper/2.67
 「Webサイトをディレクトリ構造を維持してダウンロード」との事。
 ようするにWebsite Explorerみたいなものか?
 「Web」と「ストリッパー」を合成するネーミングセンスに底知れぬパワーを感じるねw
 ま、頑張ってちょ。
 【 GetTheBrunch 】 GetTheBrunch 1.00 GetTheBrunch 1.00
 「えっちでよくないブラウザー」というののダウンロード機能…のようです。
 世の中にはいろんな名前のブラウザーがありますねぇ…。
 【 Irvine 】  Irvine/1.0.3b Irvine/1.0.3b
 Mozilla/4.0 (compatible; MSIE 6.0; Win32)
 やたらめったら有名なダウンローダー。
 デフォルトでUserAgentを詐称しているので、本名を名乗ってくるのは非常に稀。
 そういえばFlashGetとかいうのもデフォルトで詐称してるんでしたっけ。
 きっと普通のブラウザーに見えて実はこれらだったってアクセスもあるんでしょうね。あーやだやだ。
 【 波乗野郎 】 Mozilla/3.0 (compatible; PerMan Surfer 3.0; Win95) Mozilla/3.0 (compatible; PerMan Surfer 3.0; Win95)
 これもGetHTMLと同じ頃に来ていたけど、GetHTMLよりも利用者は少なめ。
 アイコンが冨樫先生みたいで微笑ましいが、うむ、さらばだ。
 
- クローラー
- 
【 Google 】Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
 DoCoMo/1.0/N505i/c20/TB/W20H10 (compatible; Googlebot-Mobile/2.1; +http://www.google.com/bot.html)
 Googlebot-Image/1.0
 ご存知Googleからの使者。
 METAタグによる検索拒否もちゃんと守ってくれて、トップページだけを拾っています。
 画像検索用のロボットもたまに来るみたいだけど、特に何もお持ち帰りされていないみたいで安心(笑)
 一時期トップ以外のページもかなり拾われた事があったけど、削除申請をしたら3日ほどで削除してくれました。
 削除申請を受け付けるだけじゃなく迅速にやってくれるとは…。
 この辺がお高くとまっている某大手検索エンジンとは違いますね。見習え!Yah○○!
 【 Yahoo 】     Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp) Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)
 Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)
 Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)
 KDDI-CA33 UP.Browser/6.2.0.10.4 (compatible; Y!J-SRD/1.0; http://help.yahoo.co.jp/help/jp/search/indexing/indexing-27.html)
 Vodafone/1.0/V705SH (compatible; Y!J-SRD/1.0; http://help.yahoo.co.jp/help/jp/search/indexing/indexing-27.html)
 DoCoMo/2.0 SH902i (compatible; Y!J-SRD/1.0; http://help.yahoo.co.jp/help/jp/search/indexing/indexing-27.html)
 Yahoo! Slurp/Site Explorer
 なんか色々並んでいますが、全部Yahooのクローラーです。もしかしたらまだ増えるかも。
 こいつはね、トップページは全然拾わないくせにアクセスカウンターCGIとかCSSファイルのURLを拾って検索対象にしたり、
 既に削除したページを数年間にわたって検索対象としてインデックスしたりするトンチキな検索エンジンなんですよ。
 もちろんMETAタグもガン無視されて、管理者用ヘルプの通りにしても無駄無駄無駄ッ!
 検索されたくなかったらページを削除するか認証が必要なページにしろってどれだけ上から目線なんですか。
 問い合わせても、「クローラーが勝手にやっていることなのよぉ~」みたいな事を返されてお話になりませんでした。
 
 サイトエクスプローラーなるものが出来ていました。
 サイトオーナーの認証を行えば検索結果に表示するURLを非表示にもできるので、困っている人はお試しあれ。
 【 Yahoo サイトエクスプローラー 】Yahoo! Slurp/Site Explorer
 傍若無人・天衣無縫な態度で検索拒否なんか見えやしねぇ~なYahooのウェブマスターツールがありました。
 しかも日本語版!あのワガママYahooに何があったんですかね~w
 クロールの日付なんかも確認できたりします。
 数年前に削除したページがまだ検索対象になっていたので、バシッと非表示にしておきました。
 これで一安心かな?
 
 sebe500.inktomisearch.com
 【 MSN Live Search 】msnbot/1.0 (+http://search.msn.com/msnbot.htm)
 別に拒否してるわけじゃないんだけど、バリアに引っかかってウチの検索結果の紹介文が気の毒な事になっていた検索エンジンw
 とっても不思議な検索結果を弾き出してくれて、???と思わずにはいられない検索結果がなんともいえない。
 バクチ的に使ってみると面白い…かも。
 【 Bing 】msnbot-media/1.1 (+http://search.msn.com/msnbot.htm)
 元々は上のMSN Live Searchだそうです。
 移転後は特に登録とかしていなかったのですが、いつの間にかこれも来るようになっていました。
 
 msnbot-65-55-230-29.search.msn.com
 
 プロキシの環境変数→FROM:msnbot(at)microsoft.com
 【 百度検索 】Baiduspider+(+http://www.baidu.com/search/spider_jp.html)
 Mozilla/4.0 (compatible; MSIE 5.0; Windows 98; DigExt) ←これを装うことも?
 Mozilla/4.0 (compatible; MSIE 5.0; Windows 98) ←これでrobots.txtを読んでいたこともある
 物凄いアクセス劇を繰り広げたという事ですこぶる評判の悪いクローラー。
 ウチにはポツポツとログが残っている程度なんだけど、この検索エンジンってどうなんでしょうね。
 なんか使いにくいような…。
 【 はてなアンテナ 】Hatena Antenna/0.5 (http://a.hatena.ne.jp/help)
 よく分からないけど数時間おきにやってきていたクローラー。
 はてな?よくGoogleで検索している時に「○○とは」って引っかかるやつだろうか。
 それがウチにもきていたんだ。ほほぉ~。
 【 Nutch 】nutch/Nutch-1.0-dev (nutch)
 REAP-crawler Nutch/Nutch-1.0-dev (Reap Project; http://reap.cs.cmu.edu/REAP-crawler/; Reap Project)
 これもよく分からないけどNutchという検索エンジンのクローラーらしいです。
 公式サイトでは検索エンジンの独占状態がどうとか書いてあるけど、Yahooみたいな粗暴な振る舞いをしなければ何もいうまい。
 【 MARS FLAG 】  一般的なブラウザーを詐称しているものと思われる 一般的なブラウザーを詐称しているものと思われる
 見える!検索エンジンだそうです。
 まあ確かに検索結果と一緒にサイトのサムネイルが表示されるのは初心者受けするかもしれないね。
 そこまでは許すとしても、だ。METAタグ完全無視ってのはいただけない。
 そんなわけでクロールは丁重にお断りしますm(_ _)m
 【 NAVER 】Yeti/0.01 (nhn/1noon, yetibot@naver.com, check robots.txt daily and follow it)
 その筋ではあんまり評判のよくないNAVERのクローラー。
 ウチはあまり好かれていないのか月に数回ぐらいしか来ていなかったようです。
 【 東京大学喜連川豊田研究室のクローラー? 】Steeler/3.3 (http://www.tkl.iis.u-tokyo.ac.jp/~crawler/)
 しばらく前に1回だけ来ていて、UAに記載された参照先も見れないという不思議チャンなクローラー(2009年4月現在は復活)
 以前は検索エンジンの研究の一環だとか参照先に書かれていた気がしたんですが、研究は無事に終了したんでしょうか。
 【 Ask.com Search Engine 】Mozilla/2.0 (compatible; Ask Jeeves/Teoma; +http://about.ask.com/en/docs/about/webmasters.shtml)
 なぜか存在しないページを何度何度ももリクエストしてきていた謎のクローラー。
 参照先を見てみると、METAタグの記述にも従うしrobots.txtも読んでくれるそうで、紳士的と言えるのかもしれない。
 トップページはなんとなくMacOSを彷彿させる作りで、クッキーが有効ならスキンの変更も出来るみたいです。
 【 SAGOOL 】Mozilla/5.0 (Windows; U; Windows NT 5.1; ja; rv:1.8.1.7) Gecko/20070914 Firefox/2.0.0.7/Mozilla/5.0 (MaSagool; http://sagool.jp/)
 たま~に足跡が残っているカラフルな検索エンジン。
 かなり前に削除して閲覧しようがないはずのページに痕跡が残っていたりして、なにやらこれも不思議チャン。
 せっかくなのでSAGOOLでウチを検索してみたけど全然引っかからなくて、どうやら冷やかしだったようです?
 【 Yodao 】Mozilla/5.0 (compatible; YodaoBot/1.0; http://www.yodao.com/help/webmaster/spider/; )
 これも思い出したようにやってくるよく分からない検索エンジン…。
 GoogleとYahooを意識しているっぽいデザインだが、あ~、とりあえずアク禁でいいかな?
 【 ICC-Crawler 】 ICC-Crawler-3(Mozilla-compatible; icc-crawl-contact(at)ml(dot)nict(dot)go(dot)jp; http://kc.nict.go.jp/icc/crawl.html) ICC-Crawler-3(Mozilla-compatible; icc-crawl-contact(at)ml(dot)nict(dot)go(dot)jp; http://kc.nict.go.jp/icc/crawl.html)
 東京大学近山・田浦研究室で研究の為に使われているクローラーだそうです。
 METAタグにもrobots.txtにも従うとの事。
 東京大学ではクローラーの研究って流行っているのか?
 しかし存在しないページを2時間半もリクエストしてくる様子を見ると、研究結果は芳しくないようだ。
 Mozilla/5.0 (compatible; BecomeJPBot/2.3; MSIE 6.0 compatible; +http://www.become.co.jp/site_owners.html)
 UAにある参照先を見ても商品の検索がどうとか。
 site_owners.htmlってところからしておそらくは注意書きが見れるページを用意したかったんだろうけど、よく分かりません。
 って思っていたんだけど、いつの間にかサイトオーナー向けのページにリダイレクトされるようになってました。
 robots.txtは守ると言っているようだけど、検索してみたらMETAタグでの検索拒否を無視するとかあったので、
 第二のYahoo悲劇にならない為にもお断りしておきましょうかね。
 Yanga WorldSearch Bot v1.1/beta (http://www.yanga.co.uk/)
 はじめまして。
 う~ん、なんなのか分かんないね~。
 
 91.205.124.12
 Gaisbot/3.0+(robot06@gais.cs.ccu.edu.tw;+http://gais.cs.ccu.edu.tw/robot.php)
 ここのスペースにきて初めてお目にかかったボット。
 いきなり403に引っかかったということは、何か良からぬことをしているんじゃああるまいな…。
 
 ll-122-147-76-66.ll.sparqnet.net
 Mozilla/5.0 (Twiceler-0.9 http://www.cuil.com/twiceler/robot.html)
 これまたここのスペースにきて初めてお目にかかったボット。
 ウェブマスター向けのページを見ると、robots.txtは読むようになっているらしいです。
 おかしなマネをしなければ何も言うまい。
 
 crawl-11c.cuil.com
 
- ウェブサイト引用(?)サービス
- 
【 Internet Archive 】     ia_archiver ia_archiver
 Mozilla/5.0 (compatible; archive.org_bot/1.13.1x +http://crawler.archive.org)
 ia_archiver-web.archive.org
 ia_archiver (+http://www.alexa.com/site/help/webmasters; crawler@alexa.com)
 2006年ぐらいから急に利用者が増えたような気がするInternet Archiveです。
 ず~っと前のジオシティーズ時代の未熟なページがMETAタグで拒否していたのに拾われてまして、いや~これには参ったワイ!
 引っ越してきてからもやっぱりMETAタグによる検索拒否を無視されてバッチリ拾われていたんですが、
 あれは2005年ぐらいだったか、このInternet Archiveが今みたいに有名になる前のことでしたが、
 運営元に削除依頼のメールを出してなんとか事なきを得ました。
 ページ収集を許可する理由は何もないのでもちろんアク禁。
 その後も「ia_archiver」が幾度となく訪問していたようですが全て403Forbiddenに飛ばされていたみたいで、今は平和です。
 環境変数・HTTP_FROMでcrawler@alexa.comとかigor@archive.orgを吐いてくるのもなんともいえませんな。
 稀にクッキーやリファラーを残すこともある???
 
 ec2-67-202-54-191.compute-1.amazonaws.com
 xcrawl100.alexa.com
 64.208.172.172
 67.202.54.191
 207.241.227.81
 207.241.227.91
 207.241.227.95
 207.241.227.70
 他多数
 
 クッキー?
 CFGLOBALS=urltoken%3DCFID%23%3D837993%26CFTOKEN%23%3D9895813%23lastvisit%3D%7Bts%20%272007%2D07%2D14%2016%3A40%3A49%27%7D%23timecreated%3D%7Bts%20%272007%2D07%2D14%2016%3A34%3A09%27%7D%23hitcount%3D8%23cftoken%3D9895813%23cfid%3D837993%23; CFID=837993; CFMAGIC=837993%3A9895813; CFTOKEN=9895813; XTCsid=de01e6ce97b05b0f3ae0f6efc67502f1
 【 ウェブ魚拓 】                                     Megalodon(http://megalodon.jp/) Megalodon(http://megalodon.jp/)
 Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.0.12) Gecko/20071126 Fedora/1.5.0.12-7.fc6 Firefox/1.5.0.12
 Mozilla/5.0 (X11; U; Linux x86_64; en-US; rv:1.9.1.2) Gecko/20090803 Fedora/3.5.2-2.fc11 Firefox/3.5.2
 Mozilla/4.0 (compatible; MSIE 7.0; Windows XP)
 「引用は日本国憲法で認められている行為である」というプロパガンダを掲げてご活躍中のサービスでーすwww
 魚拓運営開始のかなり初期の段階でその存在を突き止めていたので先手を打って拒否してやりました。
 案の定ページを保存しようとして403Forbiddenが保存されているログがちらほら見られますねw
 個人サイトのメインコンテンツを誰でも見れるところに「丸ごと保存」する行為のどこが「引用」なのか説明して欲しいwww
 
 仮に魚拓を取れたとして、その後はどうするつもりだったんですかね。
 自分さえよければ複製したページは残ったままてもかまわない、という思惑が見え隠れして悲しい気分になります。
 最近では引用する範囲を指定できるようになったようだけど、それでもこいつは受け入れがたい存在です。
 METAタグで検索拒否をしているページは「丸ごと」が使えなくなったけど、以前のスタイルではやはり問題があったのだろう。
 まあ、今でも十分に大問題なんだけどw
 
 ちなみに、ウェブ魚拓は「引用」する時には吐き出すUserAgentを堂々と詐称してくる。
 それが上記に記述したFirefoxのUAなんだけど、モニタの解像度900×4000というおかしな数値を吐くのでモロバレ。
 しかも今時Firefoxの1.5ってちょっと古くないか…。
 「丸ごと」では本名を名乗ってくるようだが、どちらにしてもお断りである。
 
 UAで弾いても「引用」か「丸ごと」のどちらかは無効だったと思うので、弾くのならIPで弾きます。
 以下はウェブ魚拓が吐き出すリモートホストやIPの流れ。
 ドメイン検索で変換しようとしても一方通行にしか変換できませんでした。
 
 s04.megalodon.jp → 216.98.130.25 → fc613025.aspadmin.net
 s03.megalodon.jp → 216.98.130.26 → fc613026.aspadmin.net
 s01.megalodon.jp → 71.6.145.82 → fc614582.aspadmin.net
 s02.megalodon.jp → 71.6.145.92 → fc614592.aspadmin.net
 
 2009年10月4日現在はこう。
 s04.megalodon.jp → 216.75.62.120 → fc1062120.aspadmin.net
 s03.megalodon.jp → 66.240.243.153 → fc10243153.aspadmin.net
 s01.megalodon.jp → 71.6.150.12 → fc1015012.aspadmin.net
 s02.megalodon.jp → 71.6.203.27 → fc1020327.aspadmin.net
 
 megalodon.jpとaspadmin.netのリモートホストではどういうわけか弾けないけどIPでなら引用も丸ごとも弾けました。
 .htaccessで弾けば大丈夫だったけど、CGIとかPHPで弾いた場合は分からないな。
 「丸ごと」をrobots.txtで弾いてやるとこんな画面が表示されますww
 こうやってエラー画面を「引用」するのはOKなんですよね?
 
 
 ※2009年10月4日追加
 
 使用するサーバーを変えたのか、吐き出すリモートホストが変わっています。
 詐称するブラウザーもFirefoxの3.5.2になり、ますます磨きがかかってきましたねwww
 
 st0058.nas951.sendai.nttpc.ne.jp
 
 固定ではない感じ?なので、nas951.sendai.nttpc.ne.jpで弾きました。
 このプロバイダーを使っている仙台の人は巻き添えって形になりますかねぇ…。
 恨むのなら魚拓を恨んでください。
 
 ※2011年2月10日追加
 
 いつの間にかまたサーバーを変えたみたい。
 「引用」がなぜか利用不可。まあどうでもいいけど。
 「まるごと」で詐称するブラウザーがなぜかIEに変わったけど、相変わらずインチキくさい名前を使っていますね。
 
 182.48.59.200
 www17406u.sakura.ne.jp
 Mozilla/4.0 (compatible; MSIE 7.0; Windows XP)
 
 UAにWindows XPって…。
 いかにもウソっぽいのでこれをアク禁にしてねってことなんだよな?www
 【 存在証明サービス 】 Java/1.5.0_11 Java/1.5.0_11
 茨城大学工学部米倉研究室にて稼動中のサービス。
 これも「Java/○○○○」と名乗ってきます。やはり「Java/○○○○」はこんな奴らばかりなのか?
 ページを保存すると圧縮ファイルが生成され、解凍するにはしかるべき手順を踏む必要がある…みたいです。
 その時点でそのページが本当に存在したのかを証明するのが目的のようだが、どんな場面で必要なのか見当も付きません。
 手順が面倒なので保存目的で使われることは少なそうだけど、念のために拒絶しておこうかな。ではごきげんよう~!
 
 www.existingproof.jp
 210.250.55.120
 【 LookLeap 】    Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0) Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)
 URLを短縮すると同時にそのページのキャッシュも生成するサービス。
 日本語が含まれているとキャッシュされても壮大に文字化けしてしまうようなので、危険度-1でw
 UAはMSIEを詐称してくるようなので、リモートホストやIPで弾きませう。
 
 lookleap.com
 alpha.flipforms.com
 204.10.140.52
 【 Yahoo!ブックマーク 】  Mozilla/5.0 (compatible; BMF/1.0 (Y!J-AGENT)) Mozilla/5.0 (compatible; BMF/1.0 (Y!J-AGENT))
 PCではなくWEBにお気に入りを保存して出先からでもお気に入りを利用する…というサービスのようです。
 Myブックマークを公開して皆で共有するというような使い方も出来るらしいです。
 と、ここまでは別にいいんですが、ブックマークする時にページのキャッシュも作るのがいただけない。
 試しに自分のMyブックマークを作成してウチを登録してみたところ、なぜかキャッシュが表示不可。
 なんで?と思ったら、以前に弾いた怪しげなクローラーがYahooブックマークだった模様w
 ブックマークからウチに飛んだら、数分後にこれのクローラーらしきものが来たのを確認したので引き続き拒否設定にしておきますね。
 UAで弾いても大丈夫みたいだけど、万全を期す為にホストやIPでも弾いておくことにします。
 
 bm-proxy01.ssearch.ogk.yahoo.co.jp
 124.83.159.186
 bm-proxy02.ssearch.ogk.yahoo.co.jp
 124.83.159.187
 Mozilla/5.0 (X11; U; Linux x86_64; en-US; rv:1.8.1.14) Gecko/20080416 HeartRails_Capture/0.6 (+http://capture.heartrails.com/) BonEcho/2.0.0.14
 あの鬱陶しくてしょうがないウェブ魚拓と非常によく似たサービスが登場!
 魚拓よろしく引用範囲を指定出来るようです。
 パクリ元にリンクがあった場合はそれも再現する事が出来るようだけど、ウチには全く必要ないサービスですね。
 こういうサービスも使い方次第だと思うんだけど、実際には転載やいやがらせ目的で使われることが多いから、自衛の為に拒否しなくてはならない。
 
 67-220-193-118.hosted.static.webnx.com
 67.220.193.118
 159.160.192.61.east.global.alpha-net.ne.jp
 61.192.160.159
 【 backupURL 】     UAを吐かない UAを吐かない
 またしてもウェブ魚拓系のうざ~いサービスが登場しなすった('A`)
 FAQでいろいろ書いているけど、こういうのって必ず悪用する奴が出てくるから、決して相容れることはない!
 試してみたところ、アクセス解析に残ったのはIPだけだったw
 覆い隠せるものは全部隠してるって感じ。
 IPで弾くしかないなあ。
 
 66.71.253.25
 
- その他
- 
【 AlexaToolbar 】 Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Alexa Toolbar) みたいなの Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Alexa Toolbar) みたいなの
 よく分からないサービスだがデータをInternet Archiveに提供しているらしい…。
 AlexaToolbar自体には何の恨みもないんだけど、万が一という事も考えられるのでバシッとお断りします。
 【 やたらと長かったり怪しかったりするUA 】Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1) ; Embedded Web Browser from: http://bsalsa.com/; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30; .NET CLR 3.0.04506.648) みたいなの
 こんな感じでやたらめったら長~いUserAgentを吐いてくる人がたまにいるんですよね~。
 「bsalsa.com」って含まれているケースが非常に多いです。メーカーの回し者かなんかだろうか?
 あと、UAにわざわざ「User-agent:」って含まれているのはワタシ騙す気マンマンですって感じですねw
 「WinXP」って入れる奴もあからさまに怪しいです。昔のウェブ魚拓がそうですね。
 そういう得体の知れない連中はお引取り願いましょうか。
 【 空白 】
 本当に1文字も吐かない。
 ホームページ編集ソフトとかダウンローダーを喰らった時とかにそうなる事があるんだよね…。
 プロキシにもたまにUAをブロックするのがあるみたい。
 何かコソコソして男らしくないので、断る。
 【 CM? 】【川向】ヨコチのペット ヨコチのペット かわいい、かわいいおともだち!【あっちむいてほい!!】
 な・なんなんだろうねこれは^^;
 検索してみたところ、ヨコチのペットというのは静岡県内でやってたCMに関係しているっぽい。
 静岡県のローカルCMについての詳細は不明だが、こういう面白いUAは歓迎しますのでどんどんやってくださいw
 【 いやがらせその1 】-------------------------------------------------------------------------------------------------------
 このようにハイフンだけをバーッと並べて吐いて来る人がごくたまにいます。
 このUAが残されているログを見てみるとISPが同じだったので、おそらくは同一人物。
 UAさえも知られたくないシャイボーイ…かどうかは不明だが、
 RPGで「ああああ」って名前をつけてるみたいな手抜き具合が好きじゃないなあ。
 本人のやる気が全然感じられないし、せっかくUAを偽装するんだったらもっと趣向を凝らして欲しいよね。
 【 いやがらせその2 】Mozilla/5.0 (000000000; 0; 000 000 00 0 0000000; 00000) 000000000000000000 0000000 0000 000000 0000000000000 0000000000000
 うぜぇ~~~!!
 こういうのが好きな人には悪いんだけどさ、こうやって同じ文字を使いまくる手抜き作品は大嫌いなんだよね。
 アクセスログが無駄に汚れるから い り ま せ ん 。
 【 HTML Get 】HTML Get
 UAに「HTML Get」とだけ表示されている謎の存在。
 名前からすると新手のダウンローダーかなにかだろうか?
 痕跡を残していく人もバラバラで普通のプロバイダーを使っている一般人のようだが、何が目的なのか本当に謎。
 これを残していった人は過去にウチを訪れたログも残っておらず、
 もしかしたらウィルスによるアクセスではないか?なんて考えてしまいますね~。
 【 新手のダウンローダー? 】HTTP Get Test Application ver-1.00
 もう一つの謎の存在。
 検索してみるとそれらしいものが見つかるけど、ダウンローダーっぽいなあ。
 とりあえず断る。
 【 HTMLParser 】HTMLParser/1.6
 なんかよく分からないけど、HTMLの構成を書き出したり整形したりするらしい。
 名前がダウンローダーを連想させて不吉なので断る。
 【 ライブドア? 】livedoor HttpClient/0.1
 なんだろう…これ。
 ログに紛れていたんだけどサッパリ分かりません。
 【 MEGAUPLOAD 】MEGAUPLOAD 1.0
 オンラインストレージサービスだそうです。
 かなり前からこれを名乗ってくる人が多くて気になっていたので調べてみたところ、
 ムフフな動画とか公開する時によく使われるみたいですねw
 【 google mobile proxy 】Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; Google Wireless Transcoder;)
 google mobile proxyというところを経由させるとこのUAになるみたいです。
 そういえば携帯でググって検索結果からサイトを開くと自動的にこれを中継していたような…。
 アクセス解析によってはUAが空白になっている事もある。
 Google-Sitemaps/1.0
 Googleのウェブマスターツールでrobots.txtを確認しようとしたら吐いてきました。
 特に有害ではないと思うけど、心当たりが無いのにこれが残っていたらちょっと嫌かもしれない。
 【 2ch用ブラウザー 】Monazilla/1.00 (cockcrow/2.5.5.4)
 Hotzonu/2.0
 モナジラとホットゾヌ…ねらーが来ていたようですね。
 リファラーが残ってなかったからどのスレかは分からないけど、今日もまた2chで晒されているのかな。
 どうかお手柔らかにお願いしますよwwwwwwwww
 【 Xenu Link Sleuth 】Xenu Link Sleuth 1.2h
 ウェブサイトのリンク切れを検索するのだそう。
 言っとくがウチは(あんまり)リンク切れなんかしてないぞ!
 【 KamiProfessional 】KamiProfessional
 Webページのテキストや画像をレイアウトそのままに取り込めるスクラップソフト…だそうです。
 こういうのまでアクセスログに残ることもあるんですねぇ。
 【 DiffBrowser 】DiffBrowser/0.70 (Windows)
 サイトの更新チェッカーのようです。
 更新状況も表示してくれるみたいだが…これを使われてもあまり嬉しいと思わないなあ。
 なんで嬉しくないかは分からないんだけど、本能的にヤダ。
 IEFav172Free
 これもサイトの更新チェッカーでした。
 更新チェックの他に、サーバーソフトは何を使っているのかも分かる場合はあるみたいです。
 お気に入りを、テキスト・HTML・CSV形式で出力する事も可能。
 特に害はないようだけど、荒らしが使っていたプロバイダーのユーザーが使っていたからあんまり印象が良くないんだよね。
 というわけで丁重にお断りします。恨むのなら荒らしを恨んでください^^;
 【 DLC 】DLC/0.55
 IEの「お気に入り」にあるショートカットがリンク切れしていないか調べるツールだそうです。
 【 ファミコン? 】Family Computer (compatible; Family Basic V3)
 まあおそらくネタで詐称してるんでしょうけど、せめてスーファミぐらいにしようよー。
 ファミリーベーシックもそれっぽくて捨てがたいが、スーファミでもマリオペイントでマウス使ってたんだよ。
 噂ではメガドライブはインターネットに接続できたらしいから、今度はその線で。ね?
 【 PS3 】Mozilla/5.0 (PLAYSTATION 3; 1.00)
 パラパラとログが残っているけど、これの普及率ってどうなんでしょうね。
 個人的にはバー○ャル○ーイと同じ運命を辿るのではないかとハラハラしてるんですがw
 コード検索エンジンから来ている人が多いけど、バリアに反応してマトモに見れてないっぽいなあ。
 もしかしてPSPと同じブラウザーだったりするんだろうか。
 ウチはパソコン以外でブラウジングするとメタクソになるのが大弱点だなあ。
 【 ブログ用ツール? 】URI::Fetch/0.04
 WWW::Mechanize::Cached
 LWP::UserAgent::WithCache
 検索するとブログ用っぽかったけどイミフ。
 説明を読んでいてもよく分からないけど、あまりありがたい恩恵を受けられるわけでもなさそう。
 トラックバックみたいなものか?
 なんにしても特に必要を感じないのでとりあえず拒否で。
 【 パストラック 】Pathtraq/0.1 Gungho/0.09005
 「パストラックは、ウェブブラウザの拡張ソフトウェアを利用してみんなでつくるアクセスランキングサイトです。」との事。
 悪さしているわけではないようだが、こちらに何か有益なものをもたらしてくれるとも思えないので拒否で。
 【 CamelStampede 】CamelStampede/0.0.7(beta)
 突如現れた謎のUAで、検索してみても詳細不明。
 ダウンローダーなのかクローラーなのかブラウザーなのか、はたまた全く未知の存在なのか?
 単にUAを詐称しているブラウザーだったってのが一番可能性が高いような気がする。
 【 Another HTML-lint 】Another_HTML-lint/1.20 +libwww-perl/5.801
 知ってる人はよく知ってる、HTML文法チェックのAnotherHTMLです。
 弾くつもりはなかったのだけど、UAにダウンローダーと同じ文字が入っているために結果的に弾かれる事に…。
 URLでチェックするのは無理だけど、ソースを貼り付けてチェックは出来るので安心(?)
 【 EmptyBrowser 】EmptyBrowser
 PCサイトも携帯サイトのように見れる…らしいです。
 
 s10.coreserver.jp【 aguse 】Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.4) Gecko/2008111319 CentOS/3.0.4-1.el5.centos Firefox/3.0.4
 サイトが危なくないか確認できるらしいです。スクリーンショットつきで。
 こういうのって存在自体は良いものだと思うのだけど、必ず悪用する輩が出てくるので残念ですが弾きますね。
 
 i58-89-52-124.s05.a023.ap.plala.or.jp【 OSSProxy 】OSSProxy 1.3.325.362 (Build 325.362 Win32 en-us)(Jan 29 2010 14:15:34)
 検索してみたらシマンテックのページでスパイウェアとして扱われていました。
 しかしこれを残していった人は次々とブラウザーを変えてアクセスしてきていることから、
 感染してしまって意図せず残したのではなく、ハッキリとした目的があってこのUAを残したものと思われます。
 そーいう事は止めて欲しいのですがね…。
 
 softbank221077078081.bbtec.net【 とにかく長い! 】Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; GTB6.4; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; msn OptimizedIE8;JAJP; AskTB5.6; 7879056903; runtime 11.00231; 796806474703; 8888019603; 69790903; 79880703; 87990117603; 7998005903; 8769002803; 7889018903; 78990703; 89770803; 78990676803; 989703492803; 97680603; 96890903; 89770903; 887809783603; 879906803; 967907923803; 8779090603; 669607603; 89870665803; 8888093803; 999606291803; 886808631903; 87690803; 9669049803; 97690291603; 89970781703; 897708703; 99660113803; 6969064903)
 凄いです!ここまで長ったらしいUAははじめて見ましたw
 意図してこういうのにしているのかそれともソフトをインストールしまくったらこうなったのか…。
 どちらにしても貴重な存在ですw
 
 pxxxx-ipngn401hodogaya.kanagawa.ocn.ne.jp
- あとがき
- 
はいでー!や~っと書き終わった!
 どのUAに対してもかなり辛口だけど、Web保存サービスとYahooについては本当に酷いですね~。
 ダウンローダーには全部ガイコツマークをつけてもいいぐらいだと思っています。
 わざわざツールで探っても、存在しないものは差し上げられませんよw
 一応ガイコツマークをつけるのは1~5個としていましたが、ウェブ魚拓だけは相当嫌いなので特盛りにしてあげましたw
 
 余談ではありますが、こういう特殊なUAってなかなかアクセス解析にひっかからないですね。
 Yahooのクローラーとか以前は忍者の解析に引っかかっていたのですが、
 クローラーが進化したのか解析が退化したのか今はすり抜け状態にw
 このスペースだったらサーバーログを確認するって手もあります。ちょっと目が疲れますが。
 1日のアクセス数が200~300程度でもダウンローダーやクローラーって結構頻繁に来ていてビックリしました。
 今後も新手のスタンド使いが次々と現れてくるのかね('A`)