旧・無印吉澤

昔はてなダイアリーに書いていた記事のアーカイブです

米Overture、32億文書をインデックスした“世界最大”の検索エンジン(Internet Watch)

http://internet.watch.impress.co.jp/cda/news/2003/08/22/216.html

米Overtureは21日、同社が4月に買収したFast Search and Transfer(FAST)のWeb検索部門が検索エンジンのインデックスとしては“世界最大”となる32億文書のインデックスを完了したと発表した。このインデックスは現在AlltheWeb.comから利用できる。

(略)

サーチエンジンの評価は簡単にできるものではないが、日本語を使って実際にAlltheWeb.comでいくつかのテストを行なってみたところ、明らかに表示順位が変わったことのほか、Googleにはまだ及ばないものの、従来に比べて検索結果が的確になった印象を持った。

というわけで早速試してみました。検索精度自体は比べてみても、実際どちらがどうこうと言えるほどにはわからなかったのですが……。とりあえずAlltheWeb.comの方はまだgoogleと違って「日本語のページを検索」ということが出来ません(「Japanese and English」までは指定できる)。あとは、インデックスしている文書の量が多い弊害でしょうが、googleほどに新しいサイトは捕捉できてませんね。例えば、今現在AlltheWebで「Overture 世界最大 検索エンジン」と検索しても上の記事にはたどり着けなかったりします*1。そのうち、早さのgoogleと検索精度のAlltheWebみたいに棲み分けが起こったりするんでしょうか?(本音:googleと比べて大したインパクトも無いし、こりゃダメだろ……)

参考:Googleが1日前の情報も検索可能に〜ニュースサイトや日記も含まれる
http://www.watch.impress.co.jp/internet/www/article/2001/0820/google.htm

*1:ちなみに、7月下旬に出来たこのサイトも捕捉できてませんでした。