ニュースの読み方 / あなたの知らない検索エンジンの秘密
【あなたの知らない検索エンジンの秘密】Amazonの書籍データが自由に検索できる日がやってくる?
2002年11月6日
どうなる? インクトゥミの将来
 |

筆者のジェフ・ルート(Jeff Root)。イージャパン(株)(http://www.ejapaninc.com/)でチーフSEOスペシャリストとして働く。日本には出たり入ったりで早や10年。北米と中央アメリカでも、SEOの仕事の経験を積んできた。 |
米インクトゥミ(Inktomi)社が、第4会計四半期と通年(2001年10月〜2002年9月)の決算結果を発表した。第4四半期の売上高は2040万ドル(約25億円)。同期の損失は1億3160万ドル(約160億円)だった。これは1株あたり0.87ドル(約106円)の損失ということになるね。2002年通年では、1億1270万ドル(約137億円)の売り上げがあり、損失は5億80万ドル(約610億円)、1株あたり3.51ドル(約427円)だった。でも彼らは、まだ銀行には4540万ドル(約55億2000万円)の現金があると言っている。
インクトゥミのデビッド・ピーターシュミット(David Peterschmidt)CEOは、こんな風にコメントしている。「非常に厳しい環境の中で、全体の売り上げ目標を達成した。次の四半期には、検索エンジン業界に集中的に力を注ぎ、財務を慎重に管理し、ねばり強く顧客を獲得し、新しい製品を開発する。そうした努力によって、株主と市場に価値を与える道筋を作りたい」。
ふぅむ、どうなることやら。何でもいいけど、平和裡に話が進んでほしいものだね。
ところで、日本のgooの検索エンジンは、インクトゥミをベースにしているんだった。
 |

膨大な書籍データベースを擁するAmazonのサイト。このデータベースがグーグルなどの検索エンジンから検索できるようになれば、ウェブの世界はまた大きく変わるだろう |
データベースを最適化する
検索エンジンの障害物になっているもののひとつに、データベースがある。最近データベースに収容されたウェブがどんどん増えているということは、検索エンジンのプログラマーたちにとっては今や常識になりつつある。たとえば.aspや.phpで構成されたEコマースのサイト。こうしたデータベースはご存じのように、発せられたリクエストに応じて自動的にレスポンスを生成する。たとえばウェブブラウザーのフォームに何かを入力すると、特定のページが返される、といった具合。
しかしロボットはたいていの場合、フォームを埋めたり、ダイアログにキーワードを入力したりといった、人間がデータベースから情報を取り出す際に行なうような手作業はできない。ロボットがデータベースの中身を参照できるようにコーディングされている場合もあるが、たとえばグーグルのロボットである“グーグルボット”(Googlebot)だとそうしたデータベースでもコンテンツの一部しか見に行かない。グーグルはこんなふうに説明している。
「動的に生成されたページをインデックス化することは可能だ。しかしわれわれのグーグルボットは動的なコンテンツをサポートしたサイトを壊してしまうことが多いため、動的ページのインデックス化には制限をかけている」
ではどうすればいいのだろう? ロボットを引きつけるひとつの方法は、動的なコンテンツを静的なHTMLページに自動的に変換して発行してくれるソフトウェアを利用することだ。それはブリッジのようなイメージだ。あなたのデータベースは片側にあり、グーグルからのアクセスは反対側にある。グーグルのロボットがデータベースに入り込んでデータの一部だけを収集していくかわりに、この種のソフトを使ってコンテンツのすべてのデータを引き出し、グーグルボットが好む場所――つまり静的なHTMLページの中に置いておく。この方法は実は僕が働いているイージャパンが採っている手法で、まあだから僕がこの手法に偏ってしまうのも仕方ないよね。でも僕がこの手法をお勧めするのは、いちばんうまく行くからなんだよ。
巨大なデータベースとグーグルのロボットの間のギャップを埋めるもうひとつの方法――それはネットを駆けめぐっている噂の域を出ないのだけれど――グーグルと交渉することだ。その噂によれば、グーグルはいま、米国内の200以上の企業と交渉し、彼らのデータベースをグーグルボットで扱えるように話を進めているという。たとえばアマゾン・ドット・コム(Amazon.com)やCDNOW、イーベイ(eBay)といった企業のデータベースは非常に大きく、そして非常に有意義だ。もしグーグルのこの計画が遂行されれば、Eコマースサイトへの影響は非常に大きいし、今後のEコマースサイトのあり方自体を変えていく可能性もある。そうなればSEO(検索エンジン最適化)もHTMLページを最適化するかわりに、RDDLファイルやRDFファイル、XMLコンテンツ、XSLTテンプレートなんかを最適化できるようになる。もっともそうなってもキーフレーズの選び方自体の重要性は変わらないと思うけどね。
この話は来週、もっと詳しくお伝えできそうだ。お楽しみに。
さて今週のSEO講座は、イージャパンのSEOスペシャリストでちょっとシャイな松下智がお届けする。文字コードの指定方法だ。
Contents...
|