検索エンジンを調べる(4) … タイトル・概要と記事全文の把握時期にずれ?-3
(前の記事からの続き)
→「検索エンジンを調べる(1)」
→「検索エンジンを調べる(2)」
→「検索エンジンを調べる(3)」
前回、前々回の結果を見ると、この記事のタイトルにあるように、
検索エンジンが「タイトル・概要」と「記事全文」のそれぞれを把握する時期にずれがあるのではないか、
と思えてくる。
本文末尾の「番号と日付」をキーワードとする「検索エンジンを調べる(2)」の検索では、新しい記事は検索結果に含まれなかった。
しかし、記事のタイトルをキーワードとする「検索エンジンを調べる(3)」の検索では、(2)の結果に含まれなかったものも表示された。(ただし、個別記事ページの表示が期待された YAHOO! JAPAN の結果でも、1件を除いてトップ・ページが表示された。)
この結果をみても、タイトル等が先に把握され、記事全文の把握(データベース化)は、その少し後になっているのではないかと思える。
実は、「タイトル・概要と記事全文の把握時期にずれ」があるとすれば、その主たる原因は、「記事公開時のping送信の効果が反映されるタイミング」と「検索エンジンのクローラーによるデータ収集のタイミング」との時間差にあるのではないかと、密かに考えている。 (もっとも、「記事公開時のping送信」が、ブログ検索ではなく、一般のウェブ検索にどの程度関係しているのかは不明だが…。)
ここまでの調査でその状況証拠はそろったようにも思えるが、検索エンジンの活動も結構活発なようで、YAHOO! JAPAN の予定外(?)の動きで、きょうの検索で意外な結果が出た。
昨日公開した一つ前の記事のタイトル「検索エンジンを調べる(3) … タイトル・概要と記事全文の把握時期にずれ?-2」をキーワードとして検索してみると、次のようになる。
*YAHOO! JAPAN … 検索結果は1件だけで、それがこのブログのトップ・ページ(keyboard.at.webry.info)であった。「キャッシュ」をクリックしてみると、昨日公開した記事も含めて、トップページの全文が表示された。
*Google … 「該当するページが見つかりませんでした。」と表示された。
次に、前の記事の本文末尾に記載してある「番号と日付」の部分「H120/C:2006.08.21」をキーワードとして検索すると、次のようになる。
*YAHOO! JAPAN … 検検索結果のトップににこのブログのトップ・ページ(keyboard.at.webry.info)が表示された。
*Google … 「該当するページが見つかりませんでした。」と表示された。
どうも昨日の記事を公開した後、 YAHOO! JAPAN のクローラーがこのブログを訪れて、データを収集したようである。(ただし、データベース化されたのはトップ・ページだけで、個別記事のページは把握されていないようだ。)
トップ・ページが YAHOO! JAPAN に早々と全文把握されてしまったので、最新の記事については「タイトル・概要と記事全文の把握時期にずれ」に関する調査ができなくなってしまった。
次の記事でも、引き続き、追加の調査とそれを含めた結果の分析を行う予定である。
(次の記事につづく)
---------------------
<このブログのテーマ(抜粋)> PC 周辺機器 ベータ版を使う インターネット アクセスアップ 検索エンジン セキュリティ ファッション 雑貨 生活 食器・キッチン 美容・健康 ギフト 音楽 本 映画
<<<H121/C:2006.08.22/{検索、検索エンジン、アクセス アップ、YAHOO! JAPAN、Google、ブログ、インターネット}>>>

この記事へのコメント