ホーム » ブックマーク » 検索エンジンの仕組みをおさらい。クローラー対策とステータスコード
検索エンジンの仕組みをおさらい。クローラー対策とステータスコード
元記事⇒ 検索エンジンの仕組みをおさらい。クローラー対策とステータスコード
登録日 2014年5月20日 11:46 AM記事内容 :登録日 2014年5月20日 11:46 AM
タグ:クローラー余談ですが、Googleではインデックスしたページが1兆ページを超えたそうです(Googleのオフィシャルブログの投稿より)。クローラーはそのページに変更がないかを確認するため同一ページを何度も取得しに来ますから、インデックス数以上のクローリングを行っているということになります。膨大なリクエスト数だと想像できます。
開発者の観点から考えると最大処理数に制限をかけるということも考えられます(あくまで可能性ですが)。
メモ/関連情報いかにインデックスさせるかという考えから脱却しなくては・・・