WEB制作知識

インデックスページ、クローラーとは?

インデックスとは

目次あるいは目次として登録されている状態のことをいいます。
ホームページのトップページや、製品ページ、最上層ページなど、他のページへのアクセ
スするための起点となるページを指すこともあります。
検索エンジンが世界中に存在する無数のホームページを瞬時に見つけることができるのは
、検索エンジンを提供している会社が、常に全世界のホームページのデータを収集し、自
社のデータベースに登録しているから。
ホームページのタイトルなど情報を限定して登録することで高速性を確保しています。
この登録作業をインデックスと呼びます。

サイトをツリー型の構造にするとユーザが目的の情報にたどり着きやすく、SEO的に有利
になる。
下層ページが深すぎるとユーザのクリック数が多くなり、途中のページにも戻りにくく、
クローラーからも検知されにくい。

検索エンジンとは
インターネット上のコンテンツを検索するサービスの総称
現在はロボット型
ロボット型検索エンジンは3つのプログラムで構成されている
・WEBサイトの情報(HTMLや画像)を集めてデータベース化するプログラム
・上記で収集した情報を分析し、評価するプログラム
・検索サイトで入力されたキーワードに対して、評価に基づき検索結果を表示するプログ
ラム
クローラーに検索されやすくするためには
1.Googleにクロールをリクエストする
Google Search Consoleと いう無料ツールから「URL検査」という機能を使ってリクエス
トします。

  1. URLの正規化
    同じページに2つのURLがあると重複コンテンツと見なされ、クロー ルの頻度が減ってし
    まいます。複数あるURLは一つに統一しましょう。
  2. URLの階層は3段までにする
     すべてのページをトップページから2クリックで行けるように設計します。
  3. リンクはテキストで設定する