Webデザインの教科書
- URLの正規化 -
Scroll

簡単に出来るURLの正規化と正しい使い方

Webページを公開した時に絶対やってほしいURLの正規化。

もしかすると初めて聞く言葉かも知れません。

とても重要なことなので、ぜひやってみてください。

URLの正規化とは?

INDEX sheep.com
http://sheep.com/
https://sheep.com/
http://www.sheep.com/
https://www.sheep.com/

制作したWebページを公開すると、URLからページを開くことが出来ます。

実はアクセス出来るURLは1つではなく、複数のURLでアクセスすることが出来ます。

すべて同じページなのに、複数のURLが存在すると不都合なことがあります。

  • Googleの検索順位に悪影響
    sheep.com
    ヒツジがふわふわな理由5つ

    ページを公開すると、検索に引っかかる状態になります。

    その際になるべく上位に表示されるように、適切に設定をしなければなりません。

    そのためにはまず、Google検索の簡単な仕組みを知る必要があります。

    • URLに評価をつける

      Googleは質の高いページを検索上位に表示させます。

      良いページだと判断した場合はURLに高評価、悪いページと判断した場合はURLに低評価を付けます。

      検索順位は高評価を得たページほど上位に表示されます。

    • 似たようなページは低評価

      Googleは、他のページをコピーしたものや似ている部分が多い場合は低評価にします。

      また、公開したWebページは、1つのページに対して複数のURLでアクセス可能です。

      つまり、1つしかページがなのに同じ内容が複数あると判断されて、低評価の対象になってしまいます。

  • URLの正規化
    https://sheep.com/

    URLの正規化とは、アクセス可能な複数のURLの中から1つ選び、そのURLが正しいURLとして扱うように設定をします。

    URLを正規化することで、適切に評価してもらえるようになります。

    この設定はとても重要ですが、実はとても簡単に設定が出来ます。

URLの正規化はとても簡単です。

HTMLファイルの中に、たった1行追加するだけで完了です。

ただ、それぞれのHTMLファイルごとに追加するので、少し手間になるかもしれません。

正規化する方法

<!DOCTYPE html>
<html lang="ja">
<head>
...
<link rel="canonical" href="https://sheep.com/">
...
</head>
<body>
...
</body>
</html>
URLを正規化する方法
    アクセス出来るURL
  1. http://sheep.com/
  2. http://www.sheep.com/
  3. https://sheep.com/
  4. https://www.sheep.com/

Webページを公開すると「http」や「https」から始まるURLでアクセスすることが出来ます。

例えば「index.html」にアクセスする時は、上記の4つのURLからアクセスすることが出来ます。

4つもアクセス出来るURLがあるのは不都合なことがあるため、今回は3の「https://sheep.com/」を正しいURLとして設定します。

  • URLを正規化する

    アクセス出来る上記の4つのURLのうち、一番シンプルで安全な「https://sheep.com/」を正しいURLとして正規化します。

    headタグの中に正規化させたいURLを指定します。

    今回はドメインを「sheep.com」で解説します。
    • index.html
      sheep.com/
      index.html

      「index.html」を公開している場合は省略が可能なので、「https://sheep.com/」が正しいURLとして指定します。

      「index.html」のheadタグの中に、正規化するURLを指定します。

      <head>
      <link rel="canonical" href="https://sheep.com/">
      </head>
    • その他のファイル
      sheep.com/
      profile.html

      例えば「profile.html」を公開している場合も、「https://sheep.com/profile.html」が正しいURLになるように指定します。

      「profile.html」のheadタグの中に、正規化するURLを指定します。

      <head>
      <link rel="canonical" href="https://sheep.com/profile.html">
      </head>
    • 下の階層のファイル
      sheep.com/
      favorite/
      sports.html

      下の階層にある「sports.html」を公開している場合も、「https://sheep.com/favorite/sports.html」が正しいURLになるように指定します。

      「sports.html」のheadタグの中に、正規化するURLを指定します。

      <head>
      <link rel="canonical" href="https://sheep.com/favorite/sports.html">
      </head>
http・https・wwwってなに?

おそらく「http」「https」「www」とは何か疑問に思った方がいると思います。

どれもURLでアクセスする時に使うものですが、それぞれに意味があります。

  • http

    「http」はWebページを見るために必要な通信するための技術です。

    ブラウザから「http」から始まるURLでWebページの表示に必要な情報画像を取得します。

    この通信技術は欠点があり、通信中の中身はすべて丸見えの状態になります。

    つまり、パスワードなど重要なものは、通信中に中身を見て盗むことが出来ます。

    この欠点を解消するために新しく「https」が誕生しました。

  • https

    「http」のセキュリティを強化したものが「https」という通信技術です。

    通信内容は見える状態ですが、たとえ見られても人やコンピュータには意味がわからないように暗号化をします。

    暗号化した内容は共通の鍵を使うことで、元の状態に戻す復号化をしてWebページを表示します。

    現在はこの「https」が推奨されている通信方法です。

  • www

    「www」はWebブラウザの原型となる技術を表しています。

    正式名称は「World Wide Web」と呼ばれ、「http」「URL」「HTML」が誕生する基盤になったものです。

    現在では「Web」と呼ばれることが多いです。

    URLの中に「www」が入っていますが、あってもなくても同じページが表示されるため省略されることが多いです。

これでURLの正規化が完了しました。

指定するURLは、基本的にそのページのURLです。

他のページと同じURLを指定することは避けてください。

次は、正規化についてもう少し深く触れてみたいと思います。

正規化と検索順位

URLの正規化が必要な理由
    アクセス出来るURL
  1. http://sheep.com/
  2. http://www.sheep.com/
  3. https://sheep.com/
  4. https://www.sheep.com/

公開したWebページにアクセス出来るURLは、主に上のような4つのパターンです。

具体的には「http」「https」の違いや、「www」の有無が関係しています。

  • webページとURLの関係
      アクセス出来るURL
    1. http://sheep.com/
    2. http://www.sheep.com/
    3. https://sheep.com/
    4. https://www.sheep.com/

    Webページを1つ公開した場合、アクセス可能なURLはそれぞれ別のページとして判断されます。

    つまり、合計4つのWebページが存在すると間違った認識をされてしまいます。

    同じ内容のページが複数ある状態は、コピーしたものと判断されて低評価を受ける対象になります。

    低評価を受けたページは、検索順位の降下または除外されることがあるのでリスクがあります。

  • URLと検索順位の関係
      アクセス出来るURL
    1. http://sheep.com/
    2. http://www.sheep.com/
    3. https://sheep.com/
    4. https://www.sheep.com/

    Googleの検索順位はURLの評価によって決まるため、評価が高いほど上位に表示されます。

    Webページを公開すると、Googleが自動で有益な情報があるページに評価ポイントを付加します。

    その評価ポイントはURLに付加されて、蓄積していきます。

    そのため、URLが複数ある状態はせっかくの評価が分散してしまうことがあります。

    • ページの評価が分散してしまう
      +1点
      +2点
      +6点
      +4点

      上記で説明した通り、同じページでもURLが違えばそれぞれ別のページとして評価されます。

      URLにページの評価が蓄積されるということは、4つのURLがあれば評価が分散されるということです。

      上の図の場合、本来は合計で「13点」の評価ですが、実際は「6点」しかない状態になるため非常にもったいないです。

      URLを正規化していれば、本来の評価である「13点」として適切に評価してもらえます。

    • ページの評価をまとめる
      +13点

      評価ポイントが分散して、評価が低いURLは検索結果に表示されません。

      正しく評価してもらうには、それぞれの評価ポイントをまとめて「13ポイント」にする必要があります。

      URLの正規化」とは、URLごとの評価ポイントを1つにまとめるという役割があります。

      なので今回の場合では、安全でURLが短い3の「https://sheep.com/」のURLに評価をまとめます。

      これはページごとに設定するため、他のページと同じURLを指定することはほぼありません。

      つまり、他のサイトのURLを指定することや、他のページとURLが重複することが避けるようにします。

      <head>
      <link rel="canonical" href="https://sheep.com/">
      </head>
間違った正規化
  • 相対パスでURLを指定する
  • 1ページに複数のURLを指定する
  • すべて同じURLを指定する

URLを正規化する際に、間違ったやり方で設定をしてしまうことがあります。

間違ったやり方のまま公開してしまうと、十分な効果が期待出来ません。

よくある間違った使い方を3つ紹介します。

  • 相対パスでURLを指定する

    正規化するURLを、相対パスで指定してしまうパターンです。

    下記のように「https」から無いURLは無効になります。

    正規化するURLは、「https」から始まる絶対パスで指定しましょう。

    これはダメ
    <head>
    <link rel="canonical" href="../../profile.html">
    </head>
  • 1ページに複数のURLを指定する

    1ページに何個も正規化のコードを書いてしまうパターンです。

    例えば下記のような書き方は、無効になります。

    この場合、どれを参考にすればいいかわからないため無視されます。

    これはダメ
    <head>
    <link rel="canonical" href="https://sheep.com/">
    <link rel="canonical" href="https://sheep.com/index.html">
    </head>
  • すべて同じURLを指定する

    すべてのページに同じURLを指定してしまうパターンです。

    例えば、サイトのトップページに他のページの評価を集めれば、トップページの検索順位が上がると考えた時です。

    正規化は内容が重複する時に使用するので、効果が得られないか低評価になる可能性があります。

    評価を1箇所に集める目的で使用することはNGです。

以上がURLの正規化についてです。

簡単に設定が出来ますが、しっかりと理解して使う必要があります。

ぜひ正規化に挑戦してみてください。