ウェブサイト運営において、Googleのサーチコンソールは非常に重要なツールです。
しかし、時には「アクセス禁止(403)が原因でブロックされました」「見つかりませんでした」というメッセージが表示され、頭を悩ませることがあります。
このメッセージの背後にある原因を理解することで、より効果的にウェブサイトを管理し、問題を解決することができます。
Googlebotのアクセスをブロックする主な原因
Googlebotがウェブサイトにアクセスし情報を収集する過程で、様々な障害に遭遇することがあります。ここでは、その障害の原因となる主要な要因を掘り下げていきましょう。
サーバー設定とセキュリティポリシー
ウェブサイトのセキュリティは非常に重要ですが、時にはそのセキュリティ設定がGooglebotのアクセスを妨げることがあります。
robots.txtファイルによるクロールの禁止
robots.txtファイルは、ウェブサイトのどの部分をクロールさせるか、またはさせないかを検索エンジンに指示するために使用されます。
誤ってウェブサイト全体、または重要なページをクロール禁止にしてしまうと、Googlebotはそのページにアクセスできず、結果的に403エラーが発生します。
このファイルの設定を確認し、必要なページがクロール可能であることを保証しましょう。
サーバーがGooglebotのIPアドレスをブロックしている
セキュリティ対策の一環として、不正アクセスを防ぐために特定のIPアドレスをブロックすることがあります。
しかし、この設定が原因でGooglebotのIPアドレスも誤ってブロックされてしまうことがあります。サーバーの設定を見直し、Googlebotが安全にアクセスできるようにしましょう。
ウェブページが特定のユーザーエージェントに対してアクセスを制限している
ウェブサイトが特定のブラウザやクローラーに対してアクセスを制限している場合、Googlebotもその対象となることがあります。ユーザーエージェントに基づくアクセス制限を設定する際は、Googlebotが含まれないよう注意しましょう。
国内サイトから海外にアクセスが繋げないような仕組みを取るサーバーもあります。
ウェブサイトのセキュリティ設定がGooglebotのアクセスを拒否している
ウェブサイトのセキュリティ強化は必要不可欠ですが、その設定が厳しすぎると、Googlebotのような正当なクローラーまでアクセスを拒否してしまうことがあります。セキュリティ設定を見直し、Googlebotが情報を収集できるように調整しましょう。
ウェブアプリケーションファイアウォール(WAF)がGooglebotをブロックしている
ウェブアプリケーションファイアウォール(WAF)は、ウェブサイトを保護するために不正なアクセスをブロックしますが、設定によってはGooglebotを含む正当なクローラーのアクセスも誤ってブロックしてしまうことがあります。WAFの設定を確認し、Googlebotがウェブサイトの情報を収集できるようにしましょう。
初期設定でWAFがオンになっているのは過去にはロリポップ・コノハサーバーなどがあげられました。これを解除しないとアドセンスやサーチコンソールのタグを貼れないこともあるので注意しましょう。
サーバーの誤設定とリソース問題
ウェブサイトを運営する上で、サーバーの設定やリソース管理は非常に重要です。しかし、これらが原因で「アクセス禁止(403)」のエラーが発生することがあります。ここでは、そのような状況と対処法について、初心者にも分かりやすく解説します。
サーバーの設定ミスにより、誤って403エラーを返している
サーバーの設定ミスは、意図せず403エラーを引き起こす一般的な原因です。例えば、ウェブサーバーの設定ファイルである.htaccess設定ファイルに誤りがあると、正当なアクセスであっても拒否されることがあります。
このような場合、設定ファイルを丁寧に確認し、アクセス制御に関する指示が正しく設定されているかを見直す必要があります。特に、Deny from allのような指示が誤って適用されていないか、注意深くチェックしましょう。
.htaccessファイルによる不適切なアクセス制御設定
.htaccessファイルは、特定のディレクトリに対するアクセス制御を細かく設定できる強力なツールです。
しかし、このファイルの設定を誤ると、ウェブサイトの重要な部分へのアクセスが意図せず制限され、403エラーが発生することがあります。例えば、Require all deniedのような設定が含まれている場合、そのディレクトリへの全てのアクセスが拒否されます。
設定を変更する際は、ウェブサイトのアクセス権限にどのような影響を与えるかを十分に理解した上で行いましょう。
サーバーのリソース不足により、一時的にアクセスを拒否している
ウェブサーバーが扱うリクエストの量が多すぎると、リソース不足に陥り、一時的に新しいアクセスを拒否することがあります。これは、サーバーが過負荷状態にあるときによく見られる現象です。
リソース不足が原因で403エラーが発生している場合、サーバーのリソースを増強するか、不要なアプリケーションやプロセスを停止してリソースを解放することが対処法となります。
ブログの記事がバズって数十万PVを超えるとサーバーがとまりこのような一時的なエラーが出ることがあります。特に数百円の低容量サーバーや無料サーバーでは起こりますよ。
サーバーが一時的にダウンしており、リクエストに応答できない
サーバーがハードウェアの故障やソフトウェアの問題でダウンしてしまうと、当然ながらリクエストに応答できず、403エラーを含む様々なエラーが発生します。
このような場合、サーバーの状態を確認し、必要に応じて再起動や修復作業を行う必要があります。また、定期的なメンテナンスと監視を行うことで、サーバーのダウンを未然に防ぐことが可能です。
サーバーの工事中にGoogleのロボットが来ると404のエラーをサーチコンソールに残します。各レンタルサーバーのメンテナンスの時間帯を見てみましょう。
コンテンツと認証に関する問題
ウェブサイトを訪れた際に「アクセス禁止(403)」のエラーに遭遇することは、ユーザーにとってもウェブマスターにとっても悩ましい問題です。
このセクションでは、コンテンツアクセスや認証に関連する一般的な問題と、それらがどのように403エラーを引き起こす可能性があるかを掘り下げていきます。
アクセス制限と認証エラー
ウェブサイトには、さまざまな理由でアクセスを制限する場合があります。ここでは、そのような状況の具体例と、それらがなぜ403エラーを引き起こすのかを解説します。
ウェブサイトが地域や国に基づいてアクセスを制限している
コンテンツの著作権保護や特定の地域向けのサービス提供などの理由から、ウェブサイトが特定の国や地域からのアクセスを制限することがあります。
例えば、日本のテレビ番組を配信するウェブサイトが、日本国外からのアクセスを制限することがあります。このような地理的な制限は、ユーザーのIPアドレスを基に行われ、該当する地域からのアクセスを試みると403エラーが表示されることがあります。
ページがメンテナンス中で、一時的にアクセスが制限されている
ウェブサイトの更新やサーバーのメンテナンスなど、一時的な作業のために特定のページやウェブサイト全体へのアクセスを制限することがあります。
この期間、ウェブマスターは通常、ユーザーにメンテナンスの告知を行いますが、アクセスしようとすると403エラーが表示される場合があります。メンテナンスが完了すれば、アクセスは再び可能になります。
ウェブサイトが会員専用ページで、未認証のアクセスを拒否している
有料会員サービスや限定コンテンツを提供するウェブサイトでは、認証されたユーザーのみがコンテンツにアクセスできるようになっています。
ワードプレスでブロガーが会員専用ページを作るケースも増えています。
ログインしていない、または会員でないユーザーがこれらのページにアクセスしようとすると、403エラーが表示されることがあります。この場合、適切なユーザー認証を行うことでアクセスが可能になります。
ページがパスワードで保護されており、Googlebotがアクセスできない
ウェブサイトの一部のコンテンツがパスワードで保護されている場合、Googlebotを含むクローラーはそのコンテンツにアクセスできません。
このような保護されたページにアクセスしようとすると、クローラーは403エラーに遭遇します。ウェブマスターは、インデックスを希望するコンテンツがクローラーにアクセス可能であることを確認する必要があります。
これらの問題は、ウェブサイトの運営においてよく遭遇するものです。403エラーに直面した場合は、これらの一般的な原因を頭に置き、問題解決に向けた適切なステップを踏むことが重要です。
ユーザーとしては、エラーメッセージに記載されている指示に従うか、ウェブサイトの管理者に問い合わせることで、問題の解決に繋がることがあります。
今回の記事で分からないものは質問どうぞ!少しずつ頑張ろう!!