このツールに問題がありますか?

「robots.txt 作成 オンライン」について

このツールはサイト用の robots.txt を作成し、検索クローラーやボットにインデックス対象/非対象のパスを示します。User-Agent ごと(Googlebot/Bingbot/* など)にルールを定義し、allow/disallow とサイトマップ URL を指定すれば、デプロイ可能な robots.txt が出力されます。

正しい robots.txt は管理画面・検索結果ページ・非公開コンテンツへの無駄なクロールを抑え、サイトマップへ明示的に誘導します。設定漏れや誤設定はインデックス肥大、クロール遅延、公開ページの誤遮断につながります。

ファイルはドメイン直下(https://example.com/robots.txt)に置きます。これは行儀のよいボットへのヒントであり、アクセス制御ではありません。機微情報の保護には使えません。

このツールの使い方

サイトの robots.txt を生成する手順

  1. プリセットを選ぶ

    「Preset」は `allow-all`(全ボットに全クロール許可)、`disallow-all`(全ボットを全 URL からブロック — staging に便利)、`disallow-admin`(多くは許可、`/admin` と `/private` を遮断)から選択。これが `User-agent: *` ブロックを書き出します。

  2. Sitemap URL(任意)

    「Sitemap URL」を入れると末尾に `Sitemap:` 行が追加され、XML サイトマップを指します。これを見つけた検索エンジンは別途送信不要で読みます。絶対 URL(`https://example.com/sitemap.xml`)を使用。

  3. 「実行」

    結果は `robotsTxt` のみ。名前そのままで `robots.txt` という実ファイルとしてサイトのルートに保存 — `https://example.com/robots.txt`(`/blog/robots.txt` ではなく)からアクセス可能でなければなりません。

  4. robots.txt は何ではないか

    それは要請であり強制ではありません。行儀の良いボット(Googlebot、Bingbot)は従いますが、悪意あるクローラは無視します。本当のアクセス制御には認証、IP ブロック、レート制限を — 秘密パスを robots.txt に書かないこと(公開しているのと同じです)。