1. llms.txt とは何か
llms.txt は、AI クローラー(GPTBot / ClaudeBot / PerplexityBot など)が自社サイトを効率的に理解できるようにするためのガイドファイルです。Markdown 形式で、サイトの概要 + 重要ページへのリンク集を記述します。2024 年に Anthropic / Jeremy Howard らが提案した新標準で、現在は AI 界隈で急速に採用が広がっています。
位置付けとしては「AI クローラー版のサイトマップ」と考えると近いですが、サイトマップが「ページ一覧」を提供するのに対し、llms.txt は「このサイトは何で、どのページから読むと良いか」という意味的なガイドを Markdown で提供します。
重要なポイントは次の 3 点:
- 場所:サイトのルートに配置(
https://yourdomain.com/llms.txt) - 形式:プレーンテキストの Markdown(HTML や JSON ではない)
- 目的:AI クローラーが「このサイトを最短で理解する」ための地図
2. robots.txt との違い
よく混同されますが、役割が違います。両方を設置するのが正解です。
| ファイル | 役割 | 記述形式 |
|---|---|---|
| robots.txt | クロール許可 / 拒否のアクセス制御 | 独自テキスト書式(User-agent / Allow / Disallow) |
| llms.txt | サイト構造とコンテンツの意味的ガイド | Markdown |
実装順序としては、まず robots.txt で AI クローラー(GPTBot / ClaudeBot / PerplexityBot / Google-Extended / OAI-SearchBot 等)を Allow し、その上で llms.txt でサイト案内を提供する、という流れが基本です。robots.txt で Disallow されているページは、llms.txt に書いてもアクセスされません。
3. llms.txt の書式
llms.txt は通常の Markdown ファイルです。仕様で求められる構成は次のとおり。
- # サービス名(H1) — サイト名 / 会社名
- > 1〜2 文の概要(blockquote) — このサイトが何を提供するかを核となる 1〜2 文で
- ## セクション見出し(H2) — 「主要ページ」「ドキュメント」「ブログ」など
- 各見出し下にリンクのリスト — `[タイトル](URL): 補足説明`
- Optional セクション — 重要度が低いページや法的情報など
ポイントは「AI が短時間で理解できる構造」になっていること。冒頭の概要文で AI に「このサイトは何か」を一発で伝え、続くセクションで「どのページに何があるか」を明示します。
書く際の鉄則 5 つ:
- blockquote の概要文は主語 + 動詞 + 数値を含む 1〜2 文で
- 各リンクには「コロン後の補足説明」を必ず付与(リンクだけ羅列しない)
- セクション数は 4〜8 個が読みやすい範囲
- 各セクションのリンクは 3〜10 個程度(多すぎると AI が要点を見失う)
- 「重要度の高い順」に並べる(AI は上から読むため)
4. 基本テンプレート(SaaS 向け)
中小規模の SaaS / プロダクトサイトの基本テンプレートです。Sakyura 自身の llms.txt をベースにしています。
# Sakyura > Sakyura は ChatGPT / Perplexity / Gemini / Claude / Google AI Overviews の 5 つの生成 AI 検索エンジンで、貴社ブランドの引用率を毎日計測する GEO/AEO SaaS です。 ## 主要ページ - [トップ](https://sakyura.com/): サービス概要・機能・料金 - [機能](https://sakyura.com/#features): 計測・改善・競合分析 - [料金](https://sakyura.com/#pricing): Free / Starter / Pro / Business - [無料診断](https://sakyura.com/diagnose): URL を入れて 30 秒で AI 引用準備度をチェック - [お問い合わせ](https://sakyura.com/contact): 製品に関する質問・相談 ## ブログ - [GEOとは?完全ガイド](https://sakyura.com/blog/geo-towa) - [AI Overviews 対策完全ガイド](https://sakyura.com/blog/ai-overviews-taisaku) - [ChatGPT に引用されるサイトの作り方](https://sakyura.com/blog/chatgpt-citation-howto)
これをコピー → 自社情報に差し替え → ルートに llms.txt として配置するだけ。5 分で実装完了です。
5. 大規模企業サイトの実装例
ページ数が多い企業サイト・複数製品を扱う SaaS の場合、セクション分けを明確にして AI が「製品 / ドキュメント / 会社情報 / 業界情報」を区別できるようにします。
# 自社サービス名 > サービスの 1〜2 文の説明(このサイトが何を提供するかを AI に伝える核となる文)。 ## サービス・製品 - [製品 A 概要](https://example.com/products/a): 〜の課題を解決する〜 - [製品 B 概要](https://example.com/products/b): 〜 - [機能一覧](https://example.com/features) - [料金プラン](https://example.com/pricing) ## ドキュメント - [API リファレンス](https://example.com/docs/api) - [SDK ガイド](https://example.com/docs/sdk) - [チュートリアル](https://example.com/docs/tutorials) ## 会社情報 - [会社概要](https://example.com/about) - [採用情報](https://example.com/careers) - [プレスリリース](https://example.com/press) ## 業界情報・ブログ - [カテゴリ A](https://example.com/blog/category-a/) - [カテゴリ B](https://example.com/blog/category-b/) ## Optional: 用語集 / FAQ - [用語集](https://example.com/glossary) - [よくある質問](https://example.com/faq)
リンクを大量に羅列するよりも、セクション単位で意図的にキュレーションするのが効きます。「全ページのリンク集」ではなく「AI に読んでほしい代表ページの選定」が本質です。
6. EC サイトの実装例
D2C / EC サイト向けに、商品カテゴリ・ブランドストーリー・サポートを軸にした構成例です。
# 自社 EC ストア名 > オーガニックコスメ専門の D2C ブランド。創業 2018 年。〜万人のユーザーに支持されるブランド理念と商品ラインナップを発信。 ## 商品カテゴリ - [スキンケア商品一覧](https://example.com/skincare/): クレンジング・化粧水・美容液 - [メイクアップ商品一覧](https://example.com/makeup/): ファンデーション・リップ・アイメイク - [ボディケア商品一覧](https://example.com/bodycare/): ハンドクリーム・ボディローション ## ブランドストーリー - [ブランドコンセプト](https://example.com/about): 創業の想い・理念 - [素材・成分へのこだわり](https://example.com/ingredients): オーガニック認証情報 - [製造過程](https://example.com/process): 安全性・品質管理 ## サポート - [配送・お支払い](https://example.com/shipping) - [返品・交換ポリシー](https://example.com/returns) - [よくある質問](https://example.com/faq) - [お問い合わせ](https://example.com/contact)
EC サイトでは「商品単品ページ」ではなく「カテゴリページ」を中心に列挙するのが効率的。AI に「ブランドコンセプト」「素材へのこだわり」「保証ポリシー」が伝わると、商品比較系のクエリで引用される確率が上がります。
7. llms-full.txt との使い分け
llms-full.txt は llms.txt の拡張版で、リンク集ではなく主要ページの本文を全文連結したテキストファイルを提供します。AI が「リンク先を辿らずに 1 ファイルで全部読める」状態を作ります。
- llms.txt:必須レベル。全サイトが置くべき基本ファイル
- llms-full.txt:オプション。ドキュメント中心のサイト / API リファレンス / 教材サイトに有効
SaaS の LP / 通常コーポレートサイトなら llms.txt だけで十分。OSS の README 群や API ドキュメントを集約したい場合に llms-full.txt を追加検討してください。サイズが大きくなりすぎる場合(>100KB)は、AI 側で打ち切られる可能性があるので分割を検討。
8. プラットフォーム別の配置方法(6 例)
サイトのルートに llms.txt として配置するのが標準です。具体的には https://yourdomain.com/llms.txt でアクセスできる場所です。プラットフォーム別の手順:
Next.js / Vercel
プロジェクトの public/llms.txt に配置。デプロイ後は https://yourdomain.com/llms.txt で自動的にアクセス可能。
WordPress
FTP / SFTP / cPanel ファイルマネージャでドキュメントルート直下に llms.txt を配置。「Yoast SEO」プラグイン等で robots.txt と一緒に管理する方法もあり。
Shopify
テーマカスタマイズで llms.txt をテーマファイルに含めるか、Shopify アプリ「robots.txt Editor」等で対応。一部要工夫。
Webflow
Custom Code セクション or Hosting 設定で /llms.txt へのリダイレクトを設定。または直接ホスティングしてリダイレクトで対応。
Hugo / Jekyll / Astro / Eleventy
static / public / src/static ディレクトリに llms.txt を配置。ビルド時にルートに展開される。
Wix / Squarespace 等のクローズド SaaS
標準でルートファイルの追加機能がない。サブパス(/docs/llms.txt 等)への配置になるため、AI クローラーの検出率が下がる。可能なら独自ドメイン + 別ホスティングを検討。
9. 検証手順(5 ステップ)
配置後の確認ステップは次の 5 つです。
ステップ 1: HTTP 200 で取得できるか
ブラウザで https://yourdomain.com/llms.txt にアクセス。404 や認証必須になっていないか確認。curl でも OK:curl -I https://yourdomain.com/llms.txt
ステップ 2: Markdown が正しく解釈できる形か
見出し階層(# / ##)、リンク記法([text](url))が正しいか目視。Markdown プレビュー(VS Code 等)で表示崩れがないか確認。
ステップ 3: リンク先が全て生きているか
404 リンクが含まれていないか、リンクチェッカ(W3C Link Checker、SEMrush Site Audit 等)で確認。手動なら 5〜10 件をランダムサンプリング。
ステップ 4: 文字エンコーディングが UTF-8 か
ブラウザで開いた際に日本語が文字化けしていないか確認。サーバー設定で Content-Type: text/plain; charset=utf-8 を返すように。
ステップ 5: AI 経由の確認(オプション)
ChatGPT に「https://yourdomain.com/llms.txt の内容を要約して」と指示し、内容が正しく読み取られているかを確認。
Sakyura の無料診断ツールは llms.txt の存在 / 構造をはじめ、AI クローラーの許可状況、構造化データ、OGP など 10+ 項目を 30 秒で自動チェックします。 さらに自社の引用率を継続計測したい場合、無料プラン(クレカ不要)で今日から計測を始められます。 無料で計測を始める。
10. FAQ
Q.llms.txt は必須ですか?
現時点で「必須」と明言している AI ベンダーはありませんが、Anthropic / Perplexity を含む複数の AI クローラーが llms.txt を参照する傾向にあります。設置コストはほぼゼロなので、置かない理由がありません。
Q.robots.txt と llms.txt の違いは何ですか?
robots.txt は「クロールしてよいか / だめか」のアクセス制御。llms.txt は「クロールしてよい場合に、サイトの構造と重要ページを Markdown 形式で説明する」ガイド。役割が補完的です。両方設置するのが正解です。
Q.llms.txt を置いたら ChatGPT に引用されますか?
それだけでは引用されません。llms.txt は AI クローラーに「このサイトは何のサイトで、どのページが重要か」を伝えるだけ。引用されるかは本文の質・構造化データ・外部 mention で決まります。llms.txt は「読まれやすくする」基礎工事です。
Q.llms.txt と llms-full.txt は何が違いますか?
llms.txt は「サイト構造のサマリ + 重要ページへのリンク」を Markdown で書くガイドファイル。llms-full.txt は「主要ページの本文を全文連結」した展開ファイル。前者は必須レベル、後者は規模が小さいサイト or ドキュメント中心サイト向けの追加オプションです。
Q.WordPress / Shopify でも llms.txt は置けますか?
置けます。WordPress なら FTP でルートに直接アップロード or プラグイン経由。Shopify はカスタムページ機能 or テーマファイル経由。Next.js / Vercel ならプロジェクトの public/ ディレクトリにファイルを置くだけ。詳細は本記事の配置場所セクションを参照。
Q.llms.txt が正しく配置されているかを確認する方法は?
ブラウザで `https://yourdomain.com/llms.txt` にアクセスして 200 OK で内容が表示されれば OK。Sakyura の無料診断ツールでも自動チェックできます(diagnose ページ)。
Q.llms.txt はどのくらいの頻度で更新すべきですか?
サイト構造が変わったタイミング、または重要ページを追加したタイミングで更新します。動きの少ないサイトなら半年に 1 度の見直しで十分。動きの多い SaaS なら月次で見直すのが理想です。
Q.AI に読ませたくないページがある場合はどうすれば?
robots.txt で該当 AI クローラーに対して Disallow を設定します。llms.txt 側でそのページに言及しなければ AI に案内されないので、リスクはコントロール可能です。社内専用の管理画面 / 顧客データを含むページは必ず robots.txt で除外してください。
Q.llms.txt に書ける文字数の上限はありますか?
明確な上限は仕様で定められていませんが、現実的には 500〜1500 字程度が読まれやすい範囲です。長すぎると AI 側で打ち切られる可能性があるため、サイトの本質を端的に説明することを優先します。
Q.複数言語(ja / en)対応のサイトでは llms.txt はどうすべきですか?
ルートの llms.txt に両言語のリンク集を書き、必要なら /en/llms.txt のように言語別に置く 2 段構成が推奨です。AI クローラーがどちらを優先するかはケースバイケースなので、両方用意しておくのが安全です。
Q.llms.txt は SEO に直接影響しますか?
従来 SEO(Google 検索順位)への直接影響はありません。llms.txt は AI クローラー専用のメタファイルで、Google の検索アルゴリズムの評価対象外。ただし AI 検索で引用されるための前提条件として実装すべきインフラです。
Q.llms.txt の内容は AI に必ず読まれますか?
AI クローラー側の判断によります。OpenAI / Anthropic / Perplexity などは llms.txt を参照する傾向にありますが、Google / Microsoft はまだ標準対応していません。「AI ベンダーごとに対応状況が異なる」前提で、設置することのコストはほぼゼロなので置いておくのが正解です。
Q.llms.txt を更新したら AI に反映されるまでどれくらいかかりますか?
AI クローラーが再訪問するまで 1〜4 週間が一般的。OpenAI の GPTBot は週 1 回程度の頻度で主要サイトを巡回しているため、内容更新から 1〜2 週で反映されることが多い。確実に反映させたい場合は、Google Search Console や OpenAI のフィードバック窓口に通知する手もあります。
Q.llms.txt のテンプレートを公開しているサイトはありますか?
Anthropic 公式(llmstxt.org)と Jeremy Howard の GitHub で公式仕様とサンプルが公開されています。本記事のテンプレートはそれらをベースに、日本語サイト向けに最適化した形です。自社サイトに合わせて core ページのリンクを 5〜10 個ピックアップするのが基本。
Q.llms.txt を置いただけで AI 引用率が上がりますか?
上がりません。llms.txt は「AI に正しく読まれる」ための前提条件で、引用されるかどうかはコンテンツの質次第。質問応答型の見出し、構造化データ、E-E-A-T などの本質的な施策と組み合わせて初めて効果が出ます。
11. まとめ
llms.txt は実装コストがほぼゼロで、AI に正しく自社サイトを理解してもらうための基礎インフラです。 引用率を直接押し上げるものではありませんが、これを置かない理由はありません。 本記事のテンプレートをコピーして、5 分で導入してください。 実装後は https://yourdomain.com/llms.txt にアクセスして 200 OK を確認するだけ。
まずは無料プランで計測を始める
llms.txt 設置後、引用率はどう変わりましたか?
Sakyura は ChatGPT / Perplexity / Gemini / Claude / Google AI Overviews の 5 エンジンで自社・競合の引用率を日次で自動計測。施策の効果を数字で見届けられます。 クレジットカード不要、今日から始められます。
無料で計測を始める関連記事
- GEOとは?生成AI検索最適化の完全ガイド — 全体像と llms.txt の位置付け
- GEO対策の完全実装ガイド — llms.txt はステップ 3 として組み込まれる
- schema.org × AI 検索 — 構造化データ実装ガイド — llms.txt とセットで実装する技術メタ
- ChatGPT に引用されるサイトの作り方 — llms.txt の次に取り組む実装施策