llms.txt最適構成がわかる!企業担当者が知っておくべきルール、基本構造・書くべき・書いてはいけない情報解説

AI検索の波が押し寄せる今、従来のSEO対策だけでは不十分になりつつあります。そんな中、注目を集めているのが「LLMs.txt」という新しい規格です。

しかし、「本当に効果があるのか」「今すぐ導入すべきなのか」「どう書けば最適なのか」と言った疑問も沸いてきます。業界内でもGoogleのJohn Muellerは「主要LLMで使われている確認できていない」と発言し、一方で大手IT企業は続々と導入しています。

本記事では、LLMs.txtの最適構成に特化した実践ガイドをお届けします。基本構成ルール、業界別のコピペ可能なテンプレートまで網羅します。あなたの会社が今すぐ導入すべきか、それとも様子を見るべきか—冷静に判断できる材料を提供します。

LLMs.txtファイルの基本要件4つのルールとは?

LLMs.txtファイルの基本要件4つのルール

LLMs.txtを作成する上で、まず遵守すべき技術的な基本ルールが4つあります。これらはAIがファイルを正しく認識するための大前提であり、一つでも欠けていると意図通りに機能しない可能性があります。

ファイル名

必ずllms.txt(複数形、小文字)というファイル名にしてください。

よくある間違いとして、単数形のllm.txtにしてしまうケースがありますが、正しくは複数形のllmsです。

設置場所

ウェブサイトのルートディレクトリに設置する必要があります。これは、https://yourdomain.com/llms.txtのように、ドメイン直下でアクセスできる場所を指します。

ファイルが一般公開されており、ログイン認証などがかかっていないことを確認します。

フォーマット

ファイル形式はマークダウン(Markdown)構文を用いたプレーンテキストファイルです。HTMLタグなどは含めず、シンプルなテキストで記述します。

そして、Content-Typeがtext/plainとして配信されているか確認してください。一部のAIクローラーはtext/markdownを正しく解釈できず、エラーを返すことがあります。

文字コード

ファイルを保存する際の文字コードはUTF-8を選択してください。Shift_JISなどでは文字化けします。

特に、BOM(Byte Order Mark)なしのUTF-8が推奨されています。

LLMs.txtに使うマークダウン構文の基本構造

LLMs.txtに使うマークダウン構文の基本構造

LLMs.txtの記述ルールは驚くほどシンプルです。実は、必須項目は実質1つだけ。あとは推奨項目を必要に応じて追加していく形式です。

公式な仕様書は存在せず、コミュニティベースで緩やかに標準化が進んでいます。だからこそ、基本原則を押さえた上で、自社サイトに合わせた柔軟なカスタマイズが可能です。

ここでは、各設定項目の役割と記述方法を詳しく見ていきましょう。

【必須】H1タイトル(サイト名・プロジェクト名)

ファイルの最初に、サイト名やプロジェクト名を記述します。これが唯一の必須項目です。

#記号1つとスペース、続けてサイト名を記述します。

ファイルの冒頭に、サイト名のH1見出しを1つだけ配置します。複数のH1は混乱を招くため避けましょう。

例えば、ECサイトなら「# ○○○オンラインショップ」、企業サイトなら「# 株式会社○○○」、個人ブログなら「# ○○○のWeb戦略ブログ」といった形です。シンプルで明確な名称が、AIの理解を助けます。

  • 悪い例:# 会社名# 製品情報 の両方を記載
  • 良い例:# 会社名(H1は1つだけ)、## 製品情報(H2を使う)

【推奨】ブロッククォート(> 記号)

H1見出しの次に、サイトの目的や概要を簡潔に記述します。AIがファイル全体を理解するための重要な要約部分です。

>記号で始まる行で記述し、1〜2文にまとめます。

引用ブロックの説明は2-3文が目安です。長文はLLMの処理負荷を増やします。

この要約文が、AIがあなたのサイトを説明する際の「第一声」になります。以下のポイントを意識しましょう。

  • 事業内容や専門分野を明記
  • 対象顧客(誰のためのサイトか)を示唆
  • ユニークな価値提案を簡潔に表現
  • 60〜100文字程度に収める

避けるべきは、抽象的で曖昧な表現です。「最高のサービスを提供」「お客様第一主義」といった一般論ではなく、具体的な事業内容を伝えましょう。

【推奨】H2セクション(カテゴリ別URLリスト)

コンテンツを論理的なグループに分けるために使用します。LLMs.txtの本体とも言えるのが、H2見出しで分類されたURL一覧です。

「## 主要サービス」「## 導入事例」のように、分かりやすいセクション名を設定します。

H2セクション名の例としては、以下のようなものがあります。

  • サービス紹介/Products/Services
  • 導入事例/Case Studies/Examples
  • ブログ/Blog/Articles
  • よくある質問/FAQ
  • 会社情報/About Us/Company
  • お問い合わせ/Contact

業種や目的に応じて、最適なセクション構成を選びましょう。

【推奨】リンク(テキスト形式)

各セクション内で、具体的なコンテンツへのリンクをリスト形式で記述します。

各リンクの記述形式は、Markdownの標準に従います。[表示テキスト](URL): 説明文という構造です。

括弧の種類に注意しましょう。

また、必ず、相対URLではなく絶対URLを使ってください。また、常にHTTPS URLを使用してください。

  • 悪い例:[製品](/products)
  • 良い例:[製品](https://example.com/products)

単にURLを並べるだけでなく、リンク先の内容を簡潔に説明する説明文を付与することがAIの文脈理解を助ける上で極めて重要です。説明文は20〜40文字が目安です。

すべてのリンクが正しく動作するか公開前に確認しましょう。404エラーは致命的です。

【オプション】リスト(- 記号)

ハイフン(-)をリストの記号として使用すると、箇条書きリストが作成されます。記号の後にスペースを1つ空け、その後にテキストを入力します。

【オプション】## Optional 補足情報

「## Optional」の見出しを持つセクションは、「任意」または「補足情報」として扱われます。AIが限られたコンテキストウィンドウで情報を処理する際に、このセクションをスキップすることが許容されることを示唆します。

優先度の低い情報や、補足的な資料へのリンクをここに配置するのが効果的です。

見出しは#の後にスペース必須です。

  • 正しい:# 見出し
  • 誤り:#見出し

【オプション】Optionalセクション

特定の読者にのみ関連する情報や、補足的なリソースは## Optionalセクションにまとめます。このセクションは、AIが必要に応じてスキップできる二次的な情報として扱われます。

Optionalセクションは、すべてのサイトに必要というわけではありません。一般ユーザー向けの情報が十分に揃っていれば、このセクションは省略しても構いません。

開発者向けドキュメント、詳細な技術仕様、コミュニティリソース、アーカイブ情報など、特定の目的を持つ読者のみが必要とする情報を配置する場所として活用しましょう。

LLMs.txtに載せるべきコンテンツとは?

LLMs.txtに何を載せ、何を載せないか

LLMs.txtの価値は、その「キュレーション(厳選)」にあります。サイトマップのように全てのページを羅列するのではなく、AIに伝えたい最も重要な情報だけを戦略的に選ぶことが求められます。

この選定プロセスは、単なる技術的な作業にとどまりません。自社のウェブサイトにおいて「本当に価値のあるコンテンツは何か?」「顧客が最も知りたい情報は何か?」を問い直す戦略的なコンテンツ監査の機会そのものです。

含めるべきコンテンツの例

  • 企業の核心情報: 「会社概要」「事業内容」「ミッション・ビジョン」など、自社が何者であるかを定義するページ。
  • 主要な製品・サービスページ
  • FAQ・よくある質問
  • 権威性を示すコンテンツ: 導入事例、お客様の声、専門家による解説記事など信頼性を高めるページ。
  • エバーグリーンコンテンツ: 流行り廃りがなく、長期的に価値を提供する普遍的なガイド記事やノウハウ集。

避けるべきコンテンツの例

  • 網羅的なリスト: サイトの全ページをリストアップすることは避けましょう。目安として、まずは10〜20ページの最重要コンテンツに絞り込むのが賢明です。
  • 質の低い、古い情報: 情報が古かったり、内容が薄かったりするページは除外します。
  • マーケティング色の強い言葉: 過度な宣伝文句や専門用語の羅列は避け、客観的で分かりやすい言葉で説明します。
  • 壊れたリンクやリダイレクト

サイト構造が変わったら、LLMs.txtも更新しましょう。古い情報は逆効果です。

LLMs.txt最適構成の3段階モデル

LLMs.txt最適構成の3段階モデル

多くのLLMs.txt解説記事は「書き方」を教えてくれますが、「最適構成とは何か」を明確に定義していません。そのため「結局、何をどう書けば良いのか」が分からないまま終わってしまいます。

そこで、本記事では独自に3段階モデルを定義しました。レベル1の最小限構成から、レベル3の完全構成まであなたの会社のリソースと目的に応じて選べるフレームワークです。

レベル1なら30分で完成し、すぐに効果を期待できます。レベル2は1-2時間かけて、より充実した情報を提供します。レベル3は半日かけて、大規模サイトや多言語サイトに対応した完全版を構築します。

あなたの会社がどのレベルを選ぶべきかは、サイトの規模、更新頻度、ターゲットとするLLM、そして投入できるリソースによって変わります。この章を読み終えた後には、自社に最適なレベルが明確に見えているはずです。

1:最小限構成(3行で完結、30分)

「とにかく今すぐ対応したい」「最小限の労力で始めたい」そんな方に最適なのが、レベル1の最小限構成です。これはわずか3行でLLMs.txtを完成させる最速の方法です。

最小限構成の基本構造は以下の通りです。

これだけです。H1見出しで社名、Blockquote(>)で会社説明、そして重要ページへのリンクを3つです。

シンプルですが、LLMに最低限の情報を伝えることができます。

この最小限構成の利点は、実装時間が30分以内という圧倒的なスピードです。テキストエディタでファイルを作成し、サーバーにアップロードするだけで済みます。

WordPressなら、プラグインで5分で完了します。

ただし、欠点もあります。情報が少なすぎて、LLMがサイト全体を理解するには不十分かもしれません。特に、ページ数が多いサイトや複雑なサービス構成を持つ企業には向いていません。

最小限構成が適している企業
  • サイトが10ページ以下の小規模企業
  • とりあえず対応して様子を見たい企業
  • 技術リソースが限られている企業
  • 「LLMs.txtを設置している」という事実が重要な企業

レベル1は、「完璧」を目指すのではなく、「まず始めること」を優先する選択です。設置後、効果を観察しながら、必要に応じてレベル2へアップグレードすれば良いのです。

2:推奨構成(標準的、1-2時間)

ほとんどの企業に推奨するのが、レベル2の標準構成です。これはH2セクションで情報を整理し、5-10個のリンクを含む充実した構成です。

レベル2ではサイトの主要なセクションごとにH2見出しを設け、その下に関連ページをグループ化します。これにより、LLMはサイトの構造を理解しやすくなります。

レベル2の利点は、情報の充実度と実装時間のバランスが最適という点です。1-2時間あれば完成し、LLMがサイトを理解するのに十分な情報量を提供できます。

また、WordPressユーザーには特に推奨します。Yoast SEOやAIOSEOなどのプラグインを使えば、管理画面から簡単にH2セクション付きのLLMs.txtを生成できます。

レベル2推奨構成が適している企業
  • サイトが10-100ページの中規模企業
  • BtoB SaaS、Eコマース、サービス業
  • WordPressを使用している企業
  • AI検索での露出を真剣に考えている企業

レベル2は、多くの企業にとって「ちょうど良い」選択です。過不足なく、LLMに必要な情報を伝えられます。

3:完全構成(llms-full.txt含む、半日)

大規模サイトや技術ドキュメントサイトを運営している企業には、レベル3の完全構成をお勧めします。これはllms-full.txtを含む最も詳細な構成です。

レベル3の特徴は、通常のllms.txtに加えて、llms-full.txtという別ファイルを用意する点です。llms.txtは概要とナビゲーション役に徹し、llms-full.txtにはサイトの全コンテンツを統合したMarkdownテキストを含めます。

llms-full.txtには、主要ページのコンテンツをMarkdown形式で統合します。これにより、LLMは一度のアクセスでサイト全体の情報を取得できます。

レベル3は、トークン制限を考慮した設計が必要です。LLMには一度に処理できるトークン数(テキスト量)の上限があります。

Claude 3.5は200,000トークン、GPT-4oは128,000トークンです。日本語の場合、1文字が約2-3トークンなので、Claude向けなら約7-10万文字まで対応できます。

レベル3完全構成が適している企業
  • 100ページ以上の大規模サイト
  • 技術ドキュメント・開発者向けツール
  • 多言語対応サイト
  • AI検索で競合を圧倒したい企業

レベル3の実装には半日程度かかります。また、コンテンツが更新されるたびに、llms-full.txtも更新する必要があるため運用コストも高くなります。

ただし、その分、LLMがサイトを深く理解し、正確に引用してくれる可能性が高まります。

LLMs.txt vs LLMs-full.txtの違いは?

LLMs-full.txtとは?

LLMs.txtには、通常版と完全版(llms-full.txt)の2種類があります。両者の違いを理解し、自社サイトに合った選択をしましょう。

LLMs.txt(通常版)

LLMs.txtは、サイトの概要と重要ページへのリンク集を基本とします。ほとんどのWebサイトはLLMs.txtで十分です。

  • 推奨ファイルサイズ: 10KB以下(テキストで約5,000文字)
  • 更新頻度: 中程度(主要ページ変更時)
  • 適用シーン:

LLMs-full.txt(完全版)

LLMs-full.txtは、サイトの全コンテンツを集約したテキストです。ドキュメントサイト、技術系サイト、APIリファレンスは、LLMs.txtに加えて導入を検討しましょう。

  • ファイルサイズ: 数百KB〜数MB
  • 更新頻度: 高頻度(コンテンツ更新ごと)

使い分けの基準

比較項目 llms.txt llms-full.txt
ファイルサイズ 〜10KB 数百KB〜数MB
読み込み速度 高速 低速
情報の深さ 概要のみ 全文収録
メンテナンス 容易 高難度
推奨度 すべてのサイト 技術文書サイト
AI処理負荷
  • 通常の企業サイト、ECサイト、ブログ → llms.txtのみ
  • 小規模サイト(10ページ未満) → llms.txtのみで十分
  • 大規模サイト(100ページ以上) → llms.txt必須、llms-full.txtは任意
  • 技術ドキュメント、APIリファレンス、開発者向けサイト → 両方設置

初めて実装する場合は、まずLLMs.txtから始めることを強く推奨します。運用に慣れ、効果が確認できてから、LLMs-full.txtの追加を検討しましょう。

まとめ

LLMs.txtは現時点で「確実に効果が出る施策」ではありません。しかし、30分〜2時間で完了する施策ですので圧倒的に低コストで低リスクです。

設定ミスでもサイトは壊れないので、1-2年後のLLM対応に備える意味で今からやっておきましょう。

「やるべきか」ではなく「いつやるか」の問題です。AI検索時代の波は既に来ています。準備をするなら今です。

よくある質問

LLMs.txtファイルを作る上で、守るべき基本ルールはありますか?

はい、AIがファイルを正しく認識するために、以下の4つの技術的なルールを守る必要があります。

  • ファイル名: llms.txt (必ず小文字の複数形)
  • 設置場所: サイトのルートディレクトリ(ドメイン直下)
  • フォーマット: マークダウン構文のプレーンテキスト(text/plainとして配信)
  • 文字コード: UTF-8(BOMなし推奨)

LLMs.txtはどのような書き方(構文)で書けばよいですか?

基本はマークダウン構文で記述します。必須項目は「H1タイトル」の1つだけです。

  • 【必須】H1 (サイト名): # サイト名 をファイルの先頭に1つだけ記述します。
  • 【推奨】ブロッククォート (サイト概要): > サイトの概要 をH1の次に1〜2文で記述します。
  • 【推奨】H2 (セクション): ## サービス紹介 のように、コンテンツを論理的に分類します。
  • 【推奨】リンク (URL): [表示テキスト](https://example.com/page): 説明文 の形式で、必ず「絶対URL(https)」と「簡潔な説明文」を記載します。
  • 【オプション】## Optional (補足情報): 優先度の低い情報(コミュニティリンクなど)をこの見出し以下に配置します。

LLMs.txtには、サイトのどのページを載せればよいですか?

サイトの全ページを載せるのではなく、AIに伝えたい「最も重要な情報」だけを厳選(キュレーション)することが求められます。

含めるべきコンテンツ:

  • 会社概要、事業内容、ミッションなど企業の核心情報
  • 主要な製品・サービスページ
  • よくある質問(FAQ)
  • 導入事例やお客様の声など、信頼性を示すページ
  • 長期的に価値のあるガイド記事(エバーグリーンコンテンツ)

避けるべきコンテンツ:

  • サイトの全ページ(まずは10〜20ページに絞るのが賢明)
  • 情報が古い、または内容が薄いページ
  • 過度な宣伝文句
  • リンク切れのページ