コンテンツカテゴリー

ほとんどの HTML 要素は 1 つ以上のコンテンツカテゴリーに属していて、カテゴリーごとに共通した特徴を持つ要素を分類しています。これは緩やかなグループ分けです(実際にはこれらのカテゴリーの要素間の関係を作成していません)。しかし、これらは、特にその複雑な詳細に遭遇したときに、カテゴリーの共有動作とその関連ルールを定義し記述するのに役立ちます。どのカテゴリーにも属さない要素も存在します。

コンテンツカテゴリーは 3 種類あります。

  • 主要コンテンツカテゴリー。これは多くの要素で共通のルールを定義します。
  • フォーム関連コンテンツカテゴリー。これはフォーム関連の要素に共通のルールを定義します。
  • 固有のコンテンツカテゴリー。これはいくつかの要素だけ、場合によっては特定の文脈でだけ使われる、稀なカテゴリーです。

メモ: コンテンツカテゴリーとその機能比較についての詳細な説明は、この記事の範囲外です。詳しく知りたければ、 HTML 仕様書の関連部分を読みましょう。

様々なコンテンツカテゴリーの相互関係を示すベン図。以下の節では、これらの関係をテキストで説明します。

主要コンテンツカテゴリー

メタデータコンテンツ

メタデータコンテンツのカテゴリーに属する要素は、表示方法や文書のその他の部分の挙動を変化させたり、他の文書へのリンクを確立させたり、その他の本文外の情報を伝えたりします。

このカテゴリーに属する要素は、<base>, <link>, <meta>, <noscript>, <script>, <style>, <title> です。

フローコンテンツ

フローコンテンツは、 <body> 要素の中に入ることができるほとんどの要素を含む広いカテゴリーで、見出し要素、区分要素、記述要素、埋め込み要素、対話的要素、フォーム関連要素などが含まれます。また、テキストノードも含まれます(ただし、ホワイトスペースのみで構成されるものは除きます)。

フローコンテンツは次の通りです。

特定の条件が満たされている場合のみ、このカテゴリーに属する要素がいくつか存在します。

区分コンテンツ

区分コンテンツ (sectioning content) はフローコンテンツのサブセットであり、現在のアウトライン内のセクションを作成し、これが <header><footer> 要素の範囲を定義します。

このカテゴリーに属する要素は、 <article>, <aside>, <nav>, <section> です。

見出しコンテンツ

見出しコンテンツ (heading content) はフローコンテンツのサブセットで、セクションのタイトルを定義します。この定義は、明示的な区分コンテンツ要素によってマークされたセクションと、見出しコンテンツ自体によって暗黙的に定義されたセクションの両方に適用されます。

このカテゴリーに属する要素は、 <h1>-<h6>, <hgroup> です。

メモ: <header> 要素は見出しを含む可能性がありますが、それ自身は見出しコンテンツではありません。

記述コンテンツ

記述コンテンツ (phrasing content) は、文章とその中に含まれるマークアップを定義します。記述コンテンツの集まりで段落を構成します。

このカテゴリーに属する要素は、次の通りです。

他にも特定の条件が満たされたときのみ、このカテゴリーに属する要素がいくつかあります。

  • <a>: 記述コンテンツだけを含む場合
  • <area>: <map> 要素の子孫である場合
  • <del>: 記述コンテンツだけを含む場合
  • <ins>: 記述コンテンツだけを含む場合
  • <link>: itemprop 属性がある場合
  • <map>: 記述コンテンツだけを含む場合
  • <meta>: itemprop 属性がある場合

埋め込みコンテンツ

埋め込みコンテンツ (Embedded content) は、文書に他のリソースを取り込んだり、他のマークアップ言語や名前空間を挿入したりするものです。このカテゴリーに属する要素は、次の通りです。

対話型コンテンツ

対話型コンテンツ (interactive content) にはユーザーとのやり取りのために固有にデザインされた要素が含まれます。このカテゴリーに属する要素は、次の通りです。

要素によっては、特定の条件下にある場合にのみこのカテゴリーに所属します。

知覚可能コンテンツ

コンテンツが空でも非表示でもない時は知覚可能 (palpable) です。これは描画され実在するコンテンツです。フローコンテンツまたは記述コンテンツの要素には、知覚可能なノードが少なくとも 1 つあります。

フォーム関連コンテンツ

フォーム関連コンテンツ (form-associated content) は form 属性によって表される、フォームオーナーを持つ要素を含みます。フォームオーナーは、このカテゴリーの要素を内包する <form> 要素か form 属性で id が指定された要素です。

このカテゴリーにはいくつかのサブカテゴリーが含まれています。

リスト化

IDL コレクションの form.elements と fieldset.elements によってリスト化された要素です。 <button>, <fieldset>, <input>, <object>, <output>, <select>, <textarea> を含みます。

ラベル付け可能

<label> に関連付けできる要素です。 <button>, <input>, <meter>, <output>, <progress>, <select>, <textarea> を含みます。

送信可能

フォームが送信 (submit) されるときにフォームデータセットを構築するために用いることができる要素です。 <button>, <input>, <object>, <select>, <textarea> を含みます。

リセット可能

フォームがリセットされるときに影響を受けることがある要素です。 <input>, <output>, <select> <textarea> を含みます。

二次カテゴリー

要素の二次分類がいくつかあり、知っておくと便利です。

スクリプト対応要素

スクリプト対応要素 (Script-supporting elements) は、文書の出力に直接貢献はしない要素です。代わりに、スクリプトコードを直接含んだり、スクリプトで使われるデータを定義したりして、スクリプトへの対応のために働きます。

スクリプト対応要素は以下の通りです。

透過的コンテンツモデル

要素が透過的コンテンツモデル (transparent content model) を持っている場合、透過的な要素が削除されたり、子要素で置き換えられたりしても、それ自身のコンテンツが必ず妥当な HTML 5 として構造化されているものです。

例えば、 <del><ins> 要素は透過的です。

html
<p>
  私たちはこれらの真実を<del><em>不可侵なものでありかつ否定できない</em></del
  ><ins>自明の</ins>ものであるとし続けた。
</p>

これらの要素が削除されたとしても、この断片は(文章としては正しくありませんが)妥当な HTML です。

html
<p>
  私たちはこれらの真実を<em>不可侵なものでありかつ否定できない</em>自明のものであるとし続けた。
</p>