データ段階では、ロボットがその URL のリソースのコンテンツをダウンロードしているので、記述、作成者などのコンテンツに関するデータにアクセスできます。
リソースが HTML ファイルである場合、ロボットは HTML ヘッダーの <META> タグをパースします。したがって、<META> タグに含まれるデータは、データ段階で使用可能です。
データ段階では、メタデータ段階で使用可能なソースのほかに、次のソースを RAF で使用できます。
表 19–3 データ段階で RAF で使用できるソース
ソース |
説明 |
例 |
---|---|---|
content-charset |
リソースが使用する文字セット | |
content-encoding |
エンコードの形式 | |
content-length |
リソースのバイト単位のサイズ | |
content-type |
リソースの MIME タイプ |
text/html、image/jpeg |
expires |
リソースが期限切れになる日付 | |
last-modified |
リソースの最終更新日 | |
<META> タグ内のデータ |
HTML リソースのヘッダーの <META> タグで提供されるデータ |
作成者、記述、キーワード |
<META> タグのデータを除くこれらのすべてのソースは、リソースの取得時に返される HTTP 応答ヘッダーから派生されます。