DocumentParser (Java Platform SE 8)

java.lang.Object
- javax.swing.text.html.parser.Parser
- - javax.swing.text.html.parser.DocumentParser

すべての実装されたインタフェース:

DTDConstants
```
public class DocumentParser
extends Parser
```
HTMLドキュメントのParserです。実際にはDTDを指定できますが、swingのhtml dtdにはこのクラスだけを使うようにしてください。 HTMLのInputStreamを読み取り、ParserCallbackクラスの適切なメソッドを呼び出します。これは、HTMLEditorKitがHTML urlを解析するために使用するデフォルトのパーサーです。
有効なすべてのタグ、および暗示されているが明示的には指定されていないタグに対して、コールバックを伝えます。たとえば、HTML文字列(<p>blah)で定義されているのはpタグだけです。コールバックは次のメソッドを検出します。
1. handleStartTag(html, ...)
2. handleStartTag(head, ...)
3. handleEndTag(head)
4. handleStartTag(body, ...)
5. handleStartTag(p, ...)
6. handleText(...)
7. handleEndTag(p)
8. handleEndTag(body)
9. handleEndTag(html)
italicの項目は暗示されています。つまり、明示的には指定されていませんが、正しいHTMLであるために存在しているということです(headは必要ありませんが、生成されます)。暗示されるタグについては、AttributeSet引数がキーHTMLEditorKit.ParserCallback.IMPLIEDにBoolean.TRUEの値を持ちます。
HTML.Attributesは型保証されたHTML属性の列挙を定義します。タグの属性キーがHTML.Attributeで定義される場合はHTML.Attributeがキーとして使用され、それ以外の場合はStringが使用されます。たとえば<p foo=bar class=neat>には2つの属性があります。fooはHTML.Attributeでは定義されず、クラスはHTML.Attributeで定義されるため、AttributeSetは2つの値を持ちます。「neat」というString値を持つHTML.Attribute.CLASSと、「bar」というString値を持つStringキー「foo」です。
位置引数はタグ、コメント、またはテキストの開始を示します。配列と同様に、ストリームの最初の文字は0という位置が設定されます。暗示されるタグの場合、位置は次に検出されるタグの位置を示します。最初の例では、bodyおよびhtmlの暗示された開始タグはpタグと同じ位置が設定され、p、htmlおよびbodyの暗示された終了タグはすべて同じ位置が設定されています。
HTMLは空白をスキップするため、テキストの位置は最初の有効な文字の位置になります。たとえば文字列\n\n\nblahでは、テキストblahは3という位置が設定され、改行はスキップされます。
値を持たない属性、たとえばHTML文字列<foo blah>の属性blahは値を持ちませんが、こうした属性の場合は、AttributeSetの値に配置される値として次の2つが考えられます。
- DTDが要素の定義を含まない場合、または定義に明示的な値がない場合は、AttributeSetの値はHTML.NULL_ATTRIBUTE_VALUEとなる。
- DTDが明示的な値を含む場合はdtdのその値が使用される。たとえば<!ATTLIST OPTION selected (selected)#IMPLIED>では、dtdの値(この場合はselected)が使用される。
ストリームの解析が終了すると、コールバックは行末文字列である可能性が高い文字列の通知を受けます。行末文字列は、ストリームの解析中にもっとも多く検出される\n、\rまたは\r\nのどれかです。

フィールドのサマリー
- クラス javax.swing.text.html.parser.Parserから継承されたフィールド
  dtd, strict
- インタフェース javax.swing.text.html.parser.DTDConstantsから継承されたフィールド
  ANY, CDATA, CONREF, CURRENT, DEFAULT, EMPTY, ENDTAG, ENTITIES, ENTITY, FIXED, GENERAL, ID, IDREF, IDREFS, IMPLIED, MD, MODEL, MS, NAME, NAMES, NMTOKEN, NMTOKENS, NOTATION, NUMBER, NUMBERS, NUTOKEN, NUTOKENS, PARAMETER, PI, PUBLIC, RCDATA, REQUIRED, SDATA, STARTTAG, SYSTEM

コンストラクタのサマリー

コンストラクタ
コンストラクタ説明

DocumentParser(DTD dtd)

コンストラクタ
コンストラクタ	説明
`DocumentParser(DTD dtd)`

メソッドのサマリー

すべてのメソッドインスタンス・メソッド具象メソッド
修飾子と型	メソッド	説明
`protected void`	`handleComment(char[] text)`	HTMLのコメントを検出したときに呼び出されます。
`protected void`	`handleEmptyTag(TagElement tag)`	空のタグを処理します。
`protected void`	`handleEndTag(TagElement tag)`	終了タグを処理します。
`protected void`	`handleError(int ln, String errorMsg)`	エラーが発生したことを示す。
`protected void`	`handleStartTag(TagElement tag)`	開始タグを処理します。
`protected void`	`handleText(char[] data)`	テキストを処理します。
`void`	`parse(Reader in, HTMLEditorKit.ParserCallback callback, boolean ignoreCharSet)`

クラス javax.swing.text.html.parser.Parserから継承されたメソッド
endTag, error, error, error, error, flushAttributes, getAttributes, getCurrentLine, getCurrentPos, handleEOFInComment, handleTitle, makeTag, makeTag, markFirstTime, parse, parseDTDMarkup, parseMarkupDeclarations, startTag

クラス java.lang.Objectから継承されたメソッド
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait

- コンストラクタの詳細
  - DocumentParser
```
public DocumentParser(DTD dtd)
```
- メソッドの詳細
  - parse
```
public void parse(Reader in,
                  HTMLEditorKit.ParserCallback callback,
                  boolean ignoreCharSet)
           throws IOException
```
    例外:
    
    IOException
  - handleStartTag
```
protected void handleStartTag(TagElement tag)
```
    開始タグを処理します。
    
    オーバーライド:
    
    handleStartTag、クラスParser
  - handleComment
```
protected void handleComment(char[] text)
```
    次のクラスからコピーされた説明: Parser
    
    HTMLのコメントを検出したときに呼び出されます。
    
    オーバーライド:
    
    handleComment、クラスParser
  - handleEmptyTag
```
protected void handleEmptyTag(TagElement tag)
                       throws ChangedCharSetException
```
    空のタグを処理します。
    
    オーバーライド:
    
    handleEmptyTag、クラスParser
    
    例外:
    
    ChangedCharSetException
  - handleEndTag
```
protected void handleEndTag(TagElement tag)
```
    終了タグを処理します。
    
    オーバーライド:
    
    handleEndTag、クラスParser
  - handleText
```
protected void handleText(char[] data)
```
    テキストを処理します。
    
    オーバーライド:
    
    handleText、クラスParser
  - handleError
```
protected void handleError(int ln,
                           String errorMsg)
```
    次のクラスからコピーされた説明: Parser
    
    エラーが発生したことを示す。
    
    オーバーライド:
    
    handleError、クラスParser

バグまたは機能を送信
詳細なAPIリファレンスおよび開発者ドキュメントについては、Java SEのドキュメントを参照してください。そのドキュメントには、概念的な概要、用語の定義、回避方法、有効なコード例などの、開発者を対象にしたより詳細な説明が含まれています。
Copyright © 1993, 2025, Oracle and/or its affiliates. All rights reserved. Use is subject to license terms. Documentation Redistribution Policyも参照してください。

クラスDocumentParser

フィールドのサマリー

クラス javax.swing.text.html.parser.Parserから継承されたフィールド

インタフェース javax.swing.text.html.parser.DTDConstantsから継承されたフィールド

コンストラクタのサマリー

メソッドのサマリー

クラス javax.swing.text.html.parser.Parserから継承されたメソッド

クラス java.lang.Objectから継承されたメソッド

コンストラクタの詳細

DocumentParser

メソッドの詳細

parse

handleStartTag

handleComment

handleEmptyTag

handleEndTag

handleText

handleError