正規表現とは、パターン一致によって検索文字列をカスタマイズする文字です。文字列をパターンに対して一致させることも、一致する文字列の一部を抽出することもできます。
JDeveloperでは、Apache Jakarta正規表現パッケージが使用されます。正規表現構文のJavadocは、http://jakarta.apache.org/regexp/apidocs/org/apache/regexp/RE.html
で入手できます。次の表に、正規表現についてまとめます。
正規表現 | 使用方法 |
---|---|
文字 | |
unicodeChar | 同じUnicode文字に一致します。 |
¥ | メタ文字(*など)の引用に使用されます。 |
¥¥ | 1つの¥文字に一致します。 |
¥Onn | 所定の8進数字に一致します。 |
¥xhh | 所定の8ビット16進数字に一致します。 |
¥¥uhhh | 所定の16ビット16進数字に一致します。 |
¥t | ASCIIタブ文字に一致します。 |
¥n | ASCII改行文字に一致します。 |
¥r | ASCII復帰文字に一致します。 |
¥f | ASCII改ページ文字に一致します。 |
文字クラス | |
[abc] | 単純な文字クラスに一致します。 |
[a -zA-Z] | 範囲指定された文字クラスに一致します。 |
[^abc] | 否定文字クラスに一致します。 |
標準的なPOSIX文字クラス | |
[:alnum:] | 英数字に一致します。 |
[:alpha:] | アルファベット文字に一致します。 |
[:blank:] | スペースおよびタブ文字に一致します。 |
[:cntrl:] | 制御文字に一致します。 |
[:digit:] | 数字に一致します。 |
[:graph:] | 印刷可能かつ表示可能な文字に一致します(たとえば、スペースは印字可能だが表示可能ではありません。aは、印字可能かつ表示可能です)。 |
[:lower:] | アルファベットの小文字に一致します。 |
[:print:] | 印字可能な文字(制御文字以外の文字)に一致します。 |
[:punct:] | 句読点(通常の文字、数字、制御文字または空白文字以外の文字)に一致します。 |
[:space:] | 空白文字(スペース、タブおよび改ページなど)に一致します。 |
[:upper:] | アルファベットの大文字に一致します。 |
[:xdigit:] | 16進数字に一致します。 |
非標準的なPOSIX形式の文字クラス | |
[:javastart:] | Java識別子の始まりに一致します。 |
[:javapart:] | Java識別子の一部に一致します。 |
事前定義済のクラス | |
. | 改行以外の任意の文字に一致します。 |
¥w | 意味を持つ文字(英数字および_)に一致します。 |
¥W | 意味を持たない文字に一致します。 |
¥s | 空白文字に一致します。 |
¥S | 空白文字以外の文字に一致します。 |
¥d | 数字に一致します。 |
¥D | 数字以外の文字に一致します。 |
境界との一致 | |
^ | 行頭にのみ一致します。 |
$ | 行末にのみ一致します。 |
¥b | 単語の境界にのみ一致します。 |
¥B | 単語の境界以外にのみ一致します。 |
最長一致数量子 | |
A* | 0回以上のAに一致します(最長一致)。 |
A+ | 1回以上のAに一致します(最長一致)。 |
A? | 0回または1回のAに一致します(最長一致)。 |
A{n} | n回のAに一致します(最長一致)。 |
A{n, } | n回以上のAに一致します(最長一致)。 |
A{n,m} | n回以上かつm回以下のAに一致します(最長一致)。 |
最短一致数量子 | |
A*? | 0回以上のAに一致します(最短一致)。 |
A+? | 1回以上のAに一致します(最短一致)。 |
A?? | 0回または1回のAに一致します(最短一致)。 |
論理演算子 | |
AB | AとBの連続に一致します。 |
A|B | AかBのいずれかに一致します。 |
(A) | サブ式のグループ化に使用されます。 |
後方参照 | |
¥1 | カッコで囲まれた最初のサブ式への後方参照。 |
¥2 | カッコで囲まれた2番目のサブ式への後方参照。 |
¥3 | カッコで囲まれた3番目のサブ式への後方参照。 |
¥4 | カッコで囲まれた4番目のサブ式への後方参照。 |
¥5 | カッコで囲まれた5番目のサブ式への後方参照。 |
¥6 | カッコで囲まれた6番目のサブ式への後方参照。 |
¥7 | カッコで囲まれた7番目のサブ式への後方参照。 |
¥8 | カッコで囲まれた8番目のサブ式への後方参照。 |
¥9 | カッコで囲まれた9番目のサブ式への後方参照。 |