- すべての実装されたインタフェース:
Serializable
,Comparable<Character>
,Constable
Character
クラスは、プリミティブ型char
の値をオブジェクトにラップします。 クラスCharacter
のオブジェクトには、タイプがchar
である単一のフィールドが含まれます。
また、このクラスは、文字カテゴリ(小文字、数字など。)を決定するため、また大文字から小文字への変換やその逆のために多数の静的メソッドを提供します。
Unicode適合
Character
クラスのフィールドとメソッドは、Unicode規格(特にUnicode文字データベースの一部であるUnicodeDataファイル)からの文字情報に基づいて定義されます。 このファイルは、割り当てられたすべてのUnicodeコード・ポイントまたは文字範囲の名前およびカテゴリを含むプロパティを指定します。 このファイルは、http://www.unicode.orgのUnicode Consortiumから入手できます。
文字情報は、Unicode Standardバージョン15.1に基づいています。
Javaプラットフォームは、長期にわたって異なるバージョンのUnicode Standardをサポートしました。 新しいバージョンのUnicode Standardへのアップグレードは、それぞれ新しいバージョンを示す次のJavaリリースで行われました:
Javaリリース | Unicodeバージョン |
---|---|
Java SE 22 | Unicode 15.1 |
Java SE 20 | Unicode 15.0 |
Java SE 19 | Unicode 14.0 |
Java SE 15 | Unicode 13.0 |
Java SE 13 | Unicode 12.1 |
Java SE 12 | Unicode 11.0 |
Java SE 11 | Unicode 10.0 |
Java SE 9 | Unicode 8.0 |
Java SE 8 | Unicode 6.2 |
Java SE 7 | Unicode 6.0 |
Java SE 5.0 | Unicode 4.0 |
Java SE 1.4 | Unicode 3.0 |
JDK 1.1 | Unicode 2.0 |
JDK 1.0.2 | Unicode 1.1.5 |
Unicode文字表現
char
データ型(Character
オブジェクトにカプセル化される値)は、当初のUnicode仕様に基づいています。この仕様では、文字が固定幅16ビット・エンティティとして定義されていました。 Unicode標準はその後、16ビット以上の表現を必要とする文字を許容するように変更されています。 適正なコード・ポイントの範囲は、現在U+0000 - U+10FFFFであり、Unicodeスカラー値として知られています。 (Unicode標準のU+n表記の定義を参照。)
U+0000 - U+FFFFの文字セットは、基本多言語面(BMP)と呼ばれる場合もあります。 コード・ポイントがU+FFFFよりも大きい文字は補助文字と呼ばれます。 Javaプラットフォームでは、char
配列、String
クラス、およびStringBuffer
クラスでUTF-16表現が使用されます。 この表現では、補助文字はchar
値のペアとして表現され、上位サロゲート範囲(\uD800-\uDBFF)からの最初の値と、下位サロゲート範囲(\uDC00-\uDFFF)からの第2の値から構成されています。
したがって、char
値は、サロゲート・コード・ポイントやUTF-16エンコーディングのコード単位を含む基本多言語面(BMP)コード・ポイントを表します。 int
値は、補助コード・ポイントを含むすべてのUnicodeコード・ポイントを表します。 int
の下位(最下位) 21ビットは、Unicodeコード・ポイントを表すために使用され、上位(最上位) 11ビットはゼロである必要があります。 特に指定されないかぎり、補助文字とサロゲートchar
値に関する動作は次のとおりです。
char
値だけを受け入れるメソッドは補助文字に対応できません。 これらのメソッドはサロゲート範囲のchar
値を未定義の文字として扱います。 たとえば、Character.isLetter('\uD840')
はfalse
を返し、文字列でそのあとに下位サロゲート値が続く場合でも、この特定の値は文字を表します。int
値を受け入れるメソッドは、補助文字を含むすべてのUnicode文字に対応します。 たとえば、Character.isLetter(0x2F81A)
は、コード・ポイント値が文字(CJK統合漢字)を表すため、true
を返します。
Java SE APIドキュメンテーションでは、U+0000 - U+10FFFFの範囲の文字値にUnicodeコード・ポイントを使用し、UTF-16エンコーディングのコード単位である16ビットchar
値にUnicodeコード単位を使用します。 Unicode用語の詳細は、「Unicode Glossary」を参照してください。
これはvalue-basedクラスです。プログラマは、equalのインスタンスを交換可能として扱い、同期にインスタンスを使用しないようにする必要があります。そうしないと、予期しない動作が発生する可能性があります。 たとえば、将来のリリースでは、同期が失敗する可能性があります。
- 導入されたバージョン:
- 1.0
- 外部仕様
- 関連項目:
-
ネストされたクラスのサマリー
修飾子と型クラス説明static class
このクラスのインスタンスは、Unicode文字セットの特定のサブセットを表します。static final class
Unicode仕様で定義されている文字ブロックを表す文字サブセットのファミリです。static enum
「Unicode Standard Annex#24: Script Names」で規定された文字スクリプトを表す文字サブセットのファミリです。 -
フィールドのサマリー
修飾子と型フィールド説明static final int
符号なしバイナリ形式でchar
値を表すために使用されるバイト数。static final byte
Unicode仕様の汎用カテゴリ「Mc」。static final byte
Unicode仕様の汎用カテゴリ「Pc」。static final byte
Unicode仕様の汎用カテゴリ「Cc」。static final byte
Unicode仕様の汎用カテゴリ「Sc」。static final byte
Unicode仕様の汎用カテゴリ「Pd」。static final byte
Unicode仕様の汎用カテゴリ「Nd」。static final byte
Unicode仕様の弱い双方向文字タイプ「AN」。static final byte
Unicode仕様の弱い双方向文字タイプ「BN」。static final byte
Unicode仕様の弱い双方向文字タイプ「CS」。static final byte
Unicode仕様の弱い双方向文字タイプ「EN」。static final byte
Unicode仕様の弱い双方向文字タイプ「ES」。static final byte
Unicode仕様の弱い双方向文字タイプ「ET」。static final byte
Unicode仕様の弱い双方向文字タイプ"FSI"。static final byte
Unicode仕様の強力な双方向文字タイプ「L」。static final byte
Unicode仕様の強力な双方向文字タイプ「LRE」。static final byte
Unicode仕様の弱い双方向文字タイプ"LRI"。static final byte
Unicode仕様の強力な双方向文字タイプ「LRO」。static final byte
Unicode仕様の弱い双方向文字タイプ「NSM」。static final byte
Unicode仕様のニュートラルな双方向文字タイプ「ON」。static final byte
Unicode仕様のニュートラルな双方向文字タイプ「B」。static final byte
Unicode仕様の弱い双方向文字タイプ「PDF」。static final byte
Unicode仕様の弱い双方向文字タイプ"PDI"。static final byte
Unicode仕様の強力な双方向文字タイプ「R」。static final byte
Unicode仕様の強力な双方向文字タイプ「AL」。static final byte
Unicode仕様の強力な双方向文字タイプ「RLE」。static final byte
Unicode仕様の弱い双方向文字タイプ"RLI"。static final byte
Unicode仕様の強力な双方向文字タイプ「RLO」。static final byte
Unicode仕様のニュートラルな双方向文字タイプ「S」。static final byte
未定義の双方向文字タイプ。static final byte
Unicode仕様のニュートラルな双方向文字タイプ「WS」。static final byte
Unicode仕様の汎用カテゴリ「Me」。static final byte
Unicode仕様の汎用カテゴリ「Pe」。static final byte
Unicode仕様の汎用カテゴリ「Pf」。static final byte
Unicode仕様の汎用カテゴリ「Cf」。static final byte
Unicode仕様の汎用カテゴリ「Pi」。static final byte
Unicode仕様の汎用カテゴリ「Nl」。static final byte
Unicode仕様の汎用カテゴリ「Zl」。static final byte
Unicode仕様の汎用カテゴリ「Ll」。static final byte
Unicode仕様の汎用カテゴリ「Sm」。static final int
Unicodeコード・ポイントの最大値(定数U+10FFFF
)。static final char
UTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最大値(定数'\uDBFF'
)。static final char
UTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最大値(定数'\uDFFF'
)。static final int
文字列との変換に使用可能な最大基数です。static final char
UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最大値(定数'\uDFFF'
)。static final char
このフィールドの定数値は、char
型の最大値'\uFFFF'
です。static final int
Unicodeコード・ポイントの最小値(定数U+0000
)。static final char
UTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最小値(定数'\uD800'
)。static final char
UTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最小値(定数'\uDC00'
)。static final int
文字列との変換に使用可能な最小基数です。static final int
Unicode補助コード・ポイントの最小値(定数U+10000
)。static final char
UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最小値(定数'\uD800'
)。static final char
このフィールドの定数値は、char
型の最小値'\u0000'
です。static final byte
Unicode仕様の汎用カテゴリ「Lm」。static final byte
Unicode仕様の汎用カテゴリ「Sk」。static final byte
Unicode仕様の汎用カテゴリ「Mn」。static final byte
Unicode仕様の汎用カテゴリ「Lo」。static final byte
Unicode仕様の汎用カテゴリ「No」。static final byte
Unicode仕様の汎用カテゴリ「Po」。static final byte
Unicode仕様の汎用カテゴリ「So」。static final byte
Unicode仕様の汎用カテゴリ「Zp」。static final byte
Unicode仕様の汎用カテゴリ「Co」。static final int
符号なしバイナリ形式のchar
値を表すために使用されるビット数、定数16
。static final byte
Unicode仕様の汎用カテゴリ「Zs」。static final byte
Unicode仕様の汎用カテゴリ「Ps」。static final byte
Unicode仕様の汎用カテゴリ「Cs」。static final byte
Unicode仕様の汎用カテゴリ「Lt」。プリミティブ型char
を表すClass
インスタンス。static final byte
Unicode仕様の汎用カテゴリ「Cn」。static final byte
Unicode仕様の汎用カテゴリ「Lu」。 -
コンストラクタのサマリー
コンストラクタ説明Character
(char value) 削除予定のため非推奨: このAPI要素は、将来のバージョンで削除される可能性があります。このコンストラクタを使用することはほとんどありません。 -
メソッドのサマリー
修飾子と型メソッド説明static int
charCount
(int codePoint) 指定された文字(Unicodeコード・ポイント)を表すのに必要なchar
値の数を判定します。char
このCharacter
オブジェクトの値を返します。static int
codePointAt
(char[] a, int index) char
配列の指定されたインデックスにあるコード・ポイントを返します。static int
codePointAt
(char[] a, int index, int limit) limit
の長さ未満のindex
を持つ配列要素のみを使用可能な、char
配列の指定されたインデックスにあるコード・ポイントを返します。static int
codePointAt
(CharSequence seq, int index) CharSequence
の指定されたインデックスにあるコード・ポイントを返します。static int
codePointBefore
(char[] a, int index) char
配列の指定されたインデックスの前にあるコード・ポイントを返します。static int
codePointBefore
(char[] a, int index, int start) start
以上のindex
を持つ配列要素のみを使用可能な、char
配列の指定されたインデックスの前にあるコード・ポイントを返します。static int
codePointBefore
(CharSequence seq, int index) CharSequence
の指定されたインデックスの前にあるコード・ポイントを返します。static int
codePointCount
(char[] a, int offset, int count) char
配列引数の部分配列内にあるUnicodeコード・ポイントの数を返します。static int
codePointCount
(CharSequence seq, int beginIndex, int endIndex) 指定されたcharシーケンスのテキスト範囲内のUnicodeコード・ポイントの数を返します。static int
codePointOf
(String name) 指定された文字名で指定されたUnicode文字のコード・ポイント値を返します。static int
compare
(char x, char y) 2つのchar
値を数値的に比較します。int
2つのCharacter
オブジェクトを数値的に比較します。このインスタンスの名目記述子を含むOptional
を返します。static int
digit
(char ch, int radix) 指定された基数での、文字ch
の数値としての値を返します。static int
digit
(int codePoint, int radix) 指定された基数での、指定された文字(Unicodeコード・ポイント)の数値を返します。boolean
このオブジェクトと指定されたオブジェクトを比較します。static char
forDigit
(int digit, int radix) 指定された基数での、指定された桁数の文字表現を判定します。static byte
getDirectionality
(char ch) 指定された文字のUnicode方向性プロパティを返します。static byte
getDirectionality
(int codePoint) 所定の文字(Unicodeコード・ポイント)のUnicode方向性プロパティを返します。static String
getName
(int codePoint) 指定された文字codePoint
の名前を返します。コード・ポイントがunassigned
の場合はnullを返します。static int
getNumericValue
(char ch) 指定されたUnicode文字が表すint
値を返します。static int
getNumericValue
(int codePoint) 指定された文字(Unicodeコード・ポイント)が表すint
値を返します。static int
getType
(char ch) 文字の汎用カテゴリを示す値を返します。static int
getType
(int codePoint) 文字の汎用カテゴリを示す値を返します。int
hashCode()
このCharacter
のハッシュ・コード(charValue()
を呼び出した場合の結果と等しくなる)を返します。static int
hashCode
(char value) Character.hashCode()
との互換性がある、char
値のハッシュ・コードを返します。static char
highSurrogate
(int codePoint) UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのリーディング・サロゲート(上位サロゲート・コード単位)を返します。static boolean
isAlphabetic
(int codePoint) 指定された文字(Unicodeコード・ポイント)がアルファベットかどうかを判定します。static boolean
isBmpCodePoint
(int codePoint) 指定された文字(Unicodeコード・ポイント)が基本多言語面(BMP)に含まれるかどうかを判定します。static boolean
isDefined
(char ch) 文字がUnicodeで定義されているかどうかを判定します。static boolean
isDefined
(int codePoint) 文字(Unicodeコード・ポイント)がUnicodeで定義されているかどうかを判定します。static boolean
isDigit
(char ch) 指定された文字が数字かどうかを判定します。static boolean
isDigit
(int codePoint) 指定された文字(Unicodeコード・ポイント)が数字かどうかを判定します。static boolean
isEmoji
(int codePoint) 指定した文字(Unicodeコード・ポイント)が絵文字かどうかを決定します。static boolean
isEmojiComponent
(int codePoint) 指定した文字(Unicodeコード・ポイント)が絵文字コンポーネントかどうかを決定します。static boolean
isEmojiModifier
(int codePoint) 指定した文字(Unicodeコード・ポイント)が絵文字修飾子かどうかを決定します。static boolean
isEmojiModifierBase
(int codePoint) 指定した文字(Unicodeコード・ポイント)が絵文字修飾子ベースかどうかを決定します。static boolean
isEmojiPresentation
(int codePoint) 指定された文字(Unicodeコード・ポイント)にデフォルトで絵文字プレゼンテーション・プロパティがあるかどうかを決定します。static boolean
isExtendedPictographic
(int codePoint) 指定した文字(Unicodeコード・ポイント)が拡張ピクチャかどうかを決定します。static boolean
isHighSurrogate
(char ch) 指定されたchar
値がUnicode上位サロゲート・コード単位 (リーディング・サロゲート・コード単位ともいう)であるかどうかを判定します。static boolean
isIdentifierIgnorable
(char ch) 指定された文字が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。static boolean
isIdentifierIgnorable
(int codePoint) 指定された文字(Unicodeコード・ポイント)が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。static boolean
isIdeographic
(int codePoint) 指定された文字(Unicodeコード・ポイント)が、Unicode標準で規定されたCJKV (中国語、日本語、韓国語、およびベトナム語)の表意文字かどうかを判定します。static boolean
isISOControl
(char ch) 指定された文字がISO制御文字かどうかを判定します。static boolean
isISOControl
(int codePoint) 参照された文字(Unicodeコード・ポイント)がISO制御文字かどうかを判定します。static boolean
isJavaIdentifierPart
(char ch) 指定された文字をJava識別子の最初の文字以外に使用可能かどうかを判定します。static boolean
isJavaIdentifierPart
(int codePoint) 文字(Unicodeコード・ポイント)をJava識別子の最初の文字以外に使用可能かどうかを判定します。static boolean
isJavaIdentifierStart
(char ch) 指定された文字をJava識別子の最初の文字として指定可能かどうかを判定します。static boolean
isJavaIdentifierStart
(int codePoint) 文字(Unicodeコード・ポイント)をJava識別子の最初の文字として指定可能かどうかを判定します。static boolean
isJavaLetter
(char ch) 非推奨。isJavaIdentifierStart(char)に置き換えられました。static boolean
isJavaLetterOrDigit
(char ch) 非推奨。isJavaIdentifierPart(char)に置き換えられました。static boolean
isLetter
(char ch) 指定された文字が汎用文字かどうかを判定します。static boolean
isLetter
(int codePoint) 指定された文字(Unicodeコード・ポイント)が汎用文字かどうかを判定します。static boolean
isLetterOrDigit
(char ch) 指定された文字が汎用文字または数字かどうかを判定します。static boolean
isLetterOrDigit
(int codePoint) 指定された文字(Unicodeコード・ポイント)が汎用文字または数字かどうかを判定します。static boolean
isLowerCase
(char ch) 指定された文字が小文字かどうかを判定します。static boolean
isLowerCase
(int codePoint) 指定された文字(Unicodeコード・ポイント)が小文字かどうかを判定します。static boolean
isLowSurrogate
(char ch) 指定されたchar
値がUnicode下位サロゲート・コード単位 (トレーリング・サロゲート・コード単位ともいう)であるかどうかを判定します。static boolean
isMirrored
(char ch) Unicode仕様に従って文字をミラー化するかどうかを判定します。static boolean
isMirrored
(int codePoint) Unicode仕様に従って、指定された文字(Unicodeコード・ポイント)をミラー化するかどうかを判定します。static boolean
isSpace
(char ch) 非推奨。isWhitespace(char)に置き換えられました。static boolean
isSpaceChar
(char ch) 指定された文字がUnicodeの空白文字かどうかを判定します。static boolean
isSpaceChar
(int codePoint) 指定された文字(Unicodeコード・ポイント)がUnicodeの空白文字かどうかを判定します。static boolean
isSupplementaryCodePoint
(int codePoint) 指定された文字(Unicodeコード・ポイント)が補助文字の範囲にあるかどうかを判定します。static boolean
isSurrogate
(char ch) 指定されたchar
値がUnicode サロゲート・コード単位かどうかを判定します。static boolean
isSurrogatePair
(char high, char low) 指定されたchar
値のペアが有効なUnicodeサロゲート・ペアであるかどうかを判定します。static boolean
isTitleCase
(char ch) 指定された文字がタイトル・ケース文字かどうかを判定します。static boolean
isTitleCase
(int codePoint) 指定された文字(Unicodeコード・ポイント)がタイトル・ケース文字かどうかを判定します。static boolean
isUnicodeIdentifierPart
(char ch) 指定された文字をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。static boolean
isUnicodeIdentifierPart
(int codePoint) 指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。static boolean
isUnicodeIdentifierStart
(char ch) 指定された文字をUnicode識別子の最初の文字として指定可能かどうかを判定します。static boolean
isUnicodeIdentifierStart
(int codePoint) 指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字として指定可能かどうかを判定します。static boolean
isUpperCase
(char ch) 指定された文字が大文字がどうかを判定します。static boolean
isUpperCase
(int codePoint) 指定された文字(Unicodeコード・ポイント)が大文字かどうかを判定します。static boolean
isValidCodePoint
(int codePoint) 指定されたコード・ポイントが有効なUnicodeコード・ポイント値であるかどうかを判定します。static boolean
isWhitespace
(char ch) 指定された文字がJavaの基準に従った空白かどうかを判定します。static boolean
isWhitespace
(int codePoint) 指定された文字(Unicodeコード・ポイント)がJavaの基準に従った空白かどうかを判定します。static char
lowSurrogate
(int codePoint) UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのトレーリング・サロゲート(下位サロゲート・コード単位)を返します。static int
offsetByCodePoints
(char[] a, int start, int count, int index, int codePointOffset) 指定されたchar
部分配列内で、指定されたindex
からcodePointOffset
コード・ポイント分だけオフセットされた位置のインデックスを返します。static int
offsetByCodePoints
(CharSequence seq, int index, int codePointOffset) 指定された文字シーケンス内で、指定されたindex
からcodePointOffset
コード・ポイント分だけオフセットされた位置のインデックスを返します。static char
reverseBytes
(char ch) 指定されたchar
値のバイトの順序を逆にして取得された値を返します。static char[]
toChars
(int codePoint) 指定された文字(Unicodeコード・ポイント)をchar
配列に格納されるUTF-16表現に変換します。static int
toChars
(int codePoint, char[] dst, int dstIndex) 指定された文字(Unicodeコード・ポイント)をUTF-16表現に変換します。static int
toCodePoint
(char high, char low) 指定されたサロゲート・ペアをその補助コード・ポイント値に変換します。static char
toLowerCase
(char ch) UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を小文字に変換します。static int
toLowerCase
(int codePoint) UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を小文字に変換します。toString()
このCharacter
の値を表すString
オブジェクトを返します。static String
toString
(char c) 指定されたchar
を表すString
オブジェクトを返します。static String
toString
(int codePoint) 指定された文字(Unicodeコード・ポイント)を表すString
オブジェクトを返します。static char
toTitleCase
(char ch) UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数をタイトル・ケースに変換します。static int
toTitleCase
(int codePoint) UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数をタイトル・ケースに変換します。static char
toUpperCase
(char ch) UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を大文字に変換します。static int
toUpperCase
(int codePoint) UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を大文字に変換します。static Character
valueOf
(char c) 指定されたchar
値を表すCharacter
インスタンスを返します。
-
フィールド詳細
-
MIN_RADIX
public static final int MIN_RADIX文字列との変換に使用可能な最小基数です。 このフィールドの定数値は、Integer
クラスのdigit
メソッド、forDigit
メソッド、およびtoString
メソッドなどの基数変換メソッドの最小許容値です。- 関連項目:
-
MAX_RADIX
public static final int MAX_RADIX文字列との変換に使用可能な最大基数です。 このフィールドの定数値は、Integer
クラスのdigit
メソッド、forDigit
メソッド、およびtoString
メソッドなどの基数変換メソッドの最大許容値です。- 関連項目:
-
MIN_VALUE
public static final char MIN_VALUEこのフィールドの定数値は、char
型の最小値'\u0000'
です。- 導入されたバージョン:
- 1.0.2
- 関連項目:
-
MAX_VALUE
public static final char MAX_VALUEこのフィールドの定数値は、char
型の最大値'\uFFFF'
です。- 導入されたバージョン:
- 1.0.2
- 関連項目:
-
TYPE
-
UNASSIGNED
public static final byte UNASSIGNEDUnicode仕様の汎用カテゴリ「Cn」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
UPPERCASE_LETTER
public static final byte UPPERCASE_LETTERUnicode仕様の汎用カテゴリ「Lu」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
LOWERCASE_LETTER
public static final byte LOWERCASE_LETTERUnicode仕様の汎用カテゴリ「Ll」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
TITLECASE_LETTER
public static final byte TITLECASE_LETTERUnicode仕様の汎用カテゴリ「Lt」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
MODIFIER_LETTER
public static final byte MODIFIER_LETTERUnicode仕様の汎用カテゴリ「Lm」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
OTHER_LETTER
public static final byte OTHER_LETTERUnicode仕様の汎用カテゴリ「Lo」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
NON_SPACING_MARK
public static final byte NON_SPACING_MARKUnicode仕様の汎用カテゴリ「Mn」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
ENCLOSING_MARK
public static final byte ENCLOSING_MARKUnicode仕様の汎用カテゴリ「Me」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
COMBINING_SPACING_MARK
public static final byte COMBINING_SPACING_MARKUnicode仕様の汎用カテゴリ「Mc」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
DECIMAL_DIGIT_NUMBER
public static final byte DECIMAL_DIGIT_NUMBERUnicode仕様の汎用カテゴリ「Nd」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
LETTER_NUMBER
public static final byte LETTER_NUMBERUnicode仕様の汎用カテゴリ「Nl」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
OTHER_NUMBER
public static final byte OTHER_NUMBERUnicode仕様の汎用カテゴリ「No」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
SPACE_SEPARATOR
public static final byte SPACE_SEPARATORUnicode仕様の汎用カテゴリ「Zs」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
LINE_SEPARATOR
public static final byte LINE_SEPARATORUnicode仕様の汎用カテゴリ「Zl」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
PARAGRAPH_SEPARATOR
public static final byte PARAGRAPH_SEPARATORUnicode仕様の汎用カテゴリ「Zp」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
CONTROL
public static final byte CONTROLUnicode仕様の汎用カテゴリ「Cc」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
FORMAT
public static final byte FORMATUnicode仕様の汎用カテゴリ「Cf」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
PRIVATE_USE
public static final byte PRIVATE_USEUnicode仕様の汎用カテゴリ「Co」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
SURROGATE
public static final byte SURROGATEUnicode仕様の汎用カテゴリ「Cs」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
DASH_PUNCTUATION
public static final byte DASH_PUNCTUATIONUnicode仕様の汎用カテゴリ「Pd」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
START_PUNCTUATION
public static final byte START_PUNCTUATIONUnicode仕様の汎用カテゴリ「Ps」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
END_PUNCTUATION
public static final byte END_PUNCTUATIONUnicode仕様の汎用カテゴリ「Pe」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
CONNECTOR_PUNCTUATION
public static final byte CONNECTOR_PUNCTUATIONUnicode仕様の汎用カテゴリ「Pc」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
OTHER_PUNCTUATION
public static final byte OTHER_PUNCTUATIONUnicode仕様の汎用カテゴリ「Po」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
MATH_SYMBOL
public static final byte MATH_SYMBOLUnicode仕様の汎用カテゴリ「Sm」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
CURRENCY_SYMBOL
public static final byte CURRENCY_SYMBOLUnicode仕様の汎用カテゴリ「Sc」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
MODIFIER_SYMBOL
public static final byte MODIFIER_SYMBOLUnicode仕様の汎用カテゴリ「Sk」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
OTHER_SYMBOL
public static final byte OTHER_SYMBOLUnicode仕様の汎用カテゴリ「So」。- 導入されたバージョン:
- 1.1
- 関連項目:
-
INITIAL_QUOTE_PUNCTUATION
public static final byte INITIAL_QUOTE_PUNCTUATIONUnicode仕様の汎用カテゴリ「Pi」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
FINAL_QUOTE_PUNCTUATION
public static final byte FINAL_QUOTE_PUNCTUATIONUnicode仕様の汎用カテゴリ「Pf」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_UNDEFINED
public static final byte DIRECTIONALITY_UNDEFINED未定義の双方向文字タイプ。 Unicode仕様では、未定義のchar
値の方向性は定義されていません。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_LEFT_TO_RIGHT
public static final byte DIRECTIONALITY_LEFT_TO_RIGHTUnicode仕様の強力な双方向文字タイプ「L」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_RIGHT_TO_LEFT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFTUnicode仕様の強力な双方向文字タイプ「R」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABICUnicode仕様の強力な双方向文字タイプ「AL」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_EUROPEAN_NUMBER
public static final byte DIRECTIONALITY_EUROPEAN_NUMBERUnicode仕様の弱い双方向文字タイプ「EN」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATORUnicode仕様の弱い双方向文字タイプ「ES」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATORUnicode仕様の弱い双方向文字タイプ「ET」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_ARABIC_NUMBER
public static final byte DIRECTIONALITY_ARABIC_NUMBERUnicode仕様の弱い双方向文字タイプ「AN」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATORUnicode仕様の弱い双方向文字タイプ「CS」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_NONSPACING_MARK
public static final byte DIRECTIONALITY_NONSPACING_MARKUnicode仕様の弱い双方向文字タイプ「NSM」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_BOUNDARY_NEUTRAL
public static final byte DIRECTIONALITY_BOUNDARY_NEUTRALUnicode仕様の弱い双方向文字タイプ「BN」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_PARAGRAPH_SEPARATOR
public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATORUnicode仕様のニュートラルな双方向文字タイプ「B」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_SEGMENT_SEPARATOR
public static final byte DIRECTIONALITY_SEGMENT_SEPARATORUnicode仕様のニュートラルな双方向文字タイプ「S」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_WHITESPACE
public static final byte DIRECTIONALITY_WHITESPACEUnicode仕様のニュートラルな双方向文字タイプ「WS」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_OTHER_NEUTRALS
public static final byte DIRECTIONALITY_OTHER_NEUTRALSUnicode仕様のニュートラルな双方向文字タイプ「ON」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDINGUnicode仕様の強力な双方向文字タイプ「LRE」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDEUnicode仕様の強力な双方向文字タイプ「LRO」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDINGUnicode仕様の強力な双方向文字タイプ「RLE」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDEUnicode仕様の強力な双方向文字タイプ「RLO」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMATUnicode仕様の弱い双方向文字タイプ「PDF」。- 導入されたバージョン:
- 1.4
- 関連項目:
-
DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATEUnicode仕様の弱い双方向文字タイプ"LRI"。- 導入されたバージョン:
- 9
- 関連項目:
-
DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATEUnicode仕様の弱い双方向文字タイプ"RLI"。- 導入されたバージョン:
- 9
- 関連項目:
-
DIRECTIONALITY_FIRST_STRONG_ISOLATE
public static final byte DIRECTIONALITY_FIRST_STRONG_ISOLATEUnicode仕様の弱い双方向文字タイプ"FSI"。- 導入されたバージョン:
- 9
- 関連項目:
-
DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_ISOLATEUnicode仕様の弱い双方向文字タイプ"PDI"。- 導入されたバージョン:
- 9
- 関連項目:
-
MIN_HIGH_SURROGATE
public static final char MIN_HIGH_SURROGATEUTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最小値(定数'\uD800'
)。 上位サロゲートは、リーディング・サロゲートともいいます。- 導入されたバージョン:
- 1.5
- 関連項目:
-
MAX_HIGH_SURROGATE
public static final char MAX_HIGH_SURROGATEUTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最大値(定数'\uDBFF'
)。 上位サロゲートは、リーディング・サロゲートともいいます。- 導入されたバージョン:
- 1.5
- 関連項目:
-
MIN_LOW_SURROGATE
public static final char MIN_LOW_SURROGATEUTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最小値(定数'\uDC00'
)。 下位サロゲートは、トレーリング・サロゲートともいいます。- 導入されたバージョン:
- 1.5
- 関連項目:
-
MAX_LOW_SURROGATE
public static final char MAX_LOW_SURROGATEUTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最大値(定数'\uDFFF'
)。 下位サロゲートは、トレーリング・サロゲートともいいます。- 導入されたバージョン:
- 1.5
- 関連項目:
-
MIN_SURROGATE
public static final char MIN_SURROGATEUTF-16エンコーディングでのUnicodeサロゲート・コード単位の最小値(定数'\uD800'
)。- 導入されたバージョン:
- 1.5
- 関連項目:
-
MAX_SURROGATE
public static final char MAX_SURROGATEUTF-16エンコーディングでのUnicodeサロゲート・コード単位の最大値(定数'\uDFFF'
)。- 導入されたバージョン:
- 1.5
- 関連項目:
-
MIN_SUPPLEMENTARY_CODE_POINT
public static final int MIN_SUPPLEMENTARY_CODE_POINTUnicode補助コード・ポイントの最小値(定数U+10000
)。- 導入されたバージョン:
- 1.5
- 関連項目:
-
MIN_CODE_POINT
-
MAX_CODE_POINT
-
SIZE
public static final int SIZE符号なしバイナリ形式のchar
値を表すために使用されるビット数、定数16
。- 導入されたバージョン:
- 1.5
- 関連項目:
-
BYTES
public static final int BYTES符号なしバイナリ形式でchar
値を表すために使用されるバイト数。- 導入されたバージョン:
- 1.8
- 関連項目:
-
-
コンストラクタの詳細
-
Character
@Deprecated(since="9", forRemoval=true) public Character(char value) 削除予定のため非推奨: このAPI要素は、将来のバージョンで削除される可能性があります。このコンストラクタを使用することはほとんどありません。 静的ファクトリvalueOf(char)
は、より良いスペースと時間のパフォーマンスをもたらす可能性が高いため、通常はより良い選択です。指定されたchar
値を表す、新しく割り当てられたCharacter
オブジェクトを構築します。- パラメータ:
value
-Character
オブジェクトによって表される値。
-
-
メソッドの詳細
-
describeConstable
public Optional<DynamicConstantDesc<Character>> describeConstable()このインスタンスの名目記述子を含むOptional
を返します。- 定義:
- インタフェース
Constable
内のdescribeConstable
- 戻り値:
- Characterインスタンスを説明する
Optional
- 導入されたバージョン:
- 15
-
valueOf
public static Character valueOf(char c) 指定されたchar
値を表すCharacter
インスタンスを返します。 新しいCharacter
インスタンスが必要ない場合は、通常、このメソッドをコンストラクタCharacter(char)
よりも使用する必要があります。このメソッドを使用すると、頻繁にリクエストされる値をキャッシュすることで、領域と時間のパフォーマンスが大幅に向上する可能性があります。 このメソッドは、'\u0000'
から'\u007F'
の範囲(両端含む)の値を常にキャッシュしますが、この範囲に含まれないその他の値をキャッシュすることもあります。- パラメータ:
c
- char値。- 戻り値:
c
を表すCharacter
インスタンス。- 導入されたバージョン:
- 1.5
-
charValue
public char charValue()このCharacter
オブジェクトの値を返します。- 戻り値:
- このオブジェクトが表すプリミティブ
char
値。
-
hashCode
-
hashCode
public static int hashCode(char value) Character.hashCode()
との互換性がある、char
値のハッシュ・コードを返します。- パラメータ:
value
- ハッシュ・コードが返されるchar
。- 戻り値:
char
値のハッシュ・コード値。- 導入されたバージョン:
- 1.8
-
equals
-
toString
-
toString
public static String toString(char c) 指定されたchar
を表すString
オブジェクトを返します。 結果は、指定されたchar
だけで構成される長さ1の文字列になります。- APIのノート:
- このメソッドは「補助文字」を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
toString(int)
メソッドを使用します。 - パラメータ:
c
- 変換するchar
- 戻り値:
- 指定された
char
の文字列表現 - 導入されたバージョン:
- 1.4
-
toString
public static String toString(int codePoint) 指定された文字(Unicodeコード・ポイント)を表すString
オブジェクトを返します。 結果は、指定されたcodePoint
のみで構成された1または2の長さの文字列です。- パラメータ:
codePoint
- 変換するcodePoint
- 戻り値:
- 指定された
codePoint
の文字列表現 - 例外:
IllegalArgumentException
- 指定されたcodePoint
が「有効なUnicodeコード・ポイント」ではない場合。- 導入されたバージョン:
- 11
-
isValidCodePoint
public static boolean isValidCodePoint(int codePoint) 指定されたコード・ポイントが有効なUnicodeコード・ポイント値であるかどうかを判定します。- パラメータ:
codePoint
- 判定対象のUnicodeコード・ポイント- 戻り値:
- 指定されたコード・ポイント値が
MIN_CODE_POINT
-MAX_CODE_POINT
の範囲(両端含む)に含まれる場合はtrue
、それ以外の場合はfalse
。 - 導入されたバージョン:
- 1.5
-
isBmpCodePoint
public static boolean isBmpCodePoint(int codePoint) 指定された文字(Unicodeコード・ポイント)が基本多言語面(BMP)に含まれるかどうかを判定します。 そのようなコード・ポイントは単一のchar
を使って表せます。 -
isSupplementaryCodePoint
public static boolean isSupplementaryCodePoint(int codePoint) 指定された文字(Unicodeコード・ポイント)が補助文字の範囲にあるかどうかを判定します。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)- 戻り値:
- 指定されたコード・ポイントが
MIN_SUPPLEMENTARY_CODE_POINT
-MAX_CODE_POINT
の範囲(両端含む)に含まれる場合はtrue
、それ以外の場合はfalse
。 - 導入されたバージョン:
- 1.5
-
isHighSurrogate
public static boolean isHighSurrogate(char ch) 指定されたchar
値がUnicode上位サロゲート・コード単位 (リーディング・サロゲート・コード単位ともいう)であるかどうかを判定します。これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。
- パラメータ:
ch
- 判定されるchar
値。- 戻り値:
char
の値がMIN_HIGH_SURROGATE
-MAX_HIGH_SURROGATE
の範囲(両端含む)に含まれる場合はtrue
、それ以外の場合はfalse
。- 導入されたバージョン:
- 1.5
- 関連項目:
-
isLowSurrogate
public static boolean isLowSurrogate(char ch) 指定されたchar
値がUnicode下位サロゲート・コード単位 (トレーリング・サロゲート・コード単位ともいう)であるかどうかを判定します。これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。
- パラメータ:
ch
- 判定されるchar
値。- 戻り値:
char
値がMIN_LOW_SURROGATE
-MAX_LOW_SURROGATE
の範囲(両端含む)に含まれる場合はtrue
、それ以外の場合はfalse
。- 導入されたバージョン:
- 1.5
- 関連項目:
-
isSurrogate
public static boolean isSurrogate(char ch) 指定されたchar
値がUnicode サロゲート・コード単位かどうかを判定します。これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。
char値がサロゲート・コード単位になるのは、それが下位サロゲート・コード単位と上位サロゲート・コード単位のいずれかである場合だけです。
- パラメータ:
ch
- 判定されるchar
値。- 戻り値:
char
値がMIN_SURROGATE
-MAX_SURROGATE
の範囲(両端含む)に含まれる場合はtrue
、それ以外の場合はfalse
。- 導入されたバージョン:
- 1.7
-
isSurrogatePair
public static boolean isSurrogatePair(char high, char low) 指定されたchar
値のペアが有効なUnicodeサロゲート・ペアであるかどうかを判定します。このメソッドは次の式と等価です。
isHighSurrogate(high) && isLowSurrogate(low)
- パラメータ:
high
- 判定対象の上位サロゲート・コード値low
- 判定対象の下位サロゲート・コード値- 戻り値:
- 指定された上位/下位サロゲート・コード値が有効なサロゲート・ペアを表す場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
-
charCount
public static int charCount(int codePoint) 指定された文字(Unicodeコード・ポイント)を表すのに必要なchar
値の数を判定します。 このメソッドは、指定された文字が0x10000以上である場合は2を返します。 それ以外の場合は1を返します。このメソッドは、指定された文字が有効なUnicodeコード・ポイントであることを検証しません。 呼出し側で、必要に応じて
isValidCodePoint
を使用して、文字値を検証する必要があります。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が有効な補助文字の場合は2、そうでない場合は1。
- 導入されたバージョン:
- 1.5
- 関連項目:
-
toCodePoint
public static int toCodePoint(char high, char low) 指定されたサロゲート・ペアをその補助コード・ポイント値に変換します。 このメソッドは、指定されたサロゲート・ペアを検証しません。 呼出し側は必要に応じて、isSurrogatePair
を使って検証する必要があります。- パラメータ:
high
- 上位サロゲート・コード単位low
- 下位サロゲート・コード単位- 戻り値:
- 指定されたサロゲート・ペアから作成された補助コード・ポイント。
- 導入されたバージョン:
- 1.5
-
codePointAt
public static int codePointAt(CharSequence seq, int index) CharSequence
の指定されたインデックスにあるコード・ポイントを返します。CharSequence
内の指定されたインデックス位置のchar
値が上位サロゲート範囲に含まれており、それに続くインデックスがCharSequence
の長さ未満であり、かつそのインデックス位置のchar
値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar
値が返されます。- パラメータ:
seq
-char
値のシーケンス(Unicodeコード単位)index
- 変換されるseq
内のchar
値(Unicodeコード単位)へのインデックス- 戻り値:
- 所定のインデックス位置のUnicodeコード・ポイント
- 例外:
NullPointerException
-seq
がnullである場合。IndexOutOfBoundsException
- 値index
が負であるかseq.length()
以上である場合。- 導入されたバージョン:
- 1.5
-
codePointAt
public static int codePointAt(char[] a, int index) char
配列の指定されたインデックスにあるコード・ポイントを返します。char
配列内の指定されたインデックス位置のchar
値が上位サロゲート範囲に含まれており、それに続くインデックスがchar
配列の長さ未満であり、かつそのインデックス位置のchar
値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar
値が返されます。- パラメータ:
a
-char
配列index
- 変換されるchar
配列内のchar
値(Unicodeコード単位)へのインデックス- 戻り値:
- 所定のインデックス位置のUnicodeコード・ポイント
- 例外:
NullPointerException
-a
がnullである場合。IndexOutOfBoundsException
-index
が負の値、またはchar
配列の長さ以上の値である場合。- 導入されたバージョン:
- 1.5
-
codePointAt
public static int codePointAt(char[] a, int index, int limit) limit
の長さ未満のindex
を持つ配列要素のみを使用可能な、char
配列の指定されたインデックスにあるコード・ポイントを返します。char
配列内の指定されたインデックス位置のchar
値が上位サロゲート範囲に含まれており、それに続くインデックスがlimit
未満であり、かつそのインデックス位置のchar
値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar
値が返されます。- パラメータ:
a
-char
配列index
- 変換されるchar
配列内のchar
値(Unicodeコード単位)へのインデックスlimit
-char
配列で使用可能な最後の配列要素の後ろのインデックス- 戻り値:
- 所定のインデックス位置のUnicodeコード・ポイント
- 例外:
NullPointerException
-a
がnullである場合。IndexOutOfBoundsException
-index
引数が負の値またはlimit
引数以上である場合、またはlimit
引数が負の値またはchar
配列の長さより大きい場合。- 導入されたバージョン:
- 1.5
-
codePointBefore
public static int codePointBefore(CharSequence seq, int index) CharSequence
の指定されたインデックスの前にあるコード・ポイントを返します。CharSequence
内の(index - 1)
のchar
値が下位サロゲート範囲に含まれており、(index - 2)
が負でなく、かつCharSequence
内の(index - 2)
のchar
値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)
のchar
値が返されます。- パラメータ:
seq
-CharSequence
インスタンスindex
- 返すべきコード・ポイントの直後のインデックス- 戻り値:
- 指定されたインデックスの前にあるUnicodeコード・ポイント値。
- 例外:
NullPointerException
-seq
がnullである場合。IndexOutOfBoundsException
-index
引数が1より小さいかseq.length()
より大きい場合。- 導入されたバージョン:
- 1.5
-
codePointBefore
public static int codePointBefore(char[] a, int index) char
配列の指定されたインデックスの前にあるコード・ポイントを返します。char
配列内の(index - 1)
のchar
値が下位サロゲート範囲に含まれており、(index - 2)
が負でなく、かつchar
配列内の(index - 2)
のchar
値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)
のchar
値が返されます。- パラメータ:
a
-char
配列index
- 返すべきコード・ポイントの直後のインデックス- 戻り値:
- 指定されたインデックスの前にあるUnicodeコード・ポイント値。
- 例外:
NullPointerException
-a
がnullである場合。IndexOutOfBoundsException
-index
引数が1未満であるか、またはchar
配列の長さより大きい値の場合- 導入されたバージョン:
- 1.5
-
codePointBefore
public static int codePointBefore(char[] a, int index, int start) start
以上のindex
を持つ配列要素のみを使用可能な、char
配列の指定されたインデックスの前にあるコード・ポイントを返します。char
配列内の(index - 1)
のchar
値が下位サロゲート範囲に含まれており、(index - 2)
がstart
以上であり、かつchar
配列内の(index - 2)
のchar
値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)
のchar
値が返されます。- パラメータ:
a
-char
配列index
- 返すべきコード・ポイントの直後のインデックスstart
-char
配列の最初の配列要素のインデックス- 戻り値:
- 指定されたインデックスの前にあるUnicodeコード・ポイント値。
- 例外:
NullPointerException
-a
がnullである場合。IndexOutOfBoundsException
-index
引数がstart
引数以下であるかchar
配列の長さより大きい場合、またはstart
引数が負の値であるかchar
配列の長さ以上である場合。- 導入されたバージョン:
- 1.5
-
highSurrogate
public static char highSurrogate(int codePoint) UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのリーディング・サロゲート(上位サロゲート・コード単位)を返します。 指定された文字が補助文字でない場合は、未指定のchar
が返されます。isSupplementaryCodePoint(x)
がtrue
の場合、isHighSurrogate
(highSurrogate(x))
およびtoCodePoint
(highSurrogate(x),
lowSurrogate
(x))== x
も常にtrue
になります。- パラメータ:
codePoint
- 補助文字(Unicodeコード・ポイント)- 戻り値:
- この文字をUTF-16エンコーディングで表すために使用されるリーディング・サロゲート・コード単位
- 導入されたバージョン:
- 1.7
-
lowSurrogate
public static char lowSurrogate(int codePoint) UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのトレーリング・サロゲート(下位サロゲート・コード単位)を返します。 指定された文字が補助文字でない場合は、未指定のchar
が返されます。isSupplementaryCodePoint(x)
がtrue
の場合、isLowSurrogate
(lowSurrogate(x))
およびtoCodePoint
(
highSurrogate
(x), lowSurrogate(x))== x
も常にtrue
になります。- パラメータ:
codePoint
- 補助文字(Unicodeコード・ポイント)- 戻り値:
- この文字をUTF-16エンコーディングで表すために使用されるトレーリング・サロゲート・コード単位
- 導入されたバージョン:
- 1.7
-
toChars
public static int toChars(int codePoint, char[] dst, int dstIndex) 指定された文字(Unicodeコード・ポイント)をUTF-16表現に変換します。 指定されたコード・ポイントがBMP (基本多言語面または第0面)値の場合は、同じ値がdst[dstIndex]
に格納され、1が返されます。 指定されたコード・ポイントが補助文字の場合は、サロゲート値がdst[dstIndex]
(上位サロゲート)とdst[dstIndex+1]
(下位サロゲート)に格納され、2が返されます。- パラメータ:
codePoint
- 変換対象の文字(Unicodeコード・ポイント)。dst
-codePoint
のUTF-16値が格納されるchar
の配列。dstIndex
- 変換された値が格納されるdst
配列の開始インデックス。- 戻り値:
- コード・ポイントがBMPコード・ポイントの場合は1、コード・ポイントが補助コード・ポイントの場合は2。
- 例外:
IllegalArgumentException
- 指定されたcodePoint
が有効なUnicodeコード・ポイントでない場合。NullPointerException
- 指定されたdst
がnullの場合。IndexOutOfBoundsException
-dstIndex
が負の値であるかdst.length
以上である場合、またはdstIndex
位置のdst
が結果として得られるchar
値を格納する十分な配列要素を持たない場合。 (dstIndex
がdst.length-1
と等価で、指定されたcodePoint
が補助文字の場合、上位サロゲート値はdst[dstIndex]
に格納されない。)- 導入されたバージョン:
- 1.5
-
toChars
public static char[] toChars(int codePoint) 指定された文字(Unicodeコード・ポイント)をchar
配列に格納されるUTF-16表現に変換します。 指定されたコード・ポイントがBMP (基本多言語面または第0面)値の場合、結果として得られるchar
配列はcodePoint
と同じ値を持ちます。 指定されたコード・ポイントが補助コード・ポイントの場合は、結果として得られるchar
配列は対応するサロゲート・ペアを持ちます。- パラメータ:
codePoint
- Unicodeコード・ポイント- 戻り値:
codePoint
のUTF-16表現を持つchar
配列。- 例外:
IllegalArgumentException
- 指定されたcodePoint
が有効なUnicodeコード・ポイントでない場合。- 導入されたバージョン:
- 1.5
-
codePointCount
public static int codePointCount(CharSequence seq, int beginIndex, int endIndex) 指定されたcharシーケンスのテキスト範囲内のUnicodeコード・ポイントの数を返します。 テキスト範囲は、指定されたbeginIndex
からインデックスendIndex - 1
の位置のchar
までです。 したがって、テキスト範囲の長さ(char
数)は、endIndex-beginIndex
になります。 テキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。- パラメータ:
seq
- 文字シーケンスbeginIndex
- テキスト範囲内の最初のchar
へのインデックス。endIndex
- テキスト範囲内の最後のchar
の直後のインデックス。- 戻り値:
- 指定されたテキスト範囲内のUnicodeコード・ポイントの数
- 例外:
NullPointerException
-seq
がnullである場合。IndexOutOfBoundsException
-beginIndex
が負であるか、endIndex
が指定されたシーケンスの長さより大きいか、あるいはbeginIndex
がendIndex
より大きい場合。- 導入されたバージョン:
- 1.5
-
codePointCount
public static int codePointCount(char[] a, int offset, int count) char
配列引数の部分配列内にあるUnicodeコード・ポイントの数を返します。offset
引数は、部分配列の最初のchar
のインデックスであり、count
引数はchar
間の部分配列の長さを指定します。 部分配列内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。- パラメータ:
a
-char
配列offset
- 指定されたchar
配列の最初のchar
のインデックスcount
- 部分配列の長さ(char
数)- 戻り値:
- 指定された部分配列内のUnicodeコード・ポイントの数
- 例外:
NullPointerException
-a
がnullである場合。IndexOutOfBoundsException
-offset
またはcount
が負の場合、またはoffset+count
が指定された配列の長さより大きい場合。- 導入されたバージョン:
- 1.5
-
offsetByCodePoints
public static int offsetByCodePoints(CharSequence seq, int index, int codePointOffset) 指定された文字シーケンス内で、指定されたindex
からcodePointOffset
コード・ポイント分だけオフセットされた位置のインデックスを返します。index
とcodePointOffset
で指定されるテキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。- パラメータ:
seq
- 文字シーケンスindex
- オフセットされるインデックスcodePointOffset
- オフセット(コード・ポイント数)- 戻り値:
- charシーケンス内のインデックス
- 例外:
NullPointerException
-seq
がnullである場合。IndexOutOfBoundsException
-index
がcharシーケンスの長さよりも負または大きい場合、またはcodePointOffset
が正で、index
で始まるサブ・シーケンスがcodePointOffset
コード・ポイントより少ない場合、またはcodePointOffset
が負でindex
より前のサブ・シーケンスがcodePointOffset
コード・ポイントの絶対値より少ない場合。- 導入されたバージョン:
- 1.5
-
offsetByCodePoints
public static int offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset) 指定されたchar
部分配列内で、指定されたindex
からcodePointOffset
コード・ポイント分だけオフセットされた位置のインデックスを返します。start
およびcount
引数は、char
配列の部分配列を指定します。index
とcodePointOffset
で指定されるテキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。- パラメータ:
a
-char
配列start
- 部分配列内の最初のchar
のインデックスcount
- 部分配列の長さ(char
数)index
- オフセットされるインデックスcodePointOffset
- オフセット(コード・ポイント数)- 戻り値:
- 部分配列内のインデックス
- 例外:
NullPointerException
-a
がnullである場合。IndexOutOfBoundsException
-start
またはcount
が負の場合、またはstart+count
が指定された配列の長さより大きい場合、またはindex
がstart
より小さいかstart+count
より大きい場合、またはcodePointOffset
が正で、index
から始まりstart+count - 1
で終わるテキスト範囲内のコード・ポイント数がcodePointOffset
コード・ポイント数より少ない場合、またはcodePointOffset
が負で、start
から始まりindex - 1
で終わるテキスト範囲内のコード・ポイント数がcodePointOffset
コード・ポイントの絶対値より少ない場合。- 導入されたバージョン:
- 1.5
-
isLowerCase
public static boolean isLowerCase(char ch) 指定された文字が小文字かどうかを判定します。ある文字が小文字になるのは、
Character.getType(ch)
によって提供される汎用カテゴリ型がLOWERCASE_LETTER
である場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Lowercaseを持つ場合です。小文字の例を次に示します。
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
Unicode文字には、ほかにも多数の小文字が存在します。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isLowerCase(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字が小文字の場合は
true
、そうでない場合はfalse
。 - 関連項目:
-
isLowerCase
public static boolean isLowerCase(int codePoint) 指定された文字(Unicodeコード・ポイント)が小文字かどうかを判定します。ある文字が小文字になるのは、
getType(codePoint)
によって提供される汎用カテゴリ型がLOWERCASE_LETTER
である場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Lowercaseを持つ場合です。小文字の例を次に示します。
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
Unicode文字には、ほかにも多数の小文字が存在します。
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が小文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
-
isUpperCase
public static boolean isUpperCase(char ch) 指定された文字が大文字がどうかを判定します。ある文字が大文字になるのは、
Character.getType(ch)
によって提供される汎用カテゴリ型がUPPERCASE_LETTER
である場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Uppercaseを持つ場合です。大文字の例を次に示します。
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
Unicode文字には、ほかにも多数の大文字が存在します。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isUpperCase(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字が大文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.0
- 関連項目:
-
isUpperCase
public static boolean isUpperCase(int codePoint) 指定された文字(Unicodeコード・ポイント)が大文字かどうかを判定します。ある文字が大文字になるのは、
getType(codePoint)
によって提供される汎用カテゴリ型がUPPERCASE_LETTER
である場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Uppercaseを持つ場合です。大文字の例を次に示します。
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
Unicode文字には、ほかにも多数の大文字が存在します。
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が大文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
-
isTitleCase
public static boolean isTitleCase(char ch) 指定された文字がタイトル・ケース文字かどうかを判定します。Character.getType(ch)
により示される汎用カテゴリ型がTITLECASE_LETTER
の場合、文字はタイトル・ケース文字になります。文字の中には、ラテン文字のペアのように見えるものがあります。 たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。 「Lj」のように見える3つ目の形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。
次に示すのは、このメソッドが
true
を返すUnicode文字の一部です。LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
Unicode文字には、ほかにも多数のタイトル・ケース文字が存在します。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isTitleCase(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字がタイトル・ケースの場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.0.2
- 関連項目:
-
isTitleCase
public static boolean isTitleCase(int codePoint) 指定された文字(Unicodeコード・ポイント)がタイトル・ケース文字かどうかを判定します。getType(codePoint)
により示される汎用カテゴリ型がTITLECASE_LETTER
の場合、文字はタイトル・ケース文字になります。文字の中には、ラテン文字のペアのように見えるものがあります。 たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。 「Lj」のように見える3つ目の形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。
次に示すのは、このメソッドが
true
を返すUnicode文字の一部です。LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
Unicode文字には、ほかにも多数のタイトル・ケース文字が存在します。
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がタイトル・ケースの場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
-
isDigit
public static boolean isDigit(char ch) 指定された文字が数字かどうかを判定します。Character.getType(ch)
により示される汎用カテゴリ型がDECIMAL_DIGIT_NUMBER
の場合、文字は数字になります。Unicode文字範囲の中には、次の数字を含むものがあります。
'\u0030'
-'\u0039'
、ISO-LATIN-1数字('0'
-'9'
)'\u0660'
-'\u0669'
、アラビア数字'\u06F0'
-'\u06F9'
、拡張アラビア数字'\u0966'
-'\u096F'
、デヴァーナーガリ数字'\uFF10'
-'\uFF19'
、全角数字
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isDigit(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字が数字の場合は
true
、そうでない場合はfalse
。 - 関連項目:
-
isDigit
public static boolean isDigit(int codePoint) 指定された文字(Unicodeコード・ポイント)が数字かどうかを判定します。getType(codePoint)
により示される汎用カテゴリ型がDECIMAL_DIGIT_NUMBER
の場合、文字は数字になります。Unicode文字範囲の中には、次の数字を含むものがあります。
'\u0030'
-'\u0039'
、ISO-LATIN-1数字('0'
-'9'
)'\u0660'
-'\u0669'
、アラビア数字'\u06F0'
-'\u06F9'
、拡張アラビア数字'\u0966'
-'\u096F'
、デヴァーナーガリ数字'\uFF10'
-'\uFF19'
、全角数字
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が数字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
-
isDefined
public static boolean isDefined(char ch) 文字がUnicodeで定義されているかどうかを判定します。少なくとも次のいずれかに当てはまる場合、文字は定義されています。
- UnicodeDataファイル内にエントリがある
- UnicodeDataファイルで定義された範囲に値を持つ
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isDefined(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字- 戻り値:
- 文字がUnicodeに定義されている場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.0.2
- 関連項目:
-
isDefined
public static boolean isDefined(int codePoint) 文字(Unicodeコード・ポイント)がUnicodeで定義されているかどうかを判定します。少なくとも次のいずれかに当てはまる場合、文字は定義されています。
- UnicodeDataファイル内にエントリがある
- UnicodeDataファイルで定義された範囲に値を持つ
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がUnicodeに定義されている場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
-
isLetter
public static boolean isLetter(char ch) 指定された文字が汎用文字かどうかを判定します。Character.getType(ch)
の示す汎用カテゴリ型が次のどれかの場合に、文字は汎用文字と見なされます。-
UPPERCASE_LETTER
-
LOWERCASE_LETTER
-
TITLECASE_LETTER
-
MODIFIER_LETTER
-
OTHER_LETTER
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isLetter(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字が汎用文字の場合は
true
、そうでない場合はfalse
。 - 関連項目:
-
-
isLetter
public static boolean isLetter(int codePoint) 指定された文字(Unicodeコード・ポイント)が汎用文字かどうかを判定します。getType(codePoint)
の示す汎用カテゴリ型が次のどれかの場合に、文字は汎用文字と見なされます。-
UPPERCASE_LETTER
-
LOWERCASE_LETTER
-
TITLECASE_LETTER
-
MODIFIER_LETTER
-
OTHER_LETTER
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が汎用文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
-
-
isLetterOrDigit
public static boolean isLetterOrDigit(char ch) 指定された文字が汎用文字または数字かどうかを判定します。ある文字が文字または数字とみなされるのは、その文字の
Character.isLetter(char ch)
またはCharacter.isDigit(char ch)
からtrue
が返される場合です。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isLetterOrDigit(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字が汎用文字または数字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.0.2
- 関連項目:
-
isLetterOrDigit
public static boolean isLetterOrDigit(int codePoint) 指定された文字(Unicodeコード・ポイント)が汎用文字または数字かどうかを判定します。ある文字が文字または数字とみなされるのは、その文字の
isLetter(codePoint)
またはisDigit(codePoint)
からtrue
が返される場合です。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が汎用文字または数字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
-
isJavaLetter
@Deprecated(since="1.1") public static boolean isJavaLetter(char ch) 非推奨。isJavaIdentifierStart(char)に置き換えられました。指定された文字をJava識別子の最初の文字として指定可能かどうかを判定します。次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。
-
isLetter(ch)
がtrue
を返す -
getType(ch)
がLETTER_NUMBER
を返す -
ch
が通貨記号である('$'
など) -
ch
が連結句読点文字である('_'
など)
- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字をJava識別子の先頭で使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.0.2
- 関連項目:
-
-
isJavaLetterOrDigit
@Deprecated(since="1.1") public static boolean isJavaLetterOrDigit(char ch) 非推奨。isJavaIdentifierPart(char)に置き換えられました。指定された文字をJava識別子の最初の文字以外に使用可能かどうかを判定します。次のいずれかの条件に当てはまる場合のみ、Java識別子の一部を文字にすることができます:
- 汎用文字である
- それが通貨記号である(
'$'
など) - それが連結句読点文字である(
'_'
など) - 数字である
- 数値汎用文字である(ローマ数字文字など)
- 連結マークである
- 非スペーシング・マークである
- 文字の
isIdentifierIgnorable
がtrue
を返す。
- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字をJava識別子の一部に使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.0.2
- 関連項目:
-
isAlphabetic
public static boolean isAlphabetic(int codePoint) 指定された文字(Unicodeコード・ポイント)がアルファベットかどうかを判定します。getType(codePoint)
の示す汎用カテゴリ型が次のどれかの場合に、文字はアルファベットと見なされます。-
UPPERCASE_LETTER
-
LOWERCASE_LETTER
-
TITLECASE_LETTER
-
MODIFIER_LETTER
-
OTHER_LETTER
-
LETTER_NUMBER
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がUnicodeアルファベット文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.7
-
-
isIdeographic
public static boolean isIdeographic(int codePoint) 指定された文字(Unicodeコード・ポイント)が、Unicode標準で規定されたCJKV (中国語、日本語、韓国語、およびベトナム語)の表意文字かどうかを判定します。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がUnicode表意文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.7
-
isJavaIdentifierStart
public static boolean isJavaIdentifierStart(char ch) 指定された文字をJava識別子の最初の文字として指定可能かどうかを判定します。次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。
-
isLetter(ch)
がtrue
を返す -
getType(ch)
がLETTER_NUMBER
を返す -
ch
が通貨記号である('$'
など) -
ch
が連結句読点文字である('_'
など)
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isJavaIdentifierStart(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字をJava識別子の先頭で使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.1
- 関連項目:
-
-
isJavaIdentifierStart
public static boolean isJavaIdentifierStart(int codePoint) 文字(Unicodeコード・ポイント)をJava識別子の最初の文字として指定可能かどうかを判定します。次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。
-
isLetter(codePoint)
はtrue
を返す -
getType(codePoint)
はLETTER_NUMBER
を返す - 参照される文字が通貨記号である(
'$'
など) - 参照文字が連結句読点文字である(
'_'
など)
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字をJava識別子の先頭で使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
-
-
isJavaIdentifierPart
public static boolean isJavaIdentifierPart(char ch) 指定された文字をJava識別子の最初の文字以外に使用可能かどうかを判定します。次のいずれかの条件が満たされる場合、文字はJava識別子の一部になることがあります:
- 汎用文字である
- それが通貨記号である(
'$'
など) - それが連結句読点文字である(
'_'
など) - 数字である
- 数値汎用文字である(ローマ数字文字など)
- 連結マークである
- 非スペーシング・マークである
- 文字の
isIdentifierIgnorable
がtrue
を返す
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isJavaIdentifierPart(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字をJava識別子の一部に使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.1
- 関連項目:
-
isJavaIdentifierPart
public static boolean isJavaIdentifierPart(int codePoint) 文字(Unicodeコード・ポイント)をJava識別子の最初の文字以外に使用可能かどうかを判定します。次のいずれかの条件が満たされる場合、文字はJava識別子の一部になることがあります:
- 汎用文字である
- それが通貨記号である(
'$'
など) - それが連結句読点文字である(
'_'
など) - 数字である
- 数値汎用文字である(ローマ数字文字など)
- 連結マークである
- 非スペーシング・マークである
-
isIdentifierIgnorable(codePoint)
は、コード・ポイントのtrue
を返します。
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字をJava識別子の一部に使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
-
isUnicodeIdentifierStart
public static boolean isUnicodeIdentifierStart(char ch) 指定された文字をUnicode識別子の最初の文字として指定可能かどうかを判定します。次の条件のどれかに当てはまる場合にだけ、その文字をUnicode識別子の最初に指定できます。
-
isLetter(ch)
がtrue
を返す -
getType(ch)
がLETTER_NUMBER
を返す。 - これは
Other_ID_Start
文字です。
このメソッドは、Unicode Standardの「UAX31-R1 : デフォルト識別子」要件に準拠します。次のプロファイルはUAX 31です:
Start := ID_Start + 'VERTICAL TILDE' (U+2E2F)
'VERTICAL TILDE'
は、下位互換性のためにStart
に追加されています。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isUnicodeIdentifierStart(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字をUnicode識別子の先頭で使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.1
- 外部仕様
- 関連項目:
-
-
isUnicodeIdentifierStart
public static boolean isUnicodeIdentifierStart(int codePoint) 指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字として指定可能かどうかを判定します。次の条件のどれかに当てはまる場合にだけ、その文字をUnicode識別子の最初に指定できます。
-
isLetter(codePoint)
はtrue
を返す -
getType(codePoint)
がLETTER_NUMBER
を返す。 - これは
Other_ID_Start
文字です。
このメソッドは、Unicode Standardの「UAX31-R1 : デフォルト識別子」要件に準拠します。次のプロファイルはUAX 31です:
Start := ID_Start + 'VERTICAL TILDE' (U+2E2F)
'VERTICAL TILDE'
は、下位互換性のためにStart
に追加されています。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字をUnicode識別子の先頭で使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 外部仕様
- 関連項目:
-
-
isUnicodeIdentifierPart
public static boolean isUnicodeIdentifierPart(char ch) 指定された文字をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。次の文のどれかに当てはまる場合にだけ、その文字をUnicode識別子の一部に使用できます。
- 汎用文字である
- それが連結句読点文字である(
'_'
など) - 数字である
- 数値汎用文字である(ローマ数字文字など)
- 連結マークである
- 非スペーシング・マークである
- この文字の
isIdentifierIgnorable
がtrue
を返す。 - これは
Other_ID_Start
文字です。 - これは
Other_ID_Continue
文字です。
このメソッドは、Unicode Standardの「UAX31-R1 : デフォルト識別子」要件に準拠します。次のプロファイルはUAX 31です:
Continue := Start + ID_Continue + ignorable Medial := empty ignorable := isIdentifierIgnorable(char) returns true for the character
ignorable
は、下位互換性のためにContinue
に追加されています。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isUnicodeIdentifierPart(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字をUnicode識別子の一部に使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.1
- 外部仕様
- 関連項目:
-
isUnicodeIdentifierPart
public static boolean isUnicodeIdentifierPart(int codePoint) 指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。次の文のどれかに当てはまる場合にだけ、その文字をUnicode識別子の一部に使用できます。
- 汎用文字である
- それが連結句読点文字である(
'_'
など) - 数字である
- 数値汎用文字である(ローマ数字文字など)
- 連結マークである
- 非スペーシング・マークである
- この文字の
isIdentifierIgnorable
がtrue
を返す。 - これは
Other_ID_Start
文字です。 - これは
Other_ID_Continue
文字です。
このメソッドは、Unicode Standardの「UAX31-R1 : デフォルト識別子」要件に準拠します。次のプロファイルはUAX 31です:
Continue := Start + ID_Continue + ignorable Medial := empty ignorable := isIdentifierIgnorable(int) returns true for the character
ignorable
は、下位互換性のためにContinue
に追加されています。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字をUnicode識別子の一部に使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 外部仕様
- 関連項目:
-
isIdentifierIgnorable
public static boolean isIdentifierIgnorable(char ch) 指定された文字が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。次のUnicode文字は、Java識別子やUnicode識別子内で無視できます。
- 空白以外のISO制御文字
'\u0000'
-'\u0008'
'\u000E'
-'\u001B'
'\u007F'
-'\u009F'
- 汎用カテゴリ値
FORMAT
を保持するすべての文字
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isIdentifierIgnorable(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- JavaまたはUnicode識別子の一部に使用可能な、無視できる制御文字の場合は
true
、それ以外の場合はfalse
。 - 導入されたバージョン:
- 1.1
- 関連項目:
- 空白以外のISO制御文字
-
isIdentifierIgnorable
public static boolean isIdentifierIgnorable(int codePoint) 指定された文字(Unicodeコード・ポイント)が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。次のUnicode文字は、Java識別子やUnicode識別子内で無視できます。
- 空白以外のISO制御文字
'\u0000'
-'\u0008'
'\u000E'
-'\u001B'
'\u007F'
-'\u009F'
- 汎用カテゴリ値
FORMAT
を保持するすべての文字
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- JavaまたはUnicode識別子の一部に使用可能な、無視できる制御文字の場合は
true
、それ以外の場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
- 空白以外のISO制御文字
-
isEmoji
public static boolean isEmoji(int codePoint) 指定した文字(Unicodeコード・ポイント)が絵文字かどうかを決定します。文字が絵文字と見なされるのは、「Unicode Emoji (テクニカル標準#51)」で定義されている
Emoji
プロパティがある場合のみです。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が絵文字の場合は
true
、それ以外の場合はfalse
。 - 導入されたバージョン:
- 21
-
isEmojiPresentation
public static boolean isEmojiPresentation(int codePoint) 指定された文字(Unicodeコード・ポイント)にデフォルトで絵文字プレゼンテーション・プロパティがあるかどうかを決定します。「Unicode Emoji (テクニカル標準#51)」で定義されている
Emoji_Presentation
プロパティがある場合にのみ、文字に絵文字プレゼンテーション・プロパティがあるとみなされます。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字に絵文字プレゼンテーション・プロパティがある場合は
true
、それ以外の場合はfalse
。 - 導入されたバージョン:
- 21
-
isEmojiModifier
public static boolean isEmojiModifier(int codePoint) 指定した文字(Unicodeコード・ポイント)が絵文字修飾子かどうかを決定します。文字が絵文字修飾子と見なされるのは、「Unicode Emoji (テクニカル標準#51)」で定義されている
Emoji_Modifier
プロパティがある場合のみです。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が絵文字修飾子の場合は
true
、それ以外の場合はfalse
。 - 導入されたバージョン:
- 21
-
isEmojiModifierBase
public static boolean isEmojiModifierBase(int codePoint) 指定した文字(Unicodeコード・ポイント)が絵文字修飾子ベースかどうかを決定します。文字が絵文字修飾子ベースとみなされるのは、「Unicode Emoji (テクニカル標準#51)」で定義されている
Emoji_Modifier_Base
プロパティがある場合のみです。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が絵文字修飾子ベースの場合は
true
、それ以外の場合はfalse
。 - 導入されたバージョン:
- 21
-
isEmojiComponent
public static boolean isEmojiComponent(int codePoint) 指定した文字(Unicodeコード・ポイント)が絵文字コンポーネントかどうかを決定します。文字が絵文字コンポーネントとみなされるのは、「Unicode Emoji (テクニカル標準#51)」で定義されている
Emoji_Component
プロパティがある場合のみです。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が絵文字コンポーネントの場合は
true
、それ以外の場合はfalse
。 - 導入されたバージョン:
- 21
-
isExtendedPictographic
public static boolean isExtendedPictographic(int codePoint) 指定した文字(Unicodeコード・ポイント)が拡張ピクチャかどうかを決定します。文字が拡張ピクチャとみなされるのは、「Unicode Emoji (テクニカル標準#51)」で定義されている
Extended_Pictographic
プロパティがある場合のみです。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が拡張ピクチャの場合は
true
、それ以外の場合はfalse
。 - 導入されたバージョン:
- 21
-
toLowerCase
public static char toLowerCase(char ch) UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を小文字に変換します。Character.isLowerCase(Character.toLowerCase(ch))
は、ある範囲の文字(特に表意文字や記号)に対して常にtrue
を返すわけではありません。一般に、文字を小文字にマッピングする際には
String.toLowerCase()
を使用するようにしてください。String
のケース・マッピング・メソッドにはCharacter
のケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、String
のケース・マッピング・メソッドでは実行できますが、Character
のケース・マッピング・メソッドでは実行できません。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
toLowerCase(int)
メソッドを使用してください。- パラメータ:
ch
- 変換対象の文字。- 戻り値:
- 対応する小文字(存在する場合)。小文字がない場合は、指定された文字そのもの。
- 関連項目:
-
toLowerCase
public static int toLowerCase(int codePoint) UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を小文字に変換します。Character.isLowerCase(Character.toLowerCase(codePoint))
は、ある範囲の文字(特に表意文字や記号)に対して常にtrue
を返すわけではありません。一般に、文字を小文字にマッピングする際には
String.toLowerCase()
を使用するようにしてください。String
のケース・マッピング・メソッドにはCharacter
のケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、String
のケース・マッピング・メソッドでは実行できますが、Character
のケース・マッピング・メソッドでは実行できません。- パラメータ:
codePoint
- 変換対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 指定された文字(Unicodeコード・ポイント)の対応する小文字。対応する小文字がない場合は、指定された文字そのもの。
- 導入されたバージョン:
- 1.5
- 関連項目:
-
toUpperCase
public static char toUpperCase(char ch) UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を大文字に変換します。Character.isUpperCase(Character.toUpperCase(ch))
は、ある範囲の文字(特に表意文字や記号)に対して常にtrue
を返すわけではありません。一般に、文字を大文字にマッピングする際には
String.toUpperCase()
を使用するようにしてください。String
のケース・マッピング・メソッドにはCharacter
のケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、String
のケース・マッピング・メソッドでは実行できますが、Character
のケース・マッピング・メソッドでは実行できません。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
toUpperCase(int)
メソッドを使用してください。- パラメータ:
ch
- 変換対象の文字。- 戻り値:
- 対応する大文字(存在する場合)。大文字がない場合は、指定された文字そのもの。
- 関連項目:
-
toUpperCase
public static int toUpperCase(int codePoint) UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を大文字に変換します。Character.isUpperCase(Character.toUpperCase(codePoint))
は、ある範囲の文字(特に表意文字や記号)に対して常にtrue
を返すわけではありません。一般に、文字を大文字にマッピングする際には
String.toUpperCase()
を使用するようにしてください。String
のケース・マッピング・メソッドにはCharacter
のケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、String
のケース・マッピング・メソッドでは実行できますが、Character
のケース・マッピング・メソッドでは実行できません。- パラメータ:
codePoint
- 変換対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 対応する大文字(存在する場合)。大文字がない場合は、指定された文字そのもの。
- 導入されたバージョン:
- 1.5
- 関連項目:
-
toTitleCase
public static char toTitleCase(char ch) UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数をタイトル・ケースに変換します。 文字が、明示的なタイトル・ケース・マッピングを保持せず、かつUnicodeDataに準拠したタイトル・ケースcharではない場合、等価なタイトル・ケースとして大文字へのマッピングが返されます。char
引数がタイトル・ケースchar
である場合には、同じchar
値が返されます。Character.isTitleCase(Character.toTitleCase(ch))
は、ある範囲の文字に対して常にtrue
を返すわけではありません。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
toTitleCase(int)
メソッドを使用してください。- パラメータ:
ch
- 変換対象の文字。- 戻り値:
- 対応するタイトル・ケース(存在する場合)。タイトル・ケースがない場合は、指定された文字そのもの。
- 導入されたバージョン:
- 1.0.2
- 関連項目:
-
toTitleCase
public static int toTitleCase(int codePoint) UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数をタイトル・ケースに変換します。 文字が、明示的なタイトル・ケース・マッピングを保持せず、かつUnicodeDataに準拠したタイトル・ケースcharではない場合、等価なタイトル・ケースとして大文字へのマッピングが返されます。 文字の引数がタイトル・ケース文字である場合には、同じ文字値が返されます。Character.isTitleCase(Character.toTitleCase(codePoint))
は、ある範囲の文字に対して常にtrue
を返すわけではありません。- パラメータ:
codePoint
- 変換対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 対応するタイトル・ケース(存在する場合)。タイトル・ケースがない場合は、指定された文字そのもの。
- 導入されたバージョン:
- 1.5
- 関連項目:
-
digit
public static int digit(char ch, int radix) 指定された基数での、文字ch
の数値としての値を返します。基数が
MIN_RADIX
≤radix
≤MAX_RADIX
の範囲外の場合、またはch
の値が指定された基数の有効数字でない場合は、-1
が返されます。 次のどれかに当てはまる場合、文字は有効数字です。- 文字についてメソッド
isDigit
がtrue
を返し、その文字のUnicode 10進数値(または単一文字の分解)が指定された基数よりも小さい。 この場合、10進値が返される。 - 文字が
'A'
-'Z'
のラテン大文字のどれかで、そのコードがradix+'A' - 10
よりも小さい。 この場合、ch - 'A'+10
が返される。 - 文字が
'a'
-'z'
のラテン小文字のどれかで、そのコードがradix+'a' - 10
よりも小さい。 この場合、ch - 'a'+10
が返される。 - 文字がA (
'\uFF21'
) - Z ('\uFF3A'
)の全角ラテン大文字のどれかで、そのコードがradix+'\uFF21' - 10
よりも小さい。 この場合、ch - '\uFF21'+10
が返される。 - 文字がa (
'\uFF41'
) - z ('\uFF5A'
)の全角ラテン小文字のどれかで、そのコードがradix+'\uFF41' - 10
よりも小さい。 この場合、ch - '\uFF41'+10
が返される。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
digit(int, int)
メソッドを使用してください。- パラメータ:
ch
- 変換対象の文字。radix
- 基数。- 戻り値:
- 指定された基数での、文字によって表される数値
- 関連項目:
- 文字についてメソッド
-
digit
public static int digit(int codePoint, int radix) 指定された基数での、指定された文字(Unicodeコード・ポイント)の数値を返します。基数が
MIN_RADIX
≤radix
≤MAX_RADIX
の範囲外の場合、または文字が指定された基数の有効数字でない場合は、-1
が返されます。 次のどれかに当てはまる場合、文字は有効数字です。- 文字についてメソッド
isDigit(codePoint)
がtrue
を返し、その文字のUnicode 10進数値(または単一文字の分解)が指定された基数よりも小さい。 この場合、10進値が返される。 - 文字が
'A'
-'Z'
のラテン大文字のどれかで、そのコードがradix+'A' - 10
よりも小さい。 この場合、codePoint - 'A'+10
が返される。 - 文字が
'a'
-'z'
のラテン小文字のどれかで、そのコードがradix+'a' - 10
よりも小さい。 この場合、codePoint - 'a'+10
が返される。 - 文字がA (
'\uFF21'
) - Z ('\uFF3A'
)の全角ラテン大文字のどれかで、そのコードがradix+'\uFF21' - 10
よりも小さい。 この場合、codePoint - '\uFF21'+10
が返される。 - 文字がa (
'\uFF41'
) - z ('\uFF5A'
)の全角ラテン小文字のどれかで、そのコードがradix+'\uFF41'- 10
よりも小さい。 この場合、codePoint - '\uFF41'+10
が返される。
- パラメータ:
codePoint
- 変換対象の文字(Unicodeコード・ポイント)。radix
- 基数。- 戻り値:
- 指定された基数での、文字によって表される数値
- 導入されたバージョン:
- 1.5
- 関連項目:
- 文字についてメソッド
-
getNumericValue
public static int getNumericValue(char ch) 指定されたUnicode文字が表すint
値を返します。 たとえば、文字'\u216C'
(ローマ数字の50)は、値50のintを返します。文字A - Zの大文字(
'\u0041'
-'\u005A'
)、小文字('\u0061'
-'\u007A'
)、全角バリアント('\uFF21'
-'\uFF3A'
および'\uFF41'
-'\uFF5A'
)の各形式は、10 - 35の数値を持ちます。 これはUnicode仕様とは無関係であり、Unicode仕様ではこれらのchar
値に数値は割り当てられません。文字が数値を持たない場合は、-1が返されます。 文字の数値を負でない整数として表現できない場合(小数値など)は、-2が返されます。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
getNumericValue(int)
メソッドを使用してください。- パラメータ:
ch
- 変換対象の文字。- 戻り値:
- 負でない
int
値としての文字の数値。文字に数値が含まれているが、その値を負でないint
値として表すことができない場合は -2。文字に数値がない場合は -1。 - 導入されたバージョン:
- 1.1
- 関連項目:
-
getNumericValue
public static int getNumericValue(int codePoint) 指定された文字(Unicodeコード・ポイント)が表すint
値を返します。 たとえば、文字'\u216C'
(ローマ数字の50)は、値50のint
を返します。文字A - Zの大文字(
'\u0041'
-'\u005A'
)、小文字('\u0061'
-'\u007A'
)、全角バリアント('\uFF21'
-'\uFF3A'
および'\uFF41'
-'\uFF5A'
)の各形式は、10 - 35の数値を持ちます。 これはUnicode仕様とは無関係であり、Unicode仕様ではこれらのchar
値に数値は割り当てられません。文字が数値を持たない場合は、-1が返されます。 文字の数値を負でない整数として表現できない場合(小数値など)は、-2が返されます。
- パラメータ:
codePoint
- 変換対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 負でない
int
値としての文字の数値。文字に数値が含まれているが、その値を負でないint
値として表すことができない場合は -2。文字に数値がない場合は -1。 - 導入されたバージョン:
- 1.5
- 関連項目:
-
isSpace
@Deprecated(since="1.1") public static boolean isSpace(char ch) 非推奨。isWhitespace(char)に置き換えられました。指定された文字がISO-LATIN-1の空白かどうかを判定します。 次の5つの文字についてだけ、このメソッドはtrue
を返します。文字 コード 名 '\t'
U+0009
HORIZONTAL TABULATION
'\n'
U+000A
NEW LINE
'\f'
U+000C
FORM FEED
'\r'
U+000D
CARRIAGE RETURN
' '
U+0020
SPACE
- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字がISO-LATIN-1の空白の場合は
true
、そうでない場合はfalse
。 - 関連項目:
-
isSpaceChar
public static boolean isSpaceChar(char ch) 指定された文字がUnicodeの空白文字かどうかを判定します。 空白文字と見なされるのは、Unicode標準で空白文字として指定されている場合だけです。 文字の汎用カテゴリ型が次のどれかの場合にだけ、このメソッドはtrueを返します。-
SPACE_SEPARATOR
-
LINE_SEPARATOR
-
PARAGRAPH_SEPARATOR
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isSpaceChar(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字が空白文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.1
- 関連項目:
-
-
isSpaceChar
public static boolean isSpaceChar(int codePoint) 指定された文字(Unicodeコード・ポイント)がUnicodeの空白文字かどうかを判定します。 空白文字と見なされるのは、Unicode標準で空白文字として指定されている場合だけです。 文字の汎用カテゴリ型が次のどれかの場合にだけ、このメソッドはtrueを返します。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が空白文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
-
isWhitespace
public static boolean isWhitespace(char ch) 指定された文字がJavaの基準に従った空白かどうかを判定します。 次の基準のどれかを満たす場合にだけ、Javaの空白文字になります。- Unicodeの空白文字(
SPACE_SEPARATOR
、LINE_SEPARATOR
、またはPARAGRAPH_SEPARATOR
)であるが、改行なしの空白('\u00A0'
、'\u2007'
、'\u202F'
)ではない。 -
'\t'
(U+0009水平タブ)である。 -
'\n'
(U+000A改行)である。 -
'\u000B'
(U+000B垂直タブ)である。 -
'\f'
(U+000Cフォーム・フィード)である。 -
'\r'
(U+000D復帰)である。 -
'\u001C'
(U+001Cファイル区切り文字)である。 -
'\u001D'
(U+001Dグループ区切り文字)である。 -
'\u001E'
(U+001Eレコード区切り文字)である。 -
'\u001F'
(U+001F単位区切り文字)である。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isWhitespace(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字がJava空白文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.1
- 関連項目:
- Unicodeの空白文字(
-
isWhitespace
public static boolean isWhitespace(int codePoint) 指定された文字(Unicodeコード・ポイント)がJavaの基準に従った空白かどうかを判定します。 次の基準のどれかを満たす場合にだけ、Javaの空白文字になります。- Unicodeの空白文字(
SPACE_SEPARATOR
、LINE_SEPARATOR
、またはPARAGRAPH_SEPARATOR
)であるが、改行なしの空白('\u00A0'
、'\u2007'
、'\u202F'
)ではない。 -
'\t'
(U+0009水平タブ)である。 -
'\n'
(U+000A改行)である。 -
'\u000B'
(U+000B垂直タブ)である。 -
'\f'
(U+000Cフォーム・フィード)である。 -
'\r'
(U+000D復帰)である。 -
'\u001C'
(U+001Cファイル区切り文字)である。 -
'\u001D'
(U+001Dグループ区切り文字)である。 -
'\u001E'
(U+001Eレコード区切り文字)である。 -
'\u001F'
(U+001F単位区切り文字)である。
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がJava空白文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
- Unicodeの空白文字(
-
isISOControl
public static boolean isISOControl(char ch) 指定された文字がISO制御文字かどうかを判定します。 コードが'\u0000'
-'\u001F'
の範囲、または'\u007F'
-'\u009F'
の範囲の場合は、ISO制御文字と見なされます。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isISOControl(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字がISO制御文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.1
- 関連項目:
-
isISOControl
public static boolean isISOControl(int codePoint) 参照された文字(Unicodeコード・ポイント)がISO制御文字かどうかを判定します。 コードが'\u0000'
-'\u001F'
の範囲、または'\u007F'
-'\u009F'
の範囲の場合は、ISO制御文字と見なされます。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がISO制御文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
-
getType
public static int getType(char ch) 文字の汎用カテゴリを示す値を返します。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
getType(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字の汎用カテゴリを表す
int
型の値。 - 導入されたバージョン:
- 1.1
- 関連項目:
-
getType
public static int getType(int codePoint) 文字の汎用カテゴリを示す値を返します。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字の汎用カテゴリを表す
int
型の値。 - 導入されたバージョン:
- 1.5
- 関連項目:
-
forDigit
public static char forDigit(int digit, int radix) 指定された基数での、指定された桁数の文字表現を判定します。radix
の値が無効な基数の場合、またはdigit
が指定された基数で無効な数字の場合は、null文字('\u0000'
)が返されます。radix
引数は、MIN_RADIX
以上MAX_RADIX
以下の場合に有効です。digit
引数は、0 <= digit < radix
の場合に有効です。数字が10より小さいと、
'0'+digit
が返されます。 そうでない場合は、値'a'+digit - 10
が返されます。- パラメータ:
digit
- 文字に変換する数。radix
- 基数。- 戻り値:
- 指定された基数での、指定された数値の
char
表現。 - 関連項目:
-
getDirectionality
public static byte getDirectionality(char ch) 指定された文字のUnicode方向性プロパティを返します。 文字の方向性は、テキストの表示順の計算に使用されます。 未定義のchar
値の方向性値はDIRECTIONALITY_UNDEFINED
です。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
getDirectionality(int)
メソッドを使用してください。- パラメータ:
ch
- 方向性プロパティが要求されたchar
。- 戻り値:
char
値の方向性プロパティ。- 導入されたバージョン:
- 1.4
- 関連項目:
-
getDirectionality
public static byte getDirectionality(int codePoint) 所定の文字(Unicodeコード・ポイント)のUnicode方向性プロパティを返します。 文字の方向性は、テキストの表示順の計算に使用されます。 未定義の文字の方向性値はDIRECTIONALITY_UNDEFINED
です。- パラメータ:
codePoint
- 方向性プロパティが要求された文字(Unicodeコード・ポイント)。- 戻り値:
- 文字の方向性プロパティ
- 導入されたバージョン:
- 1.5
- 関連項目:
-
isMirrored
public static boolean isMirrored(char ch) Unicode仕様に従って文字をミラー化するかどうかを判定します。 テキスト内で右から左に文字が描画される場合、文字のミラー化により、グリフが水平方向にミラー化されます。 たとえば、'\u0028'
LEFT PARENTHESISは、セマンティックスでは開きカッコとして定義されています。 これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isMirrored(int)
メソッドを使用してください。- パラメータ:
ch
- ミラー化プロパティが要求されたchar
- 戻り値:
- charがミラー化される場合は
true
、char
がミラー化されないか未定義の場合はfalse
。 - 導入されたバージョン:
- 1.4
-
isMirrored
public static boolean isMirrored(int codePoint) Unicode仕様に従って、指定された文字(Unicodeコード・ポイント)をミラー化するかどうかを判定します。 テキスト内で右から左に文字が描画される場合、文字のミラー化により、グリフが水平方向にミラー化されます。 たとえば、'\u0028'
LEFT PARENTHESISは、セマンティックスでは開きカッコとして定義されています。 これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がミラー化される場合は
true
、文字がミラー化されないか未定義の場合はfalse
。 - 導入されたバージョン:
- 1.5
-
compareTo
public int compareTo(Character anotherCharacter) 2つのCharacter
オブジェクトを数値的に比較します。- 定義:
compareTo
、インタフェースComparable<Character>
- パラメータ:
anotherCharacter
- 比較対象のCharacter
。- 戻り値:
- 引数
Character
がこのCharacter
と等しい場合は値0
、このCharacter
がCharacter
引数より小さい数値の場合は0
より小さい値、このCharacter
がCharacter
引数より大きい数値の場合は0
より大きい値(符号なしの比較)。 これは完全に数値の比較なので、ロケールに依存しない - 導入されたバージョン:
- 1.2
-
compare
public static int compare(char x, char y) 2つのchar
値を数値的に比較します。 返される値は、次から返される値と同じになります。Character.valueOf(x).compareTo(Character.valueOf(y))
- パラメータ:
x
- 比較する最初のchar
y
- 比較する2番目のchar
- 戻り値:
x == y
の場合は値0
、x < y
の場合は0
より小さい値、x> y
の場合は0
より大きい値- 導入されたバージョン:
- 1.7
-
reverseBytes
public static char reverseBytes(char ch) 指定されたchar
値のバイトの順序を逆にして取得された値を返します。- パラメータ:
ch
- そのバイト順を逆にするchar
。- 戻り値:
- 指定された
char
値のバイトを(または、同等のスワップ)で逆にすることで取得された値。 - 導入されたバージョン:
- 1.5
-
getName
public static String getName(int codePoint) 指定された文字codePoint
の名前を返します。コード・ポイントがunassigned
の場合はnullを返します。指定した文字にUnicodeDataファイル(ユニコード・コンソーシアムによって管理されているUnicode文字データベースの一部)によって名前が割り当てられていない場合、返される名前は式の結果と同じです:
UnicodeDataファイルのCharacter.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);
codePoint
の場合、このメソッドによって返される名前は、Unicode Standardの"Unicode名プロパティ"セクションのネーミング・スキームに従います。 Hangul/Ideographsなどの他のコード・ポイントの場合、前述の名前生成ルールはUnicode Standardで定義されているものとは異なります。- パラメータ:
codePoint
- 文字(Unicodeコード・ポイント)- 戻り値:
- 指定した文字の名前、またはコード・ポイントが割り当てられていない場合はnull。
- 例外:
IllegalArgumentException
- 指定されたcodePoint
が有効なUnicodeコード・ポイントでない場合。- 導入されたバージョン:
- 1.7
-
codePointOf
public static int codePointOf(String name) 指定された文字名で指定されたUnicode文字のコード・ポイント値を返します。文字にUnicodeDataファイル(ユニコード・コンソーシアムによって管理されているUnicode文字データベースの一部)によって名前が割り当てられていない場合、その名前は式の結果として定義されます:
Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);
name
の一致では大文字と小文字は区別されず、先頭と末尾の空白文字は削除されます。 UnicodeDataファイルのコード・ポイントの場合、このメソッドは、Unicode Standardの"Unicode名プロパティ"セクションで定義された名前に準拠する名前を認識します。 他のコード・ポイントの場合、このメソッドはgetName(int)
メソッドで生成された名前を認識します。- パラメータ:
name
- 文字名- 戻り値:
- 名前で指定された文字のコード・ポイント値。
- 例外:
IllegalArgumentException
- 指定したname
が有効な文字名でない場合。NullPointerException
-name
がnull
である場合- 導入されたバージョン:
- 9
-