- java.lang.Object
-
- java.lang.Character
-
- すべての実装されたインタフェース:
Serializable
,Comparable<Character>
public final class Character extends Object implements Serializable, Comparable<Character>
Character
クラスは、プリミティブ型char
の値をオブジェクトにラップします。Character
クラスのオブジェクトには、型がchar
の単一フィールドが含まれます。また、このクラスは、文字のカテゴリ(小文字、数字など)を決定したり、大文字から小文字(およびその逆)の変換を行う多数のstaticメソッドも提供します。
Unicode準拠
Character
クラスのフィールドおよびメソッドは、Unicode標準(特にUnicode Character Databaseの一部であるUnicodeDataファイル)の文字情報の観点から定義されています。 このファイルは、割当て済みのUnicodeコード・ポイントまたは文字範囲ごとの名前やカテゴリなどのプロパティを指定します。 ファイルは、Unicode Consortium (http://www.unicode.org)から入手できます。Java SE 11 Platformは、Unicode Standardのバージョン10.0からの文字情報と、2つの拡張機能を使用します。 まず、Java SE 11 Platformでは、クラス
Character
を実装して、Unicode Standardバージョン11.0のU+9FEB
からU+9FEF
の範囲のコード・ポイントを使用できるようにし、このクラスで中国のGB18030-2022標準の"実装レベル2"を許可します。 次に、Java SE 11 Platformでは、クラスCharacter
を実装して、Unicode Standardバージョン12.1のJapanese Eraコード・ポイントU+32FF
を使用できます。 したがって、前述のコード・ポイント(バージョン10.0以外)を処理する場合、Character
クラスのフィールドおよびメソッドの動作は、Java識別子を定義する次のメソッドを除き、Java SE 11 Platformの実装によって異なる可能性があります:isJavaIdentifierStart(int)
、isJavaIdentifierStart(char)
、isJavaIdentifierPart(int)
およびisJavaIdentifierPart(char)
。 Java識別子のコード・ポイントは、Unicode Standardのバージョン10.0から取得する必要があります。Unicode文字表現
char
データ型(Character
オブジェクトにカプセル化される値)は、当初のUnicode仕様に基づいています。この仕様では、文字が固定幅16ビット・エンティティとして定義されていました。 Unicode標準はその後、16ビット以上の表現を必要とする文字を許容するように変更されています。 適正なコード・ポイントの範囲は、現在U+0000 - U+10FFFFであり、Unicodeスカラー値として知られています。 (Unicode標準のU+n表記の定義を参照。)U+0000 - U+FFFFの文字セットは、基本多言語面(BMP)と呼ばれる場合もあります。 コード・ポイントがU+FFFFよりも大きい文字は補助文字と呼ばれます。 Javaプラットフォームでは、
char
配列、String
クラス、およびStringBuffer
クラスでUTF-16表現が使用されます。 この表現では、補助文字はchar
値のペアとして表現され、上位サロゲート範囲(\uD800-\uDBFF)からの最初の値と、下位サロゲート範囲(\uDC00-\uDFFF)からの第2の値から構成されています。したがって、
char
値は、サロゲート・コード・ポイントやUTF-16エンコーディングのコード単位を含む基本多言語面(BMP)コード・ポイントを表します。int
値は、補助コード・ポイントを含むすべてのUnicodeコード・ポイントを表します。int
の下位(最下位) 21ビットは、Unicodeコード・ポイントを表すために使用され、上位(最上位) 11ビットはゼロである必要があります。 特に指定されないかぎり、補助文字とサロゲートchar
値に関する動作は次のとおりです。char
値だけを受け入れるメソッドは補助文字に対応できません。 これらのメソッドはサロゲート範囲のchar
値を未定義の文字として扱います。 たとえば、Character.isLetter('\uD840')
はfalse
を返し、文字列でそのあとに下位サロゲート値が続く場合でも、この特定の値は文字を表します。int
値を受け入れるメソッドは、補助文字を含むすべてのUnicode文字に対応します。 たとえば、Character.isLetter(0x2F81A)
は、コード・ポイント値が文字(CJK統合漢字)を表すため、true
を返します。
Java SE APIドキュメンテーションでは、U+0000 - U+10FFFFの範囲の文字値にUnicodeコード・ポイントを使用し、UTF-16エンコーディングのコード単位である16ビット
char
値にUnicodeコード単位を使用します。 Unicode用語の詳細は、「Unicode Glossary」を参照してください。- 導入されたバージョン:
- 1.0
- 関連項目:
- 直列化された形式
-
-
ネストされたクラスのサマリー
ネストされたクラス 修飾子と型 クラス 説明 static class
Character.Subset
このクラスのインスタンスは、Unicode文字セットの特定のサブセットを表します。static class
Character.UnicodeBlock
Unicode仕様で定義されている文字ブロックを表す文字サブセットのファミリです。static class
Character.UnicodeScript
「Unicode Standard Annex#24: Script Names」で規定された文字スクリプトを表す文字サブセットのファミリです。
-
フィールドのサマリー
フィールド 修飾子と型 フィールド 説明 static int
BYTES
符号なしバイナリ形式でchar
値を表すために使用されるバイト数。static byte
COMBINING_SPACING_MARK
Unicode仕様の汎用カテゴリ「Mc」。static byte
CONNECTOR_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pc」。static byte
CONTROL
Unicode仕様の汎用カテゴリ「Cc」。static byte
CURRENCY_SYMBOL
Unicode仕様の汎用カテゴリ「Sc」。static byte
DASH_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pd」。static byte
DECIMAL_DIGIT_NUMBER
Unicode仕様の汎用カテゴリ「Nd」。static byte
DIRECTIONALITY_ARABIC_NUMBER
Unicode仕様の弱い双方向文字タイプ「AN」。static byte
DIRECTIONALITY_BOUNDARY_NEUTRAL
Unicode仕様の弱い双方向文字タイプ「BN」。static byte
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
Unicode仕様の弱い双方向文字タイプ「CS」。static byte
DIRECTIONALITY_EUROPEAN_NUMBER
Unicode仕様の弱い双方向文字タイプ「EN」。static byte
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
Unicode仕様の弱い双方向文字タイプ「ES」。static byte
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
Unicode仕様の弱い双方向文字タイプ「ET」。static byte
DIRECTIONALITY_FIRST_STRONG_ISOLATE
Unicode仕様の弱い双方向文字型"FSI"。static byte
DIRECTIONALITY_LEFT_TO_RIGHT
Unicode仕様の強力な双方向文字タイプ「L」。static byte
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
Unicode仕様の強力な双方向文字タイプ「LRE」。static byte
DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
Unicode仕様の弱い双方向文字型"LRI"。static byte
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
Unicode仕様の強力な双方向文字タイプ「LRO」。static byte
DIRECTIONALITY_NONSPACING_MARK
Unicode仕様の弱い双方向文字タイプ「NSM」。static byte
DIRECTIONALITY_OTHER_NEUTRALS
Unicode仕様のニュートラルな双方向文字タイプ「ON」。static byte
DIRECTIONALITY_PARAGRAPH_SEPARATOR
Unicode仕様のニュートラルな双方向文字タイプ「B」。static byte
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
Unicode仕様の弱い双方向文字タイプ「PDF」。static byte
DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
Unicode仕様の弱い双方向文字型"PDI"。static byte
DIRECTIONALITY_RIGHT_TO_LEFT
Unicode仕様の強力な双方向文字タイプ「R」。static byte
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
Unicode仕様の強力な双方向文字タイプ「AL」。static byte
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
Unicode仕様の強力な双方向文字タイプ「RLE」。static byte
DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
Unicode仕様の弱い双方向文字型"RLI"。static byte
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
Unicode仕様の強力な双方向文字タイプ「RLO」。static byte
DIRECTIONALITY_SEGMENT_SEPARATOR
Unicode仕様のニュートラルな双方向文字タイプ「S」。static byte
DIRECTIONALITY_UNDEFINED
未定義の双方向文字タイプ。static byte
DIRECTIONALITY_WHITESPACE
Unicode仕様のニュートラルな双方向文字タイプ「WS」。static byte
ENCLOSING_MARK
Unicode仕様の汎用カテゴリ「Me」。static byte
END_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pe」。static byte
FINAL_QUOTE_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pf」。static byte
FORMAT
Unicode仕様の汎用カテゴリ「Cf」。static byte
INITIAL_QUOTE_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pi」。static byte
LETTER_NUMBER
Unicode仕様の汎用カテゴリ「Nl」。static byte
LINE_SEPARATOR
Unicode仕様の汎用カテゴリ「Zl」。static byte
LOWERCASE_LETTER
Unicode仕様の汎用カテゴリ「Ll」。static byte
MATH_SYMBOL
Unicode仕様の汎用カテゴリ「Sm」。static int
MAX_CODE_POINT
Unicodeコード・ポイントの最大値(定数U+10FFFF
)。static char
MAX_HIGH_SURROGATE
UTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最大値(定数'\uDBFF'
)。static char
MAX_LOW_SURROGATE
UTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最大値(定数'\uDFFF'
)。static int
MAX_RADIX
文字列との変換に使用可能な最大基数。static char
MAX_SURROGATE
UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最大値(定数'\uDFFF'
)。static char
MAX_VALUE
このフィールドの定数値は、char
型の最大値'\uFFFF'
。static int
MIN_CODE_POINT
Unicodeコード・ポイントの最小値(定数U+0000
)。static char
MIN_HIGH_SURROGATE
UTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最小値(定数'\uD800'
)。static char
MIN_LOW_SURROGATE
UTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最小値(定数'\uDC00'
)。static int
MIN_RADIX
文字列との変換に使用可能な最小基数。static int
MIN_SUPPLEMENTARY_CODE_POINT
Unicode補助コード・ポイントの最小値(定数U+10000
)。static char
MIN_SURROGATE
UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最小値(定数'\uD800'
)。static char
MIN_VALUE
このフィールドの定数値は、char
型の最小値'\u0000'
。static byte
MODIFIER_LETTER
Unicode仕様の汎用カテゴリ「Lm」。static byte
MODIFIER_SYMBOL
Unicode仕様の汎用カテゴリ「Sk」。static byte
NON_SPACING_MARK
Unicode仕様の汎用カテゴリ「Mn」。static byte
OTHER_LETTER
Unicode仕様の汎用カテゴリ「Lo」。static byte
OTHER_NUMBER
Unicode仕様の汎用カテゴリ「No」。static byte
OTHER_PUNCTUATION
Unicode仕様の汎用カテゴリ「Po」。static byte
OTHER_SYMBOL
Unicode仕様の汎用カテゴリ「So」。static byte
PARAGRAPH_SEPARATOR
Unicode仕様の汎用カテゴリ「Zp」。static byte
PRIVATE_USE
Unicode仕様の汎用カテゴリ「Co」。static int
SIZE
符号なしバイナリ形式でchar
値を表すのに使用されるビット数(定数16
)。static byte
SPACE_SEPARATOR
Unicode仕様の汎用カテゴリ「Zs」。static byte
START_PUNCTUATION
Unicode仕様の汎用カテゴリ「Ps」。static byte
SURROGATE
Unicode仕様の汎用カテゴリ「Cs」。static byte
TITLECASE_LETTER
Unicode仕様の汎用カテゴリ「Lt」。static Class<Character>
TYPE
プリミティブ型char
を表すClass
インスタンス。static byte
UNASSIGNED
Unicode仕様の汎用カテゴリ「Cn」。static byte
UPPERCASE_LETTER
Unicode仕様の汎用カテゴリ「Lu」。
-
コンストラクタのサマリー
コンストラクタ コンストラクタ 説明 Character(char value)
非推奨。このコンストラクタを使用することはほとんどありません。
-
メソッドのサマリー
すべてのメソッド staticメソッド インスタンス・メソッド 具象メソッド 非推奨のメソッド 修飾子と型 メソッド 説明 static int
charCount(int codePoint)
指定された文字(Unicodeコード・ポイント)を表すのに必要なchar
値の数を判定します。char
charValue()
このCharacter
オブジェクトの値を返します。static int
codePointAt(char[] a, int index)
char
配列の指定されたインデックスにあるコード・ポイントを返します。static int
codePointAt(char[] a, int index, int limit)
limit
の長さ未満のindex
を持つ配列要素のみを使用可能な、char
配列の指定されたインデックスにあるコード・ポイントを返します。static int
codePointAt(CharSequence seq, int index)
CharSequence
の指定されたインデックスにあるコード・ポイントを返します。static int
codePointBefore(char[] a, int index)
char
配列の指定されたインデックスの前にあるコード・ポイントを返します。static int
codePointBefore(char[] a, int index, int start)
start
以上のindex
を持つ配列要素のみを使用可能な、char
配列の指定されたインデックスの前にあるコード・ポイントを返します。static int
codePointBefore(CharSequence seq, int index)
CharSequence
の指定されたインデックスの前にあるコード・ポイントを返します。static int
codePointCount(char[] a, int offset, int count)
char
配列引数の部分配列内にあるUnicodeコード・ポイントの数を返します。static int
codePointCount(CharSequence seq, int beginIndex, int endIndex)
指定されたcharシーケンスのテキスト範囲内のUnicodeコード・ポイントの数を返します。static int
codePointOf(String name)
指定されたUnicode文字名で指定されたUnicode文字のコード・ポイント値を返します。static int
compare(char x, char y)
2つのchar
値を数値的に比較します。int
compareTo(Character anotherCharacter)
2つのCharacter
オブジェクトを数値的に比較します。static int
digit(char ch, int radix)
指定された基数での、文字ch
の数値としての値を返します。static int
digit(int codePoint, int radix)
指定された基数での、指定された文字(Unicodeコード・ポイント)の数値を返します。boolean
equals(Object obj)
このオブジェクトと指定されたオブジェクトを比較します。static char
forDigit(int digit, int radix)
指定された基数での、指定された桁数の文字表現を判定します。static byte
getDirectionality(char ch)
指定された文字のUnicode方向性プロパティを返します。static byte
getDirectionality(int codePoint)
所定の文字(Unicodeコード・ポイント)のUnicode方向性プロパティを返します。static String
getName(int codePoint)
指定された文字codePoint
のUnicode名(コード・ポイントがunassigned
の場合はnull)を返します。static int
getNumericValue(char ch)
指定されたUnicode文字が表すint
値を返します。static int
getNumericValue(int codePoint)
指定された文字(Unicodeコード・ポイント)が表すint
値を返します。static int
getType(char ch)
文字の汎用カテゴリを示す値を返します。static int
getType(int codePoint)
文字の汎用カテゴリを示す値を返します。int
hashCode()
このCharacter
のハッシュ・コード(charValue()
を呼び出した場合の結果と等しくなる)を返します。static int
hashCode(char value)
Character.hashCode()
との互換性がある、char
値のハッシュ・コードを返します。static char
highSurrogate(int codePoint)
UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのリーディング・サロゲート(上位サロゲート・コード単位)を返します。static boolean
isAlphabetic(int codePoint)
指定された文字(Unicodeコード・ポイント)がアルファベットかどうかを判定します。static boolean
isBmpCodePoint(int codePoint)
指定された文字(Unicodeコード・ポイント)が基本多言語面(BMP)に含まれるかどうかを判定します。static boolean
isDefined(char ch)
文字がUnicodeで定義されているかどうかを判定します。static boolean
isDefined(int codePoint)
文字(Unicodeコード・ポイント)がUnicodeで定義されているかどうかを判定します。static boolean
isDigit(char ch)
指定された文字が数字かどうかを判定します。static boolean
isDigit(int codePoint)
指定された文字(Unicodeコード・ポイント)が数字かどうかを判定します。static boolean
isHighSurrogate(char ch)
指定されたchar
値がUnicode上位サロゲート・コード単位 (リーディング・サロゲート・コード単位ともいう)であるかどうかを判定します。static boolean
isIdentifierIgnorable(char ch)
指定された文字が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。static boolean
isIdentifierIgnorable(int codePoint)
指定された文字(Unicodeコード・ポイント)が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。static boolean
isIdeographic(int codePoint)
指定された文字(Unicodeコード・ポイント)が、Unicode標準で規定されたCJKV (中国語、日本語、韓国語、およびベトナム語)の表意文字かどうかを判定します。static boolean
isISOControl(char ch)
指定された文字がISO制御文字かどうかを判定します。static boolean
isISOControl(int codePoint)
参照された文字(Unicodeコード・ポイント)がISO制御文字かどうかを判定します。static boolean
isJavaIdentifierPart(char ch)
指定された文字をJava識別子の最初の文字以外に使用可能かどうかを判定します。static boolean
isJavaIdentifierPart(int codePoint)
文字(Unicodeコード・ポイント)をJava識別子の最初の文字以外に使用可能かどうかを判定します。static boolean
isJavaIdentifierStart(char ch)
指定された文字をJava識別子の最初の文字として指定可能かどうかを判定します。static boolean
isJavaIdentifierStart(int codePoint)
文字(Unicodeコード・ポイント)をJava識別子の最初の文字として指定可能かどうかを判定します。static boolean
isJavaLetter(char ch)
非推奨。isJavaIdentifierStart(char)に置き換えられました。static boolean
isJavaLetterOrDigit(char ch)
非推奨。isJavaIdentifierPart(char)に置き換えられました。static boolean
isLetter(char ch)
指定された文字が汎用文字かどうかを判定します。static boolean
isLetter(int codePoint)
指定された文字(Unicodeコード・ポイント)が汎用文字かどうかを判定します。static boolean
isLetterOrDigit(char ch)
指定された文字が汎用文字または数字かどうかを判定します。static boolean
isLetterOrDigit(int codePoint)
指定された文字(Unicodeコード・ポイント)が汎用文字または数字かどうかを判定します。static boolean
isLowerCase(char ch)
指定された文字が小文字かどうかを判定します。static boolean
isLowerCase(int codePoint)
指定された文字(Unicodeコード・ポイント)が小文字かどうかを判定します。static boolean
isLowSurrogate(char ch)
指定されたchar
値がUnicode下位サロゲート・コード単位 (トレーリング・サロゲート・コード単位ともいう)であるかどうかを判定します。static boolean
isMirrored(char ch)
Unicode仕様に従って文字をミラー化するかどうかを判定します。static boolean
isMirrored(int codePoint)
Unicode仕様に従って、指定された文字(Unicodeコード・ポイント)をミラー化するかどうかを判定します。static boolean
isSpace(char ch)
非推奨。isWhitespace(char)に置き換えられました。static boolean
isSpaceChar(char ch)
指定された文字がUnicodeの空白文字かどうかを判定します。static boolean
isSpaceChar(int codePoint)
指定された文字(Unicodeコード・ポイント)がUnicodeの空白文字かどうかを判定します。static boolean
isSupplementaryCodePoint(int codePoint)
指定された文字(Unicodeコード・ポイント)が補助文字の範囲にあるかどうかを判定します。static boolean
isSurrogate(char ch)
指定されたchar
値がUnicode サロゲート・コード単位かどうかを判定します。static boolean
isSurrogatePair(char high, char low)
指定されたchar
値のペアが有効なUnicodeサロゲート・ペアであるかどうかを判定します。static boolean
isTitleCase(char ch)
指定された文字がタイトル・ケース文字かどうかを判定します。static boolean
isTitleCase(int codePoint)
指定された文字(Unicodeコード・ポイント)がタイトル・ケース文字かどうかを判定します。static boolean
isUnicodeIdentifierPart(char ch)
指定された文字をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。static boolean
isUnicodeIdentifierPart(int codePoint)
指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。static boolean
isUnicodeIdentifierStart(char ch)
指定された文字をUnicode識別子の最初の文字として指定可能かどうかを判定します。static boolean
isUnicodeIdentifierStart(int codePoint)
指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字として指定可能かどうかを判定します。static boolean
isUpperCase(char ch)
指定された文字が大文字がどうかを判定します。static boolean
isUpperCase(int codePoint)
指定された文字(Unicodeコード・ポイント)が大文字かどうかを判定します。static boolean
isValidCodePoint(int codePoint)
指定されたコード・ポイントが有効なUnicodeコード・ポイント値であるかどうかを判定します。static boolean
isWhitespace(char ch)
指定された文字がJavaの基準に従った空白かどうかを判定します。static boolean
isWhitespace(int codePoint)
指定された文字(Unicodeコード・ポイント)がJavaの基準に従った空白かどうかを判定します。static char
lowSurrogate(int codePoint)
UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのトレーリング・サロゲート(下位サロゲート・コード単位)を返します。static int
offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)
指定されたchar
部分配列内で、指定されたindex
からcodePointOffset
コード・ポイント分だけオフセットされた位置のインデックスを返します。static int
offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
指定された文字シーケンス内で、指定されたindex
からcodePointOffset
コード・ポイント分だけオフセットされた位置のインデックスを返します。static char
reverseBytes(char ch)
指定されたchar
値でバイト順を逆にして取得した値を返します。static char[]
toChars(int codePoint)
指定された文字(Unicodeコード・ポイント)をchar
配列に格納されるUTF-16表現に変換します。static int
toChars(int codePoint, char[] dst, int dstIndex)
指定された文字(Unicodeコード・ポイント)をUTF-16表現に変換します。static int
toCodePoint(char high, char low)
指定されたサロゲート・ペアをその補助コード・ポイント値に変換します。static char
toLowerCase(char ch)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を小文字に変換します。static int
toLowerCase(int codePoint)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を小文字に変換します。String
toString()
このCharacter
の値を表すString
オブジェクトを返します。static String
toString(char c)
指定されたchar
を表すString
オブジェクトを返します。static String
toString(int codePoint)
指定された文字(Unicodeコード・ポイント)を表すString
オブジェクトを返します。static char
toTitleCase(char ch)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数をタイトル・ケースに変換します。static int
toTitleCase(int codePoint)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数をタイトル・ケースに変換します。static char
toUpperCase(char ch)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を大文字に変換します。static int
toUpperCase(int codePoint)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を大文字に変換します。static Character
valueOf(char c)
指定されたchar
値を表すCharacter
インスタンスを返します。
-
-
-
フィールドの詳細
-
MIN_RADIX
public static final int MIN_RADIX
文字列との変換に使用可能な最小基数です。 このフィールドの定数値は、Integer
クラスのdigit
メソッド、forDigit
メソッド、およびtoString
メソッドなどの基数変換メソッドの最小許容値です。
-
MAX_RADIX
public static final int MAX_RADIX
文字列との変換に使用可能な最大基数です。 このフィールドの定数値は、Integer
クラスのdigit
メソッド、forDigit
メソッド、およびtoString
メソッドなどの基数変換メソッドの最大許容値です。
-
MIN_VALUE
public static final char MIN_VALUE
このフィールドの定数値は、char
型の最小値'\u0000'
です。- 導入されたバージョン:
- 1.0.2
- 関連項目:
- 定数フィールド値
-
MAX_VALUE
public static final char MAX_VALUE
このフィールドの定数値は、char
型の最大値'\uFFFF'
です。- 導入されたバージョン:
- 1.0.2
- 関連項目:
- 定数フィールド値
-
UNASSIGNED
public static final byte UNASSIGNED
Unicode仕様の汎用カテゴリ「Cn」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
UPPERCASE_LETTER
public static final byte UPPERCASE_LETTER
Unicode仕様の汎用カテゴリ「Lu」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
LOWERCASE_LETTER
public static final byte LOWERCASE_LETTER
Unicode仕様の汎用カテゴリ「Ll」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
TITLECASE_LETTER
public static final byte TITLECASE_LETTER
Unicode仕様の汎用カテゴリ「Lt」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
MODIFIER_LETTER
public static final byte MODIFIER_LETTER
Unicode仕様の汎用カテゴリ「Lm」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
OTHER_LETTER
public static final byte OTHER_LETTER
Unicode仕様の汎用カテゴリ「Lo」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
NON_SPACING_MARK
public static final byte NON_SPACING_MARK
Unicode仕様の汎用カテゴリ「Mn」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
ENCLOSING_MARK
public static final byte ENCLOSING_MARK
Unicode仕様の汎用カテゴリ「Me」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
COMBINING_SPACING_MARK
public static final byte COMBINING_SPACING_MARK
Unicode仕様の汎用カテゴリ「Mc」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
DECIMAL_DIGIT_NUMBER
public static final byte DECIMAL_DIGIT_NUMBER
Unicode仕様の汎用カテゴリ「Nd」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
LETTER_NUMBER
public static final byte LETTER_NUMBER
Unicode仕様の汎用カテゴリ「Nl」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
OTHER_NUMBER
public static final byte OTHER_NUMBER
Unicode仕様の汎用カテゴリ「No」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
SPACE_SEPARATOR
public static final byte SPACE_SEPARATOR
Unicode仕様の汎用カテゴリ「Zs」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
LINE_SEPARATOR
public static final byte LINE_SEPARATOR
Unicode仕様の汎用カテゴリ「Zl」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
PARAGRAPH_SEPARATOR
public static final byte PARAGRAPH_SEPARATOR
Unicode仕様の汎用カテゴリ「Zp」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
CONTROL
public static final byte CONTROL
Unicode仕様の汎用カテゴリ「Cc」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
FORMAT
public static final byte FORMAT
Unicode仕様の汎用カテゴリ「Cf」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
PRIVATE_USE
public static final byte PRIVATE_USE
Unicode仕様の汎用カテゴリ「Co」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
SURROGATE
public static final byte SURROGATE
Unicode仕様の汎用カテゴリ「Cs」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
DASH_PUNCTUATION
public static final byte DASH_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pd」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
START_PUNCTUATION
public static final byte START_PUNCTUATION
Unicode仕様の汎用カテゴリ「Ps」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
END_PUNCTUATION
public static final byte END_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pe」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
CONNECTOR_PUNCTUATION
public static final byte CONNECTOR_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pc」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
OTHER_PUNCTUATION
public static final byte OTHER_PUNCTUATION
Unicode仕様の汎用カテゴリ「Po」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
MATH_SYMBOL
public static final byte MATH_SYMBOL
Unicode仕様の汎用カテゴリ「Sm」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
CURRENCY_SYMBOL
public static final byte CURRENCY_SYMBOL
Unicode仕様の汎用カテゴリ「Sc」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
MODIFIER_SYMBOL
public static final byte MODIFIER_SYMBOL
Unicode仕様の汎用カテゴリ「Sk」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
OTHER_SYMBOL
public static final byte OTHER_SYMBOL
Unicode仕様の汎用カテゴリ「So」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
INITIAL_QUOTE_PUNCTUATION
public static final byte INITIAL_QUOTE_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pi」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
FINAL_QUOTE_PUNCTUATION
public static final byte FINAL_QUOTE_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pf」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_UNDEFINED
public static final byte DIRECTIONALITY_UNDEFINED
未定義の双方向文字タイプ。 Unicode仕様では、未定義のchar
値の方向性は定義されていません。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_LEFT_TO_RIGHT
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT
Unicode仕様の強力な双方向文字タイプ「L」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_RIGHT_TO_LEFT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT
Unicode仕様の強力な双方向文字タイプ「R」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
Unicode仕様の強力な双方向文字タイプ「AL」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_EUROPEAN_NUMBER
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER
Unicode仕様の弱い双方向文字タイプ「EN」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
Unicode仕様の弱い双方向文字タイプ「ES」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
Unicode仕様の弱い双方向文字タイプ「ET」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_ARABIC_NUMBER
public static final byte DIRECTIONALITY_ARABIC_NUMBER
Unicode仕様の弱い双方向文字タイプ「AN」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
Unicode仕様の弱い双方向文字タイプ「CS」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_NONSPACING_MARK
public static final byte DIRECTIONALITY_NONSPACING_MARK
Unicode仕様の弱い双方向文字タイプ「NSM」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_BOUNDARY_NEUTRAL
public static final byte DIRECTIONALITY_BOUNDARY_NEUTRAL
Unicode仕様の弱い双方向文字タイプ「BN」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_PARAGRAPH_SEPARATOR
public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
Unicode仕様のニュートラルな双方向文字タイプ「B」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_SEGMENT_SEPARATOR
public static final byte DIRECTIONALITY_SEGMENT_SEPARATOR
Unicode仕様のニュートラルな双方向文字タイプ「S」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_WHITESPACE
public static final byte DIRECTIONALITY_WHITESPACE
Unicode仕様のニュートラルな双方向文字タイプ「WS」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_OTHER_NEUTRALS
public static final byte DIRECTIONALITY_OTHER_NEUTRALS
Unicode仕様のニュートラルな双方向文字タイプ「ON」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
Unicode仕様の強力な双方向文字タイプ「LRE」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
Unicode仕様の強力な双方向文字タイプ「LRO」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
Unicode仕様の強力な双方向文字タイプ「RLE」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
Unicode仕様の強力な双方向文字タイプ「RLO」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
Unicode仕様の弱い双方向文字タイプ「PDF」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
Unicode仕様の弱い双方向文字型"LRI"。- 導入されたバージョン:
- 9
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
Unicode仕様の弱い双方向文字型"RLI"。- 導入されたバージョン:
- 9
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_FIRST_STRONG_ISOLATE
public static final byte DIRECTIONALITY_FIRST_STRONG_ISOLATE
Unicode仕様の弱い双方向文字型"FSI"。- 導入されたバージョン:
- 9
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
Unicode仕様の弱い双方向文字型"PDI"。- 導入されたバージョン:
- 9
- 関連項目:
- 定数フィールド値
-
MIN_HIGH_SURROGATE
public static final char MIN_HIGH_SURROGATE
UTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最小値(定数'\uD800'
)。 上位サロゲートは、リーディング・サロゲートともいいます。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
MAX_HIGH_SURROGATE
public static final char MAX_HIGH_SURROGATE
UTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最大値(定数'\uDBFF'
)。 上位サロゲートは、リーディング・サロゲートともいいます。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
MIN_LOW_SURROGATE
public static final char MIN_LOW_SURROGATE
UTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最小値(定数'\uDC00'
)。 下位サロゲートは、トレーリング・サロゲートともいいます。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
MAX_LOW_SURROGATE
public static final char MAX_LOW_SURROGATE
UTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最大値(定数'\uDFFF'
)。 下位サロゲートは、トレーリング・サロゲートともいいます。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
MIN_SURROGATE
public static final char MIN_SURROGATE
UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最小値(定数'\uD800'
)。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
MAX_SURROGATE
public static final char MAX_SURROGATE
UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最大値(定数'\uDFFF'
)。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
MIN_SUPPLEMENTARY_CODE_POINT
public static final int MIN_SUPPLEMENTARY_CODE_POINT
Unicode補助コード・ポイントの最小値(定数U+10000
)。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
MIN_CODE_POINT
public static final int MIN_CODE_POINT
Unicodeコード・ポイントの最小値(定数U+0000
)。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
MAX_CODE_POINT
public static final int MAX_CODE_POINT
Unicodeコード・ポイントの最大値(定数U+10FFFF
)。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
SIZE
public static final int SIZE
符号なしバイナリ形式でchar
値を表すのに使用されるビット数(定数16
)。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
BYTES
public static final int BYTES
符号なしバイナリ形式でchar
値を表すために使用されるバイト数。- 導入されたバージョン:
- 1.8
- 関連項目:
- 定数フィールド値
-
-
コンストラクタの詳細
-
Character
@Deprecated(since="9") public Character(char value)
非推奨。このコンストラクタを使用することはほとんどありません。 静的ファクトリvalueOf(char)
は、より良いスペースと時間のパフォーマンスをもたらす可能性が高いため、通常はより良い選択です。指定されたchar
値を表す、新しく割り当てられたCharacter
オブジェクトを構築します。- パラメータ:
value
-Character
オブジェクトによって表される値。
-
-
メソッドの詳細
-
valueOf
public static Character valueOf(char c)
指定されたchar
値を表すCharacter
インスタンスを返します。 新規Character
インスタンスが不要な場合、通常このメソッドがコンストラクタCharacter(char)
に優先して使用されます。その理由は、このメソッドが頻繁に要求される値をキャッシュするので、操作に必要な領域や時間がはるかに少なくて済む場合が多いためです。 このメソッドは、'\u0000'
から'\u007F'
の範囲(両端含む)の値を常にキャッシュしますが、この範囲に含まれないその他の値をキャッシュすることもあります。- パラメータ:
c
- char値。- 戻り値:
c
を表すCharacter
インスタンス。- 導入されたバージョン:
- 1.5
-
charValue
public char charValue()
このCharacter
オブジェクトの値を返します。- 戻り値:
- このオブジェクトが表すプリミティブ
char
値。
-
hashCode
public int hashCode()
このCharacter
のハッシュ・コード(charValue()
を呼び出した場合の結果と等しくなる)を返します。- オーバーライド:
hashCode
、クラスObject
- 戻り値:
- この
Character
のハッシュ・コード値 - 関連項目:
Object.equals(java.lang.Object)
,System.identityHashCode(java.lang.Object)
-
hashCode
public static int hashCode(char value)
Character.hashCode()
との互換性がある、char
値のハッシュ・コードを返します。- パラメータ:
value
- ハッシュ・コードが返されるchar
。- 戻り値:
char
値のハッシュ・コード値。- 導入されたバージョン:
- 1.8
-
equals
public boolean equals(Object obj)
このオブジェクトと指定されたオブジェクトを比較します。 結果がtrue
になるのは、引数がnull
ではなく、このオブジェクトと同じchar
値を表すCharacter
オブジェクトである場合だけです。- オーバーライド:
equals
、クラスObject
- パラメータ:
obj
- 比較対象のオブジェクト- 戻り値:
- オブジェクトが同じである場合は
true
、そうでない場合はfalse
。 - 関連項目:
Object.hashCode()
、HashMap
-
toString
public String toString()
このCharacter
の値を表すString
オブジェクトを返します。 結果は、長さ1の文字列(構成要素はCharacter
オブジェクトにより表されるプリミティブ型のchar
値だけ)になります。
-
toString
public static String toString(char c)
指定されたchar
を表すString
オブジェクトを返します。 結果は、指定されたchar
だけで構成される長さ1の文字列になります。- APIのノート:
- このメソッドは「補助文字」を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
toString(int)
メソッドを使用します。 - パラメータ:
c
- 変換するchar
- 戻り値:
- 指定された
char
の文字列表現 - 導入されたバージョン:
- 1.4
-
toString
public static String toString(int codePoint)
指定された文字(Unicodeコード・ポイント)を表すString
オブジェクトを返します。 結果は、指定されたcodePoint
のみで構成された1または2の長さの文字列です。- パラメータ:
codePoint
- 変換するcodePoint
- 戻り値:
- 指定された
codePoint
の文字列表現 - 例外:
IllegalArgumentException
- 指定されたcodePoint
が「有効なUnicodeコード・ポイント」ではない場合。- 導入されたバージョン:
- 11
-
isValidCodePoint
public static boolean isValidCodePoint(int codePoint)
指定されたコード・ポイントが有効なUnicodeコード・ポイント値であるかどうかを判定します。- パラメータ:
codePoint
- 判定対象のUnicodeコード・ポイント- 戻り値:
- 指定されたコード・ポイント値が
MIN_CODE_POINT
-MAX_CODE_POINT
の範囲(両端含む)に含まれる場合はtrue
、それ以外の場合はfalse
。 - 導入されたバージョン:
- 1.5
-
isBmpCodePoint
public static boolean isBmpCodePoint(int codePoint)
指定された文字(Unicodeコード・ポイント)が基本多言語面(BMP)に含まれるかどうかを判定します。 そのようなコード・ポイントは単一のchar
を使って表せます。
-
isSupplementaryCodePoint
public static boolean isSupplementaryCodePoint(int codePoint)
指定された文字(Unicodeコード・ポイント)が補助文字の範囲にあるかどうかを判定します。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)- 戻り値:
- 指定されたコード・ポイントが
MIN_SUPPLEMENTARY_CODE_POINT
-MAX_CODE_POINT
の範囲(両端含む)に含まれる場合はtrue
、それ以外の場合はfalse
。 - 導入されたバージョン:
- 1.5
-
isHighSurrogate
public static boolean isHighSurrogate(char ch)
指定されたchar
値がUnicode上位サロゲート・コード単位 (リーディング・サロゲート・コード単位ともいう)であるかどうかを判定します。これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。
- パラメータ:
ch
- 判定されるchar
値。- 戻り値:
char
の値がMIN_HIGH_SURROGATE
-MAX_HIGH_SURROGATE
の範囲(両端含む)に含まれる場合はtrue
、それ以外の場合はfalse
。- 導入されたバージョン:
- 1.5
- 関連項目:
isLowSurrogate(char)
,Character.UnicodeBlock.of(int)
-
isLowSurrogate
public static boolean isLowSurrogate(char ch)
指定されたchar
値がUnicode下位サロゲート・コード単位 (トレーリング・サロゲート・コード単位ともいう)であるかどうかを判定します。これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。
- パラメータ:
ch
- 判定されるchar
値。- 戻り値:
char
値がMIN_LOW_SURROGATE
-MAX_LOW_SURROGATE
の範囲(両端含む)に含まれる場合はtrue
、それ以外の場合はfalse
。- 導入されたバージョン:
- 1.5
- 関連項目:
isHighSurrogate(char)
-
isSurrogate
public static boolean isSurrogate(char ch)
指定されたchar
値がUnicode サロゲート・コード単位かどうかを判定します。これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。
char値がサロゲート・コード単位になるのは、それが下位サロゲート・コード単位と上位サロゲート・コード単位のいずれかである場合だけです。
- パラメータ:
ch
- 判定されるchar
値。- 戻り値:
char
値がMIN_SURROGATE
-MAX_SURROGATE
の範囲(両端含む)に含まれる場合はtrue
、それ以外の場合はfalse
。- 導入されたバージョン:
- 1.7
-
isSurrogatePair
public static boolean isSurrogatePair(char high, char low)
指定されたchar
値のペアが有効なUnicodeサロゲート・ペアであるかどうかを判定します。このメソッドは次の式と等価です。
isHighSurrogate(high) && isLowSurrogate(low)
- パラメータ:
high
- 判定対象の上位サロゲート・コード値low
- 判定対象の下位サロゲート・コード値- 戻り値:
- 指定された上位/下位サロゲート・コード値が有効なサロゲート・ペアを表す場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
-
charCount
public static int charCount(int codePoint)
指定された文字(Unicodeコード・ポイント)を表すのに必要なchar
値の数を判定します。 このメソッドは、指定された文字が0x10000以上である場合は2を返します。 それ以外の場合は1を返します。このメソッドは、指定された文字が有効なUnicodeコード・ポイントであることを検証しません。 呼出し側で、必要に応じて
isValidCodePoint
を使用して、文字値を検証する必要があります。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が有効な補助文字の場合は2、そうでない場合は1。
- 導入されたバージョン:
- 1.5
- 関連項目:
isSupplementaryCodePoint(int)
-
toCodePoint
public static int toCodePoint(char high, char low)
指定されたサロゲート・ペアをその補助コード・ポイント値に変換します。 このメソッドは、指定されたサロゲート・ペアを検証しません。 呼出し側は必要に応じて、isSurrogatePair
を使って検証する必要があります。- パラメータ:
high
- 上位サロゲート・コード単位low
- 下位サロゲート・コード単位- 戻り値:
- 指定されたサロゲート・ペアから作成された補助コード・ポイント。
- 導入されたバージョン:
- 1.5
-
codePointAt
public static int codePointAt(CharSequence seq, int index)
CharSequence
の指定されたインデックスにあるコード・ポイントを返します。CharSequence
内の指定されたインデックス位置のchar
値が上位サロゲート範囲に含まれており、それに続くインデックスがCharSequence
の長さ未満であり、かつそのインデックス位置のchar
値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar
値が返されます。- パラメータ:
seq
-char
値のシーケンス(Unicodeコード単位)index
- 変換されるseq
内のchar
値(Unicodeコード単位)へのインデックス- 戻り値:
- 所定のインデックス位置のUnicodeコード・ポイント
- 例外:
NullPointerException
-seq
がnullである場合。IndexOutOfBoundsException
- 値index
が負であるかseq.length()
以上である場合。- 導入されたバージョン:
- 1.5
-
codePointAt
public static int codePointAt(char[] a, int index)
char
配列の指定されたインデックスにあるコード・ポイントを返します。char
配列内の指定されたインデックス位置のchar
値が上位サロゲート範囲に含まれており、それに続くインデックスがchar
配列の長さ未満であり、かつそのインデックス位置のchar
値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar
値が返されます。- パラメータ:
a
-char
配列index
- 変換されるchar
配列内のchar
値(Unicodeコード単位)へのインデックス- 戻り値:
- 所定のインデックス位置のUnicodeコード・ポイント
- 例外:
NullPointerException
-a
がnullである場合。IndexOutOfBoundsException
-index
が負の値、またはchar
配列の長さ以上の値である場合。- 導入されたバージョン:
- 1.5
-
codePointAt
public static int codePointAt(char[] a, int index, int limit)
limit
の長さ未満のindex
を持つ配列要素のみを使用可能な、char
配列の指定されたインデックスにあるコード・ポイントを返します。char
配列内の指定されたインデックス位置のchar
値が上位サロゲート範囲に含まれており、それに続くインデックスがlimit
未満であり、かつそのインデックス位置のchar
値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar
値が返されます。- パラメータ:
a
-char
配列index
- 変換されるchar
配列内のchar
値(Unicodeコード単位)へのインデックスlimit
-char
配列で使用可能な最後の配列要素の後ろのインデックス- 戻り値:
- 所定のインデックス位置のUnicodeコード・ポイント
- 例外:
NullPointerException
-a
がnullである場合。IndexOutOfBoundsException
-index
引数が負の値またはlimit
引数以上である場合、またはlimit
引数が負の値またはchar
配列の長さより大きい場合。- 導入されたバージョン:
- 1.5
-
codePointBefore
public static int codePointBefore(CharSequence seq, int index)
CharSequence
の指定されたインデックスの前にあるコード・ポイントを返します。CharSequence
内の(index - 1)
のchar
値が下位サロゲート範囲に含まれており、(index - 2)
が負でなく、かつCharSequence
内の(index - 2)
のchar
値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)
のchar
値が返されます。- パラメータ:
seq
-CharSequence
インスタンスindex
- 返すべきコード・ポイントの直後のインデックス- 戻り値:
- 指定されたインデックスの前にあるUnicodeコード・ポイント値。
- 例外:
NullPointerException
-seq
がnullである場合。IndexOutOfBoundsException
-index
引数が1より小さいかseq.length()
より大きい場合。- 導入されたバージョン:
- 1.5
-
codePointBefore
public static int codePointBefore(char[] a, int index)
char
配列の指定されたインデックスの前にあるコード・ポイントを返します。char
配列内の(index - 1)
のchar
値が下位サロゲート範囲に含まれており、(index - 2)
が負でなく、かつchar
配列内の(index - 2)
のchar
値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)
のchar
値が返されます。- パラメータ:
a
-char
配列index
- 返すべきコード・ポイントの直後のインデックス- 戻り値:
- 指定されたインデックスの前にあるUnicodeコード・ポイント値。
- 例外:
NullPointerException
-a
がnullである場合。IndexOutOfBoundsException
-index
引数が1未満であるか、またはchar
配列の長さより大きい値の場合- 導入されたバージョン:
- 1.5
-
codePointBefore
public static int codePointBefore(char[] a, int index, int start)
start
以上のindex
を持つ配列要素のみを使用可能な、char
配列の指定されたインデックスの前にあるコード・ポイントを返します。char
配列内の(index - 1)
のchar
値が下位サロゲート範囲に含まれており、(index - 2)
がstart
以上であり、かつchar
配列内の(index - 2)
のchar
値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)
のchar
値が返されます。- パラメータ:
a
-char
配列index
- 返すべきコード・ポイントの直後のインデックスstart
-char
配列の最初の配列要素のインデックス- 戻り値:
- 指定されたインデックスの前にあるUnicodeコード・ポイント値。
- 例外:
NullPointerException
-a
がnullである場合。IndexOutOfBoundsException
-index
引数がstart
引数以下であるかchar
配列の長さより大きい場合、またはstart
引数が負の値であるかchar
配列の長さ以上である場合。- 導入されたバージョン:
- 1.5
-
highSurrogate
public static char highSurrogate(int codePoint)
UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのリーディング・サロゲート(上位サロゲート・コード単位)を返します。 指定された文字が補助文字でない場合は、未指定のchar
が返されます。isSupplementaryCodePoint(x)
がtrue
の場合、isHighSurrogate
(highSurrogate(x))
およびtoCodePoint
(highSurrogate(x),
lowSurrogate
(x))== x
も常にtrue
になります。- パラメータ:
codePoint
- 補助文字(Unicodeコード・ポイント)- 戻り値:
- この文字をUTF-16エンコーディングで表すために使用されるリーディング・サロゲート・コード単位
- 導入されたバージョン:
- 1.7
-
lowSurrogate
public static char lowSurrogate(int codePoint)
UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのトレーリング・サロゲート(下位サロゲート・コード単位)を返します。 指定された文字が補助文字でない場合は、未指定のchar
が返されます。isSupplementaryCodePoint(x)
がtrue
の場合、isLowSurrogate
(lowSurrogate(x))
およびtoCodePoint
(
highSurrogate
(x), lowSurrogate(x))== x
も常にtrue
になります。- パラメータ:
codePoint
- 補助文字(Unicodeコード・ポイント)- 戻り値:
- この文字をUTF-16エンコーディングで表すために使用されるトレーリング・サロゲート・コード単位
- 導入されたバージョン:
- 1.7
-
toChars
public static int toChars(int codePoint, char[] dst, int dstIndex)
指定された文字(Unicodeコード・ポイント)をUTF-16表現に変換します。 指定されたコード・ポイントがBMP (基本多言語面または第0面)値の場合は、同じ値がdst[dstIndex]
に格納され、1が返されます。 指定されたコード・ポイントが補助文字の場合は、サロゲート値がdst[dstIndex]
(上位サロゲート)とdst[dstIndex+1]
(下位サロゲート)に格納され、2が返されます。- パラメータ:
codePoint
- 変換対象の文字(Unicodeコード・ポイント)。dst
-codePoint
のUTF-16値が格納されるchar
の配列。dstIndex
- 変換された値が格納されるdst
配列の開始インデックス。- 戻り値:
- コード・ポイントがBMPコード・ポイントの場合は1、コード・ポイントが補助コード・ポイントの場合は2。
- 例外:
IllegalArgumentException
- 指定されたcodePoint
が有効なUnicodeコード・ポイントでない場合。NullPointerException
- 指定されたdst
がnullの場合。IndexOutOfBoundsException
-dstIndex
が負の値であるかdst.length
以上である場合、またはdstIndex
位置のdst
が結果として得られるchar
値を格納する十分な配列要素を持たない場合。 (dstIndex
がdst.length-1
と等価で、指定されたcodePoint
が補助文字の場合、上位サロゲート値はdst[dstIndex]
に格納されない。)- 導入されたバージョン:
- 1.5
-
toChars
public static char[] toChars(int codePoint)
指定された文字(Unicodeコード・ポイント)をchar
配列に格納されるUTF-16表現に変換します。 指定されたコード・ポイントがBMP (基本多言語面または第0面)値の場合、結果として得られるchar
配列はcodePoint
と同じ値を持ちます。 指定されたコード・ポイントが補助コード・ポイントの場合は、結果として得られるchar
配列は対応するサロゲート・ペアを持ちます。- パラメータ:
codePoint
- Unicodeコード・ポイント- 戻り値:
codePoint
のUTF-16表現を持つchar
配列。- 例外:
IllegalArgumentException
- 指定されたcodePoint
が有効なUnicodeコード・ポイントでない場合。- 導入されたバージョン:
- 1.5
-
codePointCount
public static int codePointCount(CharSequence seq, int beginIndex, int endIndex)
指定されたcharシーケンスのテキスト範囲内のUnicodeコード・ポイントの数を返します。 テキスト範囲は、指定されたbeginIndex
からインデックスendIndex - 1
の位置のchar
までです。 したがって、テキスト範囲の長さ(char
数)は、endIndex-beginIndex
になります。 テキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。- パラメータ:
seq
- 文字シーケンスbeginIndex
- テキスト範囲内の最初のchar
へのインデックスendIndex
- テキスト範囲内の最後のchar
の直後のインデックス- 戻り値:
- 指定されたテキスト範囲内のUnicodeコード・ポイントの数
- 例外:
NullPointerException
-seq
がnullである場合。IndexOutOfBoundsException
-beginIndex
が負であるか、endIndex
が指定されたシーケンスの長さより大きいか、あるいはbeginIndex
がendIndex
より大きい場合。- 導入されたバージョン:
- 1.5
-
codePointCount
public static int codePointCount(char[] a, int offset, int count)
char
配列引数の部分配列内にあるUnicodeコード・ポイントの数を返します。offset
引数は、部分配列の最初のchar
のインデックスであり、count
引数はchar
間の部分配列の長さを指定します。 部分配列内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。- パラメータ:
a
-char
配列offset
- 指定されたchar
配列の最初のchar
のインデックスcount
- 部分配列の長さ(char
数)- 戻り値:
- 指定された部分配列内のUnicodeコード・ポイントの数
- 例外:
NullPointerException
-a
がnullである場合。IndexOutOfBoundsException
-offset
またはcount
が負の場合、またはoffset+count
が指定された配列の長さより大きい場合。- 導入されたバージョン:
- 1.5
-
offsetByCodePoints
public static int offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
指定された文字シーケンス内で、指定されたindex
からcodePointOffset
コード・ポイント分だけオフセットされた位置のインデックスを返します。index
とcodePointOffset
で指定されるテキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。- パラメータ:
seq
- 文字シーケンスindex
- オフセットされるインデックスcodePointOffset
- オフセット(コード・ポイント数)- 戻り値:
- charシーケンス内のインデックス
- 例外:
NullPointerException
-seq
がnullである場合。IndexOutOfBoundsException
-index
が負の値または文字シーケンスの長さよりも大きい場合、codePointOffset
が正の値でありindex
で始まるサブシーケンスの持つコード・ポイント数がcodePointOffset
コード・ポイント数よりも少ない場合、あるいはcodePointOffset
が負の値でindex
の前のサブシーケンスの持つ値がcodePointOffset
コード・ポイントの絶対値よりも小さい場合。- 導入されたバージョン:
- 1.5
-
offsetByCodePoints
public static int offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)
指定されたchar
部分配列内で、指定されたindex
からcodePointOffset
コード・ポイント分だけオフセットされた位置のインデックスを返します。start
およびcount
引数は、char
配列の部分配列を指定します。index
とcodePointOffset
で指定されるテキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。- パラメータ:
a
-char
配列start
- 部分配列内の最初のchar
のインデックスcount
- 部分配列の長さ(char
数)index
- オフセットされるインデックスcodePointOffset
- オフセット(コード・ポイント数)- 戻り値:
- 部分配列内のインデックス
- 例外:
NullPointerException
-a
がnullである場合。IndexOutOfBoundsException
-start
またはcount
が負の場合、またはstart+count
が指定された配列の長さより大きい場合、またはindex
がstart
より小さいかstart+count
より大きい場合、またはcodePointOffset
が正で、index
から始まりstart+count - 1
で終わるテキスト範囲内のコード・ポイント数がcodePointOffset
コード・ポイント数より少ない場合、またはcodePointOffset
が負で、start
から始まりindex - 1
で終わるテキスト範囲内のコード・ポイント数がcodePointOffset
コード・ポイントの絶対値より少ない場合。- 導入されたバージョン:
- 1.5
-
isLowerCase
public static boolean isLowerCase(char ch)
指定された文字が小文字かどうかを判定します。ある文字が小文字になるのは、
Character.getType(ch)
によって提供される汎用カテゴリ型がLOWERCASE_LETTER
である場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Lowercaseを持つ場合です。小文字の例を次に示します。
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
Unicode文字には、ほかにも多数の小文字が存在します。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isLowerCase(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字が小文字の場合は
true
、そうでない場合はfalse
。 - 関連項目:
isLowerCase(char)
,isTitleCase(char)
,toLowerCase(char)
,getType(char)
-
isLowerCase
public static boolean isLowerCase(int codePoint)
指定された文字(Unicodeコード・ポイント)が小文字かどうかを判定します。ある文字が小文字になるのは、
getType(codePoint)
によって提供される汎用カテゴリ型がLOWERCASE_LETTER
である場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Lowercaseを持つ場合です。小文字の例を次に示します。
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
Unicode文字には、ほかにも多数の小文字が存在します。
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が小文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
isLowerCase(int)
,isTitleCase(int)
,toLowerCase(int)
,getType(int)
-
isUpperCase
public static boolean isUpperCase(char ch)
指定された文字が大文字がどうかを判定します。ある文字が大文字になるのは、
Character.getType(ch)
によって提供される汎用カテゴリ型がUPPERCASE_LETTER
である場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Uppercaseを持つ場合です。大文字の例を次に示します。
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
Unicode文字には、ほかにも多数の大文字が存在します。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isUpperCase(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字が大文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.0
- 関連項目:
isLowerCase(char)
,isTitleCase(char)
,toUpperCase(char)
,getType(char)
-
isUpperCase
public static boolean isUpperCase(int codePoint)
指定された文字(Unicodeコード・ポイント)が大文字かどうかを判定します。ある文字が大文字になるのは、
getType(codePoint)
によって提供される汎用カテゴリ型がUPPERCASE_LETTER
である場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Uppercaseを持つ場合です。大文字の例を次に示します。
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
Unicode文字には、ほかにも多数の大文字が存在します。
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が大文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
isLowerCase(int)
,isTitleCase(int)
,toUpperCase(int)
,getType(int)
-
isTitleCase
public static boolean isTitleCase(char ch)
指定された文字がタイトル・ケース文字かどうかを判定します。Character.getType(ch)
により示される汎用カテゴリ型がTITLECASE_LETTER
の場合、文字はタイトル・ケース文字になります。文字の中には、ラテン文字のペアのように見えるものがあります。 たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。 「Lj」のように見える3つ目の形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。
次に示すのは、このメソッドが
true
を返すUnicode文字の一部です。LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
Unicode文字には、ほかにも多数のタイトル・ケース文字が存在します。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isTitleCase(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字がタイトル・ケースの場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.0.2
- 関連項目:
isLowerCase(char)
,isUpperCase(char)
,toTitleCase(char)
,getType(char)
-
isTitleCase
public static boolean isTitleCase(int codePoint)
指定された文字(Unicodeコード・ポイント)がタイトル・ケース文字かどうかを判定します。getType(codePoint)
により示される汎用カテゴリ型がTITLECASE_LETTER
の場合、文字はタイトル・ケース文字になります。文字の中には、ラテン文字のペアのように見えるものがあります。 たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。 「Lj」のように見える3つ目の形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。
次に示すのは、このメソッドが
true
を返すUnicode文字の一部です。LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
Unicode文字には、ほかにも多数のタイトル・ケース文字が存在します。
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がタイトル・ケースの場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
isLowerCase(int)
,isUpperCase(int)
,toTitleCase(int)
,getType(int)
-
isDigit
public static boolean isDigit(char ch)
指定された文字が数字かどうかを判定します。Character.getType(ch)
により示される汎用カテゴリ型がDECIMAL_DIGIT_NUMBER
の場合、文字は数字になります。Unicode文字範囲の中には、次の数字を含むものがあります。
'\u0030'
-'\u0039'
、ISO-LATIN-1数字('0'
-'9'
)'\u0660'
-'\u0669'
、アラビア数字'\u06F0'
-'\u06F9'
、拡張アラビア数字'\u0966'
-'\u096F'
、デヴァーナーガリ数字'\uFF10'
-'\uFF19'
、全角数字
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isDigit(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字が数字の場合は
true
、そうでない場合はfalse
。 - 関連項目:
digit(char, int)
,forDigit(int, int)
,getType(char)
-
isDigit
public static boolean isDigit(int codePoint)
指定された文字(Unicodeコード・ポイント)が数字かどうかを判定します。getType(codePoint)
により示される汎用カテゴリ型がDECIMAL_DIGIT_NUMBER
の場合、文字は数字になります。Unicode文字範囲の中には、次の数字を含むものがあります。
'\u0030'
-'\u0039'
、ISO-LATIN-1数字('0'
-'9'
)'\u0660'
-'\u0669'
、アラビア数字'\u06F0'
-'\u06F9'
、拡張アラビア数字'\u0966'
-'\u096F'
、デヴァーナーガリ数字'\uFF10'
-'\uFF19'
、全角数字
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が数字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
forDigit(int, int)
,getType(int)
-
isDefined
public static boolean isDefined(char ch)
文字がUnicodeで定義されているかどうかを判定します。少なくとも次のいずれかに当てはまる場合、文字は定義されています。
- UnicodeDataファイル内にエントリがある
- UnicodeDataファイルで定義された範囲に値を持つ
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isDefined(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字- 戻り値:
- 文字がUnicodeに定義されている場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.0.2
- 関連項目:
isDigit(char)
,isLetter(char)
,isLetterOrDigit(char)
,isLowerCase(char)
,isTitleCase(char)
,isUpperCase(char)
-
isDefined
public static boolean isDefined(int codePoint)
文字(Unicodeコード・ポイント)がUnicodeで定義されているかどうかを判定します。少なくとも次のいずれかに当てはまる場合、文字は定義されています。
- UnicodeDataファイル内にエントリがある
- UnicodeDataファイルで定義された範囲に値を持つ
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がUnicodeに定義されている場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
isDigit(int)
,isLetter(int)
,isLetterOrDigit(int)
,isLowerCase(int)
,isTitleCase(int)
,isUpperCase(int)
-
isLetter
public static boolean isLetter(char ch)
指定された文字が汎用文字かどうかを判定します。Character.getType(ch)
の示す汎用カテゴリ型が次のどれかの場合に、文字は汎用文字と見なされます。-
UPPERCASE_LETTER
-
LOWERCASE_LETTER
-
TITLECASE_LETTER
-
MODIFIER_LETTER
-
OTHER_LETTER
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isLetter(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字が汎用文字の場合は
true
、そうでない場合はfalse
。 - 関連項目:
isDigit(char)
,isJavaIdentifierStart(char)
,isJavaLetter(char)
,isJavaLetterOrDigit(char)
,isLetterOrDigit(char)
,isLowerCase(char)
,isTitleCase(char)
,isUnicodeIdentifierStart(char)
,isUpperCase(char)
-
-
isLetter
public static boolean isLetter(int codePoint)
指定された文字(Unicodeコード・ポイント)が汎用文字かどうかを判定します。getType(codePoint)
の示す汎用カテゴリ型が次のどれかの場合に、文字は汎用文字と見なされます。-
UPPERCASE_LETTER
-
LOWERCASE_LETTER
-
TITLECASE_LETTER
-
MODIFIER_LETTER
-
OTHER_LETTER
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が汎用文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
isDigit(int)
,isJavaIdentifierStart(int)
,isLetterOrDigit(int)
,isLowerCase(int)
,isTitleCase(int)
,isUnicodeIdentifierStart(int)
,isUpperCase(int)
-
-
isLetterOrDigit
public static boolean isLetterOrDigit(char ch)
指定された文字が汎用文字または数字かどうかを判定します。ある文字が文字または数字とみなされるのは、その文字の
Character.isLetter(char ch)
またはCharacter.isDigit(char ch)
からtrue
が返される場合です。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isLetterOrDigit(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字が汎用文字または数字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.0.2
- 関連項目:
isDigit(char)
,isJavaIdentifierPart(char)
,isJavaLetter(char)
,isJavaLetterOrDigit(char)
,isLetter(char)
,isUnicodeIdentifierPart(char)
-
isLetterOrDigit
public static boolean isLetterOrDigit(int codePoint)
指定された文字(Unicodeコード・ポイント)が汎用文字または数字かどうかを判定します。ある文字が文字または数字とみなされるのは、その文字の
isLetter(codePoint)
またはisDigit(codePoint)
からtrue
が返される場合です。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が汎用文字または数字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
isDigit(int)
,isJavaIdentifierPart(int)
,isLetter(int)
,isUnicodeIdentifierPart(int)
-
isJavaLetter
@Deprecated(since="1.1") public static boolean isJavaLetter(char ch)
非推奨。isJavaIdentifierStart(char)に置き換えられました。指定された文字をJava識別子の最初の文字として指定可能かどうかを判定します。次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。
-
isLetter(ch)
がtrue
を返す -
getType(ch)
がLETTER_NUMBER
を返す -
ch
が通貨記号である('$'
など) -
ch
が連結句読点文字である('_'
など)
- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字をJava識別子の先頭で使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.0.2
- 関連項目:
isJavaLetterOrDigit(char)
,isJavaIdentifierStart(char)
,isJavaIdentifierPart(char)
,isLetter(char)
,isLetterOrDigit(char)
,isUnicodeIdentifierStart(char)
-
-
isJavaLetterOrDigit
@Deprecated(since="1.1") public static boolean isJavaLetterOrDigit(char ch)
非推奨。isJavaIdentifierPart(char)に置き換えられました。指定された文字をJava識別子の最初の文字以外に使用可能かどうかを判定します。次のいずれかの条件に当てはまる場合のみ、Java識別子の一部を文字にすることができます:
- 汎用文字である
- それが通貨記号である(
'$'
など) - それが連結句読点文字である(
'_'
など) - 数字である
- 数値汎用文字である(ローマ数字文字など)
- 連結マークである
- 非スペーシング・マークである
- 文字の
isIdentifierIgnorable
がtrue
を返す。
- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字をJava識別子の一部に使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.0.2
- 関連項目:
isJavaLetter(char)
,isJavaIdentifierStart(char)
,isJavaIdentifierPart(char)
,isLetter(char)
,isLetterOrDigit(char)
,isUnicodeIdentifierPart(char)
,isIdentifierIgnorable(char)
-
isAlphabetic
public static boolean isAlphabetic(int codePoint)
指定された文字(Unicodeコード・ポイント)がアルファベットかどうかを判定します。getType(codePoint)
の示す汎用カテゴリ型が次のどれかの場合に、文字はアルファベットと見なされます。-
UPPERCASE_LETTER
-
LOWERCASE_LETTER
-
TITLECASE_LETTER
-
MODIFIER_LETTER
-
OTHER_LETTER
-
LETTER_NUMBER
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がUnicodeアルファベット文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.7
-
-
isIdeographic
public static boolean isIdeographic(int codePoint)
指定された文字(Unicodeコード・ポイント)が、Unicode標準で規定されたCJKV (中国語、日本語、韓国語、およびベトナム語)の表意文字かどうかを判定します。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がUnicode表意文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.7
-
isJavaIdentifierStart
public static boolean isJavaIdentifierStart(char ch)
指定された文字をJava識別子の最初の文字として指定可能かどうかを判定します。次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。
-
isLetter(ch)
がtrue
を返す -
getType(ch)
がLETTER_NUMBER
を返す -
ch
が通貨記号である('$'
など) -
ch
が連結句読点文字である('_'
など)
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isJavaIdentifierStart(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字をJava識別子の先頭で使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.1
- 関連項目:
isJavaIdentifierPart(char)
,isLetter(char)
,isUnicodeIdentifierStart(char)
,SourceVersion.isIdentifier(CharSequence)
-
-
isJavaIdentifierStart
public static boolean isJavaIdentifierStart(int codePoint)
文字(Unicodeコード・ポイント)をJava識別子の最初の文字として指定可能かどうかを判定します。次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。
-
isLetter(codePoint)
はtrue
を返す -
getType(codePoint)
はLETTER_NUMBER
を返す - 参照される文字が通貨記号である(
'$'
など) - 参照文字が連結句読点文字である(
'_'
など)
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字をJava識別子の先頭で使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
isJavaIdentifierPart(int)
,isLetter(int)
,isUnicodeIdentifierStart(int)
,SourceVersion.isIdentifier(CharSequence)
-
-
isJavaIdentifierPart
public static boolean isJavaIdentifierPart(char ch)
指定された文字をJava識別子の最初の文字以外に使用可能かどうかを判定します。次のいずれかの条件に当てはまる場合、その文字をJava識別子の一部に指定できます。
- 汎用文字である
- それが通貨記号である(
'$'
など) - それが連結句読点文字である(
'_'
など) - 数字である
- 数値汎用文字である(ローマ数字文字など)
- 連結マークである
- 非スペーシング・マークである
- 文字の
isIdentifierIgnorable
がtrue
を返す
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isJavaIdentifierPart(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字をJava識別子の一部に使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.1
- 関連項目:
isIdentifierIgnorable(char)
,isJavaIdentifierStart(char)
,isLetterOrDigit(char)
,isUnicodeIdentifierPart(char)
,SourceVersion.isIdentifier(CharSequence)
-
isJavaIdentifierPart
public static boolean isJavaIdentifierPart(int codePoint)
文字(Unicodeコード・ポイント)をJava識別子の最初の文字以外に使用可能かどうかを判定します。次のいずれかの条件に当てはまる場合、その文字をJava識別子の一部に指定できます。
- 汎用文字である
- それが通貨記号である(
'$'
など) - それが連結句読点文字である(
'_'
など) - 数字である
- 数値汎用文字である(ローマ数字文字など)
- 連結マークである
- 非スペーシング・マークである
-
isIdentifierIgnorable(codePoint)
がコード・ポイントについてtrue
を返す
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字をJava識別子の一部に使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
isIdentifierIgnorable(int)
,isJavaIdentifierStart(int)
,isLetterOrDigit(int)
,isUnicodeIdentifierPart(int)
,SourceVersion.isIdentifier(CharSequence)
-
isUnicodeIdentifierStart
public static boolean isUnicodeIdentifierStart(char ch)
指定された文字をUnicode識別子の最初の文字として指定可能かどうかを判定します。次の条件のどれかに当てはまる場合にだけ、その文字をUnicode識別子の最初に指定できます。
-
isLetter(ch)
がtrue
を返す -
getType(ch)
がLETTER_NUMBER
を返す。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isUnicodeIdentifierStart(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字をUnicode識別子の先頭で使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.1
- 関連項目:
isJavaIdentifierStart(char)
,isLetter(char)
,isUnicodeIdentifierPart(char)
-
-
isUnicodeIdentifierStart
public static boolean isUnicodeIdentifierStart(int codePoint)
指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字として指定可能かどうかを判定します。次の条件のどれかに当てはまる場合にだけ、その文字をUnicode識別子の最初に指定できます。
-
isLetter(codePoint)
はtrue
を返す -
getType(codePoint)
がLETTER_NUMBER
を返す。
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字をUnicode識別子の先頭で使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
isJavaIdentifierStart(int)
,isLetter(int)
,isUnicodeIdentifierPart(int)
-
-
isUnicodeIdentifierPart
public static boolean isUnicodeIdentifierPart(char ch)
指定された文字をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。次の文のどれかに当てはまる場合にだけ、その文字をUnicode識別子の一部に使用できます。
- 汎用文字である
- それが連結句読点文字である(
'_'
など) - 数字である
- 数値汎用文字である(ローマ数字文字など)
- 連結マークである
- 非スペーシング・マークである
- この文字の
isIdentifierIgnorable
がtrue
を返す。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isUnicodeIdentifierPart(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字をUnicode識別子の一部に使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.1
- 関連項目:
isIdentifierIgnorable(char)
,isJavaIdentifierPart(char)
,isLetterOrDigit(char)
,isUnicodeIdentifierStart(char)
-
isUnicodeIdentifierPart
public static boolean isUnicodeIdentifierPart(int codePoint)
指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。次の文のどれかに当てはまる場合にだけ、その文字をUnicode識別子の一部に使用できます。
- 汎用文字である
- それが連結句読点文字である(
'_'
など) - 数字である
- 数値汎用文字である(ローマ数字文字など)
- 連結マークである
- 非スペーシング・マークである
- この文字の
isIdentifierIgnorable
がtrue
を返す。
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字をUnicode識別子の一部に使用可能な場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
isIdentifierIgnorable(int)
,isJavaIdentifierPart(int)
,isLetterOrDigit(int)
,isUnicodeIdentifierStart(int)
-
isIdentifierIgnorable
public static boolean isIdentifierIgnorable(char ch)
指定された文字が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。次のUnicode文字は、Java識別子やUnicode識別子内で無視できます。
- 空白以外のISO制御文字
'\u0000'
-'\u0008'
'\u000E'
-'\u001B'
'\u007F'
-'\u009F'
- 汎用カテゴリ値
FORMAT
を保持するすべての文字
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isIdentifierIgnorable(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- JavaまたはUnicode識別子の一部に使用可能な、無視できる制御文字の場合は
true
、それ以外の場合はfalse
。 - 導入されたバージョン:
- 1.1
- 関連項目:
isJavaIdentifierPart(char)
,isUnicodeIdentifierPart(char)
- 空白以外のISO制御文字
-
isIdentifierIgnorable
public static boolean isIdentifierIgnorable(int codePoint)
指定された文字(Unicodeコード・ポイント)が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。次のUnicode文字は、Java識別子やUnicode識別子内で無視できます。
- 空白以外のISO制御文字
'\u0000'
-'\u0008'
'\u000E'
-'\u001B'
'\u007F'
-'\u009F'
- 汎用カテゴリ値
FORMAT
を保持するすべての文字
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- JavaまたはUnicode識別子の一部に使用可能な、無視できる制御文字の場合は
true
、それ以外の場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
isJavaIdentifierPart(int)
,isUnicodeIdentifierPart(int)
- 空白以外のISO制御文字
-
toLowerCase
public static char toLowerCase(char ch)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を小文字に変換します。Character.isLowerCase(Character.toLowerCase(ch))
は、ある範囲の文字(特に表意文字や記号)に対して常にtrue
を返すわけではありません。一般に、文字を小文字にマッピングする際には
String.toLowerCase()
を使用するようにしてください。String
のケース・マッピング・メソッドにはCharacter
のケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、String
のケース・マッピング・メソッドでは実行できますが、Character
のケース・マッピング・メソッドでは実行できません。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
toLowerCase(int)
メソッドを使用してください。- パラメータ:
ch
- 変換対象の文字。- 戻り値:
- 対応する小文字(存在する場合)。小文字がない場合は、指定された文字そのもの。
- 関連項目:
isLowerCase(char)
,String.toLowerCase()
-
toLowerCase
public static int toLowerCase(int codePoint)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を小文字に変換します。Character.isLowerCase(Character.toLowerCase(codePoint))
は、ある範囲の文字(特に表意文字や記号)に対して常にtrue
を返すわけではありません。一般に、文字を小文字にマッピングする際には
String.toLowerCase()
を使用するようにしてください。String
のケース・マッピング・メソッドにはCharacter
のケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、String
のケース・マッピング・メソッドでは実行できますが、Character
のケース・マッピング・メソッドでは実行できません。- パラメータ:
codePoint
- 変換対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 指定された文字(Unicodeコード・ポイント)の対応する小文字。対応する小文字がない場合は、指定された文字そのもの。
- 導入されたバージョン:
- 1.5
- 関連項目:
isLowerCase(int)
,String.toLowerCase()
-
toUpperCase
public static char toUpperCase(char ch)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を大文字に変換します。Character.isUpperCase(Character.toUpperCase(ch))
は、ある範囲の文字(特に表意文字や記号)に対して常にtrue
を返すわけではありません。一般に、文字を大文字にマッピングする際には
String.toUpperCase()
を使用するようにしてください。String
のケース・マッピング・メソッドにはCharacter
のケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、String
のケース・マッピング・メソッドでは実行できますが、Character
のケース・マッピング・メソッドでは実行できません。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
toUpperCase(int)
メソッドを使用してください。- パラメータ:
ch
- 変換対象の文字。- 戻り値:
- 対応する大文字(存在する場合)。大文字がない場合は、指定された文字そのもの。
- 関連項目:
isUpperCase(char)
,String.toUpperCase()
-
toUpperCase
public static int toUpperCase(int codePoint)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を大文字に変換します。Character.isUpperCase(Character.toUpperCase(codePoint))
は、ある範囲の文字(特に表意文字や記号)に対して常にtrue
を返すわけではありません。一般に、文字を大文字にマッピングする際には
String.toUpperCase()
を使用するようにしてください。String
のケース・マッピング・メソッドにはCharacter
のケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、String
のケース・マッピング・メソッドでは実行できますが、Character
のケース・マッピング・メソッドでは実行できません。- パラメータ:
codePoint
- 変換対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 対応する大文字(存在する場合)。大文字がない場合は、指定された文字そのもの。
- 導入されたバージョン:
- 1.5
- 関連項目:
isUpperCase(int)
,String.toUpperCase()
-
toTitleCase
public static char toTitleCase(char ch)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数をタイトル・ケースに変換します。 文字が、明示的なタイトル・ケース・マッピングを保持せず、かつUnicodeDataに準拠したタイトル・ケースcharではない場合、等価なタイトル・ケースとして大文字へのマッピングが返されます。char
引数がタイトル・ケースchar
である場合には、同じchar
値が返されます。Character.isTitleCase(Character.toTitleCase(ch))
は、ある範囲の文字に対して常にtrue
を返すわけではありません。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
toTitleCase(int)
メソッドを使用してください。- パラメータ:
ch
- 変換対象の文字。- 戻り値:
- 対応するタイトル・ケース(存在する場合)。タイトル・ケースがない場合は、指定された文字そのもの。
- 導入されたバージョン:
- 1.0.2
- 関連項目:
isTitleCase(char)
,toLowerCase(char)
,toUpperCase(char)
-
toTitleCase
public static int toTitleCase(int codePoint)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数をタイトル・ケースに変換します。 文字が、明示的なタイトル・ケース・マッピングを保持せず、かつUnicodeDataに準拠したタイトル・ケースcharではない場合、等価なタイトル・ケースとして大文字へのマッピングが返されます。 文字の引数がタイトル・ケース文字である場合には、同じ文字値が返されます。Character.isTitleCase(Character.toTitleCase(codePoint))
は、ある範囲の文字に対して常にtrue
を返すわけではありません。- パラメータ:
codePoint
- 変換対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 対応するタイトル・ケース(存在する場合)。タイトル・ケースがない場合は、指定された文字そのもの。
- 導入されたバージョン:
- 1.5
- 関連項目:
isTitleCase(int)
,toLowerCase(int)
,toUpperCase(int)
-
digit
public static int digit(char ch, int radix)
指定された基数での、文字ch
の数値としての値を返します。基数が
MIN_RADIX
≤radix
≤MAX_RADIX
の範囲外の場合、またはch
の値が指定された基数の有効数字でない場合は、-1
が返されます。 次のどれかに当てはまる場合、文字は有効数字です。- 文字についてメソッド
isDigit
がtrue
を返し、その文字のUnicode 10進数値(または単一文字の分解)が指定された基数よりも小さい。 この場合、10進値が返される。 - 文字が
'A'
-'Z'
のラテン大文字のどれかで、そのコードがradix+'A' - 10
よりも小さい。 この場合、ch - 'A'+10
が返される。 - 文字が
'a'
-'z'
のラテン小文字のどれかで、そのコードがradix+'a' - 10
よりも小さい。 この場合、ch - 'a'+10
が返される。 - 文字がA (
'\uFF21'
) - Z ('\uFF3A'
)の全角ラテン大文字のどれかで、そのコードがradix+'\uFF21' - 10
よりも小さい。 この場合、ch - '\uFF21'+10
が返される。 - 文字がa (
'\uFF41'
) - z ('\uFF5A'
)の全角ラテン小文字のどれかで、そのコードがradix+'\uFF41' - 10
よりも小さい。 この場合、ch - '\uFF41'+10
が返される。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
digit(int, int)
メソッドを使用してください。- パラメータ:
ch
- 変換対象の文字。radix
- 基数。- 戻り値:
- 指定された基数での、文字によって表される数値
- 関連項目:
forDigit(int, int)
,isDigit(char)
- 文字についてメソッド
-
digit
public static int digit(int codePoint, int radix)
指定された基数での、指定された文字(Unicodeコード・ポイント)の数値を返します。基数が
MIN_RADIX
≤radix
≤MAX_RADIX
の範囲外の場合、または文字が指定された基数の有効数字でない場合は、-1
が返されます。 次のどれかに当てはまる場合、文字は有効数字です。- 文字についてメソッド
isDigit(codePoint)
がtrue
を返し、その文字のUnicode 10進数値(または単一文字の分解)が指定された基数よりも小さい。 この場合、10進値が返される。 - 文字が
'A'
-'Z'
のラテン大文字のどれかで、そのコードがradix+'A' - 10
よりも小さい。 この場合、codePoint - 'A'+10
が返される。 - 文字が
'a'
-'z'
のラテン小文字のどれかで、そのコードがradix+'a' - 10
よりも小さい。 この場合、codePoint - 'a'+10
が返される。 - 文字がA (
'\uFF21'
) - Z ('\uFF3A'
)の全角ラテン大文字のどれかで、そのコードがradix+'\uFF21' - 10
よりも小さい。 この場合、codePoint - '\uFF21'+10
が返される。 - 文字がa (
'\uFF41'
) - z ('\uFF5A'
)の全角ラテン小文字のどれかで、そのコードがradix+'\uFF41'- 10
よりも小さい。 この場合、codePoint - '\uFF41'+10
が返される。
- パラメータ:
codePoint
- 変換対象の文字(Unicodeコード・ポイント)。radix
- 基数。- 戻り値:
- 指定された基数での、文字によって表される数値
- 導入されたバージョン:
- 1.5
- 関連項目:
forDigit(int, int)
,isDigit(int)
- 文字についてメソッド
-
getNumericValue
public static int getNumericValue(char ch)
指定されたUnicode文字が表すint
値を返します。 たとえば、文字'\u216C'
(ローマ数字の50)は、値50のintを返します。文字A - Zの大文字(
'\u0041'
-'\u005A'
)、小文字('\u0061'
-'\u007A'
)、全角バリアント('\uFF21'
-'\uFF3A'
および'\uFF41'
-'\uFF5A'
)の各形式は、10 - 35の数値を持ちます。 これはUnicode仕様とは無関係であり、Unicode仕様ではこれらのchar
値に数値は割り当てられません。文字が数値を持たない場合は、-1が返されます。 文字の数値を負でない整数として表現できない場合(小数値など)は、-2が返されます。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
getNumericValue(int)
メソッドを使用してください。- パラメータ:
ch
- 変換対象の文字。- 戻り値:
- 文字の数値を負でない
int
値として返します。文字に数値が含まれていても値が非負のint
値として表現できない場合は -2です。文字が数値を持たない場合は -1。 - 導入されたバージョン:
- 1.1
- 関連項目:
forDigit(int, int)
,isDigit(char)
-
getNumericValue
public static int getNumericValue(int codePoint)
指定された文字(Unicodeコード・ポイント)が表すint
値を返します。 たとえば、文字'\u216C'
(ローマ数字の50)は、値50のint
を返します。文字A - Zの大文字(
'\u0041'
-'\u005A'
)、小文字('\u0061'
-'\u007A'
)、全角バリアント('\uFF21'
-'\uFF3A'
および'\uFF41'
-'\uFF5A'
)の各形式は、10 - 35の数値を持ちます。 これはUnicode仕様とは無関係であり、Unicode仕様ではこれらのchar
値に数値は割り当てられません。文字が数値を持たない場合は、-1が返されます。 文字の数値を負でない整数として表現できない場合(小数値など)は、-2が返されます。
- パラメータ:
codePoint
- 変換対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字の数値を負でない
int
値として返します。文字に数値が含まれていても値が非負のint
値として表現できない場合は -2です。文字が数値を持たない場合は -1。 - 導入されたバージョン:
- 1.5
- 関連項目:
forDigit(int, int)
,isDigit(int)
-
isSpace
@Deprecated(since="1.1") public static boolean isSpace(char ch)
非推奨。isWhitespace(char)に置き換えられました。指定された文字がISO-LATIN-1の空白かどうかを判定します。 次の5つの文字についてだけ、このメソッドはtrue
を返します。文字 コード 名前 '\t'
U+0009
HORIZONTAL TABULATION
'\n'
U+000A
NEW LINE
'\f'
U+000C
FORM FEED
'\r'
U+000D
CARRIAGE RETURN
' '
U+0020
SPACE
- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字がISO-LATIN-1の空白の場合は
true
、そうでない場合はfalse
。 - 関連項目:
isSpaceChar(char)
,isWhitespace(char)
-
isSpaceChar
public static boolean isSpaceChar(char ch)
指定された文字がUnicodeの空白文字かどうかを判定します。 空白文字と見なされるのは、Unicode標準で空白文字として指定されている場合だけです。 文字の汎用カテゴリ型が次のどれかの場合にだけ、このメソッドはtrueを返します。-
SPACE_SEPARATOR
-
LINE_SEPARATOR
-
PARAGRAPH_SEPARATOR
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isSpaceChar(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字が空白文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.1
- 関連項目:
isWhitespace(char)
-
-
isSpaceChar
public static boolean isSpaceChar(int codePoint)
指定された文字(Unicodeコード・ポイント)がUnicodeの空白文字かどうかを判定します。 空白文字と見なされるのは、Unicode標準で空白文字として指定されている場合だけです。 文字の汎用カテゴリ型が次のどれかの場合にだけ、このメソッドはtrueを返します。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が空白文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
isWhitespace(int)
-
isWhitespace
public static boolean isWhitespace(char ch)
指定された文字がJavaの基準に従った空白かどうかを判定します。 次の基準のどれかを満たす場合にだけ、Javaの空白文字になります。- Unicodeの空白文字(
SPACE_SEPARATOR
、LINE_SEPARATOR
、またはPARAGRAPH_SEPARATOR
)であるが、改行なしの空白('\u00A0'
、'\u2007'
、'\u202F'
)ではない。 -
'\t'
(U+0009水平タブ)である。 -
'\n'
(U+000A改行)である。 -
'\u000B'
(U+000B垂直タブ)である。 -
'\f'
(U+000Cフォーム・フィード)である。 -
'\r'
(U+000D復帰)である。 -
'\u001C'
(U+001Cファイル区切り文字)である。 -
'\u001D'
(U+001Dグループ区切り文字)である。 -
'\u001E'
(U+001Eレコード区切り文字)である。 -
'\u001F'
(U+001F単位区切り文字)である。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isWhitespace(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字がJava空白文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.1
- 関連項目:
isSpaceChar(char)
- Unicodeの空白文字(
-
isWhitespace
public static boolean isWhitespace(int codePoint)
指定された文字(Unicodeコード・ポイント)がJavaの基準に従った空白かどうかを判定します。 次の基準のどれかを満たす場合にだけ、Javaの空白文字になります。- Unicodeの空白文字(
SPACE_SEPARATOR
、LINE_SEPARATOR
、またはPARAGRAPH_SEPARATOR
)であるが、改行なしの空白('\u00A0'
、'\u2007'
、'\u202F'
)ではない。 -
'\t'
(U+0009水平タブ)である。 -
'\n'
(U+000A改行)である。 -
'\u000B'
(U+000B垂直タブ)である。 -
'\f'
(U+000Cフォーム・フィード)である。 -
'\r'
(U+000D復帰)である。 -
'\u001C'
(U+001Cファイル区切り文字)である。 -
'\u001D'
(U+001Dグループ区切り文字)である。 -
'\u001E'
(U+001Eレコード区切り文字)である。 -
'\u001F'
(U+001F単位区切り文字)である。
- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がJava空白文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
isSpaceChar(int)
- Unicodeの空白文字(
-
isISOControl
public static boolean isISOControl(char ch)
指定された文字がISO制御文字かどうかを判定します。 コードが'\u0000'
-'\u001F'
の範囲、または'\u007F'
-'\u009F'
の範囲の場合は、ISO制御文字と見なされます。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isISOControl(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字がISO制御文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.1
- 関連項目:
isSpaceChar(char)
,isWhitespace(char)
-
isISOControl
public static boolean isISOControl(int codePoint)
参照された文字(Unicodeコード・ポイント)がISO制御文字かどうかを判定します。 コードが'\u0000'
-'\u001F'
の範囲、または'\u007F'
-'\u009F'
の範囲の場合は、ISO制御文字と見なされます。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がISO制御文字の場合は
true
、そうでない場合はfalse
。 - 導入されたバージョン:
- 1.5
- 関連項目:
isSpaceChar(int)
,isWhitespace(int)
-
getType
public static int getType(char ch)
文字の汎用カテゴリを示す値を返します。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
getType(int)
メソッドを使用してください。- パラメータ:
ch
- 判定対象の文字。- 戻り値:
- 文字の汎用カテゴリを表す
int
型の値。 - 導入されたバージョン:
- 1.1
- 関連項目:
COMBINING_SPACING_MARK
,CONNECTOR_PUNCTUATION
,CONTROL
,CURRENCY_SYMBOL
,DASH_PUNCTUATION
,DECIMAL_DIGIT_NUMBER
,ENCLOSING_MARK
,END_PUNCTUATION
,FINAL_QUOTE_PUNCTUATION
,FORMAT
,INITIAL_QUOTE_PUNCTUATION
,LETTER_NUMBER
,LINE_SEPARATOR
,LOWERCASE_LETTER
,MATH_SYMBOL
,MODIFIER_LETTER
,MODIFIER_SYMBOL
,NON_SPACING_MARK
,OTHER_LETTER
,OTHER_NUMBER
,OTHER_PUNCTUATION
,OTHER_SYMBOL
,PARAGRAPH_SEPARATOR
,PRIVATE_USE
,SPACE_SEPARATOR
,START_PUNCTUATION
,SURROGATE
,TITLECASE_LETTER
,UNASSIGNED
,UPPERCASE_LETTER
-
getType
public static int getType(int codePoint)
文字の汎用カテゴリを示す値を返します。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字の汎用カテゴリを表す
int
型の値。 - 導入されたバージョン:
- 1.5
- 関連項目:
COMBINING_SPACING_MARK
,CONNECTOR_PUNCTUATION
,CONTROL
,CURRENCY_SYMBOL
,DASH_PUNCTUATION
,DECIMAL_DIGIT_NUMBER
,ENCLOSING_MARK
,END_PUNCTUATION
,FINAL_QUOTE_PUNCTUATION
,FORMAT
,INITIAL_QUOTE_PUNCTUATION
,LETTER_NUMBER
,LINE_SEPARATOR
,LOWERCASE_LETTER
,MATH_SYMBOL
,MODIFIER_LETTER
,MODIFIER_SYMBOL
,NON_SPACING_MARK
,OTHER_LETTER
,OTHER_NUMBER
,OTHER_PUNCTUATION
,OTHER_SYMBOL
,PARAGRAPH_SEPARATOR
,PRIVATE_USE
,SPACE_SEPARATOR
,START_PUNCTUATION
,SURROGATE
,TITLECASE_LETTER
,UNASSIGNED
,UPPERCASE_LETTER
-
forDigit
public static char forDigit(int digit, int radix)
指定された基数での、指定された桁数の文字表現を判定します。radix
の値が無効な基数の場合、またはdigit
が指定された基数で無効な数字の場合は、null文字('\u0000'
)が返されます。radix
引数は、MIN_RADIX
以上MAX_RADIX
以下の場合に有効です。digit
引数は、0 <= digit < radix
の場合に有効です。数字が10より小さいと、
'0'+digit
が返されます。 そうでない場合は、値'a'+digit - 10
が返されます。- パラメータ:
digit
- 文字に変換する数。radix
- 基数。- 戻り値:
- 指定された基数での、指定された数値の
char
表現。 - 関連項目:
MIN_RADIX
,MAX_RADIX
,digit(char, int)
-
getDirectionality
public static byte getDirectionality(char ch)
指定された文字のUnicode方向性プロパティを返します。 文字の方向性は、テキストの表示順の計算に使用されます。 未定義のchar
値の方向性値はDIRECTIONALITY_UNDEFINED
です。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
getDirectionality(int)
メソッドを使用してください。- パラメータ:
ch
- 方向性プロパティが要求されたchar
。- 戻り値:
char
値の方向性プロパティ。- 導入されたバージョン:
- 1.4
- 関連項目:
DIRECTIONALITY_UNDEFINED
,DIRECTIONALITY_LEFT_TO_RIGHT
,DIRECTIONALITY_RIGHT_TO_LEFT
,DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
,DIRECTIONALITY_EUROPEAN_NUMBER
,DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
,DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
,DIRECTIONALITY_ARABIC_NUMBER
,DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
,DIRECTIONALITY_NONSPACING_MARK
,DIRECTIONALITY_BOUNDARY_NEUTRAL
,DIRECTIONALITY_PARAGRAPH_SEPARATOR
,DIRECTIONALITY_SEGMENT_SEPARATOR
,DIRECTIONALITY_WHITESPACE
,DIRECTIONALITY_OTHER_NEUTRALS
,DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
,DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
,DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
,DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
,DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
,DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
,DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
,DIRECTIONALITY_FIRST_STRONG_ISOLATE
,DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
-
getDirectionality
public static byte getDirectionality(int codePoint)
所定の文字(Unicodeコード・ポイント)のUnicode方向性プロパティを返します。 文字の方向性は、テキストの表示順の計算に使用されます。 未定義の文字の方向性値はDIRECTIONALITY_UNDEFINED
です。- パラメータ:
codePoint
- 方向性プロパティが要求された文字(Unicodeコード・ポイント)。- 戻り値:
- 文字の方向性プロパティ
- 導入されたバージョン:
- 1.5
- 関連項目:
DIRECTIONALITY_UNDEFINED
,DIRECTIONALITY_LEFT_TO_RIGHT
,DIRECTIONALITY_RIGHT_TO_LEFT
,DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
,DIRECTIONALITY_EUROPEAN_NUMBER
,DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
,DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
,DIRECTIONALITY_ARABIC_NUMBER
,DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
,DIRECTIONALITY_NONSPACING_MARK
,DIRECTIONALITY_BOUNDARY_NEUTRAL
,DIRECTIONALITY_PARAGRAPH_SEPARATOR
,DIRECTIONALITY_SEGMENT_SEPARATOR
,DIRECTIONALITY_WHITESPACE
,DIRECTIONALITY_OTHER_NEUTRALS
,DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
,DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
,DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
,DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
,DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
,DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
,DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
,DIRECTIONALITY_FIRST_STRONG_ISOLATE
,DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
-
isMirrored
public static boolean isMirrored(char ch)
Unicode仕様に従って文字をミラー化するかどうかを判定します。 テキスト内で右から左に文字が描画される場合、文字のミラー化により、グリフが水平方向にミラー化されます。 たとえば、'\u0028'
LEFT PARENTHESISは、セマンティックスでは開きカッコとして定義されています。 これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isMirrored(int)
メソッドを使用してください。- パラメータ:
ch
- ミラー化プロパティが要求されたchar
- 戻り値:
- charがミラー化される場合は
true
、char
がミラー化されないか未定義の場合はfalse
。 - 導入されたバージョン:
- 1.4
-
isMirrored
public static boolean isMirrored(int codePoint)
Unicode仕様に従って、指定された文字(Unicodeコード・ポイント)をミラー化するかどうかを判定します。 テキスト内で右から左に文字が描画される場合、文字のミラー化により、グリフが水平方向にミラー化されます。 たとえば、'\u0028'
LEFT PARENTHESISは、セマンティックスでは開きカッコとして定義されています。 これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。- パラメータ:
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がミラー化される場合は
true
、文字がミラー化されないか未定義の場合はfalse
。 - 導入されたバージョン:
- 1.5
-
compareTo
public int compareTo(Character anotherCharacter)
2つのCharacter
オブジェクトを数値的に比較します。- 定義:
compareTo
、インタフェースComparable<Character>
- パラメータ:
anotherCharacter
- 比較対象のCharacter
。- 戻り値:
- 引数
Character
がこのCharacter
と等しい場合は値0
、このCharacter
がCharacter
引数より小さい数値の場合は0
より小さい値、このCharacter
がCharacter
引数より大きい数値の場合は0
より大きい値(符号なしの比較)。 これは完全に数値の比較なので、ロケールに依存しない - 導入されたバージョン:
- 1.2
-
compare
public static int compare(char x, char y)
2つのchar
値を数値的に比較します。 返される値は、次から返される値と同じになります。Character.valueOf(x).compareTo(Character.valueOf(y))
- パラメータ:
x
- 比較する最初のchar
y
- 比較する2番目のchar
- 戻り値:
x == y
の場合は値0
、x < y
の場合は0
より小さい値、x> y
の場合は0
より大きい値- 導入されたバージョン:
- 1.7
-
reverseBytes
public static char reverseBytes(char ch)
指定されたchar
値でバイト順を逆にして取得した値を返します。- パラメータ:
ch
- そのバイト順を逆にするchar
。- 戻り値:
- 指定された
char
値でバイト順を逆にして(つまり入れ替えて)取得した値。 - 導入されたバージョン:
- 1.5
-
getName
public static String getName(int codePoint)
指定された文字codePoint
のUnicode名(コード・ポイントがunassigned
の場合はnull)を返します。ノート: UnicodeDataファイル(Unicode Consortiumがメンテナンスを行っているUnicode Character Databaseの一部)で、指定された文字に名前が割り当てられていない場合、返される名前は次の式の結果と同じになります。
Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);
- パラメータ:
codePoint
- 文字(Unicodeコード・ポイント)- 戻り値:
- 指定された文字のUnicode名(コード・ポイントが未割当ての場合はnull)。
- 例外:
IllegalArgumentException
- 指定されたcodePoint
が有効なUnicodeコード・ポイントでない場合。- 導入されたバージョン:
- 1.7
-
codePointOf
public static int codePointOf(String name)
指定されたUnicode文字名で指定されたUnicode文字のコード・ポイント値を返します。ノート: UnicodeDataファイル(ユニコード・コンソーシアムによって管理されているUnicode文字データベースの一部)で文字に名前が割り当てられていない場合、その名前は式の結果として定義されます
Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);
name
のマッチングでは、大文字と小文字は区別されず、前後の空白文字は削除されます。- パラメータ:
name
- Unicode文字の名前- 戻り値:
- その名前で指定された文字のコード・ポイント値。
- 例外:
IllegalArgumentException
- 指定されたname
が有効なUnicode文字名でない場合。NullPointerException
-name
がnull
である場合- 導入されたバージョン:
- 9
-
-