public final class Character extends Object implements Serializable, Comparable<Character>
Character
クラスは、プリミティブ型char
の値をオブジェクトにラップします。Character
クラスのオブジェクトには、型がchar
の単一フィールドが含まれます。
また、このクラスは、文字のカテゴリ(小文字、数字など)を決定したり、大文字から小文字(およびその逆)の変換を行う多数のstaticメソッドも提供します。
Character
クラスのフィールドおよびメソッドは、Unicode標準(特にUnicode Character Databaseの一部であるUnicodeDataファイル)の文字情報の観点から定義されています。このファイルは、割当て済みのUnicodeコード・ポイントまたは文字範囲ごとの名前やカテゴリなどのプロパティを指定します。ファイルは、Unicode Consortium (http://www.unicode.org)から入手できます。
Java SE 8プラットフォームは、Unicode標準のバージョン6.2の文字情報および2つの拡張を使用します。第一に、Java SE 8プラットフォームでは、Character
クラスの実装で日本の元号のコードポイントU+32FF
を使用できます。これは、コードポイントを割り当てた6.2以降のUnicode標準の最初のバージョンからです。第二に、新しい通貨が頻繁に出現するという実状を考慮し、Java SE 8プラットフォームでは、Character
クラスの実装でUnicode標準のバージョン10.0から通貨記号ブロックを使用できます。したがって、Character
クラスのフィールドおよびメソッドの動作は、前述のコード・ポイントを処理する際、Java SE 8プラットフォームの実装ごとに異なる可能性があります(バージョン6.2以外)。ただし、Java識別子を定義するメソッドisJavaIdentifierStart(int)
、isJavaIdentifierStart(char)
、isJavaIdentifierPart(int)
およびisJavaIdentifierPart(char)
は除きます。Java識別子のコード・ポイントは、バージョン6.2のUnicode標準から導出される必要があります。
char
データ型(Character
オブジェクトにカプセル化される値)は、当初のUnicode仕様に基づいています。この仕様では、文字が固定幅16ビット・エンティティとして定義されていました。Unicode標準はその後、16ビット以上の表現を必要とする文字を許容するように変更されています。適正なコード・ポイントの範囲は、現在U+0000 - U+10FFFFであり、Unicodeスカラー値として知られています。(Unicode標準のU+n表記の定義を参照。)
U+0000 - U+FFFFの文字セットは、基本多言語面(BMP)と呼ばれる場合もあります。コード・ポイントがU+FFFFよりも大きい文字は補助文字と呼ばれます。Javaプラットフォームでは、char
配列、String
クラス、およびStringBuffer
クラスでUTF-16表現が使用されます。この表現では、補助文字はchar
値のペアとして表現され、上位サロゲート範囲(\uD800-\uDBFF)からの最初の値と、下位サロゲート範囲(\uDC00-\uDFFF)からの第2の値から構成されています。
したがって、char
値は、サロゲート・コード・ポイントやUTF-16エンコーディングのコード単位を含む基本多言語面(BMP)コード・ポイントを表します。int
値は、補助コード・ポイントを含むすべてのUnicodeコード・ポイントを表します。int
の下位(最下位) 21ビットは、Unicodeコード・ポイントを表すために使用され、上位(最上位) 11ビットはゼロである必要があります。特に指定されないかぎり、補助文字とサロゲートchar
値に関する動作は次のとおりです。
char
値だけを受け入れるメソッドは補助文字に対応できません。これらのメソッドはサロゲート範囲のchar
値を未定義の文字として扱います。たとえば、Character.isLetter('\uD840')
はfalse
を返し、文字列でそのあとに下位サロゲート値が続く場合でも、この特定の値は文字を表します。
int
値を受け入れるメソッドは、補助文字を含むすべてのUnicode文字に対応します。たとえば、Character.isLetter(0x2F81A)
は、コード・ポイント値が文字(CJK統合漢字)を表すため、true
を返します。
Java SE APIドキュメンテーションでは、U+0000 - U+10FFFFの範囲の文字値にUnicodeコード・ポイントを使用し、UTF-16エンコーディングのコード単位である16ビットchar
値にUnicodeコード単位を使用します。Unicode用語の詳細は、「Unicode Glossary」を参照してください。
修飾子と型 | クラスと説明 |
---|---|
static class |
Character.Subset
このクラスのインスタンスは、Unicode文字セットの特定のサブセットを表します。
|
static class |
Character.UnicodeBlock
Unicode仕様で定義されている文字ブロックを表す文字サブセットのファミリです。
|
static class |
Character.UnicodeScript
「Unicode Standard Annex#24: Script Names」で規定された文字スクリプトを表す文字サブセットのファミリです。
|
修飾子と型 | フィールドと説明 |
---|---|
static int |
BYTES
符号なしバイナリ形式で
char 値を表すために使用されるバイト数。 |
static byte |
COMBINING_SPACING_MARK
Unicode仕様の汎用カテゴリ「Mc」。
|
static byte |
CONNECTOR_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pc」。
|
static byte |
CONTROL
Unicode仕様の汎用カテゴリ「Cc」。
|
static byte |
CURRENCY_SYMBOL
Unicode仕様の汎用カテゴリ「Sc」。
|
static byte |
DASH_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pd」。
|
static byte |
DECIMAL_DIGIT_NUMBER
Unicode仕様の汎用カテゴリ「Nd」。
|
static byte |
DIRECTIONALITY_ARABIC_NUMBER
Unicode仕様の弱い双方向文字タイプ「AN」。
|
static byte |
DIRECTIONALITY_BOUNDARY_NEUTRAL
Unicode仕様の弱い双方向文字タイプ「BN」。
|
static byte |
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
Unicode仕様の弱い双方向文字タイプ「CS」。
|
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER
Unicode仕様の弱い双方向文字タイプ「EN」。
|
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
Unicode仕様の弱い双方向文字タイプ「ES」。
|
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
Unicode仕様の弱い双方向文字タイプ「ET」。
|
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT
Unicode仕様の強力な双方向文字タイプ「L」。
|
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
Unicode仕様の強力な双方向文字タイプ「LRE」。
|
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
Unicode仕様の強力な双方向文字タイプ「LRO」。
|
static byte |
DIRECTIONALITY_NONSPACING_MARK
Unicode仕様の弱い双方向文字タイプ「NSM」。
|
static byte |
DIRECTIONALITY_OTHER_NEUTRALS
Unicode仕様のニュートラルな双方向文字タイプ「ON」。
|
static byte |
DIRECTIONALITY_PARAGRAPH_SEPARATOR
Unicode仕様のニュートラルな双方向文字タイプ「B」。
|
static byte |
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
Unicode仕様の弱い双方向文字タイプ「PDF」。
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT
Unicode仕様の強力な双方向文字タイプ「R」。
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
Unicode仕様の強力な双方向文字タイプ「AL」。
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
Unicode仕様の強力な双方向文字タイプ「RLE」。
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
Unicode仕様の強力な双方向文字タイプ「RLO」。
|
static byte |
DIRECTIONALITY_SEGMENT_SEPARATOR
Unicode仕様のニュートラルな双方向文字タイプ「S」。
|
static byte |
DIRECTIONALITY_UNDEFINED
未定義の双方向文字タイプ。
|
static byte |
DIRECTIONALITY_WHITESPACE
Unicode仕様のニュートラルな双方向文字タイプ「WS」。
|
static byte |
ENCLOSING_MARK
Unicode仕様の汎用カテゴリ「Me」。
|
static byte |
END_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pe」。
|
static byte |
FINAL_QUOTE_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pf」。
|
static byte |
FORMAT
Unicode仕様の汎用カテゴリ「Cf」。
|
static byte |
INITIAL_QUOTE_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pi」。
|
static byte |
LETTER_NUMBER
Unicode仕様の汎用カテゴリ「Nl」。
|
static byte |
LINE_SEPARATOR
Unicode仕様の汎用カテゴリ「Zl」。
|
static byte |
LOWERCASE_LETTER
Unicode仕様の汎用カテゴリ「Ll」。
|
static byte |
MATH_SYMBOL
Unicode仕様の汎用カテゴリ「Sm」。
|
static int |
MAX_CODE_POINT
Unicodeコード・ポイントの最大値(定数
U+10FFFF )。 |
static char |
MAX_HIGH_SURROGATE
UTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最大値(定数
'\uDBFF' )。 |
static char |
MAX_LOW_SURROGATE
UTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最大値(定数
'\uDFFF' )。 |
static int |
MAX_RADIX
文字列との変換に使用可能な最大基数。
|
static char |
MAX_SURROGATE
UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最大値(定数
'\uDFFF' )。 |
static char |
MAX_VALUE
このフィールドの定数値は、
char 型の最大値'\uFFFF' 。 |
static int |
MIN_CODE_POINT
Unicodeコード・ポイントの最小値(定数
U+0000 )。 |
static char |
MIN_HIGH_SURROGATE
UTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最小値(定数
'\uD800' )。 |
static char |
MIN_LOW_SURROGATE
UTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最小値(定数
'\uDC00' )。 |
static int |
MIN_RADIX
文字列との変換に使用可能な最小基数。
|
static int |
MIN_SUPPLEMENTARY_CODE_POINT
Unicode補助コード・ポイントの最小値(定数
U+10000 )。 |
static char |
MIN_SURROGATE
UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最小値(定数
'\uD800' )。 |
static char |
MIN_VALUE
このフィールドの定数値は、
char 型の最小値'\u0000' 。 |
static byte |
MODIFIER_LETTER
Unicode仕様の汎用カテゴリ「Lm」。
|
static byte |
MODIFIER_SYMBOL
Unicode仕様の汎用カテゴリ「Sk」。
|
static byte |
NON_SPACING_MARK
Unicode仕様の汎用カテゴリ「Mn」。
|
static byte |
OTHER_LETTER
Unicode仕様の汎用カテゴリ「Lo」。
|
static byte |
OTHER_NUMBER
Unicode仕様の汎用カテゴリ「No」。
|
static byte |
OTHER_PUNCTUATION
Unicode仕様の汎用カテゴリ「Po」。
|
static byte |
OTHER_SYMBOL
Unicode仕様の汎用カテゴリ「So」。
|
static byte |
PARAGRAPH_SEPARATOR
Unicode仕様の汎用カテゴリ「Zp」。
|
static byte |
PRIVATE_USE
Unicode仕様の汎用カテゴリ「Co」。
|
static int |
SIZE
符号なしバイナリ形式でchar値を表すのに使用されるビット数(定数
16 )。 |
static byte |
SPACE_SEPARATOR
Unicode仕様の汎用カテゴリ「Zs」。
|
static byte |
START_PUNCTUATION
Unicode仕様の汎用カテゴリ「Ps」。
|
static byte |
SURROGATE
Unicode仕様の汎用カテゴリ「Cs」。
|
static byte |
TITLECASE_LETTER
Unicode仕様の汎用カテゴリ「Lt」。
|
static Class<Character> |
TYPE
プリミティブ型
char を表すClass インスタンス。 |
static byte |
UNASSIGNED
Unicode仕様の汎用カテゴリ「Cn」。
|
static byte |
UPPERCASE_LETTER
Unicode仕様の汎用カテゴリ「Lu」。
|
コンストラクタと説明 |
---|
Character(char value)
指定された
char 値を表す、新しく割り当てられたCharacter オブジェクトを構築します。 |
修飾子と型 | メソッドと説明 |
---|---|
static int |
charCount(int codePoint)
指定された文字(Unicodeコード・ポイント)を表すのに必要な
char 値の数を判定します。 |
char |
charValue()
この
Character オブジェクトの値を返します。 |
static int |
codePointAt(char[] a, int index)
char 配列の指定されたインデックスにあるコード・ポイントを返します。 |
static int |
codePointAt(char[] a, int index, int limit)
limit の長さ未満のindex を持つ配列要素のみを使用可能な、char 配列の指定されたインデックスにあるコード・ポイントを返します。 |
static int |
codePointAt(CharSequence seq, int index)
CharSequence の指定されたインデックスにあるコード・ポイントを返します。 |
static int |
codePointBefore(char[] a, int index)
char 配列の指定されたインデックスの前にあるコード・ポイントを返します。 |
static int |
codePointBefore(char[] a, int index, int start)
start 以上のindex を持つ配列要素のみを使用可能な、char 配列の指定されたインデックスの前にあるコード・ポイントを返します。 |
static int |
codePointBefore(CharSequence seq, int index)
CharSequence の指定されたインデックスの前にあるコード・ポイントを返します。 |
static int |
codePointCount(char[] a, int offset, int count)
char 配列引数の部分配列内にあるUnicodeコード・ポイントの数を返します。 |
static int |
codePointCount(CharSequence seq, int beginIndex, int endIndex)
指定されたcharシーケンスのテキスト範囲内のUnicodeコード・ポイントの数を返します。
|
static int |
compare(char x, char y)
2つの
char 値を数値的に比較します。 |
int |
compareTo(Character anotherCharacter)
2つの
Character オブジェクトを数値的に比較します。 |
static int |
digit(char ch, int radix)
指定された基数での、文字
ch の数値としての値を返します。 |
static int |
digit(int codePoint, int radix)
指定された基数での、指定された文字(Unicodeコード・ポイント)の数値を返します。
|
boolean |
equals(Object obj)
このオブジェクトと指定されたオブジェクトを比較します。
|
static char |
forDigit(int digit, int radix)
指定された基数での、指定された桁数の文字表現を判定します。
|
static byte |
getDirectionality(char ch)
指定された文字のUnicode方向性プロパティを返します。
|
static byte |
getDirectionality(int codePoint)
所定の文字(Unicodeコード・ポイント)のUnicode方向性プロパティを返します。
|
static String |
getName(int codePoint)
指定された文字
codePoint のUnicode名(コード・ポイントがunassigned の場合はnull)を返します。 |
static int |
getNumericValue(char ch)
指定されたUnicode文字が表す
int 値を返します。 |
static int |
getNumericValue(int codePoint)
指定された文字(Unicodeコード・ポイント)が表す
int 値を返します。 |
static int |
getType(char ch)
文字の汎用カテゴリを示す値を返します。
|
static int |
getType(int codePoint)
文字の汎用カテゴリを示す値を返します。
|
int |
hashCode()
この
Character のハッシュ・コード(charValue() を呼び出した場合の結果と等しくなる)を返します。 |
static int |
hashCode(char value)
Character.hashCode() との互換性がある、char 値のハッシュ・コードを返します。 |
static char |
highSurrogate(int codePoint)
UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのリーディング・サロゲート(上位サロゲート・コード単位)を返します。
|
static boolean |
isAlphabetic(int codePoint)
指定された文字(Unicodeコード・ポイント)がアルファベットかどうかを判定します。
|
static boolean |
isBmpCodePoint(int codePoint)
指定された文字(Unicodeコード・ポイント)が基本多言語面(BMP)に含まれるかどうかを判定します。
|
static boolean |
isDefined(char ch)
文字がUnicodeで定義されているかどうかを判定します。
|
static boolean |
isDefined(int codePoint)
文字(Unicodeコード・ポイント)がUnicodeで定義されているかどうかを判定します。
|
static boolean |
isDigit(char ch)
指定された文字が数字かどうかを判定します。
|
static boolean |
isDigit(int codePoint)
指定された文字(Unicodeコード・ポイント)が数字かどうかを判定します。
|
static boolean |
isHighSurrogate(char ch)
指定された
char 値がUnicode上位サロゲート・コード単位 (リーディング・サロゲート・コード単位ともいう)であるかどうかを判定します。 |
static boolean |
isIdentifierIgnorable(char ch)
指定された文字が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。
|
static boolean |
isIdentifierIgnorable(int codePoint)
指定された文字(Unicodeコード・ポイント)が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。
|
static boolean |
isIdeographic(int codePoint)
指定された文字(Unicodeコード・ポイント)が、Unicode標準で規定されたCJKV (中国語、日本語、韓国語、およびベトナム語)の表意文字かどうかを判定します。
|
static boolean |
isISOControl(char ch)
指定された文字がISO制御文字かどうかを判定します。
|
static boolean |
isISOControl(int codePoint)
参照された文字(Unicodeコード・ポイント)がISO制御文字かどうかを判定します。
|
static boolean |
isJavaIdentifierPart(char ch)
指定された文字をJava識別子の最初の文字以外に使用可能かどうかを判定します。
|
static boolean |
isJavaIdentifierPart(int codePoint)
文字(Unicodeコード・ポイント)をJava識別子の最初の文字以外に使用可能かどうかを判定します。
|
static boolean |
isJavaIdentifierStart(char ch)
指定された文字をJava識別子の最初の文字として指定可能かどうかを判定します。
|
static boolean |
isJavaIdentifierStart(int codePoint)
文字(Unicodeコード・ポイント)をJava識別子の最初の文字として指定可能かどうかを判定します。
|
static boolean |
isJavaLetter(char ch)
非推奨。
isJavaIdentifierStart(char)に置き換えられています。
|
static boolean |
isJavaLetterOrDigit(char ch)
非推奨。
isJavaIdentifierPart(char)に置き換えられています。
|
static boolean |
isLetter(char ch)
指定された文字が汎用文字かどうかを判定します。
|
static boolean |
isLetter(int codePoint)
指定された文字(Unicodeコード・ポイント)が汎用文字かどうかを判定します。
|
static boolean |
isLetterOrDigit(char ch)
指定された文字が汎用文字または数字かどうかを判定します。
|
static boolean |
isLetterOrDigit(int codePoint)
指定された文字(Unicodeコード・ポイント)が汎用文字または数字かどうかを判定します。
|
static boolean |
isLowerCase(char ch)
指定された文字が小文字かどうかを判定します。
|
static boolean |
isLowerCase(int codePoint)
指定された文字(Unicodeコード・ポイント)が小文字かどうかを判定します。
|
static boolean |
isLowSurrogate(char ch)
指定された
char 値がUnicode下位サロゲート・コード単位 (トレーリング・サロゲート・コード単位ともいう)であるかどうかを判定します。 |
static boolean |
isMirrored(char ch)
Unicode仕様に従って文字をミラー化するかどうかを判定します。
|
static boolean |
isMirrored(int codePoint)
Unicode仕様に従って、指定された文字(Unicodeコード・ポイント)をミラー化するかどうかを判定します。
|
static boolean |
isSpace(char ch)
非推奨。
isWhitespace(char)に置き換えられています。
|
static boolean |
isSpaceChar(char ch)
指定された文字がUnicodeの空白文字かどうかを判定します。
|
static boolean |
isSpaceChar(int codePoint)
指定された文字(Unicodeコード・ポイント)がUnicodeの空白文字かどうかを判定します。
|
static boolean |
isSupplementaryCodePoint(int codePoint)
指定された文字(Unicodeコード・ポイント)が補助文字の範囲にあるかどうかを判定します。
|
static boolean |
isSurrogate(char ch)
指定された
char 値がUnicode サロゲート・コード単位かどうかを判定します。 |
static boolean |
isSurrogatePair(char high, char low)
指定された
char 値のペアが有効なUnicodeサロゲート・ペアであるかどうかを判定します。 |
static boolean |
isTitleCase(char ch)
指定された文字がタイトル・ケース文字かどうかを判定します。
|
static boolean |
isTitleCase(int codePoint)
指定された文字(Unicodeコード・ポイント)がタイトル・ケース文字かどうかを判定します。
|
static boolean |
isUnicodeIdentifierPart(char ch)
指定された文字をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。
|
static boolean |
isUnicodeIdentifierPart(int codePoint)
指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。
|
static boolean |
isUnicodeIdentifierStart(char ch)
指定された文字をUnicode識別子の最初の文字として指定可能かどうかを判定します。
|
static boolean |
isUnicodeIdentifierStart(int codePoint)
指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字として指定可能かどうかを判定します。
|
static boolean |
isUpperCase(char ch)
指定された文字が大文字がどうかを判定します。
|
static boolean |
isUpperCase(int codePoint)
指定された文字(Unicodeコード・ポイント)が大文字かどうかを判定します。
|
static boolean |
isValidCodePoint(int codePoint)
指定されたコード・ポイントが有効なUnicodeコード・ポイント値であるかどうかを判定します。
|
static boolean |
isWhitespace(char ch)
指定された文字がJavaの基準に従った空白かどうかを判定します。
|
static boolean |
isWhitespace(int codePoint)
指定された文字(Unicodeコード・ポイント)がJavaの基準に従った空白かどうかを判定します。
|
static char |
lowSurrogate(int codePoint)
UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのトレーリング・サロゲート(下位サロゲート・コード単位)を返します。
|
static int |
offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)
指定された
char 部分配列内で、指定されたindex からcodePointOffset コード・ポイント分だけオフセットされた位置のインデックスを返します。 |
static int |
offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
指定された文字シーケンス内で、指定された
index からcodePointOffset コード・ポイント分だけオフセットされた位置のインデックスを返します。 |
static char |
reverseBytes(char ch)
指定されたchar値でバイト順を逆にして取得した値を返します。
|
static char[] |
toChars(int codePoint)
指定された文字(Unicodeコード・ポイント)を
char 配列に格納されるUTF-16表現に変換します。 |
static int |
toChars(int codePoint, char[] dst, int dstIndex)
指定された文字(Unicodeコード・ポイント)をUTF-16表現に変換します。
|
static int |
toCodePoint(char high, char low)
指定されたサロゲート・ペアをその補助コード・ポイント値に変換します。
|
static char |
toLowerCase(char ch)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を小文字に変換します。
|
static int |
toLowerCase(int codePoint)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を小文字に変換します。
|
String |
toString()
この
Character の値を表すString オブジェクトを返します。 |
static String |
toString(char c)
指定された
char を表すString オブジェクトを返します。 |
static char |
toTitleCase(char ch)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数をタイトル・ケースに変換します。
|
static int |
toTitleCase(int codePoint)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数をタイトル・ケースに変換します。
|
static char |
toUpperCase(char ch)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を大文字に変換します。
|
static int |
toUpperCase(int codePoint)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を大文字に変換します。
|
static Character |
valueOf(char c)
指定されたchar値を表すCharacterインスタンスを返します。
|
public static final int MIN_RADIX
Integer
クラスのdigit
メソッド、forDigit
メソッド、およびtoString
メソッドなどの基数変換メソッドの最小許容値です。public static final int MAX_RADIX
Integer
クラスのdigit
メソッド、forDigit
メソッド、およびtoString
メソッドなどの基数変換メソッドの最大許容値です。public static final char MIN_VALUE
char
型の最小値'\u0000'
です。public static final char MAX_VALUE
char
型の最大値'\uFFFF'
です。public static final byte UNASSIGNED
public static final byte UPPERCASE_LETTER
public static final byte LOWERCASE_LETTER
public static final byte TITLECASE_LETTER
public static final byte MODIFIER_LETTER
public static final byte OTHER_LETTER
public static final byte NON_SPACING_MARK
public static final byte ENCLOSING_MARK
public static final byte COMBINING_SPACING_MARK
public static final byte DECIMAL_DIGIT_NUMBER
public static final byte LETTER_NUMBER
public static final byte OTHER_NUMBER
public static final byte SPACE_SEPARATOR
public static final byte LINE_SEPARATOR
public static final byte PARAGRAPH_SEPARATOR
public static final byte CONTROL
public static final byte FORMAT
public static final byte PRIVATE_USE
public static final byte SURROGATE
public static final byte DASH_PUNCTUATION
public static final byte START_PUNCTUATION
public static final byte END_PUNCTUATION
public static final byte CONNECTOR_PUNCTUATION
public static final byte OTHER_PUNCTUATION
public static final byte MATH_SYMBOL
public static final byte CURRENCY_SYMBOL
public static final byte MODIFIER_SYMBOL
public static final byte OTHER_SYMBOL
public static final byte INITIAL_QUOTE_PUNCTUATION
public static final byte FINAL_QUOTE_PUNCTUATION
public static final byte DIRECTIONALITY_UNDEFINED
char
値の方向性は定義されていません。public static final byte DIRECTIONALITY_LEFT_TO_RIGHT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
public static final byte DIRECTIONALITY_ARABIC_NUMBER
public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_NONSPACING_MARK
public static final byte DIRECTIONALITY_BOUNDARY_NEUTRAL
public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
public static final byte DIRECTIONALITY_SEGMENT_SEPARATOR
public static final byte DIRECTIONALITY_WHITESPACE
public static final byte DIRECTIONALITY_OTHER_NEUTRALS
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static final char MIN_HIGH_SURROGATE
'\uD800'
)。上位サロゲートは、リーディング・サロゲートともいいます。public static final char MAX_HIGH_SURROGATE
'\uDBFF'
)。上位サロゲートは、リーディング・サロゲートともいいます。public static final char MIN_LOW_SURROGATE
'\uDC00'
)。下位サロゲートは、トレーリング・サロゲートともいいます。public static final char MAX_LOW_SURROGATE
'\uDFFF'
)。下位サロゲートは、トレーリング・サロゲートともいいます。public static final char MIN_SURROGATE
'\uD800'
)。public static final char MAX_SURROGATE
'\uDFFF'
)。public static final int MIN_SUPPLEMENTARY_CODE_POINT
U+10000
)。public static final int MIN_CODE_POINT
U+0000
)。public static final int MAX_CODE_POINT
U+10FFFF
)。public static final int SIZE
16
)。public static final int BYTES
char
値を表すために使用されるバイト数。public Character(char value)
char
値を表す、新しく割り当てられたCharacter
オブジェクトを構築します。value
- Character
オブジェクトによって表される値。public static Character valueOf(char c)
Character(char)
に優先して使用されます。その理由は、このメソッドが頻繁に要求される値をキャッシュするので、操作に必要な領域や時間がはるかに少なくて済む場合が多いためです。このメソッドは、'\u0000'
から'\u007F'
の範囲(両端含む)の値を常にキャッシュしますが、この範囲に含まれないその他の値をキャッシュすることもあります。c
- char値。public char charValue()
Character
オブジェクトの値を返します。char
値。public int hashCode()
Character
のハッシュ・コード(charValue()
を呼び出した場合の結果と等しくなる)を返します。hashCode
、クラス: Object
Character
のハッシュ・コード値Object.equals(java.lang.Object)
, System.identityHashCode(java.lang.Object)
public static int hashCode(char value)
Character.hashCode()
との互換性がある、char
値のハッシュ・コードを返します。value
- ハッシュ・コードが返されるchar
。char
値のハッシュ・コード値。public boolean equals(Object obj)
true
になるのは、引数がnull
ではなく、このオブジェクトと同じchar
値を表すCharacter
オブジェクトである場合だけです。equals
、クラス: Object
obj
- 比較対象のオブジェクトtrue
、そうでない場合はfalse
。Object.hashCode()
、HashMap
public String toString()
Character
の値を表すString
オブジェクトを返します。結果は、長さ1の文字列(構成要素はCharacter
オブジェクトにより表されるプリミティブ型のchar
値だけ)になります。public static String toString(char c)
char
を表すString
オブジェクトを返します。結果は、指定されたchar
だけで構成される長さ1の文字列になります。c
- 変換するchar
char
の文字列表現public static boolean isValidCodePoint(int codePoint)
codePoint
- 判定対象のUnicodeコード・ポイントMIN_CODE_POINT
- MAX_CODE_POINT
の範囲(両端含む)に含まれる場合はtrue
、それ以外の場合はfalse
。public static boolean isBmpCodePoint(int codePoint)
char
を使って表せます。public static boolean isSupplementaryCodePoint(int codePoint)
codePoint
- 判定対象の文字(Unicodeコード・ポイント)MIN_SUPPLEMENTARY_CODE_POINT
- MAX_CODE_POINT
の範囲(両端含む)に含まれる場合はtrue
、それ以外の場合はfalse
。public static boolean isHighSurrogate(char ch)
char
値がUnicode上位サロゲート・コード単位 (リーディング・サロゲート・コード単位ともいう)であるかどうかを判定します。
これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。
ch
- 判定されるchar
値。char
の値がMIN_HIGH_SURROGATE
- MAX_HIGH_SURROGATE
の範囲(両端含む)に含まれる場合はtrue
、それ以外の場合はfalse
。isLowSurrogate(char)
, Character.UnicodeBlock.of(int)
public static boolean isLowSurrogate(char ch)
char
値がUnicode下位サロゲート・コード単位 (トレーリング・サロゲート・コード単位ともいう)であるかどうかを判定します。
これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。
ch
- 判定されるchar
値。char
値がMIN_LOW_SURROGATE
- MAX_LOW_SURROGATE
の範囲(両端含む)に含まれる場合はtrue
、それ以外の場合はfalse
。isHighSurrogate(char)
public static boolean isSurrogate(char ch)
char
値がUnicode サロゲート・コード単位かどうかを判定します。
これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。
char値がサロゲート・コード単位になるのは、それが下位サロゲート・コード単位と上位サロゲート・コード単位のいずれかである場合だけです。
ch
- 判定されるchar
値。char
値がMIN_SURROGATE
- MAX_SURROGATE
の範囲(両端含む)に含まれる場合はtrue
、それ以外の場合はfalse
。public static boolean isSurrogatePair(char high, char low)
char
値のペアが有効なUnicodeサロゲート・ペアであるかどうかを判定します。
このメソッドは次の式と等価です。
isHighSurrogate(high) && isLowSurrogate(low)
high
- 判定対象の上位サロゲート・コード値low
- 判定対象の下位サロゲート・コード値true
、そうでない場合はfalse
。public static int charCount(int codePoint)
char
値の数を判定します。このメソッドは、指定された文字が0x10000以上である場合は2を返します。それ以外の場合は1を返します。
このメソッドは、指定された文字が有効なUnicodeコード・ポイントであることを検証しません。呼出し側で、必要に応じてisValidCodePoint
を使用して、文字値を検証する必要があります。
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。isSupplementaryCodePoint(int)
public static int toCodePoint(char high, char low)
isSurrogatePair
を使って検証する必要があります。high
- 上位サロゲート・コード単位low
- 下位サロゲート・コード単位public static int codePointAt(CharSequence seq, int index)
CharSequence
の指定されたインデックスにあるコード・ポイントを返します。CharSequence
内の指定されたインデックス位置のchar
値が上位サロゲート範囲に含まれており、それに続くインデックスがCharSequence
の長さ未満であり、かつそのインデックス位置のchar
値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。それ以外の場合は、指定されたインデックスにあるchar
値が返されます。seq
- char
値のシーケンス(Unicodeコード単位)index
- 変換されるseq
内のchar
値(Unicodeコード単位)へのインデックスNullPointerException
- seq
がnullである場合。IndexOutOfBoundsException
- 値index
が負であるかseq.length()
以上である場合。public static int codePointAt(char[] a, int index)
char
配列の指定されたインデックスにあるコード・ポイントを返します。char
配列内の指定されたインデックス位置のchar
値が上位サロゲート範囲に含まれており、それに続くインデックスがchar
配列の長さ未満であり、かつそのインデックス位置のchar
値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。それ以外の場合は、指定されたインデックスにあるchar
値が返されます。a
- char
配列index
- 変換されるchar
配列内のchar
値(Unicodeコード単位)へのインデックスNullPointerException
- a
がnullである場合。IndexOutOfBoundsException
- index
が負の値、またはchar
配列の長さ以上の値である場合。public static int codePointAt(char[] a, int index, int limit)
limit
の長さ未満のindex
を持つ配列要素のみを使用可能な、char
配列の指定されたインデックスにあるコード・ポイントを返します。char
配列内の指定されたインデックス位置のchar
値が上位サロゲート範囲に含まれており、それに続くインデックスがlimit
未満であり、かつそのインデックス位置のchar
値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。それ以外の場合は、指定されたインデックスにあるchar
値が返されます。a
- char
配列index
- 変換されるchar
配列内のchar
値(Unicodeコード単位)へのインデックスlimit
- char
配列で使用可能な最後の配列要素の後ろのインデックスNullPointerException
- a
がnullである場合。IndexOutOfBoundsException
- index
引数が負の値またはlimit
引数以上である場合、またはlimit
引数が負の値またはchar
配列の長さより大きい場合。public static int codePointBefore(CharSequence seq, int index)
CharSequence
の指定されたインデックスの前にあるコード・ポイントを返します。CharSequence
内の(index - 1)
のchar
値が下位サロゲート範囲に含まれており、(index - 2)
が負でなく、かつCharSequence
内の(index - 2)
のchar
値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。そうでない場合は、(index - 1)
のchar
値が返されます。seq
- CharSequence
インスタンスindex
- 返すべきコード・ポイントの直後のインデックスNullPointerException
- seq
がnullである場合。IndexOutOfBoundsException
- index
引数が1より小さいかseq.length()
より大きい場合。public static int codePointBefore(char[] a, int index)
char
配列の指定されたインデックスの前にあるコード・ポイントを返します。char
配列内の(index - 1)
のchar
値が下位サロゲート範囲に含まれており、(index - 2)
が負でなく、かつchar
配列内の(index - 2)
のchar
値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。そうでない場合は、(index - 1)
のchar
値が返されます。a
- char
配列index
- 返すべきコード・ポイントの直後のインデックスNullPointerException
- a
がnullである場合。IndexOutOfBoundsException
- index
引数が1未満であるか、またはchar
配列の長さより大きい値の場合public static int codePointBefore(char[] a, int index, int start)
start
以上のindex
を持つ配列要素のみを使用可能な、char
配列の指定されたインデックスの前にあるコード・ポイントを返します。char
配列内の(index - 1)
のchar
値が下位サロゲート範囲に含まれており、(index - 2)
がstart
以上であり、かつchar
配列内の(index - 2)
のchar
値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。そうでない場合は、(index - 1)
のchar
値が返されます。a
- char
配列index
- 返すべきコード・ポイントの直後のインデックスstart
- char
配列の最初の配列要素のインデックスNullPointerException
- a
がnullである場合。IndexOutOfBoundsException
- index
引数がstart
引数以下であるかchar
配列の長さより大きい場合、またはstart
引数が負の値であるかchar
配列の長さ以上である場合。public static char highSurrogate(int codePoint)
char
が返されます。
isSupplementaryCodePoint(x)
がtrue
の場合、isHighSurrogate
(highSurrogate(x))
およびtoCodePoint
(highSurrogate(x),
lowSurrogate
(x))== x
も常にtrue
になります。
codePoint
- 補助文字(Unicodeコード・ポイント)public static char lowSurrogate(int codePoint)
char
が返されます。
isSupplementaryCodePoint(x)
がtrue
の場合、isLowSurrogate
(lowSurrogate(x))
およびtoCodePoint
(
highSurrogate
(x), lowSurrogate(x))== x
も常にtrue
になります。
codePoint
- 補助文字(Unicodeコード・ポイント)public static int toChars(int codePoint, char[] dst, int dstIndex)
dst[dstIndex]
に格納され、1が返されます。指定されたコード・ポイントが補助文字の場合は、サロゲート値がdst[dstIndex]
(上位サロゲート)とdst[dstIndex+1]
(下位サロゲート)に格納され、2が返されます。codePoint
- 変換対象の文字(Unicodeコード・ポイント)。dst
- codePoint
のUTF-16値が格納されるchar
の配列。dstIndex
- 変換された値が格納されるdst
配列の開始インデックス。IllegalArgumentException
- 指定されたcodePoint
が有効なUnicodeコード・ポイントでない場合。NullPointerException
- 指定されたdst
がnullの場合。IndexOutOfBoundsException
- dstIndex
が負の値であるかdst.length
以上である場合、またはdstIndex
位置のdst
が結果として得られるchar
値を格納する十分な配列要素を持たない場合。(dstIndex
がdst.length-1
と等価で、指定されたcodePoint
が補助文字の場合、上位サロゲート値はdst[dstIndex]
に格納されない。)public static char[] toChars(int codePoint)
char
配列に格納されるUTF-16表現に変換します。指定されたコード・ポイントがBMP (基本多言語面または第0面)値の場合、結果として得られるchar
配列はcodePoint
と同じ値を持ちます。指定されたコード・ポイントが補助コード・ポイントの場合は、結果として得られるchar
配列は対応するサロゲート・ペアを持ちます。codePoint
- Unicodeコード・ポイントcodePoint
のUTF-16表現を持つchar
配列。IllegalArgumentException
- 指定されたcodePoint
が有効なUnicodeコード・ポイントでない場合。public static int codePointCount(CharSequence seq, int beginIndex, int endIndex)
beginIndex
からインデックスendIndex - 1
の位置のchar
までです。したがって、テキスト範囲の長さ(char
数)は、endIndex-beginIndex
になります。テキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。seq
- 文字シーケンスbeginIndex
- テキスト範囲内の最初のchar
へのインデックスendIndex
- テキスト範囲内の最後のchar
の直後のインデックスNullPointerException
- seq
がnullである場合。IndexOutOfBoundsException
- beginIndex
が負であるか、endIndex
が指定されたシーケンスの長さより大きいか、あるいはbeginIndex
がendIndex
より大きい場合。public static int codePointCount(char[] a, int offset, int count)
char
配列引数の部分配列内にあるUnicodeコード・ポイントの数を返します。offset
引数は、部分配列の最初のchar
のインデックスであり、count
引数はchar
間の部分配列の長さを指定します。部分配列内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。a
- char
配列offset
- 指定されたchar
配列の最初のchar
のインデックスcount
- 部分配列の長さ(char
数)NullPointerException
- a
がnullである場合。IndexOutOfBoundsException
- offset
またはcount
が負の場合、またはoffset+count
が指定された配列の長さより大きい場合。public static int offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
index
からcodePointOffset
コード・ポイント分だけオフセットされた位置のインデックスを返します。index
とcodePointOffset
で指定されるテキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。seq
- 文字シーケンスindex
- オフセットされるインデックスcodePointOffset
- オフセット(コード・ポイント数)NullPointerException
- seq
がnullである場合。IndexOutOfBoundsException
- index
が負の値または文字シーケンスの長さよりも大きい場合、codePointOffset
が正の値でありindex
で始まるサブシーケンスの持つコード・ポイント数がcodePointOffset
コード・ポイント数よりも少ない場合、あるいはcodePointOffset
が負の値でindex
の前のサブシーケンスの持つ値がcodePointOffset
コード・ポイントの絶対値よりも小さい場合。public static int offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)
char
部分配列内で、指定されたindex
からcodePointOffset
コード・ポイント分だけオフセットされた位置のインデックスを返します。start
およびcount
引数は、char
配列の部分配列を指定します。index
とcodePointOffset
で指定されるテキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。a
- char
配列start
- 部分配列内の最初のchar
のインデックスcount
- 部分配列の長さ(char
数)index
- オフセットされるインデックスcodePointOffset
- オフセット(コード・ポイント数)NullPointerException
- a
がnullである場合。IndexOutOfBoundsException
- start
またはcount
が負の場合、またはstart+count
が指定された配列の長さより大きい場合、またはindex
がstart
より小さいかstart+count
より大きい場合、またはcodePointOffset
が正で、index
から始まりstart+count - 1
で終わるテキスト範囲内のコード・ポイント数がcodePointOffset
コード・ポイント数より少ない場合、またはcodePointOffset
が負で、start
から始まりindex - 1
で終わるテキスト範囲内のコード・ポイント数がcodePointOffset
コード・ポイントの絶対値より少ない場合。public static boolean isLowerCase(char ch)
ある文字が小文字になるのは、Character.getType(ch)
によって提供される汎用カテゴリ型がLOWERCASE_LETTER
である場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Lowercaseを持つ場合です。
小文字の例を次に示します。
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
Unicode文字には、ほかにも多数の小文字が存在します。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、isLowerCase(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合はfalse
。isLowerCase(char)
, isTitleCase(char)
, toLowerCase(char)
, getType(char)
public static boolean isLowerCase(int codePoint)
ある文字が小文字になるのは、getType(codePoint)
によって提供される汎用カテゴリ型がLOWERCASE_LETTER
である場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Lowercaseを持つ場合です。
小文字の例を次に示します。
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
Unicode文字には、ほかにも多数の小文字が存在します。
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、そうでない場合はfalse
。isLowerCase(int)
, isTitleCase(int)
, toLowerCase(int)
, getType(int)
public static boolean isUpperCase(char ch)
ある文字が大文字になるのは、Character.getType(ch)
によって提供される汎用カテゴリ型がUPPERCASE_LETTER
である場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Uppercaseを持つ場合です。
大文字の例を次に示します。
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
Unicode文字には、ほかにも多数の大文字が存在します。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、isUpperCase(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合はfalse
。isLowerCase(char)
, isTitleCase(char)
, toUpperCase(char)
, getType(char)
public static boolean isUpperCase(int codePoint)
ある文字が大文字になるのは、getType(codePoint)
によって提供される汎用カテゴリ型がUPPERCASE_LETTER
である場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Uppercaseを持つ場合です。
大文字の例を次に示します。
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
Unicode文字には、ほかにも多数の大文字が存在します。
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、そうでない場合はfalse
。isLowerCase(int)
, isTitleCase(int)
, toUpperCase(int)
, getType(int)
public static boolean isTitleCase(char ch)
Character.getType(ch)
により示される汎用カテゴリ型がTITLECASE_LETTER
の場合、文字はタイトル・ケース文字になります。
文字の中には、ラテン文字のペアのように見えるものがあります。たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。「Lj」のように見える3つ目の形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。
次に示すのは、このメソッドがtrue
を返すUnicode文字の一部です。
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
Unicode文字には、ほかにも多数のタイトル・ケース文字が存在します。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、isTitleCase(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合はfalse
。isLowerCase(char)
, isUpperCase(char)
, toTitleCase(char)
, getType(char)
public static boolean isTitleCase(int codePoint)
getType(codePoint)
により示される汎用カテゴリ型がTITLECASE_LETTER
の場合、文字はタイトル・ケース文字になります。
文字の中には、ラテン文字のペアのように見えるものがあります。たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。「Lj」のように見える3つ目の形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。
次に示すのは、このメソッドがtrue
を返すUnicode文字の一部です。
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
Unicode文字には、ほかにも多数のタイトル・ケース文字が存在します。
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、そうでない場合はfalse
。isLowerCase(int)
, isUpperCase(int)
, toTitleCase(int)
, getType(int)
public static boolean isDigit(char ch)
Character.getType(ch)
により示される汎用カテゴリ型がDECIMAL_DIGIT_NUMBER
の場合、文字は数字になります。
Unicode文字範囲の中には、次の数字を含むものがあります。
'\u0030'
- '\u0039'
、ISO-LATIN-1数字('0'
- '9'
)
'\u0660'
- '\u0669'
、アラビア数字
'\u06F0'
- '\u06F9'
、拡張アラビア数字
'\u0966'
- '\u096F'
、デヴァーナーガリ数字
'\uFF10'
- '\uFF19'
、全角数字
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、isDigit(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合はfalse
。digit(char, int)
, forDigit(int, int)
, getType(char)
public static boolean isDigit(int codePoint)
getType(codePoint)
により示される汎用カテゴリ型がDECIMAL_DIGIT_NUMBER
の場合、文字は数字になります。
Unicode文字範囲の中には、次の数字を含むものがあります。
'\u0030'
- '\u0039'
、ISO-LATIN-1数字('0'
- '9'
)
'\u0660'
- '\u0669'
、アラビア数字
'\u06F0'
- '\u06F9'
、拡張アラビア数字
'\u0966'
- '\u096F'
、デヴァーナーガリ数字
'\uFF10'
- '\uFF19'
、全角数字
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、そうでない場合はfalse
。forDigit(int, int)
, getType(int)
public static boolean isDefined(char ch)
少なくとも次のいずれかに当てはまる場合、文字は定義されています。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、isDefined(int)
メソッドを使用してください。
ch
- 判定対象の文字true
、そうでない場合はfalse
。isDigit(char)
, isLetter(char)
, isLetterOrDigit(char)
, isLowerCase(char)
, isTitleCase(char)
, isUpperCase(char)
public static boolean isDefined(int codePoint)
少なくとも次のいずれかに当てはまる場合、文字は定義されています。
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、そうでない場合はfalse
。isDigit(int)
, isLetter(int)
, isLetterOrDigit(int)
, isLowerCase(int)
, isTitleCase(int)
, isUpperCase(int)
public static boolean isLetter(char ch)
Character.getType(ch)
の示す汎用カテゴリ型が次のどれかの場合に、文字は汎用文字と見なされます。
UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、isLetter(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合はfalse
。isDigit(char)
, isJavaIdentifierStart(char)
, isJavaLetter(char)
, isJavaLetterOrDigit(char)
, isLetterOrDigit(char)
, isLowerCase(char)
, isTitleCase(char)
, isUnicodeIdentifierStart(char)
, isUpperCase(char)
public static boolean isLetter(int codePoint)
getType(codePoint)
の示す汎用カテゴリ型が次のどれかの場合に、文字は汎用文字と見なされます。
UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、そうでない場合はfalse
。isDigit(int)
, isJavaIdentifierStart(int)
, isLetterOrDigit(int)
, isLowerCase(int)
, isTitleCase(int)
, isUnicodeIdentifierStart(int)
, isUpperCase(int)
public static boolean isLetterOrDigit(char ch)
ある文字が文字または数字とみなされるのは、その文字のCharacter.isLetter(char ch)
またはCharacter.isDigit(char ch)
からtrue
が返される場合です。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、isLetterOrDigit(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合はfalse
。isDigit(char)
, isJavaIdentifierPart(char)
, isJavaLetter(char)
, isJavaLetterOrDigit(char)
, isLetter(char)
, isUnicodeIdentifierPart(char)
public static boolean isLetterOrDigit(int codePoint)
ある文字が文字または数字とみなされるのは、その文字のisLetter(codePoint)
またはisDigit(codePoint)
からtrue
が返される場合です。
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、そうでない場合はfalse
。isDigit(int)
, isJavaIdentifierPart(int)
, isLetter(int)
, isUnicodeIdentifierPart(int)
@Deprecated public static boolean isJavaLetter(char ch)
次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。
isLetter(ch)
がtrue
を返す
getType(ch)
がLETTER_NUMBER
を返す
ch
が通貨記号である('$'
など)
ch
が連結句読点文字である('_'
など)
ch
- 判定対象の文字。true
、そうでない場合はfalse
。isJavaLetterOrDigit(char)
, isJavaIdentifierStart(char)
, isJavaIdentifierPart(char)
, isLetter(char)
, isLetterOrDigit(char)
, isUnicodeIdentifierStart(char)
@Deprecated public static boolean isJavaLetterOrDigit(char ch)
次のいずれかの条件に当てはまる場合にのみ、その文字をJava識別子の一部に指定できます。
'$'
など)
'_'
など)
isIdentifierIgnorable
がtrue
を返す。
ch
- 判定対象の文字。true
、そうでない場合はfalse
。isJavaLetter(char)
, isJavaIdentifierStart(char)
, isJavaIdentifierPart(char)
, isLetter(char)
, isLetterOrDigit(char)
, isUnicodeIdentifierPart(char)
, isIdentifierIgnorable(char)
public static boolean isAlphabetic(int codePoint)
getType(codePoint)
の示す汎用カテゴリ型が次のどれかの場合に、文字はアルファベットと見なされます。
UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
LETTER_NUMBER
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、そうでない場合はfalse
。public static boolean isIdeographic(int codePoint)
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、そうでない場合はfalse
。public static boolean isJavaIdentifierStart(char ch)
次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。
isLetter(ch)
がtrue
を返す
getType(ch)
がLETTER_NUMBER
を返す
ch
が通貨記号である('$'
など)
ch
が連結句読点文字である('_'
など)
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、isJavaIdentifierStart(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合はfalse
。isJavaIdentifierPart(char)
, isLetter(char)
, isUnicodeIdentifierStart(char)
, SourceVersion.isIdentifier(CharSequence)
public static boolean isJavaIdentifierStart(int codePoint)
次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。
isLetter(codePoint)
が次を返す: true
getType(codePoint)
が次を返す: LETTER_NUMBER
'$'
など)
'_'
など)
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、そうでない場合はfalse
。isJavaIdentifierPart(int)
, isLetter(int)
, isUnicodeIdentifierStart(int)
, SourceVersion.isIdentifier(CharSequence)
public static boolean isJavaIdentifierPart(char ch)
次のいずれかの条件に当てはまる場合、その文字をJava識別子の一部に指定できます。
'$'
など)
'_'
など)
isIdentifierIgnorable
がtrue
を返す
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、isJavaIdentifierPart(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合はfalse
。isIdentifierIgnorable(char)
, isJavaIdentifierStart(char)
, isLetterOrDigit(char)
, isUnicodeIdentifierPart(char)
, SourceVersion.isIdentifier(CharSequence)
public static boolean isJavaIdentifierPart(int codePoint)
次のいずれかの条件に当てはまる場合、その文字をJava識別子の一部に指定できます。
'$'
など)
'_'
など)
isIdentifierIgnorable(codePoint)
がコード・ポイントについてtrue
を返す
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、そうでない場合はfalse
。isIdentifierIgnorable(int)
, isJavaIdentifierStart(int)
, isLetterOrDigit(int)
, isUnicodeIdentifierPart(int)
, SourceVersion.isIdentifier(CharSequence)
public static boolean isUnicodeIdentifierStart(char ch)
次の条件のどれかに当てはまる場合にだけ、その文字をUnicode識別子の最初に指定できます。
isLetter(ch)
がtrue
を返す
getType(ch)
がLETTER_NUMBER
を返す。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、isUnicodeIdentifierStart(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合はfalse
。isJavaIdentifierStart(char)
, isLetter(char)
, isUnicodeIdentifierPart(char)
public static boolean isUnicodeIdentifierStart(int codePoint)
次の条件のどれかに当てはまる場合にだけ、その文字をUnicode識別子の最初に指定できます。
isLetter(codePoint)
が次を返す: true
getType(codePoint)
がLETTER_NUMBER
を返す。
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、そうでない場合はfalse
。isJavaIdentifierStart(int)
, isLetter(int)
, isUnicodeIdentifierPart(int)
public static boolean isUnicodeIdentifierPart(char ch)
次の文のどれかに当てはまる場合にだけ、その文字をUnicode識別子の一部に使用できます。
'_'
など)
isIdentifierIgnorable
がtrue
を返す。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、isUnicodeIdentifierPart(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合はfalse
。isIdentifierIgnorable(char)
, isJavaIdentifierPart(char)
, isLetterOrDigit(char)
, isUnicodeIdentifierStart(char)
public static boolean isUnicodeIdentifierPart(int codePoint)
次の文のどれかに当てはまる場合にだけ、その文字をUnicode識別子の一部に使用できます。
'_'
など)
isIdentifierIgnorable
がtrue
を返す。
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、そうでない場合はfalse
。isIdentifierIgnorable(int)
, isJavaIdentifierPart(int)
, isLetterOrDigit(int)
, isUnicodeIdentifierStart(int)
public static boolean isIdentifierIgnorable(char ch)
次のUnicode文字は、Java識別子やUnicode識別子内で無視できます。
'\u0000'
- '\u0008'
'\u000E'
- '\u001B'
'\u007F'
- '\u009F'
FORMAT
を保持するすべての文字
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、isIdentifierIgnorable(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、それ以外の場合はfalse
。isJavaIdentifierPart(char)
, isUnicodeIdentifierPart(char)
public static boolean isIdentifierIgnorable(int codePoint)
次のUnicode文字は、Java識別子やUnicode識別子内で無視できます。
'\u0000'
- '\u0008'
'\u000E'
- '\u001B'
'\u007F'
- '\u009F'
FORMAT
を保持するすべての文字
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、それ以外の場合はfalse
。isJavaIdentifierPart(int)
, isUnicodeIdentifierPart(int)
public static char toLowerCase(char ch)
Character.isLowerCase(Character.toLowerCase(ch))
は、ある範囲の文字(特に表意文字や記号)に対して常にtrue
を返すわけではありません。
一般に、文字を小文字にマッピングする際にはString.toLowerCase()
を使用するようにしてください。String
のケース・マッピング・メソッドにはCharacter
のケース・マッピング・メソッドと比べて、いくつかの利点があります。ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、String
のケース・マッピング・メソッドでは実行できますが、Character
のケース・マッピング・メソッドでは実行できません。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、toLowerCase(int)
メソッドを使用してください。
ch
- 変換対象の文字。isLowerCase(char)
, String.toLowerCase()
public static int toLowerCase(int codePoint)
Character.isLowerCase(Character.toLowerCase(codePoint))
は、ある範囲の文字(特に表意文字や記号)に対して常にtrue
を返すわけではありません。
一般に、文字を小文字にマッピングする際にはString.toLowerCase()
を使用するようにしてください。String
のケース・マッピング・メソッドにはCharacter
のケース・マッピング・メソッドと比べて、いくつかの利点があります。ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、String
のケース・マッピング・メソッドでは実行できますが、Character
のケース・マッピング・メソッドでは実行できません。
codePoint
- 変換対象の文字(Unicodeコード・ポイント)。isLowerCase(int)
, String.toLowerCase()
public static char toUpperCase(char ch)
Character.isUpperCase(Character.toUpperCase(ch))
は、ある範囲の文字(特に表意文字や記号)に対して常にtrue
を返すわけではありません。
一般に、文字を大文字にマッピングする際にはString.toUpperCase()
を使用するようにしてください。String
のケース・マッピング・メソッドにはCharacter
のケース・マッピング・メソッドと比べて、いくつかの利点があります。ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、String
のケース・マッピング・メソッドでは実行できますが、Character
のケース・マッピング・メソッドでは実行できません。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、toUpperCase(int)
メソッドを使用してください。
ch
- 変換対象の文字。isUpperCase(char)
, String.toUpperCase()
public static int toUpperCase(int codePoint)
Character.isUpperCase(Character.toUpperCase(codePoint))
は、ある範囲の文字(特に表意文字や記号)に対して常にtrue
を返すわけではありません。
一般に、文字を大文字にマッピングする際にはString.toUpperCase()
を使用するようにしてください。String
のケース・マッピング・メソッドにはCharacter
のケース・マッピング・メソッドと比べて、いくつかの利点があります。ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、String
のケース・マッピング・メソッドでは実行できますが、Character
のケース・マッピング・メソッドでは実行できません。
codePoint
- 変換対象の文字(Unicodeコード・ポイント)。isUpperCase(int)
, String.toUpperCase()
public static char toTitleCase(char ch)
char
引数がタイトル・ケースchar
である場合には、同じchar
値が返されます。
Character.isTitleCase(Character.toTitleCase(ch))
は、ある範囲の文字に対して常にtrue
を返すわけではありません。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、toTitleCase(int)
メソッドを使用してください。
ch
- 変換対象の文字。isTitleCase(char)
, toLowerCase(char)
, toUpperCase(char)
public static int toTitleCase(int codePoint)
Character.isTitleCase(Character.toTitleCase(codePoint))
は、ある範囲の文字に対して常にtrue
を返すわけではありません。
codePoint
- 変換対象の文字(Unicodeコード・ポイント)。isTitleCase(int)
, toLowerCase(int)
, toUpperCase(int)
public static int digit(char ch, int radix)
ch
の数値としての値を返します。
基数がMIN_RADIX
≤radix
≤MAX_RADIX
の範囲外の場合、またはch
の値が指定された基数の有効数字でない場合は、-1
が返されます。次のどれかに当てはまる場合、文字は有効数字です。
isDigit
がtrue
を返し、その文字のUnicode 10進数値(または単一文字の分解)が指定された基数よりも小さい。この場合、10進値が返される。
'A'
- 'Z'
のラテン大文字のどれかで、そのコードがradix+'A' - 10
よりも小さい。この場合、ch - 'A'+10
が返される。
'a'
- 'z'
のラテン小文字のどれかで、そのコードがradix+'a' - 10
よりも小さい。この場合、ch - 'a'+10
が返される。
'\uFF21'
) - Z ('\uFF3A'
)の全角ラテン大文字のどれかで、そのコードがradix+'\uFF21' - 10
よりも小さい。この場合、ch - '\uFF21'+10
が返される。
'\uFF41'
) - z ('\uFF5A'
)の全角ラテン小文字のどれかで、そのコードがradix+'\uFF41' - 10
よりも小さい。この場合、ch - '\uFF41'+10
が返される。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、digit(int, int)
メソッドを使用してください。
ch
- 変換対象の文字。radix
- 基数。forDigit(int, int)
, isDigit(char)
public static int digit(int codePoint, int radix)
基数がMIN_RADIX
≤radix
≤MAX_RADIX
の範囲外の場合、または文字が指定された基数の有効数字でない場合は、-1
が返されます。次のどれかに当てはまる場合、文字は有効数字です。
isDigit(codePoint)
がtrue
を返し、その文字のUnicode 10進数値(または単一文字の分解)が指定された基数よりも小さい。この場合、10進値が返される。
'A'
- 'Z'
のラテン大文字のどれかで、そのコードがradix+'A' - 10
よりも小さい。この場合、codePoint - 'A'+10
が返される。
'a'
- 'z'
のラテン小文字のどれかで、そのコードがradix+'a' - 10
よりも小さい。この場合、codePoint - 'a'+10
が返される。
'\uFF21'
) - Z ('\uFF3A'
)の全角ラテン大文字のどれかで、そのコードがradix+'\uFF21' - 10
よりも小さい。この場合、codePoint - '\uFF21'+10
が返される。
'\uFF41'
) - z ('\uFF5A'
)の全角ラテン小文字のどれかで、そのコードがradix+'\uFF41'- 10
よりも小さい。この場合、codePoint - '\uFF41'+10
が返される。
codePoint
- 変換対象の文字(Unicodeコード・ポイント)。radix
- 基数。forDigit(int, int)
, isDigit(int)
public static int getNumericValue(char ch)
int
値を返します。たとえば、文字'\u216C'
(ローマ数字の50)は、値50のintを返します。
文字A - Zの大文字('\u0041'
- '\u005A'
)、小文字('\u0061'
- '\u007A'
)、全角バリアント('\uFF21'
- '\uFF3A'
および'\uFF41'
- '\uFF5A'
)の各形式は、10 - 35の数値を持ちます。これはUnicode仕様とは無関係であり、Unicode仕様ではこれらのchar
値に数値は割り当てられません。
文字が数値を持たない場合は、-1が返されます。文字の数値を負でない整数として表現できない場合(小数値など)は、-2が返されます。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、getNumericValue(int)
メソッドを使用してください。
ch
- 変換対象の文字。int
型の数値の場合、文字の数値。文字が負でない整数以外の数値を持つ場合は -2、文字が数値を持たない場合は -1。forDigit(int, int)
, isDigit(char)
public static int getNumericValue(int codePoint)
int
値を返します。たとえば、文字'\u216C'
(ローマ数字の50)は、値50のint
を返します。
文字A - Zの大文字('\u0041'
- '\u005A'
)、小文字('\u0061'
- '\u007A'
)、全角バリアント('\uFF21'
- '\uFF3A'
および'\uFF41'
- '\uFF5A'
)の各形式は、10 - 35の数値を持ちます。これはUnicode仕様とは無関係であり、Unicode仕様ではこれらのchar
値に数値は割り当てられません。
文字が数値を持たない場合は、-1が返されます。文字の数値を負でない整数として表現できない場合(小数値など)は、-2が返されます。
codePoint
- 変換対象の文字(Unicodeコード・ポイント)。int
型の数値の場合、文字の数値。文字が負でない整数以外の数値を持つ場合は -2、文字が数値を持たない場合は -1。forDigit(int, int)
, isDigit(int)
@Deprecated public static boolean isSpace(char ch)
true
を返します。
'\t' | U+0009 |
HORIZONTAL TABULATION |
'\n' | U+000A |
NEW LINE |
'\f' | U+000C |
FORM FEED |
'\r' | U+000D |
CARRIAGE RETURN |
' ' | U+0020 |
SPACE |
ch
- 判定対象の文字。true
、そうでない場合はfalse
。isSpaceChar(char)
, isWhitespace(char)
public static boolean isSpaceChar(char ch)
SPACE_SEPARATOR
LINE_SEPARATOR
PARAGRAPH_SEPARATOR
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、isSpaceChar(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合はfalse
。isWhitespace(char)
public static boolean isSpaceChar(int codePoint)
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、そうでない場合はfalse
。isWhitespace(int)
public static boolean isWhitespace(char ch)
SPACE_SEPARATOR
、LINE_SEPARATOR
、またはPARAGRAPH_SEPARATOR
)であるが、改行なしの空白('\u00A0'
、'\u2007'
、'\u202F'
)ではない。
'\t'
(U+0009水平タブ)である。
'\n'
(U+000A改行)である。
'\u000B'
(U+000B垂直タブ)である。
'\f'
(U+000Cフォーム・フィード)である。
'\r'
(U+000D復帰)である。
'\u001C'
(U+001Cファイル区切り文字)である。
'\u001D'
(U+001Dグループ区切り文字)である。
'\u001E'
(U+001Eレコード区切り文字)である。
'\u001F'
(U+001F単位区切り文字)である。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、isWhitespace(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合はfalse
。isSpaceChar(char)
public static boolean isWhitespace(int codePoint)
SPACE_SEPARATOR
、LINE_SEPARATOR
、またはPARAGRAPH_SEPARATOR
)であるが、改行なしの空白('\u00A0'
、'\u2007'
、'\u202F'
)ではない。
'\t'
(U+0009水平タブ)である。
'\n'
(U+000A改行)である。
'\u000B'
(U+000B垂直タブ)である。
'\f'
(U+000Cフォーム・フィード)である。
'\r'
(U+000D復帰)である。
'\u001C'
(U+001Cファイル区切り文字)である。
'\u001D'
(U+001Dグループ区切り文字)である。
'\u001E'
(U+001Eレコード区切り文字)である。
'\u001F'
(U+001F単位区切り文字)である。
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、そうでない場合はfalse
。isSpaceChar(int)
public static boolean isISOControl(char ch)
'\u0000'
- '\u001F'
の範囲、または'\u007F'
- '\u009F'
の範囲の場合は、ISO制御文字と見なされます。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、isISOControl(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合はfalse
。isSpaceChar(char)
, isWhitespace(char)
public static boolean isISOControl(int codePoint)
'\u0000'
- '\u001F'
の範囲、または'\u007F'
- '\u009F'
の範囲の場合は、ISO制御文字と見なされます。codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、そうでない場合はfalse
。isSpaceChar(int)
, isWhitespace(int)
public static int getType(char ch)
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、getType(int)
メソッドを使用してください。
ch
- 判定対象の文字。int
型の値。COMBINING_SPACING_MARK
, CONNECTOR_PUNCTUATION
, CONTROL
, CURRENCY_SYMBOL
, DASH_PUNCTUATION
, DECIMAL_DIGIT_NUMBER
, ENCLOSING_MARK
, END_PUNCTUATION
, FINAL_QUOTE_PUNCTUATION
, FORMAT
, INITIAL_QUOTE_PUNCTUATION
, LETTER_NUMBER
, LINE_SEPARATOR
, LOWERCASE_LETTER
, MATH_SYMBOL
, MODIFIER_LETTER
, MODIFIER_SYMBOL
, NON_SPACING_MARK
, OTHER_LETTER
, OTHER_NUMBER
, OTHER_PUNCTUATION
, OTHER_SYMBOL
, PARAGRAPH_SEPARATOR
, PRIVATE_USE
, SPACE_SEPARATOR
, START_PUNCTUATION
, SURROGATE
, TITLECASE_LETTER
, UNASSIGNED
, UPPERCASE_LETTER
public static int getType(int codePoint)
codePoint
- 判定対象の文字(Unicodeコード・ポイント)。int
型の値。COMBINING_SPACING_MARK
, CONNECTOR_PUNCTUATION
, CONTROL
, CURRENCY_SYMBOL
, DASH_PUNCTUATION
, DECIMAL_DIGIT_NUMBER
, ENCLOSING_MARK
, END_PUNCTUATION
, FINAL_QUOTE_PUNCTUATION
, FORMAT
, INITIAL_QUOTE_PUNCTUATION
, LETTER_NUMBER
, LINE_SEPARATOR
, LOWERCASE_LETTER
, MATH_SYMBOL
, MODIFIER_LETTER
, MODIFIER_SYMBOL
, NON_SPACING_MARK
, OTHER_LETTER
, OTHER_NUMBER
, OTHER_PUNCTUATION
, OTHER_SYMBOL
, PARAGRAPH_SEPARATOR
, PRIVATE_USE
, SPACE_SEPARATOR
, START_PUNCTUATION
, SURROGATE
, TITLECASE_LETTER
, UNASSIGNED
, UPPERCASE_LETTER
public static char forDigit(int digit, int radix)
radix
の値が無効な基数の場合、またはdigit
が指定された基数で無効な数字の場合は、null文字('\u0000'
)が返されます。
radix
引数は、MIN_RADIX
以上MAX_RADIX
以下の場合に有効です。digit
引数は、0 <= digit < radix
の場合に有効です。
数字が10より小さいと、'0'+digit
が返されます。そうでない場合は、値'a'+digit - 10
が返されます。
digit
- 文字に変換する数。radix
- 基数。char
表現。MIN_RADIX
, MAX_RADIX
, digit(char, int)
public static byte getDirectionality(char ch)
char
値の方向性値はDIRECTIONALITY_UNDEFINED
です。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、getDirectionality(int)
メソッドを使用してください。
ch
- 方向性プロパティが要求されたchar
。char
値の方向性プロパティ。DIRECTIONALITY_UNDEFINED
, DIRECTIONALITY_LEFT_TO_RIGHT
, DIRECTIONALITY_RIGHT_TO_LEFT
, DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
, DIRECTIONALITY_EUROPEAN_NUMBER
, DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
, DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
, DIRECTIONALITY_ARABIC_NUMBER
, DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
, DIRECTIONALITY_NONSPACING_MARK
, DIRECTIONALITY_BOUNDARY_NEUTRAL
, DIRECTIONALITY_PARAGRAPH_SEPARATOR
, DIRECTIONALITY_SEGMENT_SEPARATOR
, DIRECTIONALITY_WHITESPACE
, DIRECTIONALITY_OTHER_NEUTRALS
, DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
, DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
, DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
, DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
, DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static byte getDirectionality(int codePoint)
DIRECTIONALITY_UNDEFINED
です。codePoint
- 方向性プロパティが要求された文字(Unicodeコード・ポイント)。DIRECTIONALITY_UNDEFINED
, DIRECTIONALITY_LEFT_TO_RIGHT
, DIRECTIONALITY_RIGHT_TO_LEFT
, DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
, DIRECTIONALITY_EUROPEAN_NUMBER
, DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
, DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
, DIRECTIONALITY_ARABIC_NUMBER
, DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
, DIRECTIONALITY_NONSPACING_MARK
, DIRECTIONALITY_BOUNDARY_NEUTRAL
, DIRECTIONALITY_PARAGRAPH_SEPARATOR
, DIRECTIONALITY_SEGMENT_SEPARATOR
, DIRECTIONALITY_WHITESPACE
, DIRECTIONALITY_OTHER_NEUTRALS
, DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
, DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
, DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
, DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
, DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static boolean isMirrored(char ch)
'\u0028'
LEFT PARENTHESISは、セマンティックスでは開きカッコとして定義されています。これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべてのUnicode文字をサポートするには、isMirrored(int)
メソッドを使用してください。
ch
- ミラー化プロパティが要求されたchar
true
、char
がミラー化されないか未定義の場合はfalse
。public static boolean isMirrored(int codePoint)
'\u0028'
LEFT PARENTHESISは、セマンティックスでは開きカッコとして定義されています。これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。codePoint
- 判定対象の文字(Unicodeコード・ポイント)。true
、文字がミラー化されないか未定義の場合はfalse
。public int compareTo(Character anotherCharacter)
Character
オブジェクトを数値的に比較します。compareTo
、インタフェース: Comparable<Character>
anotherCharacter
- 比較対象のCharacter
。Character
がこのCharacter
と等しい場合は値0
、このCharacter
がCharacter
引数より小さい数値の場合は0
より小さい値、このCharacter
がCharacter
引数より大きい数値の場合は0
より大きい値(符号なしの比較)。これは完全に数値の比較なので、ロケールに依存しないpublic static int compare(char x, char y)
char
値を数値的に比較します。返される値は、次から返される値と同じになります。
Character.valueOf(x).compareTo(Character.valueOf(y))
x
- 比較する最初のchar
y
- 比較する2番目のchar
x == y
の場合は値0
、x < y
の場合は0
より小さい値、x> y
の場合は0
より大きい値public static char reverseBytes(char ch)
ch
- そのバイト順を逆にするchar
。public static String getName(int codePoint)
codePoint
のUnicode名(コード・ポイントがunassigned
の場合はnull)を返します。
注: UnicodeDataファイル(Unicode Consortiumがメンテナンスを行っているUnicode Character Databaseの一部)で、指定された文字に名前が割り当てられていない場合、返される名前は次の式の結果と同じになります。
Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ENGLISH);
codePoint
- 文字(Unicodeコード・ポイント)IllegalArgumentException
- 指定されたcodePoint
が有効なUnicodeコード・ポイントでない場合。 バグまたは機能を送信
詳細なAPIリファレンスおよび開発者ドキュメントについては、Java SEのドキュメントを参照してください。そのドキュメントには、概念的な概要、用語の定義、回避方法、有効なコード例などの、開発者を対象にしたより詳細な説明が含まれています。
Copyright © 1993, 2020, Oracle and/or its affiliates. All rights reserved. Use is subject to license terms. Documentation Redistribution Policyも参照してください。