public final class Character extends Object implements Serializable, Comparable<Character>
Characterクラスは、プリミティブ型charの値をオブジェクトにラップします。 Characterクラスのオブジェクトには、型がcharの単一フィールドが含まれます。
また、このクラスは、文字のカテゴリ(小文字、数字など)を決定したり、大文字から小文字(およびその逆)の変換を行う多数のstaticメソッドも提供します。
Characterクラスのフィールドおよびメソッドは、Unicode標準(特にUnicode Character Databaseの一部であるUnicodeDataファイル)の文字情報の観点から定義されています。 このファイルは、割当て済みのUnicodeコード・ポイントまたは文字範囲ごとの名前やカテゴリなどのプロパティを指定します。 ファイルは、Unicode Consortium (http://www.unicode.org)から入手できます。
Java SE 8プラットフォームでは、Unicode規格のバージョン6.2の文字情報を使用し、3つの拡張機能があります。 まず、新しい通貨が頻繁に表示されることを認識して、Java SE 8 Platformでは、クラスCharacterの実装でUnicode規格のバージョン10.0の通貨記号ブロックを使用できます。 第2に、Java SE 8プラットフォームでは、クラスCharacterの実装で、Unicode規格のバージョン11.0からU+9FEF、およびUnicode規格のバージョン8.0のCJK Unified Ideographs Extension EブロックのU+9FCDからU+9FEFの範囲のコード・ポイントを使用して、中国語GB18030-2022規格の"実装レベル2"をクラスで許可できます。 第3に、Java SE 8プラットフォームでは、クラスCharacterの実装で、Unicode標準バージョン12.1の日本語Eraコード・ポイントU+32FFを使用できます。 したがって、Characterクラスのフィールドおよびメソッドの動作は、前述のコード・ポイントを処理する際、Java SE 8プラットフォームの実装ごとに異なる可能性があります(バージョン6.2以外)。ただし、Java識別子を定義するメソッドisJavaIdentifierStart(int)、isJavaIdentifierStart(char)、isJavaIdentifierPart(int)およびisJavaIdentifierPart(char)は除きます。 Java識別子のコード・ポイントは、バージョン6.2のUnicode標準から導出される必要があります。
charデータ型(Characterオブジェクトにカプセル化される値)は、当初のUnicode仕様に基づいています。この仕様では、文字が固定幅16ビット・エンティティとして定義されていました。 Unicode標準はその後、16ビット以上の表現を必要とする文字を許容するように変更されています。 適正なコード・ポイントの範囲は、現在U+0000 - U+10FFFFであり、Unicodeスカラー値として知られています。 (Unicode標準のU+n表記の定義を参照。)
U+0000 - U+FFFFの文字セットは、基本多言語面(BMP)と呼ばれる場合もあります。 コード・ポイントがU+FFFFよりも大きい文字は補助文字と呼ばれます。 Javaプラットフォームでは、char配列、Stringクラス、およびStringBufferクラスでUTF-16表現が使用されます。 この表現では、補助文字はchar値のペアとして表現され、上位サロゲート範囲(\uD800-\uDBFF)からの最初の値と、下位サロゲート範囲(\uDC00-\uDFFF)からの第2の値から構成されています。
したがって、char値は、サロゲート・コード・ポイントやUTF-16エンコーディングのコード単位を含む基本多言語面(BMP)コード・ポイントを表します。 int値は、補助コード・ポイントを含むすべてのUnicodeコード・ポイントを表します。 intの下位(最下位) 21ビットは、Unicodeコード・ポイントを表すために使用され、上位(最上位) 11ビットはゼロである必要があります。 特に指定されないかぎり、補助文字とサロゲートchar値に関する動作は次のとおりです。
char値だけを受け入れるメソッドは補助文字に対応できません。 これらのメソッドはサロゲート範囲のchar値を未定義の文字として扱います。 たとえば、Character.isLetter('\uD840')はfalseを返し、文字列でそのあとに下位サロゲート値が続く場合でも、この特定の値は文字を表します。
int値を受け入れるメソッドは、補助文字を含むすべてのUnicode文字に対応します。 たとえば、Character.isLetter(0x2F81A)は、コード・ポイント値が文字(CJK統合漢字)を表すため、trueを返します。
Java SE APIドキュメンテーションでは、U+0000 - U+10FFFFの範囲の文字値にUnicodeコード・ポイントを使用し、UTF-16エンコーディングのコード単位である16ビットchar値にUnicodeコード単位を使用します。 Unicode用語の詳細は、「Unicode Glossary」を参照してください。
| 修飾子と型 | クラス | 説明 |
|---|---|---|
static class |
Character.Subset |
このクラスのインスタンスは、Unicode文字セットの特定のサブセットを表します。
|
static class |
Character.UnicodeBlock |
Unicode仕様で定義されている文字ブロックを表す文字サブセットのファミリです。
|
static class |
Character.UnicodeScript |
「Unicode Standard Annex#24: Script Names」で規定された文字スクリプトを表す文字サブセットのファミリです。
|
| 修飾子と型 | フィールド | 説明 |
|---|---|---|
static int |
BYTES |
符号なしバイナリ形式で
char値を表すために使用されるバイト数。 |
static byte |
COMBINING_SPACING_MARK |
Unicode仕様の汎用カテゴリ「Mc」。
|
static byte |
CONNECTOR_PUNCTUATION |
Unicode仕様の汎用カテゴリ「Pc」。
|
static byte |
CONTROL |
Unicode仕様の汎用カテゴリ「Cc」。
|
static byte |
CURRENCY_SYMBOL |
Unicode仕様の汎用カテゴリ「Sc」。
|
static byte |
DASH_PUNCTUATION |
Unicode仕様の汎用カテゴリ「Pd」。
|
static byte |
DECIMAL_DIGIT_NUMBER |
Unicode仕様の汎用カテゴリ「Nd」。
|
static byte |
DIRECTIONALITY_ARABIC_NUMBER |
Unicode仕様の弱い双方向文字タイプ「AN」。
|
static byte |
DIRECTIONALITY_BOUNDARY_NEUTRAL |
Unicode仕様の弱い双方向文字タイプ「BN」。
|
static byte |
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR |
Unicode仕様の弱い双方向文字タイプ「CS」。
|
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER |
Unicode仕様の弱い双方向文字タイプ「EN」。
|
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR |
Unicode仕様の弱い双方向文字タイプ「ES」。
|
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR |
Unicode仕様の弱い双方向文字タイプ「ET」。
|
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT |
Unicode仕様の強力な双方向文字タイプ「L」。
|
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING |
Unicode仕様の強力な双方向文字タイプ「LRE」。
|
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE |
Unicode仕様の強力な双方向文字タイプ「LRO」。
|
static byte |
DIRECTIONALITY_NONSPACING_MARK |
Unicode仕様の弱い双方向文字タイプ「NSM」。
|
static byte |
DIRECTIONALITY_OTHER_NEUTRALS |
Unicode仕様のニュートラルな双方向文字タイプ「ON」。
|
static byte |
DIRECTIONALITY_PARAGRAPH_SEPARATOR |
Unicode仕様のニュートラルな双方向文字タイプ「B」。
|
static byte |
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT |
Unicode仕様の弱い双方向文字タイプ「PDF」。
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT |
Unicode仕様の強力な双方向文字タイプ「R」。
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC |
Unicode仕様の強力な双方向文字タイプ「AL」。
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING |
Unicode仕様の強力な双方向文字タイプ「RLE」。
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE |
Unicode仕様の強力な双方向文字タイプ「RLO」。
|
static byte |
DIRECTIONALITY_SEGMENT_SEPARATOR |
Unicode仕様のニュートラルな双方向文字タイプ「S」。
|
static byte |
DIRECTIONALITY_UNDEFINED |
未定義の双方向文字タイプ。
|
static byte |
DIRECTIONALITY_WHITESPACE |
Unicode仕様のニュートラルな双方向文字タイプ「WS」。
|
static byte |
ENCLOSING_MARK |
Unicode仕様の汎用カテゴリ「Me」。
|
static byte |
END_PUNCTUATION |
Unicode仕様の汎用カテゴリ「Pe」。
|
static byte |
FINAL_QUOTE_PUNCTUATION |
Unicode仕様の汎用カテゴリ「Pf」。
|
static byte |
FORMAT |
Unicode仕様の汎用カテゴリ「Cf」。
|
static byte |
INITIAL_QUOTE_PUNCTUATION |
Unicode仕様の汎用カテゴリ「Pi」。
|
static byte |
LETTER_NUMBER |
Unicode仕様の汎用カテゴリ「Nl」。
|
static byte |
LINE_SEPARATOR |
Unicode仕様の汎用カテゴリ「Zl」。
|
static byte |
LOWERCASE_LETTER |
Unicode仕様の汎用カテゴリ「Ll」。
|
static byte |
MATH_SYMBOL |
Unicode仕様の汎用カテゴリ「Sm」。
|
static int |
MAX_CODE_POINT |
Unicodeコード・ポイントの最大値(定数
U+10FFFF)。 |
static char |
MAX_HIGH_SURROGATE |
UTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最大値(定数
'\uDBFF')。 |
static char |
MAX_LOW_SURROGATE |
UTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最大値(定数
'\uDFFF')。 |
static int |
MAX_RADIX |
文字列との変換に使用可能な最大基数。
|
static char |
MAX_SURROGATE |
UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最大値(定数
'\uDFFF')。 |
static char |
MAX_VALUE |
このフィールドの定数値は、
char型の最大値'\uFFFF'。 |
static int |
MIN_CODE_POINT |
Unicodeコード・ポイントの最小値(定数
U+0000)。 |
static char |
MIN_HIGH_SURROGATE |
UTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最小値(定数
'\uD800')。 |
static char |
MIN_LOW_SURROGATE |
UTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最小値(定数
'\uDC00')。 |
static int |
MIN_RADIX |
文字列との変換に使用可能な最小基数。
|
static int |
MIN_SUPPLEMENTARY_CODE_POINT |
Unicode補助コード・ポイントの最小値(定数
U+10000)。 |
static char |
MIN_SURROGATE |
UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最小値(定数
'\uD800')。 |
static char |
MIN_VALUE |
このフィールドの定数値は、
char型の最小値'\u0000'。 |
static byte |
MODIFIER_LETTER |
Unicode仕様の汎用カテゴリ「Lm」。
|
static byte |
MODIFIER_SYMBOL |
Unicode仕様の汎用カテゴリ「Sk」。
|
static byte |
NON_SPACING_MARK |
Unicode仕様の汎用カテゴリ「Mn」。
|
static byte |
OTHER_LETTER |
Unicode仕様の汎用カテゴリ「Lo」。
|
static byte |
OTHER_NUMBER |
Unicode仕様の汎用カテゴリ「No」。
|
static byte |
OTHER_PUNCTUATION |
Unicode仕様の汎用カテゴリ「Po」。
|
static byte |
OTHER_SYMBOL |
Unicode仕様の汎用カテゴリ「So」。
|
static byte |
PARAGRAPH_SEPARATOR |
Unicode仕様の汎用カテゴリ「Zp」。
|
static byte |
PRIVATE_USE |
Unicode仕様の汎用カテゴリ「Co」。
|
static int |
SIZE |
符号なしバイナリ形式でchar値を表すのに使用されるビット数(定数
16)。 |
static byte |
SPACE_SEPARATOR |
Unicode仕様の汎用カテゴリ「Zs」。
|
static byte |
START_PUNCTUATION |
Unicode仕様の汎用カテゴリ「Ps」。
|
static byte |
SURROGATE |
Unicode仕様の汎用カテゴリ「Cs」。
|
static byte |
TITLECASE_LETTER |
Unicode仕様の汎用カテゴリ「Lt」。
|
static Class<Character> |
TYPE |
プリミティブ型
charを表すClassインスタンス。 |
static byte |
UNASSIGNED |
Unicode仕様の汎用カテゴリ「Cn」。
|
static byte |
UPPERCASE_LETTER |
Unicode仕様の汎用カテゴリ「Lu」。
|
| コンストラクタ | 説明 |
|---|---|
Character(char value) |
指定された
char値を表す、新しく割り当てられたCharacterオブジェクトを構築します。 |
| 修飾子と型 | メソッド | 説明 |
|---|---|---|
static int |
charCount(int codePoint) |
指定された文字(Unicodeコード・ポイント)を表すのに必要な
char値の数を判定します。 |
char |
charValue() |
この
Characterオブジェクトの値を返します。 |
static int |
codePointAt(char[] a, int index) |
char配列の指定されたインデックスにあるコード・ポイントを返します。 |
static int |
codePointAt(char[] a, int index, int limit) |
limitの長さ未満のindexを持つ配列要素のみを使用可能な、char配列の指定されたインデックスにあるコード・ポイントを返します。 |
static int |
codePointAt(CharSequence seq, int index) |
CharSequenceの指定されたインデックスにあるコード・ポイントを返します。 |
static int |
codePointBefore(char[] a, int index) |
char配列の指定されたインデックスの前にあるコード・ポイントを返します。 |
static int |
codePointBefore(char[] a, int index, int start) |
start以上のindexを持つ配列要素のみを使用可能な、char配列の指定されたインデックスの前にあるコード・ポイントを返します。 |
static int |
codePointBefore(CharSequence seq, int index) |
CharSequenceの指定されたインデックスの前にあるコード・ポイントを返します。 |
static int |
codePointCount(char[] a, int offset, int count) |
char配列引数の部分配列内にあるUnicodeコード・ポイントの数を返します。 |
static int |
codePointCount(CharSequence seq, int beginIndex, int endIndex) |
指定されたcharシーケンスのテキスト範囲内のUnicodeコード・ポイントの数を返します。
|
static int |
compare(char x, char y) |
2つの
char値を数値的に比較します。 |
int |
compareTo(Character anotherCharacter) |
2つの
Characterオブジェクトを数値的に比較します。 |
static int |
digit(char ch, int radix) |
指定された基数での、文字
chの数値としての値を返します。 |
static int |
digit(int codePoint, int radix) |
指定された基数での、指定された文字(Unicodeコード・ポイント)の数値を返します。
|
boolean |
equals(Object obj) |
このオブジェクトと指定されたオブジェクトを比較します。
|
static char |
forDigit(int digit, int radix) |
指定された基数での、指定された桁数の文字表現を判定します。
|
static byte |
getDirectionality(char ch) |
指定された文字のUnicode方向性プロパティを返します。
|
static byte |
getDirectionality(int codePoint) |
所定の文字(Unicodeコード・ポイント)のUnicode方向性プロパティを返します。
|
static String |
getName(int codePoint) |
指定された文字
codePointのUnicode名(コード・ポイントがunassignedの場合はnull)を返します。 |
static int |
getNumericValue(char ch) |
指定されたUnicode文字が表す
int値を返します。 |
static int |
getNumericValue(int codePoint) |
指定された文字(Unicodeコード・ポイント)が表す
int値を返します。 |
static int |
getType(char ch) |
文字の汎用カテゴリを示す値を返します。
|
static int |
getType(int codePoint) |
文字の汎用カテゴリを示す値を返します。
|
int |
hashCode() |
この
Characterのハッシュ・コード(charValue()を呼び出した場合の結果と等しくなる)を返します。 |
static int |
hashCode(char value) |
Character.hashCode()との互換性がある、char値のハッシュ・コードを返します。 |
static char |
highSurrogate(int codePoint) |
UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのリーディング・サロゲート(上位サロゲート・コード単位)を返します。
|
static boolean |
isAlphabetic(int codePoint) |
指定された文字(Unicodeコード・ポイント)がアルファベットかどうかを判定します。
|
static boolean |
isBmpCodePoint(int codePoint) |
指定された文字(Unicodeコード・ポイント)が基本多言語面(BMP)に含まれるかどうかを判定します。
|
static boolean |
isDefined(char ch) |
文字がUnicodeで定義されているかどうかを判定します。
|
static boolean |
isDefined(int codePoint) |
文字(Unicodeコード・ポイント)がUnicodeで定義されているかどうかを判定します。
|
static boolean |
isDigit(char ch) |
指定された文字が数字かどうかを判定します。
|
static boolean |
isDigit(int codePoint) |
指定された文字(Unicodeコード・ポイント)が数字かどうかを判定します。
|
static boolean |
isHighSurrogate(char ch) |
指定された
char値がUnicode上位サロゲート・コード単位 (リーディング・サロゲート・コード単位ともいう)であるかどうかを判定します。 |
static boolean |
isIdentifierIgnorable(char ch) |
指定された文字が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。
|
static boolean |
isIdentifierIgnorable(int codePoint) |
指定された文字(Unicodeコード・ポイント)が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。
|
static boolean |
isIdeographic(int codePoint) |
指定された文字(Unicodeコード・ポイント)が、Unicode標準で規定されたCJKV (中国語、日本語、韓国語、およびベトナム語)の表意文字かどうかを判定します。
|
static boolean |
isISOControl(char ch) |
指定された文字がISO制御文字かどうかを判定します。
|
static boolean |
isISOControl(int codePoint) |
参照された文字(Unicodeコード・ポイント)がISO制御文字かどうかを判定します。
|
static boolean |
isJavaIdentifierPart(char ch) |
指定された文字をJava識別子の最初の文字以外に使用可能かどうかを判定します。
|
static boolean |
isJavaIdentifierPart(int codePoint) |
文字(Unicodeコード・ポイント)をJava識別子の最初の文字以外に使用可能かどうかを判定します。
|
static boolean |
isJavaIdentifierStart(char ch) |
指定された文字をJava識別子の最初の文字として指定可能かどうかを判定します。
|
static boolean |
isJavaIdentifierStart(int codePoint) |
文字(Unicodeコード・ポイント)をJava識別子の最初の文字として指定可能かどうかを判定します。
|
static boolean |
isJavaLetter(char ch) |
非推奨。
isJavaIdentifierStart(char)に置き換えられています。
|
static boolean |
isJavaLetterOrDigit(char ch) |
非推奨。
isJavaIdentifierPart(char)に置き換えられています。
|
static boolean |
isLetter(char ch) |
指定された文字が汎用文字かどうかを判定します。
|
static boolean |
isLetter(int codePoint) |
指定された文字(Unicodeコード・ポイント)が汎用文字かどうかを判定します。
|
static boolean |
isLetterOrDigit(char ch) |
指定された文字が汎用文字または数字かどうかを判定します。
|
static boolean |
isLetterOrDigit(int codePoint) |
指定された文字(Unicodeコード・ポイント)が汎用文字または数字かどうかを判定します。
|
static boolean |
isLowerCase(char ch) |
指定された文字が小文字かどうかを判定します。
|
static boolean |
isLowerCase(int codePoint) |
指定された文字(Unicodeコード・ポイント)が小文字かどうかを判定します。
|
static boolean |
isLowSurrogate(char ch) |
指定された
char値がUnicode下位サロゲート・コード単位 (トレーリング・サロゲート・コード単位ともいう)であるかどうかを判定します。 |
static boolean |
isMirrored(char ch) |
Unicode仕様に従って文字をミラー化するかどうかを判定します。
|
static boolean |
isMirrored(int codePoint) |
Unicode仕様に従って、指定された文字(Unicodeコード・ポイント)をミラー化するかどうかを判定します。
|
static boolean |
isSpace(char ch) |
非推奨。
isWhitespace(char)に置き換えられています。
|
static boolean |
isSpaceChar(char ch) |
指定された文字がUnicodeの空白文字かどうかを判定します。
|
static boolean |
isSpaceChar(int codePoint) |
指定された文字(Unicodeコード・ポイント)がUnicodeの空白文字かどうかを判定します。
|
static boolean |
isSupplementaryCodePoint(int codePoint) |
指定された文字(Unicodeコード・ポイント)が補助文字の範囲にあるかどうかを判定します。
|
static boolean |
isSurrogate(char ch) |
指定された
char値がUnicode サロゲート・コード単位かどうかを判定します。 |
static boolean |
isSurrogatePair(char high, char low) |
指定された
char値のペアが有効なUnicodeサロゲート・ペアであるかどうかを判定します。 |
static boolean |
isTitleCase(char ch) |
指定された文字がタイトル・ケース文字かどうかを判定します。
|
static boolean |
isTitleCase(int codePoint) |
指定された文字(Unicodeコード・ポイント)がタイトル・ケース文字かどうかを判定します。
|
static boolean |
isUnicodeIdentifierPart(char ch) |
指定された文字をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。
|
static boolean |
isUnicodeIdentifierPart(int codePoint) |
指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。
|
static boolean |
isUnicodeIdentifierStart(char ch) |
指定された文字をUnicode識別子の最初の文字として指定可能かどうかを判定します。
|
static boolean |
isUnicodeIdentifierStart(int codePoint) |
指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字として指定可能かどうかを判定します。
|
static boolean |
isUpperCase(char ch) |
指定された文字が大文字がどうかを判定します。
|
static boolean |
isUpperCase(int codePoint) |
指定された文字(Unicodeコード・ポイント)が大文字かどうかを判定します。
|
static boolean |
isValidCodePoint(int codePoint) |
指定されたコード・ポイントが有効なUnicodeコード・ポイント値であるかどうかを判定します。
|
static boolean |
isWhitespace(char ch) |
指定された文字がJavaの基準に従った空白かどうかを判定します。
|
static boolean |
isWhitespace(int codePoint) |
指定された文字(Unicodeコード・ポイント)がJavaの基準に従った空白かどうかを判定します。
|
static char |
lowSurrogate(int codePoint) |
UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのトレーリング・サロゲート(下位サロゲート・コード単位)を返します。
|
static int |
offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset) |
指定された
char部分配列内で、指定されたindexからcodePointOffsetコード・ポイント分だけオフセットされた位置のインデックスを返します。 |
static int |
offsetByCodePoints(CharSequence seq, int index, int codePointOffset) |
指定された文字シーケンス内で、指定された
indexからcodePointOffsetコード・ポイント分だけオフセットされた位置のインデックスを返します。 |
static char |
reverseBytes(char ch) |
指定されたchar値でバイト順を逆にして取得した値を返します。
|
static char[] |
toChars(int codePoint) |
指定された文字(Unicodeコード・ポイント)を
char配列に格納されるUTF-16表現に変換します。 |
static int |
toChars(int codePoint, char[] dst, int dstIndex) |
指定された文字(Unicodeコード・ポイント)をUTF-16表現に変換します。
|
static int |
toCodePoint(char high, char low) |
指定されたサロゲート・ペアをその補助コード・ポイント値に変換します。
|
static char |
toLowerCase(char ch) |
UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を小文字に変換します。
|
static int |
toLowerCase(int codePoint) |
UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を小文字に変換します。
|
String |
toString() |
この
Characterの値を表すStringオブジェクトを返します。 |
static String |
toString(char c) |
指定された
charを表すStringオブジェクトを返します。 |
static char |
toTitleCase(char ch) |
UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数をタイトル・ケースに変換します。
|
static int |
toTitleCase(int codePoint) |
UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数をタイトル・ケースに変換します。
|
static char |
toUpperCase(char ch) |
UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を大文字に変換します。
|
static int |
toUpperCase(int codePoint) |
UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を大文字に変換します。
|
static Character |
valueOf(char c) |
指定されたchar値を表すCharacterインスタンスを返します。
|
public static final int MIN_RADIX
Integerクラスのdigitメソッド、forDigitメソッド、およびtoStringメソッドなどの基数変換メソッドの最小許容値です。 public static final int MAX_RADIX
Integerクラスのdigitメソッド、forDigitメソッド、およびtoStringメソッドなどの基数変換メソッドの最大許容値です。 public static final char MIN_VALUE
char型の最小値'\u0000'です。public static final char MAX_VALUE
char型の最大値'\uFFFF'です。public static final byte UNASSIGNED
public static final byte UPPERCASE_LETTER
public static final byte LOWERCASE_LETTER
public static final byte TITLECASE_LETTER
public static final byte MODIFIER_LETTER
public static final byte OTHER_LETTER
public static final byte NON_SPACING_MARK
public static final byte ENCLOSING_MARK
public static final byte COMBINING_SPACING_MARK
public static final byte DECIMAL_DIGIT_NUMBER
public static final byte LETTER_NUMBER
public static final byte OTHER_NUMBER
public static final byte SPACE_SEPARATOR
public static final byte LINE_SEPARATOR
public static final byte PARAGRAPH_SEPARATOR
public static final byte CONTROL
public static final byte FORMAT
public static final byte PRIVATE_USE
public static final byte SURROGATE
public static final byte DASH_PUNCTUATION
public static final byte START_PUNCTUATION
public static final byte END_PUNCTUATION
public static final byte CONNECTOR_PUNCTUATION
public static final byte OTHER_PUNCTUATION
public static final byte MATH_SYMBOL
public static final byte CURRENCY_SYMBOL
public static final byte MODIFIER_SYMBOL
public static final byte OTHER_SYMBOL
public static final byte INITIAL_QUOTE_PUNCTUATION
public static final byte FINAL_QUOTE_PUNCTUATION
public static final byte DIRECTIONALITY_UNDEFINED
char値の方向性は定義されていません。 public static final byte DIRECTIONALITY_LEFT_TO_RIGHT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
public static final byte DIRECTIONALITY_ARABIC_NUMBER
public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_NONSPACING_MARK
public static final byte DIRECTIONALITY_BOUNDARY_NEUTRAL
public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
public static final byte DIRECTIONALITY_SEGMENT_SEPARATOR
public static final byte DIRECTIONALITY_WHITESPACE
public static final byte DIRECTIONALITY_OTHER_NEUTRALS
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static final char MIN_HIGH_SURROGATE
'\uD800')。 上位サロゲートは、リーディング・サロゲートともいいます。 public static final char MAX_HIGH_SURROGATE
'\uDBFF')。 上位サロゲートは、リーディング・サロゲートともいいます。 public static final char MIN_LOW_SURROGATE
'\uDC00')。 下位サロゲートは、トレーリング・サロゲートともいいます。 public static final char MAX_LOW_SURROGATE
'\uDFFF')。 下位サロゲートは、トレーリング・サロゲートともいいます。 public static final char MIN_SURROGATE
'\uD800')。public static final char MAX_SURROGATE
'\uDFFF')。public static final int MIN_SUPPLEMENTARY_CODE_POINT
U+10000)。public static final int MIN_CODE_POINT
U+0000)。public static final int MAX_CODE_POINT
U+10FFFF)。public static final int SIZE
16)。public static final int BYTES
char値を表すために使用されるバイト数。public Character(char value)
char値を表す、新しく割り当てられたCharacterオブジェクトを構築します。value - Characterオブジェクトによって表される値。public static Character valueOf(char c)
Character(char)に優先して使用されます。その理由は、このメソッドが頻繁に要求される値をキャッシュするので、操作に必要な領域や時間がはるかに少なくて済む場合が多いためです。 このメソッドは、'\u0000'から'\u007F'の範囲(両端含む)の値を常にキャッシュしますが、この範囲に含まれないその他の値をキャッシュすることもあります。 c - char値。public char charValue()
Characterオブジェクトの値を返します。char値。public int hashCode()
Characterのハッシュ・コード(charValue()を呼び出した場合の結果と等しくなる)を返します。hashCode、クラスObjectCharacterのハッシュ・コード値Object.equals(java.lang.Object), System.identityHashCode(java.lang.Object)public static int hashCode(char value)
Character.hashCode()との互換性がある、char値のハッシュ・コードを返します。value - ハッシュ・コードが返されるchar。char値のハッシュ・コード値。public boolean equals(Object obj)
trueになるのは、引数がnullではなく、このオブジェクトと同じchar値を表すCharacterオブジェクトである場合だけです。 equals、クラスObjectobj - 比較対象のオブジェクトtrue、そうでない場合はfalse。Object.hashCode()、HashMappublic String toString()
Characterの値を表すStringオブジェクトを返します。 結果は、長さ1の文字列(構成要素はCharacterオブジェクトにより表されるプリミティブ型のchar値だけ)になります。 public static String toString(char c)
charを表すStringオブジェクトを返します。 結果は、指定されたcharだけで構成される長さ1の文字列になります。 c - 変換するcharcharの文字列表現public static boolean isValidCodePoint(int codePoint)
codePoint - 判定対象のUnicodeコード・ポイントMIN_CODE_POINT - MAX_CODE_POINTの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse。public static boolean isBmpCodePoint(int codePoint)
charを使って表せます。 public static boolean isSupplementaryCodePoint(int codePoint)
codePoint - 判定対象の文字(Unicodeコード・ポイント)MIN_SUPPLEMENTARY_CODE_POINT - MAX_CODE_POINTの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse。public static boolean isHighSurrogate(char ch)
char値がUnicode上位サロゲート・コード単位 (リーディング・サロゲート・コード単位ともいう)であるかどうかを判定します。
これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。
ch - 判定されるchar値。charの値がMIN_HIGH_SURROGATE - MAX_HIGH_SURROGATEの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse。isLowSurrogate(char), Character.UnicodeBlock.of(int)public static boolean isLowSurrogate(char ch)
char値がUnicode下位サロゲート・コード単位 (トレーリング・サロゲート・コード単位ともいう)であるかどうかを判定します。
これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。
ch - 判定されるchar値。char値がMIN_LOW_SURROGATE - MAX_LOW_SURROGATEの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse。isHighSurrogate(char)public static boolean isSurrogate(char ch)
char値がUnicode サロゲート・コード単位かどうかを判定します。
これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。
char値がサロゲート・コード単位になるのは、それが下位サロゲート・コード単位と上位サロゲート・コード単位のいずれかである場合だけです。
ch - 判定されるchar値。char値がMIN_SURROGATE - MAX_SURROGATEの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse。public static boolean isSurrogatePair(char high,
char low)
char値のペアが有効なUnicodeサロゲート・ペアであるかどうかを判定します。
このメソッドは次の式と等価です。
isHighSurrogate(high) && isLowSurrogate(low)
high - 判定対象の上位サロゲート・コード値low - 判定対象の下位サロゲート・コード値true、そうでない場合はfalse。public static int charCount(int codePoint)
char値の数を判定します。 このメソッドは、指定された文字が0x10000以上である場合は2を返します。 それ以外の場合は1を返します。
このメソッドは、指定された文字が有効なUnicodeコード・ポイントであることを検証しません。 呼出し側で、必要に応じてisValidCodePointを使用して、文字値を検証する必要があります。
codePoint - 判定対象の文字(Unicodeコード・ポイント)。isSupplementaryCodePoint(int)public static int toCodePoint(char high,
char low)
isSurrogatePairを使って検証する必要があります。 high - 上位サロゲート・コード単位low - 下位サロゲート・コード単位public static int codePointAt(CharSequence seq, int index)
CharSequenceの指定されたインデックスにあるコード・ポイントを返します。 CharSequence内の指定されたインデックス位置のchar値が上位サロゲート範囲に含まれており、それに続くインデックスがCharSequenceの長さ未満であり、かつそのインデックス位置のchar値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar値が返されます。 seq - char値のシーケンス(Unicodeコード単位)index - 変換されるseq内のchar値(Unicodeコード単位)へのインデックスNullPointerException - seqがnullである場合。IndexOutOfBoundsException - 値indexが負であるかseq.length()以上である場合。public static int codePointAt(char[] a,
int index)
char配列の指定されたインデックスにあるコード・ポイントを返します。 char配列内の指定されたインデックス位置のchar値が上位サロゲート範囲に含まれており、それに続くインデックスがchar配列の長さ未満であり、かつそのインデックス位置のchar値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar値が返されます。 a - char配列index - 変換されるchar配列内のchar値(Unicodeコード単位)へのインデックスNullPointerException - aがnullである場合。IndexOutOfBoundsException - indexが負の値、またはchar配列の長さ以上の値である場合。public static int codePointAt(char[] a,
int index,
int limit)
limitの長さ未満のindexを持つ配列要素のみを使用可能な、char配列の指定されたインデックスにあるコード・ポイントを返します。 char配列内の指定されたインデックス位置のchar値が上位サロゲート範囲に含まれており、それに続くインデックスがlimit未満であり、かつそのインデックス位置のchar値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar値が返されます。 a - char配列index - 変換されるchar配列内のchar値(Unicodeコード単位)へのインデックスlimit - char配列で使用可能な最後の配列要素の後ろのインデックスNullPointerException - aがnullである場合。IndexOutOfBoundsException - index引数が負の値またはlimit引数以上である場合、またはlimit引数が負の値またはchar配列の長さより大きい場合。public static int codePointBefore(CharSequence seq, int index)
CharSequenceの指定されたインデックスの前にあるコード・ポイントを返します。 CharSequence内の(index - 1)のchar値が下位サロゲート範囲に含まれており、(index - 2)が負でなく、かつCharSequence内の(index - 2)のchar値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)のchar値が返されます。 seq - CharSequenceインスタンスindex - 返すべきコード・ポイントの直後のインデックスNullPointerException - seqがnullである場合。IndexOutOfBoundsException - index引数が1より小さいかseq.length()より大きい場合。public static int codePointBefore(char[] a,
int index)
char配列の指定されたインデックスの前にあるコード・ポイントを返します。 char配列内の(index - 1)のchar値が下位サロゲート範囲に含まれており、(index - 2)が負でなく、かつchar配列内の(index - 2)のchar値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)のchar値が返されます。 a - char配列index - 返すべきコード・ポイントの直後のインデックスNullPointerException - aがnullである場合。IndexOutOfBoundsException - index引数が1未満であるか、またはchar配列の長さより大きい値の場合public static int codePointBefore(char[] a,
int index,
int start)
start以上のindexを持つ配列要素のみを使用可能な、char配列の指定されたインデックスの前にあるコード・ポイントを返します。 char配列内の(index - 1)のchar値が下位サロゲート範囲に含まれており、(index - 2)がstart以上であり、かつchar配列内の(index - 2)のchar値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)のchar値が返されます。 a - char配列index - 返すべきコード・ポイントの直後のインデックスstart - char配列の最初の配列要素のインデックスNullPointerException - aがnullである場合。IndexOutOfBoundsException - index引数がstart引数以下であるかchar配列の長さより大きい場合、またはstart引数が負の値であるかchar配列の長さ以上である場合。public static char highSurrogate(int codePoint)
charが返されます。
isSupplementaryCodePoint(x)がtrueの場合、isHighSurrogate(highSurrogate(x))およびtoCodePoint(highSurrogate(x), lowSurrogate(x))== xも常にtrueになります。
codePoint - 補助文字(Unicodeコード・ポイント)public static char lowSurrogate(int codePoint)
charが返されます。
isSupplementaryCodePoint(x)がtrueの場合、isLowSurrogate(lowSurrogate(x))およびtoCodePoint(highSurrogate(x), lowSurrogate(x))== xも常にtrueになります。
codePoint - 補助文字(Unicodeコード・ポイント)public static int toChars(int codePoint,
char[] dst,
int dstIndex)
dst[dstIndex]に格納され、1が返されます。 指定されたコード・ポイントが補助文字の場合は、サロゲート値がdst[dstIndex] (上位サロゲート)とdst[dstIndex+1] (下位サロゲート)に格納され、2が返されます。 codePoint - 変換対象の文字(Unicodeコード・ポイント)。dst - codePointのUTF-16値が格納されるcharの配列。dstIndex - 変換された値が格納されるdst配列の開始インデックス。IllegalArgumentException - 指定されたcodePointが有効なUnicodeコード・ポイントでない場合。NullPointerException - 指定されたdstがnullの場合。IndexOutOfBoundsException - dstIndexが負の値であるかdst.length以上である場合、またはdstIndex位置のdstが結果として得られるchar値を格納する十分な配列要素を持たない場合。 (dstIndexがdst.length-1と等価で、指定されたcodePointが補助文字の場合、上位サロゲート値はdst[dstIndex]に格納されない。) public static char[] toChars(int codePoint)
char配列に格納されるUTF-16表現に変換します。 指定されたコード・ポイントがBMP (基本多言語面または第0面)値の場合、結果として得られるchar配列はcodePointと同じ値を持ちます。 指定されたコード・ポイントが補助コード・ポイントの場合は、結果として得られるchar配列は対応するサロゲート・ペアを持ちます。 codePoint - Unicodeコード・ポイントcodePointのUTF-16表現を持つchar配列。IllegalArgumentException - 指定されたcodePointが有効なUnicodeコード・ポイントでない場合。public static int codePointCount(CharSequence seq, int beginIndex, int endIndex)
beginIndexからインデックスendIndex - 1の位置のcharまでです。 したがって、テキスト範囲の長さ(char数)は、endIndex-beginIndexになります。 テキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。 seq - 文字シーケンスbeginIndex - テキスト範囲内の最初のcharへのインデックスendIndex - テキスト範囲内の最後のcharの直後のインデックスNullPointerException - seqがnullである場合。IndexOutOfBoundsException - beginIndexが負であるか、endIndexが指定されたシーケンスの長さより大きいか、あるいはbeginIndexがendIndexより大きい場合。public static int codePointCount(char[] a,
int offset,
int count)
char配列引数の部分配列内にあるUnicodeコード・ポイントの数を返します。 offset引数は、部分配列の最初のcharのインデックスであり、count引数はchar間の部分配列の長さを指定します。 部分配列内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。 a - char配列offset - 指定されたchar配列の最初のcharのインデックスcount - 部分配列の長さ(char数)NullPointerException - aがnullである場合。IndexOutOfBoundsException - offsetまたはcountが負の場合、またはoffset+countが指定された配列の長さより大きい場合。public static int offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
indexからcodePointOffsetコード・ポイント分だけオフセットされた位置のインデックスを返します。 indexとcodePointOffsetで指定されるテキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。 seq - 文字シーケンスindex - オフセットされるインデックスcodePointOffset - オフセット(コード・ポイント数)NullPointerException - seqがnullである場合。IndexOutOfBoundsException - indexが負の値または文字シーケンスの長さよりも大きい場合、codePointOffsetが正の値でありindexで始まるサブシーケンスの持つコード・ポイント数がcodePointOffsetコード・ポイント数よりも少ない場合、あるいはcodePointOffsetが負の値でindexの前のサブシーケンスの持つ値がcodePointOffsetコード・ポイントの絶対値よりも小さい場合。public static int offsetByCodePoints(char[] a,
int start,
int count,
int index,
int codePointOffset)
char部分配列内で、指定されたindexからcodePointOffsetコード・ポイント分だけオフセットされた位置のインデックスを返します。 startおよびcount引数は、char配列の部分配列を指定します。 indexとcodePointOffsetで指定されるテキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。 a - char配列start - 部分配列内の最初のcharのインデックスcount - 部分配列の長さ(char数)index - オフセットされるインデックスcodePointOffset - オフセット(コード・ポイント数)NullPointerException - aがnullである場合。IndexOutOfBoundsException - startまたはcountが負の場合、またはstart+countが指定された配列の長さより大きい場合、またはindexがstartより小さいかstart+countより大きい場合、またはcodePointOffsetが正で、indexから始まりstart+count - 1で終わるテキスト範囲内のコード・ポイント数がcodePointOffsetコード・ポイント数より少ない場合、またはcodePointOffsetが負で、startから始まりindex - 1で終わるテキスト範囲内のコード・ポイント数がcodePointOffsetコード・ポイントの絶対値より少ない場合。public static boolean isLowerCase(char ch)
ある文字が小文字になるのは、Character.getType(ch)によって提供される汎用カテゴリ型がLOWERCASE_LETTERである場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Lowercaseを持つ場合です。
小文字の例を次に示します。
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
Unicode文字には、ほかにも多数の小文字が存在します。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isLowerCase(int)メソッドを使用してください。
ch - 判定対象の文字。true、そうでない場合はfalse。isLowerCase(char), isTitleCase(char), toLowerCase(char), getType(char)public static boolean isLowerCase(int codePoint)
ある文字が小文字になるのは、getType(codePoint)によって提供される汎用カテゴリ型がLOWERCASE_LETTERである場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Lowercaseを持つ場合です。
小文字の例を次に示します。
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
Unicode文字には、ほかにも多数の小文字が存在します。
codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、そうでない場合はfalse。isLowerCase(int), isTitleCase(int), toLowerCase(int), getType(int)public static boolean isUpperCase(char ch)
ある文字が大文字になるのは、Character.getType(ch)によって提供される汎用カテゴリ型がUPPERCASE_LETTERである場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Uppercaseを持つ場合です。
大文字の例を次に示します。
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
Unicode文字には、ほかにも多数の大文字が存在します。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isUpperCase(int)メソッドを使用してください。
ch - 判定対象の文字。true、そうでない場合はfalse。isLowerCase(char), isTitleCase(char), toUpperCase(char), getType(char)public static boolean isUpperCase(int codePoint)
ある文字が大文字になるのは、getType(codePoint)によって提供される汎用カテゴリ型がUPPERCASE_LETTERである場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Uppercaseを持つ場合です。
大文字の例を次に示します。
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
Unicode文字には、ほかにも多数の大文字が存在します。
codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、そうでない場合はfalse。isLowerCase(int), isTitleCase(int), toUpperCase(int), getType(int)public static boolean isTitleCase(char ch)
Character.getType(ch)により示される汎用カテゴリ型がTITLECASE_LETTERの場合、文字はタイトル・ケース文字になります。
文字の中には、ラテン文字のペアのように見えるものがあります。 たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。 「Lj」のように見える3つ目の形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。
次に示すのは、このメソッドがtrueを返すUnicode文字の一部です。
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
Unicode文字には、ほかにも多数のタイトル・ケース文字が存在します。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isTitleCase(int)メソッドを使用してください。
ch - 判定対象の文字。true、そうでない場合はfalse。isLowerCase(char), isUpperCase(char), toTitleCase(char), getType(char)public static boolean isTitleCase(int codePoint)
getType(codePoint)により示される汎用カテゴリ型がTITLECASE_LETTERの場合、文字はタイトル・ケース文字になります。
文字の中には、ラテン文字のペアのように見えるものがあります。 たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。 「Lj」のように見える3つ目の形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。
次に示すのは、このメソッドがtrueを返すUnicode文字の一部です。
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
Unicode文字には、ほかにも多数のタイトル・ケース文字が存在します。
codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、そうでない場合はfalse。isLowerCase(int), isUpperCase(int), toTitleCase(int), getType(int)public static boolean isDigit(char ch)
Character.getType(ch)により示される汎用カテゴリ型がDECIMAL_DIGIT_NUMBERの場合、文字は数字になります。
Unicode文字範囲の中には、次の数字を含むものがあります。
'\u0030' - '\u0039'、ISO-LATIN-1数字('0' - '9')
'\u0660' - '\u0669'、アラビア数字
'\u06F0' - '\u06F9'、拡張アラビア数字
'\u0966' - '\u096F'、デヴァーナーガリ数字
'\uFF10' - '\uFF19'、全角数字
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isDigit(int)メソッドを使用してください。
ch - 判定対象の文字。true、そうでない場合はfalse。digit(char, int), forDigit(int, int), getType(char)public static boolean isDigit(int codePoint)
getType(codePoint)により示される汎用カテゴリ型がDECIMAL_DIGIT_NUMBERの場合、文字は数字になります。
Unicode文字範囲の中には、次の数字を含むものがあります。
'\u0030' - '\u0039'、ISO-LATIN-1数字('0' - '9')
'\u0660' - '\u0669'、アラビア数字
'\u06F0' - '\u06F9'、拡張アラビア数字
'\u0966' - '\u096F'、デヴァーナーガリ数字
'\uFF10' - '\uFF19'、全角数字
codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、そうでない場合はfalse。forDigit(int, int), getType(int)public static boolean isDefined(char ch)
少なくとも次のいずれかに当てはまる場合、文字は定義されています。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isDefined(int)メソッドを使用してください。
ch - 判定対象の文字true、そうでない場合はfalse。isDigit(char), isLetter(char), isLetterOrDigit(char), isLowerCase(char), isTitleCase(char), isUpperCase(char)public static boolean isDefined(int codePoint)
少なくとも次のいずれかに当てはまる場合、文字は定義されています。
codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、そうでない場合はfalse。isDigit(int), isLetter(int), isLetterOrDigit(int), isLowerCase(int), isTitleCase(int), isUpperCase(int)public static boolean isLetter(char ch)
Character.getType(ch)の示す汎用カテゴリ型が次のどれかの場合に、文字は汎用文字と見なされます。
UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isLetter(int)メソッドを使用してください。
ch - 判定対象の文字。true、そうでない場合はfalse。isDigit(char), isJavaIdentifierStart(char), isJavaLetter(char), isJavaLetterOrDigit(char), isLetterOrDigit(char), isLowerCase(char), isTitleCase(char), isUnicodeIdentifierStart(char), isUpperCase(char)public static boolean isLetter(int codePoint)
getType(codePoint)の示す汎用カテゴリ型が次のどれかの場合に、文字は汎用文字と見なされます。
UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、そうでない場合はfalse。isDigit(int), isJavaIdentifierStart(int), isLetterOrDigit(int), isLowerCase(int), isTitleCase(int), isUnicodeIdentifierStart(int), isUpperCase(int)public static boolean isLetterOrDigit(char ch)
ある文字が文字または数字とみなされるのは、その文字のCharacter.isLetter(char ch)またはCharacter.isDigit(char ch)からtrueが返される場合です。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isLetterOrDigit(int)メソッドを使用してください。
ch - 判定対象の文字。true、そうでない場合はfalse。isDigit(char), isJavaIdentifierPart(char), isJavaLetter(char), isJavaLetterOrDigit(char), isLetter(char), isUnicodeIdentifierPart(char)public static boolean isLetterOrDigit(int codePoint)
ある文字が文字または数字とみなされるのは、その文字のisLetter(codePoint)またはisDigit(codePoint)からtrueが返される場合です。
codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、そうでない場合はfalse。isDigit(int), isJavaIdentifierPart(int), isLetter(int), isUnicodeIdentifierPart(int)@Deprecated public static boolean isJavaLetter(char ch)
次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。
isLetter(ch)がtrueを返す
getType(ch)がLETTER_NUMBERを返す
chが通貨記号である('$'など)
chが連結句読点文字である('_'など)
ch - 判定対象の文字。true、そうでない場合はfalse。isJavaLetterOrDigit(char), isJavaIdentifierStart(char), isJavaIdentifierPart(char), isLetter(char), isLetterOrDigit(char), isUnicodeIdentifierStart(char)@Deprecated public static boolean isJavaLetterOrDigit(char ch)
次のいずれかの条件に当てはまる場合にのみ、その文字をJava識別子の一部に指定できます。
'$'など)
'_'など)
isIdentifierIgnorableがtrueを返す。
ch - 判定対象の文字。true、そうでない場合はfalse。isJavaLetter(char), isJavaIdentifierStart(char), isJavaIdentifierPart(char), isLetter(char), isLetterOrDigit(char), isUnicodeIdentifierPart(char), isIdentifierIgnorable(char)public static boolean isAlphabetic(int codePoint)
getType(codePoint)の示す汎用カテゴリ型が次のどれかの場合に、文字はアルファベットと見なされます。
UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
LETTER_NUMBER
codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、そうでない場合はfalse。public static boolean isIdeographic(int codePoint)
codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、そうでない場合はfalse。public static boolean isJavaIdentifierStart(char ch)
次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。
isLetter(ch)がtrueを返す
getType(ch)がLETTER_NUMBERを返す
chが通貨記号である('$'など)
chが連結句読点文字である('_'など)
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isJavaIdentifierStart(int)メソッドを使用してください。
ch - 判定対象の文字。true、そうでない場合はfalse。isJavaIdentifierPart(char), isLetter(char), isUnicodeIdentifierStart(char), SourceVersion.isIdentifier(CharSequence)public static boolean isJavaIdentifierStart(int codePoint)
次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。
isLetter(codePoint)はtrueを返す
getType(codePoint)はLETTER_NUMBERを返す
'$'など)
'_'など)
codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、そうでない場合はfalse。isJavaIdentifierPart(int), isLetter(int), isUnicodeIdentifierStart(int), SourceVersion.isIdentifier(CharSequence)public static boolean isJavaIdentifierPart(char ch)
次のいずれかの条件に当てはまる場合、その文字をJava識別子の一部に指定できます。
'$'など)
'_'など)
isIdentifierIgnorableがtrueを返す
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isJavaIdentifierPart(int)メソッドを使用してください。
ch - 判定対象の文字。true、そうでない場合はfalse。isIdentifierIgnorable(char), isJavaIdentifierStart(char), isLetterOrDigit(char), isUnicodeIdentifierPart(char), SourceVersion.isIdentifier(CharSequence)public static boolean isJavaIdentifierPart(int codePoint)
次のいずれかの条件に当てはまる場合、その文字をJava識別子の一部に指定できます。
'$'など)
'_'など)
isIdentifierIgnorable(codePoint)がコード・ポイントについてtrueを返す
codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、そうでない場合はfalse。isIdentifierIgnorable(int), isJavaIdentifierStart(int), isLetterOrDigit(int), isUnicodeIdentifierPart(int), SourceVersion.isIdentifier(CharSequence)public static boolean isUnicodeIdentifierStart(char ch)
次の条件のどれかに当てはまる場合にだけ、その文字をUnicode識別子の最初に指定できます。
isLetter(ch)がtrueを返す
getType(ch)がLETTER_NUMBERを返す。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isUnicodeIdentifierStart(int)メソッドを使用してください。
ch - 判定対象の文字。true、そうでない場合はfalse。isJavaIdentifierStart(char), isLetter(char), isUnicodeIdentifierPart(char)public static boolean isUnicodeIdentifierStart(int codePoint)
次の条件のどれかに当てはまる場合にだけ、その文字をUnicode識別子の最初に指定できます。
isLetter(codePoint)はtrueを返す
getType(codePoint)がLETTER_NUMBERを返す。
codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、そうでない場合はfalse。isJavaIdentifierStart(int), isLetter(int), isUnicodeIdentifierPart(int)public static boolean isUnicodeIdentifierPart(char ch)
次の文のどれかに当てはまる場合にだけ、その文字をUnicode識別子の一部に使用できます。
'_'など)
isIdentifierIgnorableがtrueを返す。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isUnicodeIdentifierPart(int)メソッドを使用してください。
ch - 判定対象の文字。true、そうでない場合はfalse。isIdentifierIgnorable(char), isJavaIdentifierPart(char), isLetterOrDigit(char), isUnicodeIdentifierStart(char)public static boolean isUnicodeIdentifierPart(int codePoint)
次の文のどれかに当てはまる場合にだけ、その文字をUnicode識別子の一部に使用できます。
'_'など)
isIdentifierIgnorableがtrueを返す。
codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、そうでない場合はfalse。isIdentifierIgnorable(int), isJavaIdentifierPart(int), isLetterOrDigit(int), isUnicodeIdentifierStart(int)public static boolean isIdentifierIgnorable(char ch)
次のUnicode文字は、Java識別子やUnicode識別子内で無視できます。
'\u0000' - '\u0008'
'\u000E' - '\u001B'
'\u007F' - '\u009F'
FORMATを保持するすべての文字
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isIdentifierIgnorable(int)メソッドを使用してください。
ch - 判定対象の文字。true、それ以外の場合はfalse。isJavaIdentifierPart(char), isUnicodeIdentifierPart(char)public static boolean isIdentifierIgnorable(int codePoint)
次のUnicode文字は、Java識別子やUnicode識別子内で無視できます。
'\u0000' - '\u0008'
'\u000E' - '\u001B'
'\u007F' - '\u009F'
FORMATを保持するすべての文字
codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、それ以外の場合はfalse。isJavaIdentifierPart(int), isUnicodeIdentifierPart(int)public static char toLowerCase(char ch)
Character.isLowerCase(Character.toLowerCase(ch))は、ある範囲の文字(特に表意文字や記号)に対して常にtrueを返すわけではありません。
一般に、文字を小文字にマッピングする際にはString.toLowerCase()を使用するようにしてください。 Stringのケース・マッピング・メソッドにはCharacterのケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、Stringのケース・マッピング・メソッドでは実行できますが、Characterのケース・マッピング・メソッドでは実行できません。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、toLowerCase(int)メソッドを使用してください。
ch - 変換対象の文字。isLowerCase(char), String.toLowerCase()public static int toLowerCase(int codePoint)
Character.isLowerCase(Character.toLowerCase(codePoint))は、ある範囲の文字(特に表意文字や記号)に対して常にtrueを返すわけではありません。
一般に、文字を小文字にマッピングする際にはString.toLowerCase()を使用するようにしてください。 Stringのケース・マッピング・メソッドにはCharacterのケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、Stringのケース・マッピング・メソッドでは実行できますが、Characterのケース・マッピング・メソッドでは実行できません。
codePoint - 変換対象の文字(Unicodeコード・ポイント)。isLowerCase(int), String.toLowerCase()public static char toUpperCase(char ch)
Character.isUpperCase(Character.toUpperCase(ch))は、ある範囲の文字(特に表意文字や記号)に対して常にtrueを返すわけではありません。
一般に、文字を大文字にマッピングする際にはString.toUpperCase()を使用するようにしてください。 Stringのケース・マッピング・メソッドにはCharacterのケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、Stringのケース・マッピング・メソッドでは実行できますが、Characterのケース・マッピング・メソッドでは実行できません。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、toUpperCase(int)メソッドを使用してください。
ch - 変換対象の文字。isUpperCase(char), String.toUpperCase()public static int toUpperCase(int codePoint)
Character.isUpperCase(Character.toUpperCase(codePoint))は、ある範囲の文字(特に表意文字や記号)に対して常にtrueを返すわけではありません。
一般に、文字を大文字にマッピングする際にはString.toUpperCase()を使用するようにしてください。 Stringのケース・マッピング・メソッドにはCharacterのケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、Stringのケース・マッピング・メソッドでは実行できますが、Characterのケース・マッピング・メソッドでは実行できません。
codePoint - 変換対象の文字(Unicodeコード・ポイント)。isUpperCase(int), String.toUpperCase()public static char toTitleCase(char ch)
char引数がタイトル・ケースcharである場合には、同じchar値が返されます。
Character.isTitleCase(Character.toTitleCase(ch))は、ある範囲の文字に対して常にtrueを返すわけではありません。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、toTitleCase(int)メソッドを使用してください。
ch - 変換対象の文字。isTitleCase(char), toLowerCase(char), toUpperCase(char)public static int toTitleCase(int codePoint)
Character.isTitleCase(Character.toTitleCase(codePoint))は、ある範囲の文字に対して常にtrueを返すわけではありません。
codePoint - 変換対象の文字(Unicodeコード・ポイント)。isTitleCase(int), toLowerCase(int), toUpperCase(int)public static int digit(char ch,
int radix)
chの数値としての値を返します。
基数がMIN_RADIX≤radix≤MAX_RADIXの範囲外の場合、またはchの値が指定された基数の有効数字でない場合は、-1が返されます。 次のどれかに当てはまる場合、文字は有効数字です。
isDigitがtrueを返し、その文字のUnicode 10進数値(または単一文字の分解)が指定された基数よりも小さい。 この場合、10進値が返される。
'A' - 'Z'のラテン大文字のどれかで、そのコードがradix+'A' - 10よりも小さい。 この場合、ch - 'A'+10が返される。
'a' - 'z'のラテン小文字のどれかで、そのコードがradix+'a' - 10よりも小さい。 この場合、ch - 'a'+10が返される。
'\uFF21') - Z ('\uFF3A')の全角ラテン大文字のどれかで、そのコードがradix+'\uFF21' - 10よりも小さい。 この場合、ch - '\uFF21'+10が返される。
'\uFF41') - z ('\uFF5A')の全角ラテン小文字のどれかで、そのコードがradix+'\uFF41' - 10よりも小さい。 この場合、ch - '\uFF41'+10が返される。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、digit(int, int)メソッドを使用してください。
ch - 変換対象の文字。radix - 基数。forDigit(int, int), isDigit(char)public static int digit(int codePoint,
int radix)
基数がMIN_RADIX≤radix≤MAX_RADIXの範囲外の場合、または文字が指定された基数の有効数字でない場合は、-1が返されます。 次のどれかに当てはまる場合、文字は有効数字です。
isDigit(codePoint)がtrueを返し、その文字のUnicode 10進数値(または単一文字の分解)が指定された基数よりも小さい。 この場合、10進値が返される。
'A' - 'Z'のラテン大文字のどれかで、そのコードがradix+'A' - 10よりも小さい。 この場合、codePoint - 'A'+10が返される。
'a' - 'z'のラテン小文字のどれかで、そのコードがradix+'a' - 10よりも小さい。 この場合、codePoint - 'a'+10が返される。
'\uFF21') - Z ('\uFF3A')の全角ラテン大文字のどれかで、そのコードがradix+'\uFF21' - 10よりも小さい。 この場合、codePoint - '\uFF21'+10が返される。
'\uFF41') - z ('\uFF5A')の全角ラテン小文字のどれかで、そのコードがradix+'\uFF41'- 10よりも小さい。 この場合、codePoint - '\uFF41'+10が返される。
codePoint - 変換対象の文字(Unicodeコード・ポイント)。radix - 基数。forDigit(int, int), isDigit(int)public static int getNumericValue(char ch)
int値を返します。 たとえば、文字'\u216C' (ローマ数字の50)は、値50のintを返します。
文字A - Zの大文字('\u0041' - '\u005A')、小文字('\u0061' - '\u007A')、全角バリアント('\uFF21' - '\uFF3A'および'\uFF41' - '\uFF5A')の各形式は、10 - 35の数値を持ちます。 これはUnicode仕様とは無関係であり、Unicode仕様ではこれらのchar値に数値は割り当てられません。
文字が数値を持たない場合は、-1が返されます。 文字の数値を負でない整数として表現できない場合(小数値など)は、-2が返されます。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、getNumericValue(int)メソッドを使用してください。
ch - 変換対象の文字。int型の数値の場合、文字の数値。文字が負でない整数以外の数値を持つ場合は -2、文字が数値を持たない場合は -1。forDigit(int, int), isDigit(char)public static int getNumericValue(int codePoint)
int値を返します。 たとえば、文字'\u216C' (ローマ数字の50)は、値50のintを返します。
文字A - Zの大文字('\u0041' - '\u005A')、小文字('\u0061' - '\u007A')、全角バリアント('\uFF21' - '\uFF3A'および'\uFF41' - '\uFF5A')の各形式は、10 - 35の数値を持ちます。 これはUnicode仕様とは無関係であり、Unicode仕様ではこれらのchar値に数値は割り当てられません。
文字が数値を持たない場合は、-1が返されます。 文字の数値を負でない整数として表現できない場合(小数値など)は、-2が返されます。
codePoint - 変換対象の文字(Unicodeコード・ポイント)。int型の数値の場合、文字の数値。文字が負でない整数以外の数値を持つ場合は -2、文字が数値を持たない場合は -1。forDigit(int, int), isDigit(int)@Deprecated public static boolean isSpace(char ch)
trueを返します。
'\t' | U+0009 |
HORIZONTAL TABULATION |
'\n' | U+000A |
NEW LINE |
'\f' | U+000C |
FORM FEED |
'\r' | U+000D |
CARRIAGE RETURN |
' ' | U+0020 |
SPACE |
ch - 判定対象の文字。true、そうでない場合はfalse。isSpaceChar(char), isWhitespace(char)public static boolean isSpaceChar(char ch)
SPACE_SEPARATOR
LINE_SEPARATOR
PARAGRAPH_SEPARATOR
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isSpaceChar(int)メソッドを使用してください。
ch - 判定対象の文字。true、そうでない場合はfalse。isWhitespace(char)public static boolean isSpaceChar(int codePoint)
codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、そうでない場合はfalse。isWhitespace(int)public static boolean isWhitespace(char ch)
SPACE_SEPARATOR、LINE_SEPARATOR、またはPARAGRAPH_SEPARATOR)であるが、改行なしの空白('\u00A0'、'\u2007'、'\u202F')ではない。
'\t' (U+0009水平タブ)である。
'\n' (U+000A改行)である。
'\u000B' (U+000B垂直タブ)である。
'\f' (U+000Cフォーム・フィード)である。
'\r' (U+000D復帰)である。
'\u001C' (U+001Cファイル区切り文字)である。
'\u001D' (U+001Dグループ区切り文字)である。
'\u001E' (U+001Eレコード区切り文字)である。
'\u001F' (U+001F単位区切り文字)である。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isWhitespace(int)メソッドを使用してください。
ch - 判定対象の文字。true、そうでない場合はfalse。isSpaceChar(char)public static boolean isWhitespace(int codePoint)
SPACE_SEPARATOR、LINE_SEPARATOR、またはPARAGRAPH_SEPARATOR)であるが、改行なしの空白('\u00A0'、'\u2007'、'\u202F')ではない。
'\t' (U+0009水平タブ)である。
'\n' (U+000A改行)である。
'\u000B' (U+000B垂直タブ)である。
'\f' (U+000Cフォーム・フィード)である。
'\r' (U+000D復帰)である。
'\u001C' (U+001Cファイル区切り文字)である。
'\u001D' (U+001Dグループ区切り文字)である。
'\u001E' (U+001Eレコード区切り文字)である。
'\u001F' (U+001F単位区切り文字)である。
codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、そうでない場合はfalse。isSpaceChar(int)public static boolean isISOControl(char ch)
'\u0000' - '\u001F'の範囲、または'\u007F' - '\u009F'の範囲の場合は、ISO制御文字と見なされます。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isISOControl(int)メソッドを使用してください。
ch - 判定対象の文字。true、そうでない場合はfalse。isSpaceChar(char), isWhitespace(char)public static boolean isISOControl(int codePoint)
'\u0000' - '\u001F'の範囲、または'\u007F' - '\u009F'の範囲の場合は、ISO制御文字と見なされます。 codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、そうでない場合はfalse。isSpaceChar(int), isWhitespace(int)public static int getType(char ch)
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、getType(int)メソッドを使用してください。
ch - 判定対象の文字。int型の値。COMBINING_SPACING_MARK, CONNECTOR_PUNCTUATION, CONTROL, CURRENCY_SYMBOL, DASH_PUNCTUATION, DECIMAL_DIGIT_NUMBER, ENCLOSING_MARK, END_PUNCTUATION, FINAL_QUOTE_PUNCTUATION, FORMAT, INITIAL_QUOTE_PUNCTUATION, LETTER_NUMBER, LINE_SEPARATOR, LOWERCASE_LETTER, MATH_SYMBOL, MODIFIER_LETTER, MODIFIER_SYMBOL, NON_SPACING_MARK, OTHER_LETTER, OTHER_NUMBER, OTHER_PUNCTUATION, OTHER_SYMBOL, PARAGRAPH_SEPARATOR, PRIVATE_USE, SPACE_SEPARATOR, START_PUNCTUATION, SURROGATE, TITLECASE_LETTER, UNASSIGNED, UPPERCASE_LETTERpublic static int getType(int codePoint)
codePoint - 判定対象の文字(Unicodeコード・ポイント)。int型の値。COMBINING_SPACING_MARK, CONNECTOR_PUNCTUATION, CONTROL, CURRENCY_SYMBOL, DASH_PUNCTUATION, DECIMAL_DIGIT_NUMBER, ENCLOSING_MARK, END_PUNCTUATION, FINAL_QUOTE_PUNCTUATION, FORMAT, INITIAL_QUOTE_PUNCTUATION, LETTER_NUMBER, LINE_SEPARATOR, LOWERCASE_LETTER, MATH_SYMBOL, MODIFIER_LETTER, MODIFIER_SYMBOL, NON_SPACING_MARK, OTHER_LETTER, OTHER_NUMBER, OTHER_PUNCTUATION, OTHER_SYMBOL, PARAGRAPH_SEPARATOR, PRIVATE_USE, SPACE_SEPARATOR, START_PUNCTUATION, SURROGATE, TITLECASE_LETTER, UNASSIGNED, UPPERCASE_LETTERpublic static char forDigit(int digit,
int radix)
radixの値が無効な基数の場合、またはdigitが指定された基数で無効な数字の場合は、null文字('\u0000')が返されます。
radix引数は、MIN_RADIX以上MAX_RADIX以下の場合に有効です。 digit引数は、0 <= digit < radixの場合に有効です。
数字が10より小さいと、'0'+digitが返されます。 そうでない場合は、値'a'+digit - 10が返されます。
digit - 文字に変換する数。radix - 基数。char表現。MIN_RADIX, MAX_RADIX, digit(char, int)public static byte getDirectionality(char ch)
char値の方向性値はDIRECTIONALITY_UNDEFINEDです。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、getDirectionality(int)メソッドを使用してください。
ch - 方向性プロパティが要求されたchar。char値の方向性プロパティ。DIRECTIONALITY_UNDEFINED, DIRECTIONALITY_LEFT_TO_RIGHT, DIRECTIONALITY_RIGHT_TO_LEFT, DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC, DIRECTIONALITY_EUROPEAN_NUMBER, DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR, DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR, DIRECTIONALITY_ARABIC_NUMBER, DIRECTIONALITY_COMMON_NUMBER_SEPARATOR, DIRECTIONALITY_NONSPACING_MARK, DIRECTIONALITY_BOUNDARY_NEUTRAL, DIRECTIONALITY_PARAGRAPH_SEPARATOR, DIRECTIONALITY_SEGMENT_SEPARATOR, DIRECTIONALITY_WHITESPACE, DIRECTIONALITY_OTHER_NEUTRALS, DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING, DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE, DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING, DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE, DIRECTIONALITY_POP_DIRECTIONAL_FORMATpublic static byte getDirectionality(int codePoint)
DIRECTIONALITY_UNDEFINEDです。 codePoint - 方向性プロパティが要求された文字(Unicodeコード・ポイント)。DIRECTIONALITY_UNDEFINED, DIRECTIONALITY_LEFT_TO_RIGHT, DIRECTIONALITY_RIGHT_TO_LEFT, DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC, DIRECTIONALITY_EUROPEAN_NUMBER, DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR, DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR, DIRECTIONALITY_ARABIC_NUMBER, DIRECTIONALITY_COMMON_NUMBER_SEPARATOR, DIRECTIONALITY_NONSPACING_MARK, DIRECTIONALITY_BOUNDARY_NEUTRAL, DIRECTIONALITY_PARAGRAPH_SEPARATOR, DIRECTIONALITY_SEGMENT_SEPARATOR, DIRECTIONALITY_WHITESPACE, DIRECTIONALITY_OTHER_NEUTRALS, DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING, DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE, DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING, DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE, DIRECTIONALITY_POP_DIRECTIONAL_FORMATpublic static boolean isMirrored(char ch)
'\u0028' LEFT PARENTHESISは、セマンティックスでは開きカッコとして定義されています。 これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。
ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isMirrored(int)メソッドを使用してください。
ch - ミラー化プロパティが要求されたchartrue、charがミラー化されないか未定義の場合はfalse。public static boolean isMirrored(int codePoint)
'\u0028' LEFT PARENTHESISは、セマンティックスでは開きカッコとして定義されています。 これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。 codePoint - 判定対象の文字(Unicodeコード・ポイント)。true、文字がミラー化されないか未定義の場合はfalse。public int compareTo(Character anotherCharacter)
Characterオブジェクトを数値的に比較します。compareTo、インタフェースComparable<Character>anotherCharacter - 比較対象のCharacter。CharacterがこのCharacterと等しい場合は値0、このCharacterがCharacter引数より小さい数値の場合は0より小さい値、このCharacterがCharacter引数より大きい数値の場合は0より大きい値(符号なしの比較)。 これは完全に数値の比較なので、ロケールに依存しない public static int compare(char x,
char y)
char値を数値的に比較します。 返される値は、次から返される値と同じになります。
Character.valueOf(x).compareTo(Character.valueOf(y))
x - 比較する最初のchary - 比較する2番目のcharx == yの場合は値0、x < yの場合は0より小さい値、x> yの場合は0より大きい値public static char reverseBytes(char ch)
ch - そのバイト順を逆にするchar。public static String getName(int codePoint)
codePointのUnicode名(コード・ポイントがunassignedの場合はnull)を返します。
ノート: UnicodeDataファイル(Unicode Consortiumがメンテナンスを行っているUnicode Character Databaseの一部)で、指定された文字に名前が割り当てられていない場合、返される名前は次の式の結果と同じになります。
Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ENGLISH); codePoint - 文字(Unicodeコード・ポイント)IllegalArgumentException - 指定されたcodePointが有効なUnicodeコード・ポイントでない場合。 バグまたは機能を送信
詳細なAPIリファレンスおよび開発者ドキュメントについては、Java SEのドキュメントを参照してください。 そのドキュメントには、概念的な概要、用語の定義、回避方法、有効なコード例などの、開発者を対象にしたより詳細な説明が含まれています。
Copyright © 1993, 2025, Oracle and/or its affiliates. All rights reserved. Use is subject to license terms. Documentation Redistribution Policyも参照してください。