- java.lang.Object
-
- java.lang.Character
-
- すべての実装されたインタフェース:
Serializable,Comparable<Character>
public final class Character extends Object implements Serializable, Comparable<Character>
Characterクラスは、プリミティブ型charの値をオブジェクトにラップします。Character型のオブジェクトには、型がcharの単一フィールドが含まれます。また、このクラスは、文字のカテゴリ(小文字、数字など)を決定したり、大文字から小文字(およびその逆)の変換を行ういくつかのメソッドも提供します。
文字情報は、Unicode Standard、バージョン8.0.0に基づきます。
Characterクラスのメソッドおよびデータは、UnicodeDataファイル内の情報により定義されます。このファイルは、Unicode Consortiumがメンテナンスを行っているUnicode Character Databaseの一部です。 このファイルは、定義済みのUnicodeコード・ポイントまたは文字範囲ごとの名前やカテゴリを含むさまざまなプロパティを指定します。ファイルおよびその説明は、次のサイトのUnicode Consortiumから入手できます。
Unicode文字表現
charデータ型(Characterオブジェクトにカプセル化される値)は、当初のUnicode仕様に基づいています。この仕様では、文字が固定幅16ビット・エンティティとして定義されていました。 Unicode標準はその後、16ビット以上の表現を必要とする文字を許容するように変更されています。 適正なコード・ポイントの範囲は、現在U+0000 - U+10FFFFであり、Unicodeスカラー値として知られています。 (Unicode標準のU+n表記の定義を参照。)U+0000 - U+FFFFの文字セットは、基本多言語面(BMP)と呼ばれる場合もあります。 コード・ポイントがU+FFFFよりも大きい文字は補助文字と呼ばれます。 Javaプラットフォームでは、
char配列、Stringクラス、およびStringBufferクラスでUTF-16表現が使用されます。 この表現では、補助文字はchar値のペアとして表現され、上位サロゲート範囲(\uD800-\uDBFF)からの最初の値と、下位サロゲート範囲(\uDC00-\uDFFF)からの第2の値から構成されています。したがって、
char値は、サロゲート・コード・ポイントやUTF-16エンコーディングのコード単位を含む基本多言語面(BMP)コード・ポイントを表します。int値は、補助コード・ポイントを含むすべてのUnicodeコード・ポイントを表します。intの下位(最下位) 21ビットは、Unicodeコード・ポイントを表すために使用され、上位(最上位) 11ビットはゼロである必要があります。 特に指定されないかぎり、補助文字とサロゲートchar値に関する動作は次のとおりです。char値だけを受け入れるメソッドは補助文字に対応できません。 これらのメソッドはサロゲート範囲のchar値を未定義の文字として扱います。 たとえば、Character.isLetter('\uD840')はfalseを返し、文字列でそのあとに下位サロゲート値が続く場合でも、この特定の値は文字を表します。int値を受け入れるメソッドは、補助文字を含むすべてのUnicode文字に対応します。 たとえば、Character.isLetter(0x2F81A)は、コード・ポイント値が文字(CJK統合漢字)を表すため、trueを返します。
Java SE APIドキュメンテーションでは、U+0000 - U+10FFFFの範囲の文字値にUnicodeコード・ポイントを使用し、UTF-16エンコーディングのコード単位である16ビット
char値にUnicodeコード単位を使用します。 Unicode用語の詳細は、「Unicode Glossary」を参照してください。- 導入されたバージョン:
- 1.0
- 関連項目:
- 直列化された形式
-
-
ネストされたクラスのサマリー
ネストされたクラス 修飾子と型 クラス 説明 static classCharacter.Subsetこのクラスのインスタンスは、Unicode文字セットの特定のサブセットを表します。static classCharacter.UnicodeBlockUnicode仕様で定義されている文字ブロックを表す文字サブセットのファミリです。static classCharacter.UnicodeScript「Unicode Standard Annex#24: Script Names」で規定された文字スクリプトを表す文字サブセットのファミリです。
-
フィールドのサマリー
フィールド 修飾子と型 フィールド 説明 static intBYTES符号なしバイナリ形式でchar値を表すために使用されるバイト数。static byteCOMBINING_SPACING_MARKUnicode仕様の汎用カテゴリ「Mc」。static byteCONNECTOR_PUNCTUATIONUnicode仕様の汎用カテゴリ「Pc」。static byteCONTROLUnicode仕様の汎用カテゴリ「Cc」。static byteCURRENCY_SYMBOLUnicode仕様の汎用カテゴリ「Sc」。static byteDASH_PUNCTUATIONUnicode仕様の汎用カテゴリ「Pd」。static byteDECIMAL_DIGIT_NUMBERUnicode仕様の汎用カテゴリ「Nd」。static byteDIRECTIONALITY_ARABIC_NUMBERUnicode仕様の弱い双方向文字タイプ「AN」。static byteDIRECTIONALITY_BOUNDARY_NEUTRALUnicode仕様の弱い双方向文字タイプ「BN」。static byteDIRECTIONALITY_COMMON_NUMBER_SEPARATORUnicode仕様の弱い双方向文字タイプ「CS」。static byteDIRECTIONALITY_EUROPEAN_NUMBERUnicode仕様の弱い双方向文字タイプ「EN」。static byteDIRECTIONALITY_EUROPEAN_NUMBER_SEPARATORUnicode仕様の弱い双方向文字タイプ「ES」。static byteDIRECTIONALITY_EUROPEAN_NUMBER_TERMINATORUnicode仕様の弱い双方向文字タイプ「ET」。static byteDIRECTIONALITY_FIRST_STRONG_ISOLATEUnicode仕様の弱い双方向文字型"FSI"。static byteDIRECTIONALITY_LEFT_TO_RIGHTUnicode仕様の強力な双方向文字タイプ「L」。static byteDIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDINGUnicode仕様の強力な双方向文字タイプ「LRE」。static byteDIRECTIONALITY_LEFT_TO_RIGHT_ISOLATEUnicode仕様の弱い双方向文字型"LRI"。static byteDIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDEUnicode仕様の強力な双方向文字タイプ「LRO」。static byteDIRECTIONALITY_NONSPACING_MARKUnicode仕様の弱い双方向文字タイプ「NSM」。static byteDIRECTIONALITY_OTHER_NEUTRALSUnicode仕様のニュートラルな双方向文字タイプ「ON」。static byteDIRECTIONALITY_PARAGRAPH_SEPARATORUnicode仕様のニュートラルな双方向文字タイプ「B」。static byteDIRECTIONALITY_POP_DIRECTIONAL_FORMATUnicode仕様の弱い双方向文字タイプ「PDF」。static byteDIRECTIONALITY_POP_DIRECTIONAL_ISOLATEUnicode仕様の弱い双方向文字型"PDI"。static byteDIRECTIONALITY_RIGHT_TO_LEFTUnicode仕様の強力な双方向文字タイプ「R」。static byteDIRECTIONALITY_RIGHT_TO_LEFT_ARABICUnicode仕様の強力な双方向文字タイプ「AL」。static byteDIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDINGUnicode仕様の強力な双方向文字タイプ「RLE」。static byteDIRECTIONALITY_RIGHT_TO_LEFT_ISOLATEUnicode仕様の弱い双方向文字型"RLI"。static byteDIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDEUnicode仕様の強力な双方向文字タイプ「RLO」。static byteDIRECTIONALITY_SEGMENT_SEPARATORUnicode仕様のニュートラルな双方向文字タイプ「S」。static byteDIRECTIONALITY_UNDEFINED未定義の双方向文字タイプ。static byteDIRECTIONALITY_WHITESPACEUnicode仕様のニュートラルな双方向文字タイプ「WS」。static byteENCLOSING_MARKUnicode仕様の汎用カテゴリ「Me」。static byteEND_PUNCTUATIONUnicode仕様の汎用カテゴリ「Pe」。static byteFINAL_QUOTE_PUNCTUATIONUnicode仕様の汎用カテゴリ「Pf」。static byteFORMATUnicode仕様の汎用カテゴリ「Cf」。static byteINITIAL_QUOTE_PUNCTUATIONUnicode仕様の汎用カテゴリ「Pi」。static byteLETTER_NUMBERUnicode仕様の汎用カテゴリ「Nl」。static byteLINE_SEPARATORUnicode仕様の汎用カテゴリ「Zl」。static byteLOWERCASE_LETTERUnicode仕様の汎用カテゴリ「Ll」。static byteMATH_SYMBOLUnicode仕様の汎用カテゴリ「Sm」。static intMAX_CODE_POINTUnicodeコード・ポイントの最大値(定数U+10FFFF)。static charMAX_HIGH_SURROGATEUTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最大値(定数'\uDBFF')。static charMAX_LOW_SURROGATEUTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最大値(定数'\uDFFF')。static intMAX_RADIX文字列との変換に使用可能な最大基数。static charMAX_SURROGATEUTF-16エンコーディングでのUnicodeサロゲート・コード単位の最大値(定数'\uDFFF')。static charMAX_VALUEこのフィールドの定数値は、char型の最大値'\uFFFF'。static intMIN_CODE_POINTUnicodeコード・ポイントの最小値(定数U+0000)。static charMIN_HIGH_SURROGATEUTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最小値(定数'\uD800')。static charMIN_LOW_SURROGATEUTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最小値(定数'\uDC00')。static intMIN_RADIX文字列との変換に使用可能な最小基数。static intMIN_SUPPLEMENTARY_CODE_POINTUnicode補助コード・ポイントの最小値(定数U+10000)。static charMIN_SURROGATEUTF-16エンコーディングでのUnicodeサロゲート・コード単位の最小値(定数'\uD800')。static charMIN_VALUEこのフィールドの定数値は、char型の最小値'\u0000'。static byteMODIFIER_LETTERUnicode仕様の汎用カテゴリ「Lm」。static byteMODIFIER_SYMBOLUnicode仕様の汎用カテゴリ「Sk」。static byteNON_SPACING_MARKUnicode仕様の汎用カテゴリ「Mn」。static byteOTHER_LETTERUnicode仕様の汎用カテゴリ「Lo」。static byteOTHER_NUMBERUnicode仕様の汎用カテゴリ「No」。static byteOTHER_PUNCTUATIONUnicode仕様の汎用カテゴリ「Po」。static byteOTHER_SYMBOLUnicode仕様の汎用カテゴリ「So」。static bytePARAGRAPH_SEPARATORUnicode仕様の汎用カテゴリ「Zp」。static bytePRIVATE_USEUnicode仕様の汎用カテゴリ「Co」。static intSIZE符号なしバイナリ形式でchar値を表すのに使用されるビット数(定数16)。static byteSPACE_SEPARATORUnicode仕様の汎用カテゴリ「Zs」。static byteSTART_PUNCTUATIONUnicode仕様の汎用カテゴリ「Ps」。static byteSURROGATEUnicode仕様の汎用カテゴリ「Cs」。static byteTITLECASE_LETTERUnicode仕様の汎用カテゴリ「Lt」。static Class<Character>TYPEプリミティブ型charを表すClassインスタンス。static byteUNASSIGNEDUnicode仕様の汎用カテゴリ「Cn」。static byteUPPERCASE_LETTERUnicode仕様の汎用カテゴリ「Lu」。
-
コンストラクタのサマリー
コンストラクタ コンストラクタ 説明 Character(char value)非推奨。このコンストラクタを使用することはほとんどありません。
-
メソッドのサマリー
すべてのメソッド staticメソッド インスタンス・メソッド 具象メソッド 非推奨のメソッド 修飾子と型 メソッド 説明 static intcharCount(int codePoint)指定された文字(Unicodeコード・ポイント)を表すのに必要なchar値の数を判定します。charcharValue()このCharacterオブジェクトの値を返します。static intcodePointAt(char[] a, int index)char配列の指定されたインデックスにあるコード・ポイントを返します。static intcodePointAt(char[] a, int index, int limit)limitの長さ未満のindexを持つ配列要素のみを使用可能な、char配列の指定されたインデックスにあるコード・ポイントを返します。static intcodePointAt(CharSequence seq, int index)CharSequenceの指定されたインデックスにあるコード・ポイントを返します。static intcodePointBefore(char[] a, int index)char配列の指定されたインデックスの前にあるコード・ポイントを返します。static intcodePointBefore(char[] a, int index, int start)start以上のindexを持つ配列要素のみを使用可能な、char配列の指定されたインデックスの前にあるコード・ポイントを返します。static intcodePointBefore(CharSequence seq, int index)CharSequenceの指定されたインデックスの前にあるコード・ポイントを返します。static intcodePointCount(char[] a, int offset, int count)char配列引数の部分配列内にあるUnicodeコード・ポイントの数を返します。static intcodePointCount(CharSequence seq, int beginIndex, int endIndex)指定されたcharシーケンスのテキスト範囲内のUnicodeコード・ポイントの数を返します。static intcodePointOf(String name)指定されたUnicode文字名で指定されたUnicode文字のコード・ポイント値を返します。static intcompare(char x, char y)2つのchar値を数値的に比較します。intcompareTo(Character anotherCharacter)2つのCharacterオブジェクトを数値的に比較します。static intdigit(char ch, int radix)指定された基数での、文字chの数値としての値を返します。static intdigit(int codePoint, int radix)指定された基数での、指定された文字(Unicodeコード・ポイント)の数値を返します。booleanequals(Object obj)このオブジェクトと指定されたオブジェクトを比較します。static charforDigit(int digit, int radix)指定された基数での、指定された桁数の文字表現を判定します。static bytegetDirectionality(char ch)指定された文字のUnicode方向性プロパティを返します。static bytegetDirectionality(int codePoint)所定の文字(Unicodeコード・ポイント)のUnicode方向性プロパティを返します。static StringgetName(int codePoint)指定された文字codePointのUnicode名(コード・ポイントがunassignedの場合はnull)を返します。static intgetNumericValue(char ch)指定されたUnicode文字が表すint値を返します。static intgetNumericValue(int codePoint)指定された文字(Unicodeコード・ポイント)が表すint値を返します。static intgetType(char ch)文字の汎用カテゴリを示す値を返します。static intgetType(int codePoint)文字の汎用カテゴリを示す値を返します。inthashCode()このCharacterのハッシュ・コード(charValue()を呼び出した場合の結果と等しくなる)を返します。static inthashCode(char value)Character.hashCode()との互換性がある、char値のハッシュ・コードを返します。static charhighSurrogate(int codePoint)UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのリーディング・サロゲート(上位サロゲート・コード単位)を返します。static booleanisAlphabetic(int codePoint)指定された文字(Unicodeコード・ポイント)がアルファベットかどうかを判定します。static booleanisBmpCodePoint(int codePoint)指定された文字(Unicodeコード・ポイント)が基本多言語面(BMP)に含まれるかどうかを判定します。static booleanisDefined(char ch)文字がUnicodeで定義されているかどうかを判定します。static booleanisDefined(int codePoint)文字(Unicodeコード・ポイント)がUnicodeで定義されているかどうかを判定します。static booleanisDigit(char ch)指定された文字が数字かどうかを判定します。static booleanisDigit(int codePoint)指定された文字(Unicodeコード・ポイント)が数字かどうかを判定します。static booleanisHighSurrogate(char ch)指定されたchar値がUnicode上位サロゲート・コード単位 (リーディング・サロゲート・コード単位ともいう)であるかどうかを判定します。static booleanisIdentifierIgnorable(char ch)指定された文字が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。static booleanisIdentifierIgnorable(int codePoint)指定された文字(Unicodeコード・ポイント)が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。static booleanisIdeographic(int codePoint)指定された文字(Unicodeコード・ポイント)が、Unicode標準で規定されたCJKV (中国語、日本語、韓国語、およびベトナム語)の表意文字かどうかを判定します。static booleanisISOControl(char ch)指定された文字がISO制御文字かどうかを判定します。static booleanisISOControl(int codePoint)参照された文字(Unicodeコード・ポイント)がISO制御文字かどうかを判定します。static booleanisJavaIdentifierPart(char ch)指定された文字をJava識別子の最初の文字以外に使用可能かどうかを判定します。static booleanisJavaIdentifierPart(int codePoint)文字(Unicodeコード・ポイント)をJava識別子の最初の文字以外に使用可能かどうかを判定します。static booleanisJavaIdentifierStart(char ch)指定された文字をJava識別子の最初の文字として指定可能かどうかを判定します。static booleanisJavaIdentifierStart(int codePoint)文字(Unicodeコード・ポイント)をJava識別子の最初の文字として指定可能かどうかを判定します。static booleanisJavaLetter(char ch)非推奨。isJavaIdentifierStart(char)に置き換えられました。static booleanisJavaLetterOrDigit(char ch)非推奨。isJavaIdentifierPart(char)に置き換えられました。static booleanisLetter(char ch)指定された文字が汎用文字かどうかを判定します。static booleanisLetter(int codePoint)指定された文字(Unicodeコード・ポイント)が汎用文字かどうかを判定します。static booleanisLetterOrDigit(char ch)指定された文字が汎用文字または数字かどうかを判定します。static booleanisLetterOrDigit(int codePoint)指定された文字(Unicodeコード・ポイント)が汎用文字または数字かどうかを判定します。static booleanisLowerCase(char ch)指定された文字が小文字かどうかを判定します。static booleanisLowerCase(int codePoint)指定された文字(Unicodeコード・ポイント)が小文字かどうかを判定します。static booleanisLowSurrogate(char ch)指定されたchar値がUnicode下位サロゲート・コード単位 (トレーリング・サロゲート・コード単位ともいう)であるかどうかを判定します。static booleanisMirrored(char ch)Unicode仕様に従って文字をミラー化するかどうかを判定します。static booleanisMirrored(int codePoint)Unicode仕様に従って、指定された文字(Unicodeコード・ポイント)をミラー化するかどうかを判定します。static booleanisSpace(char ch)非推奨。isWhitespace(char)に置き換えられました。static booleanisSpaceChar(char ch)指定された文字がUnicodeの空白文字かどうかを判定します。static booleanisSpaceChar(int codePoint)指定された文字(Unicodeコード・ポイント)がUnicodeの空白文字かどうかを判定します。static booleanisSupplementaryCodePoint(int codePoint)指定された文字(Unicodeコード・ポイント)が補助文字の範囲にあるかどうかを判定します。static booleanisSurrogate(char ch)指定されたchar値がUnicode サロゲート・コード単位かどうかを判定します。static booleanisSurrogatePair(char high, char low)指定されたchar値のペアが有効なUnicodeサロゲート・ペアであるかどうかを判定します。static booleanisTitleCase(char ch)指定された文字がタイトル・ケース文字かどうかを判定します。static booleanisTitleCase(int codePoint)指定された文字(Unicodeコード・ポイント)がタイトル・ケース文字かどうかを判定します。static booleanisUnicodeIdentifierPart(char ch)指定された文字をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。static booleanisUnicodeIdentifierPart(int codePoint)指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。static booleanisUnicodeIdentifierStart(char ch)指定された文字をUnicode識別子の最初の文字として指定可能かどうかを判定します。static booleanisUnicodeIdentifierStart(int codePoint)指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字として指定可能かどうかを判定します。static booleanisUpperCase(char ch)指定された文字が大文字がどうかを判定します。static booleanisUpperCase(int codePoint)指定された文字(Unicodeコード・ポイント)が大文字かどうかを判定します。static booleanisValidCodePoint(int codePoint)指定されたコード・ポイントが有効なUnicodeコード・ポイント値であるかどうかを判定します。static booleanisWhitespace(char ch)指定された文字がJavaの基準に従った空白かどうかを判定します。static booleanisWhitespace(int codePoint)指定された文字(Unicodeコード・ポイント)がJavaの基準に従った空白かどうかを判定します。static charlowSurrogate(int codePoint)UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのトレーリング・サロゲート(下位サロゲート・コード単位)を返します。static intoffsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)指定されたchar部分配列内で、指定されたindexからcodePointOffsetコード・ポイント分だけオフセットされた位置のインデックスを返します。static intoffsetByCodePoints(CharSequence seq, int index, int codePointOffset)指定された文字シーケンス内で、指定されたindexからcodePointOffsetコード・ポイント分だけオフセットされた位置のインデックスを返します。static charreverseBytes(char ch)指定されたchar値でバイト順を逆にして取得した値を返します。static char[]toChars(int codePoint)指定された文字(Unicodeコード・ポイント)をchar配列に格納されるUTF-16表現に変換します。static inttoChars(int codePoint, char[] dst, int dstIndex)指定された文字(Unicodeコード・ポイント)をUTF-16表現に変換します。static inttoCodePoint(char high, char low)指定されたサロゲート・ペアをその補助コード・ポイント値に変換します。static chartoLowerCase(char ch)UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を小文字に変換します。static inttoLowerCase(int codePoint)UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を小文字に変換します。StringtoString()このCharacterの値を表すStringオブジェクトを返します。static StringtoString(char c)指定されたcharを表すStringオブジェクトを返します。static chartoTitleCase(char ch)UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数をタイトル・ケースに変換します。static inttoTitleCase(int codePoint)UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数をタイトル・ケースに変換します。static chartoUpperCase(char ch)UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を大文字に変換します。static inttoUpperCase(int codePoint)UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を大文字に変換します。static CharactervalueOf(char c)指定されたchar値を表すCharacterインスタンスを返します。
-
-
-
フィールドの詳細
-
MIN_RADIX
public static final int MIN_RADIX
文字列との変換に使用可能な最小基数です。 このフィールドの定数値は、Integerクラスのdigitメソッド、forDigitメソッド、およびtoStringメソッドなどの基数変換メソッドの最小許容値です。
-
MAX_RADIX
public static final int MAX_RADIX
文字列との変換に使用可能な最大基数です。 このフィールドの定数値は、Integerクラスのdigitメソッド、forDigitメソッド、およびtoStringメソッドなどの基数変換メソッドの最大許容値です。
-
MIN_VALUE
public static final char MIN_VALUE
このフィールドの定数値は、char型の最小値'\u0000'です。- 導入されたバージョン:
- 1.0.2
- 関連項目:
- 定数フィールド値
-
MAX_VALUE
public static final char MAX_VALUE
このフィールドの定数値は、char型の最大値'\uFFFF'です。- 導入されたバージョン:
- 1.0.2
- 関連項目:
- 定数フィールド値
-
UNASSIGNED
public static final byte UNASSIGNED
Unicode仕様の汎用カテゴリ「Cn」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
UPPERCASE_LETTER
public static final byte UPPERCASE_LETTER
Unicode仕様の汎用カテゴリ「Lu」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
LOWERCASE_LETTER
public static final byte LOWERCASE_LETTER
Unicode仕様の汎用カテゴリ「Ll」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
TITLECASE_LETTER
public static final byte TITLECASE_LETTER
Unicode仕様の汎用カテゴリ「Lt」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
MODIFIER_LETTER
public static final byte MODIFIER_LETTER
Unicode仕様の汎用カテゴリ「Lm」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
OTHER_LETTER
public static final byte OTHER_LETTER
Unicode仕様の汎用カテゴリ「Lo」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
NON_SPACING_MARK
public static final byte NON_SPACING_MARK
Unicode仕様の汎用カテゴリ「Mn」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
ENCLOSING_MARK
public static final byte ENCLOSING_MARK
Unicode仕様の汎用カテゴリ「Me」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
COMBINING_SPACING_MARK
public static final byte COMBINING_SPACING_MARK
Unicode仕様の汎用カテゴリ「Mc」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
DECIMAL_DIGIT_NUMBER
public static final byte DECIMAL_DIGIT_NUMBER
Unicode仕様の汎用カテゴリ「Nd」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
LETTER_NUMBER
public static final byte LETTER_NUMBER
Unicode仕様の汎用カテゴリ「Nl」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
OTHER_NUMBER
public static final byte OTHER_NUMBER
Unicode仕様の汎用カテゴリ「No」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
SPACE_SEPARATOR
public static final byte SPACE_SEPARATOR
Unicode仕様の汎用カテゴリ「Zs」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
LINE_SEPARATOR
public static final byte LINE_SEPARATOR
Unicode仕様の汎用カテゴリ「Zl」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
PARAGRAPH_SEPARATOR
public static final byte PARAGRAPH_SEPARATOR
Unicode仕様の汎用カテゴリ「Zp」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
CONTROL
public static final byte CONTROL
Unicode仕様の汎用カテゴリ「Cc」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
FORMAT
public static final byte FORMAT
Unicode仕様の汎用カテゴリ「Cf」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
PRIVATE_USE
public static final byte PRIVATE_USE
Unicode仕様の汎用カテゴリ「Co」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
SURROGATE
public static final byte SURROGATE
Unicode仕様の汎用カテゴリ「Cs」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
DASH_PUNCTUATION
public static final byte DASH_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pd」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
START_PUNCTUATION
public static final byte START_PUNCTUATION
Unicode仕様の汎用カテゴリ「Ps」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
END_PUNCTUATION
public static final byte END_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pe」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
CONNECTOR_PUNCTUATION
public static final byte CONNECTOR_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pc」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
OTHER_PUNCTUATION
public static final byte OTHER_PUNCTUATION
Unicode仕様の汎用カテゴリ「Po」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
MATH_SYMBOL
public static final byte MATH_SYMBOL
Unicode仕様の汎用カテゴリ「Sm」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
CURRENCY_SYMBOL
public static final byte CURRENCY_SYMBOL
Unicode仕様の汎用カテゴリ「Sc」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
MODIFIER_SYMBOL
public static final byte MODIFIER_SYMBOL
Unicode仕様の汎用カテゴリ「Sk」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
OTHER_SYMBOL
public static final byte OTHER_SYMBOL
Unicode仕様の汎用カテゴリ「So」。- 導入されたバージョン:
- 1.1
- 関連項目:
- 定数フィールド値
-
INITIAL_QUOTE_PUNCTUATION
public static final byte INITIAL_QUOTE_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pi」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
FINAL_QUOTE_PUNCTUATION
public static final byte FINAL_QUOTE_PUNCTUATION
Unicode仕様の汎用カテゴリ「Pf」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_UNDEFINED
public static final byte DIRECTIONALITY_UNDEFINED
未定義の双方向文字タイプ。 Unicode仕様では、未定義のchar値の方向性は定義されていません。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_LEFT_TO_RIGHT
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT
Unicode仕様の強力な双方向文字タイプ「L」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_RIGHT_TO_LEFT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT
Unicode仕様の強力な双方向文字タイプ「R」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
Unicode仕様の強力な双方向文字タイプ「AL」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_EUROPEAN_NUMBER
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER
Unicode仕様の弱い双方向文字タイプ「EN」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
Unicode仕様の弱い双方向文字タイプ「ES」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
Unicode仕様の弱い双方向文字タイプ「ET」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_ARABIC_NUMBER
public static final byte DIRECTIONALITY_ARABIC_NUMBER
Unicode仕様の弱い双方向文字タイプ「AN」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
Unicode仕様の弱い双方向文字タイプ「CS」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_NONSPACING_MARK
public static final byte DIRECTIONALITY_NONSPACING_MARK
Unicode仕様の弱い双方向文字タイプ「NSM」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_BOUNDARY_NEUTRAL
public static final byte DIRECTIONALITY_BOUNDARY_NEUTRAL
Unicode仕様の弱い双方向文字タイプ「BN」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_PARAGRAPH_SEPARATOR
public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
Unicode仕様のニュートラルな双方向文字タイプ「B」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_SEGMENT_SEPARATOR
public static final byte DIRECTIONALITY_SEGMENT_SEPARATOR
Unicode仕様のニュートラルな双方向文字タイプ「S」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_WHITESPACE
public static final byte DIRECTIONALITY_WHITESPACE
Unicode仕様のニュートラルな双方向文字タイプ「WS」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_OTHER_NEUTRALS
public static final byte DIRECTIONALITY_OTHER_NEUTRALS
Unicode仕様のニュートラルな双方向文字タイプ「ON」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
Unicode仕様の強力な双方向文字タイプ「LRE」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
Unicode仕様の強力な双方向文字タイプ「LRO」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
Unicode仕様の強力な双方向文字タイプ「RLE」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
Unicode仕様の強力な双方向文字タイプ「RLO」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
Unicode仕様の弱い双方向文字タイプ「PDF」。- 導入されたバージョン:
- 1.4
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
Unicode仕様の弱い双方向文字型"LRI"。- 導入されたバージョン:
- 9
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
Unicode仕様の弱い双方向文字型"RLI"。- 導入されたバージョン:
- 9
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_FIRST_STRONG_ISOLATE
public static final byte DIRECTIONALITY_FIRST_STRONG_ISOLATE
Unicode仕様の弱い双方向文字型"FSI"。- 導入されたバージョン:
- 9
- 関連項目:
- 定数フィールド値
-
DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
Unicode仕様の弱い双方向文字型"PDI"。- 導入されたバージョン:
- 9
- 関連項目:
- 定数フィールド値
-
MIN_HIGH_SURROGATE
public static final char MIN_HIGH_SURROGATE
UTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最小値(定数'\uD800')。 上位サロゲートは、リーディング・サロゲートともいいます。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
MAX_HIGH_SURROGATE
public static final char MAX_HIGH_SURROGATE
UTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最大値(定数'\uDBFF')。 上位サロゲートは、リーディング・サロゲートともいいます。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
MIN_LOW_SURROGATE
public static final char MIN_LOW_SURROGATE
UTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最小値(定数'\uDC00')。 下位サロゲートは、トレーリング・サロゲートともいいます。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
MAX_LOW_SURROGATE
public static final char MAX_LOW_SURROGATE
UTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最大値(定数'\uDFFF')。 下位サロゲートは、トレーリング・サロゲートともいいます。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
MIN_SURROGATE
public static final char MIN_SURROGATE
UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最小値(定数'\uD800')。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
MAX_SURROGATE
public static final char MAX_SURROGATE
UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最大値(定数'\uDFFF')。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
MIN_SUPPLEMENTARY_CODE_POINT
public static final int MIN_SUPPLEMENTARY_CODE_POINT
Unicode補助コード・ポイントの最小値(定数U+10000)。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
MIN_CODE_POINT
public static final int MIN_CODE_POINT
Unicodeコード・ポイントの最小値(定数U+0000)。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
MAX_CODE_POINT
public static final int MAX_CODE_POINT
Unicodeコード・ポイントの最大値(定数U+10FFFF)。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
SIZE
public static final int SIZE
符号なしバイナリ形式でchar値を表すのに使用されるビット数(定数16)。- 導入されたバージョン:
- 1.5
- 関連項目:
- 定数フィールド値
-
BYTES
public static final int BYTES
符号なしバイナリ形式でchar値を表すために使用されるバイト数。- 導入されたバージョン:
- 1.8
- 関連項目:
- 定数フィールド値
-
-
コンストラクタの詳細
-
Character
@Deprecated(since="9") public Character(char value)
非推奨。このコンストラクタを使用することはほとんどありません。 静的ファクトリvalueOf(char)は、より良いスペースと時間のパフォーマンスをもたらす可能性が高いため、通常はより良い選択です。指定されたchar値を表す、新しく割り当てられたCharacterオブジェクトを構築します。- パラメータ:
value-Characterオブジェクトによって表される値。
-
-
メソッドの詳細
-
valueOf
public static Character valueOf(char c)
指定されたchar値を表すCharacterインスタンスを返します。 新規Characterインスタンスが不要な場合、通常このメソッドがコンストラクタCharacter(char)に優先して使用されます。その理由は、このメソッドが頻繁に要求される値をキャッシュするので、操作に必要な領域や時間がはるかに少なくて済む場合が多いためです。 このメソッドは、'\u0000'から'\u007F'の範囲(両端含む)の値を常にキャッシュしますが、この範囲に含まれないその他の値をキャッシュすることもあります。- パラメータ:
c- char値。- 戻り値:
cを表すCharacterインスタンス。- 導入されたバージョン:
- 1.5
-
charValue
public char charValue()
このCharacterオブジェクトの値を返します。- 戻り値:
- このオブジェクトが表すプリミティブ
char値。
-
hashCode
public int hashCode()
このCharacterのハッシュ・コード(charValue()を呼び出した場合の結果と等しくなる)を返します。- オーバーライド:
hashCode、クラス:Object- 戻り値:
- この
Characterのハッシュ・コード値 - 関連項目:
Object.equals(java.lang.Object),System.identityHashCode(java.lang.Object)
-
hashCode
public static int hashCode(char value)
Character.hashCode()との互換性がある、char値のハッシュ・コードを返します。- パラメータ:
value- ハッシュ・コードが返されるchar。- 戻り値:
char値のハッシュ・コード値。- 導入されたバージョン:
- 1.8
-
equals
public boolean equals(Object obj)
このオブジェクトと指定されたオブジェクトを比較します。 結果がtrueになるのは、引数がnullではなく、このオブジェクトと同じchar値を表すCharacterオブジェクトである場合だけです。- オーバーライド:
equals、クラス:Object- パラメータ:
obj- 比較対象のオブジェクト- 戻り値:
- オブジェクトが同じである場合は
true、そうでない場合はfalse。 - 関連項目:
Object.hashCode()、HashMap
-
toString
public String toString()
このCharacterの値を表すStringオブジェクトを返します。 結果は、長さ1の文字列(構成要素はCharacterオブジェクトにより表されるプリミティブ型のchar値だけ)になります。
-
toString
public static String toString(char c)
指定されたcharを表すStringオブジェクトを返します。 結果は、指定されたcharだけで構成される長さ1の文字列になります。- パラメータ:
c- 変換するchar- 戻り値:
- 指定された
charの文字列表現 - 導入されたバージョン:
- 1.4
-
isValidCodePoint
public static boolean isValidCodePoint(int codePoint)
指定されたコード・ポイントが有効なUnicodeコード・ポイント値であるかどうかを判定します。- パラメータ:
codePoint- 判定対象のUnicodeコード・ポイント- 戻り値:
- 指定されたコード・ポイント値が
MIN_CODE_POINT-MAX_CODE_POINTの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse。 - 導入されたバージョン:
- 1.5
-
isBmpCodePoint
public static boolean isBmpCodePoint(int codePoint)
指定された文字(Unicodeコード・ポイント)が基本多言語面(BMP)に含まれるかどうかを判定します。 そのようなコード・ポイントは単一のcharを使って表せます。
-
isSupplementaryCodePoint
public static boolean isSupplementaryCodePoint(int codePoint)
指定された文字(Unicodeコード・ポイント)が補助文字の範囲にあるかどうかを判定します。- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)- 戻り値:
- 指定されたコード・ポイントが
MIN_SUPPLEMENTARY_CODE_POINT-MAX_CODE_POINTの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse。 - 導入されたバージョン:
- 1.5
-
isHighSurrogate
public static boolean isHighSurrogate(char ch)
指定されたchar値がUnicode上位サロゲート・コード単位 (リーディング・サロゲート・コード単位ともいう)であるかどうかを判定します。これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。
- パラメータ:
ch- 判定されるchar値。- 戻り値:
charの値がMIN_HIGH_SURROGATE-MAX_HIGH_SURROGATEの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse。- 導入されたバージョン:
- 1.5
- 関連項目:
isLowSurrogate(char),Character.UnicodeBlock.of(int)
-
isLowSurrogate
public static boolean isLowSurrogate(char ch)
指定されたchar値がUnicode下位サロゲート・コード単位 (トレーリング・サロゲート・コード単位ともいう)であるかどうかを判定します。これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。
- パラメータ:
ch- 判定されるchar値。- 戻り値:
char値がMIN_LOW_SURROGATE-MAX_LOW_SURROGATEの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse。- 導入されたバージョン:
- 1.5
- 関連項目:
isHighSurrogate(char)
-
isSurrogate
public static boolean isSurrogate(char ch)
指定されたchar値がUnicode サロゲート・コード単位かどうかを判定します。これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。
char値がサロゲート・コード単位になるのは、それが下位サロゲート・コード単位と上位サロゲート・コード単位のいずれかである場合だけです。
- パラメータ:
ch- 判定されるchar値。- 戻り値:
char値がMIN_SURROGATE-MAX_SURROGATEの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse。- 導入されたバージョン:
- 1.7
-
isSurrogatePair
public static boolean isSurrogatePair(char high, char low)指定されたchar値のペアが有効なUnicodeサロゲート・ペアであるかどうかを判定します。このメソッドは次の式と等価です。
isHighSurrogate(high) && isLowSurrogate(low)- パラメータ:
high- 判定対象の上位サロゲート・コード値low- 判定対象の下位サロゲート・コード値- 戻り値:
- 指定された上位/下位サロゲート・コード値が有効なサロゲート・ペアを表す場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.5
-
charCount
public static int charCount(int codePoint)
指定された文字(Unicodeコード・ポイント)を表すのに必要なchar値の数を判定します。 このメソッドは、指定された文字が0x10000以上である場合は2を返します。 それ以外の場合は1を返します。このメソッドは、指定された文字が有効なUnicodeコード・ポイントであることを検証しません。 呼出し側で、必要に応じて
isValidCodePointを使用して、文字値を検証する必要があります。- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が有効な補助文字の場合は2、そうでない場合は1。
- 導入されたバージョン:
- 1.5
- 関連項目:
isSupplementaryCodePoint(int)
-
toCodePoint
public static int toCodePoint(char high, char low)指定されたサロゲート・ペアをその補助コード・ポイント値に変換します。 このメソッドは、指定されたサロゲート・ペアを検証しません。 呼出し側は必要に応じて、isSurrogatePairを使って検証する必要があります。- パラメータ:
high- 上位サロゲート・コード単位low- 下位サロゲート・コード単位- 戻り値:
- 指定されたサロゲート・ペアから作成された補助コード・ポイント。
- 導入されたバージョン:
- 1.5
-
codePointAt
public static int codePointAt(CharSequence seq, int index)
CharSequenceの指定されたインデックスにあるコード・ポイントを返します。CharSequence内の指定されたインデックス位置のchar値が上位サロゲート範囲に含まれており、それに続くインデックスがCharSequenceの長さ未満であり、かつそのインデックス位置のchar値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar値が返されます。- パラメータ:
seq-char値のシーケンス(Unicodeコード単位)index- 変換されるseq内のchar値(Unicodeコード単位)へのインデックス- 戻り値:
- 所定のインデックス位置のUnicodeコード・ポイント
- 例外:
NullPointerException-seqがnullである場合。IndexOutOfBoundsException- 値indexが負であるかseq.length()以上である場合。- 導入されたバージョン:
- 1.5
-
codePointAt
public static int codePointAt(char[] a, int index)char配列の指定されたインデックスにあるコード・ポイントを返します。char配列内の指定されたインデックス位置のchar値が上位サロゲート範囲に含まれており、それに続くインデックスがchar配列の長さ未満であり、かつそのインデックス位置のchar値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar値が返されます。- パラメータ:
a-char配列index- 変換されるchar配列内のchar値(Unicodeコード単位)へのインデックス- 戻り値:
- 所定のインデックス位置のUnicodeコード・ポイント
- 例外:
NullPointerException-aがnullである場合。IndexOutOfBoundsException-indexが負の値、またはchar配列の長さ以上の値である場合。- 導入されたバージョン:
- 1.5
-
codePointAt
public static int codePointAt(char[] a, int index, int limit)limitの長さ未満のindexを持つ配列要素のみを使用可能な、char配列の指定されたインデックスにあるコード・ポイントを返します。char配列内の指定されたインデックス位置のchar値が上位サロゲート範囲に含まれており、それに続くインデックスがlimit未満であり、かつそのインデックス位置のchar値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar値が返されます。- パラメータ:
a-char配列index- 変換されるchar配列内のchar値(Unicodeコード単位)へのインデックスlimit-char配列で使用可能な最後の配列要素の後ろのインデックス- 戻り値:
- 所定のインデックス位置のUnicodeコード・ポイント
- 例外:
NullPointerException-aがnullである場合。IndexOutOfBoundsException-index引数が負の値またはlimit引数以上である場合、またはlimit引数が負の値またはchar配列の長さより大きい場合。- 導入されたバージョン:
- 1.5
-
codePointBefore
public static int codePointBefore(CharSequence seq, int index)
CharSequenceの指定されたインデックスの前にあるコード・ポイントを返します。CharSequence内の(index - 1)のchar値が下位サロゲート範囲に含まれており、(index - 2)が負でなく、かつCharSequence内の(index - 2)のchar値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)のchar値が返されます。- パラメータ:
seq-CharSequenceインスタンスindex- 返すべきコード・ポイントの直後のインデックス- 戻り値:
- 指定されたインデックスの前にあるUnicodeコード・ポイント値。
- 例外:
NullPointerException-seqがnullである場合。IndexOutOfBoundsException-index引数が1より小さいかseq.length()より大きい場合。- 導入されたバージョン:
- 1.5
-
codePointBefore
public static int codePointBefore(char[] a, int index)char配列の指定されたインデックスの前にあるコード・ポイントを返します。char配列内の(index - 1)のchar値が下位サロゲート範囲に含まれており、(index - 2)が負でなく、かつchar配列内の(index - 2)のchar値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)のchar値が返されます。- パラメータ:
a-char配列index- 返すべきコード・ポイントの直後のインデックス- 戻り値:
- 指定されたインデックスの前にあるUnicodeコード・ポイント値。
- 例外:
NullPointerException-aがnullである場合。IndexOutOfBoundsException-index引数が1未満であるか、またはchar配列の長さより大きい値の場合- 導入されたバージョン:
- 1.5
-
codePointBefore
public static int codePointBefore(char[] a, int index, int start)start以上のindexを持つ配列要素のみを使用可能な、char配列の指定されたインデックスの前にあるコード・ポイントを返します。char配列内の(index - 1)のchar値が下位サロゲート範囲に含まれており、(index - 2)がstart以上であり、かつchar配列内の(index - 2)のchar値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)のchar値が返されます。- パラメータ:
a-char配列index- 返すべきコード・ポイントの直後のインデックスstart-char配列の最初の配列要素のインデックス- 戻り値:
- 指定されたインデックスの前にあるUnicodeコード・ポイント値。
- 例外:
NullPointerException-aがnullである場合。IndexOutOfBoundsException-index引数がstart引数以下であるかchar配列の長さより大きい場合、またはstart引数が負の値であるかchar配列の長さ以上である場合。- 導入されたバージョン:
- 1.5
-
highSurrogate
public static char highSurrogate(int codePoint)
UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのリーディング・サロゲート(上位サロゲート・コード単位)を返します。 指定された文字が補助文字でない場合は、未指定のcharが返されます。isSupplementaryCodePoint(x)がtrueの場合、isHighSurrogate(highSurrogate(x))およびtoCodePoint(highSurrogate(x),lowSurrogate(x))== xも常にtrueになります。- パラメータ:
codePoint- 補助文字(Unicodeコード・ポイント)- 戻り値:
- この文字をUTF-16エンコーディングで表すために使用されるリーディング・サロゲート・コード単位
- 導入されたバージョン:
- 1.7
-
lowSurrogate
public static char lowSurrogate(int codePoint)
UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのトレーリング・サロゲート(下位サロゲート・コード単位)を返します。 指定された文字が補助文字でない場合は、未指定のcharが返されます。isSupplementaryCodePoint(x)がtrueの場合、isLowSurrogate(lowSurrogate(x))およびtoCodePoint(highSurrogate(x), lowSurrogate(x))== xも常にtrueになります。- パラメータ:
codePoint- 補助文字(Unicodeコード・ポイント)- 戻り値:
- この文字をUTF-16エンコーディングで表すために使用されるトレーリング・サロゲート・コード単位
- 導入されたバージョン:
- 1.7
-
toChars
public static int toChars(int codePoint, char[] dst, int dstIndex)指定された文字(Unicodeコード・ポイント)をUTF-16表現に変換します。 指定されたコード・ポイントがBMP (基本多言語面または第0面)値の場合は、同じ値がdst[dstIndex]に格納され、1が返されます。 指定されたコード・ポイントが補助文字の場合は、サロゲート値がdst[dstIndex](上位サロゲート)とdst[dstIndex+1](下位サロゲート)に格納され、2が返されます。- パラメータ:
codePoint- 変換対象の文字(Unicodeコード・ポイント)。dst-codePointのUTF-16値が格納されるcharの配列。dstIndex- 変換された値が格納されるdst配列の開始インデックス。- 戻り値:
- コード・ポイントがBMPコード・ポイントの場合は1、コード・ポイントが補助コード・ポイントの場合は2。
- 例外:
IllegalArgumentException- 指定されたcodePointが有効なUnicodeコード・ポイントでない場合。NullPointerException- 指定されたdstがnullの場合。IndexOutOfBoundsException-dstIndexが負の値であるかdst.length以上である場合、またはdstIndex位置のdstが結果として得られるchar値を格納する十分な配列要素を持たない場合。 (dstIndexがdst.length-1と等価で、指定されたcodePointが補助文字の場合、上位サロゲート値はdst[dstIndex]に格納されない。)- 導入されたバージョン:
- 1.5
-
toChars
public static char[] toChars(int codePoint)
指定された文字(Unicodeコード・ポイント)をchar配列に格納されるUTF-16表現に変換します。 指定されたコード・ポイントがBMP (基本多言語面または第0面)値の場合、結果として得られるchar配列はcodePointと同じ値を持ちます。 指定されたコード・ポイントが補助コード・ポイントの場合は、結果として得られるchar配列は対応するサロゲート・ペアを持ちます。- パラメータ:
codePoint- Unicodeコード・ポイント- 戻り値:
codePointのUTF-16表現を持つchar配列。- 例外:
IllegalArgumentException- 指定されたcodePointが有効なUnicodeコード・ポイントでない場合。- 導入されたバージョン:
- 1.5
-
codePointCount
public static int codePointCount(CharSequence seq, int beginIndex, int endIndex)
指定されたcharシーケンスのテキスト範囲内のUnicodeコード・ポイントの数を返します。 テキスト範囲は、指定されたbeginIndexからインデックスendIndex - 1の位置のcharまでです。 したがって、テキスト範囲の長さ(char数)は、endIndex-beginIndexになります。 テキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。- パラメータ:
seq- 文字シーケンスbeginIndex- テキスト範囲内の最初のcharへのインデックスendIndex- テキスト範囲内の最後のcharの直後のインデックス- 戻り値:
- 指定されたテキスト範囲内のUnicodeコード・ポイントの数
- 例外:
NullPointerException-seqがnullである場合。IndexOutOfBoundsException-beginIndexが負であるか、endIndexが指定されたシーケンスの長さより大きいか、あるいはbeginIndexがendIndexより大きい場合。- 導入されたバージョン:
- 1.5
-
codePointCount
public static int codePointCount(char[] a, int offset, int count)char配列引数の部分配列内にあるUnicodeコード・ポイントの数を返します。offset引数は、部分配列の最初のcharのインデックスであり、count引数はchar間の部分配列の長さを指定します。 部分配列内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。- パラメータ:
a-char配列offset- 指定されたchar配列の最初のcharのインデックスcount- 部分配列の長さ(char数)- 戻り値:
- 指定された部分配列内のUnicodeコード・ポイントの数
- 例外:
NullPointerException-aがnullである場合。IndexOutOfBoundsException-offsetまたはcountが負の場合、またはoffset+countが指定された配列の長さより大きい場合。- 導入されたバージョン:
- 1.5
-
offsetByCodePoints
public static int offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
指定された文字シーケンス内で、指定されたindexからcodePointOffsetコード・ポイント分だけオフセットされた位置のインデックスを返します。indexとcodePointOffsetで指定されるテキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。- パラメータ:
seq- 文字シーケンスindex- オフセットされるインデックスcodePointOffset- オフセット(コード・ポイント数)- 戻り値:
- charシーケンス内のインデックス
- 例外:
NullPointerException-seqがnullである場合。IndexOutOfBoundsException-indexが負の値または文字シーケンスの長さよりも大きい場合、codePointOffsetが正の値でありindexで始まるサブシーケンスの持つコード・ポイント数がcodePointOffsetコード・ポイント数よりも少ない場合、あるいはcodePointOffsetが負の値でindexの前のサブシーケンスの持つ値がcodePointOffsetコード・ポイントの絶対値よりも小さい場合。- 導入されたバージョン:
- 1.5
-
offsetByCodePoints
public static int offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)指定されたchar部分配列内で、指定されたindexからcodePointOffsetコード・ポイント分だけオフセットされた位置のインデックスを返します。startおよびcount引数は、char配列の部分配列を指定します。indexとcodePointOffsetで指定されるテキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。- パラメータ:
a-char配列start- 部分配列内の最初のcharのインデックスcount- 部分配列の長さ(char数)index- オフセットされるインデックスcodePointOffset- オフセット(コード・ポイント数)- 戻り値:
- 部分配列内のインデックス
- 例外:
NullPointerException-aがnullである場合。IndexOutOfBoundsException-startまたはcountが負の場合、またはstart+countが指定された配列の長さより大きい場合、またはindexがstartより小さいかstart+countより大きい場合、またはcodePointOffsetが正で、indexから始まりstart+count - 1で終わるテキスト範囲内のコード・ポイント数がcodePointOffsetコード・ポイント数より少ない場合、またはcodePointOffsetが負で、startから始まりindex - 1で終わるテキスト範囲内のコード・ポイント数がcodePointOffsetコード・ポイントの絶対値より少ない場合。- 導入されたバージョン:
- 1.5
-
isLowerCase
public static boolean isLowerCase(char ch)
指定された文字が小文字かどうかを判定します。ある文字が小文字になるのは、
Character.getType(ch)によって提供される汎用カテゴリ型がLOWERCASE_LETTERである場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Lowercaseを持つ場合です。小文字の例を次に示します。
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
Unicode文字には、ほかにも多数の小文字が存在します。
注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isLowerCase(int)メソッドを使用してください。- パラメータ:
ch- 判定対象の文字。- 戻り値:
- 文字が小文字の場合は
true、そうでない場合はfalse。 - 関連項目:
isLowerCase(char),isTitleCase(char),toLowerCase(char),getType(char)
-
isLowerCase
public static boolean isLowerCase(int codePoint)
指定された文字(Unicodeコード・ポイント)が小文字かどうかを判定します。ある文字が小文字になるのは、
getType(codePoint)によって提供される汎用カテゴリ型がLOWERCASE_LETTERである場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Lowercaseを持つ場合です。小文字の例を次に示します。
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
Unicode文字には、ほかにも多数の小文字が存在します。
- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が小文字の場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.5
- 関連項目:
isLowerCase(int),isTitleCase(int),toLowerCase(int),getType(int)
-
isUpperCase
public static boolean isUpperCase(char ch)
指定された文字が大文字がどうかを判定します。ある文字が大文字になるのは、
Character.getType(ch)によって提供される汎用カテゴリ型がUPPERCASE_LETTERである場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Uppercaseを持つ場合です。大文字の例を次に示します。
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
Unicode文字には、ほかにも多数の大文字が存在します。
注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isUpperCase(int)メソッドを使用してください。- パラメータ:
ch- 判定対象の文字。- 戻り値:
- 文字が大文字の場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.0
- 関連項目:
isLowerCase(char),isTitleCase(char),toUpperCase(char),getType(char)
-
isUpperCase
public static boolean isUpperCase(int codePoint)
指定された文字(Unicodeコード・ポイント)が大文字かどうかを判定します。ある文字が大文字になるのは、
getType(codePoint)によって提供される汎用カテゴリ型がUPPERCASE_LETTERである場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Uppercaseを持つ場合です。大文字の例を次に示します。
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
Unicode文字には、ほかにも多数の大文字が存在します。
- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が大文字の場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.5
- 関連項目:
isLowerCase(int),isTitleCase(int),toUpperCase(int),getType(int)
-
isTitleCase
public static boolean isTitleCase(char ch)
指定された文字がタイトル・ケース文字かどうかを判定します。Character.getType(ch)により示される汎用カテゴリ型がTITLECASE_LETTERの場合、文字はタイトル・ケース文字になります。文字の中には、ラテン文字のペアのように見えるものがあります。 たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。 「Lj」のように見える3つ目の形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。
次に示すのは、このメソッドが
trueを返すUnicode文字の一部です。LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARONLATIN CAPITAL LETTER L WITH SMALL LETTER JLATIN CAPITAL LETTER N WITH SMALL LETTER JLATIN CAPITAL LETTER D WITH SMALL LETTER Z
Unicode文字には、ほかにも多数のタイトル・ケース文字が存在します。
注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isTitleCase(int)メソッドを使用してください。- パラメータ:
ch- 判定対象の文字。- 戻り値:
- 文字がタイトル・ケースの場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.0.2
- 関連項目:
isLowerCase(char),isUpperCase(char),toTitleCase(char),getType(char)
-
isTitleCase
public static boolean isTitleCase(int codePoint)
指定された文字(Unicodeコード・ポイント)がタイトル・ケース文字かどうかを判定します。getType(codePoint)により示される汎用カテゴリ型がTITLECASE_LETTERの場合、文字はタイトル・ケース文字になります。文字の中には、ラテン文字のペアのように見えるものがあります。 たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。 「Lj」のように見える3つ目の形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。
次に示すのは、このメソッドが
trueを返すUnicode文字の一部です。LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARONLATIN CAPITAL LETTER L WITH SMALL LETTER JLATIN CAPITAL LETTER N WITH SMALL LETTER JLATIN CAPITAL LETTER D WITH SMALL LETTER Z
Unicode文字には、ほかにも多数のタイトル・ケース文字が存在します。
- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がタイトル・ケースの場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.5
- 関連項目:
isLowerCase(int),isUpperCase(int),toTitleCase(int),getType(int)
-
isDigit
public static boolean isDigit(char ch)
指定された文字が数字かどうかを判定します。Character.getType(ch)により示される汎用カテゴリ型がDECIMAL_DIGIT_NUMBERの場合、文字は数字になります。Unicode文字範囲の中には、次の数字を含むものがあります。
'\u0030'-'\u0039'、ISO-LATIN-1数字('0'-'9')'\u0660'-'\u0669'、アラビア数字'\u06F0'-'\u06F9'、拡張アラビア数字'\u0966'-'\u096F'、デヴァーナーガリ数字'\uFF10'-'\uFF19'、全角数字
注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isDigit(int)メソッドを使用してください。- パラメータ:
ch- 判定対象の文字。- 戻り値:
- 文字が数字の場合は
true、そうでない場合はfalse。 - 関連項目:
digit(char, int),forDigit(int, int),getType(char)
-
isDigit
public static boolean isDigit(int codePoint)
指定された文字(Unicodeコード・ポイント)が数字かどうかを判定します。getType(codePoint)により示される汎用カテゴリ型がDECIMAL_DIGIT_NUMBERの場合、文字は数字になります。Unicode文字範囲の中には、次の数字を含むものがあります。
'\u0030'-'\u0039'、ISO-LATIN-1数字('0'-'9')'\u0660'-'\u0669'、アラビア数字'\u06F0'-'\u06F9'、拡張アラビア数字'\u0966'-'\u096F'、デヴァーナーガリ数字'\uFF10'-'\uFF19'、全角数字
- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が数字の場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.5
- 関連項目:
forDigit(int, int),getType(int)
-
isDefined
public static boolean isDefined(char ch)
文字がUnicodeで定義されているかどうかを判定します。少なくとも次のいずれかに当てはまる場合、文字は定義されています。
- UnicodeDataファイル内にエントリがある
- UnicodeDataファイルで定義された範囲に値を持つ
注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isDefined(int)メソッドを使用してください。- パラメータ:
ch- 判定対象の文字- 戻り値:
- 文字がUnicodeに定義されている場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.0.2
- 関連項目:
isDigit(char),isLetter(char),isLetterOrDigit(char),isLowerCase(char),isTitleCase(char),isUpperCase(char)
-
isDefined
public static boolean isDefined(int codePoint)
文字(Unicodeコード・ポイント)がUnicodeで定義されているかどうかを判定します。少なくとも次のいずれかに当てはまる場合、文字は定義されています。
- UnicodeDataファイル内にエントリがある
- UnicodeDataファイルで定義された範囲に値を持つ
- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がUnicodeに定義されている場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.5
- 関連項目:
isDigit(int),isLetter(int),isLetterOrDigit(int),isLowerCase(int),isTitleCase(int),isUpperCase(int)
-
isLetter
public static boolean isLetter(char ch)
指定された文字が汎用文字かどうかを判定します。Character.getType(ch)の示す汎用カテゴリ型が次のどれかの場合に、文字は汎用文字と見なされます。-
UPPERCASE_LETTER -
LOWERCASE_LETTER -
TITLECASE_LETTER -
MODIFIER_LETTER -
OTHER_LETTER
注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isLetter(int)メソッドを使用してください。- パラメータ:
ch- 判定対象の文字。- 戻り値:
- 文字が汎用文字の場合は
true、そうでない場合はfalse。 - 関連項目:
isDigit(char),isJavaIdentifierStart(char),isJavaLetter(char),isJavaLetterOrDigit(char),isLetterOrDigit(char),isLowerCase(char),isTitleCase(char),isUnicodeIdentifierStart(char),isUpperCase(char)
-
-
isLetter
public static boolean isLetter(int codePoint)
指定された文字(Unicodeコード・ポイント)が汎用文字かどうかを判定します。getType(codePoint)の示す汎用カテゴリ型が次のどれかの場合に、文字は汎用文字と見なされます。-
UPPERCASE_LETTER -
LOWERCASE_LETTER -
TITLECASE_LETTER -
MODIFIER_LETTER -
OTHER_LETTER
- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が汎用文字の場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.5
- 関連項目:
isDigit(int),isJavaIdentifierStart(int),isLetterOrDigit(int),isLowerCase(int),isTitleCase(int),isUnicodeIdentifierStart(int),isUpperCase(int)
-
-
isLetterOrDigit
public static boolean isLetterOrDigit(char ch)
指定された文字が汎用文字または数字かどうかを判定します。ある文字が文字または数字とみなされるのは、その文字の
Character.isLetter(char ch)またはCharacter.isDigit(char ch)からtrueが返される場合です。注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isLetterOrDigit(int)メソッドを使用してください。- パラメータ:
ch- 判定対象の文字。- 戻り値:
- 文字が汎用文字または数字の場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.0.2
- 関連項目:
isDigit(char),isJavaIdentifierPart(char),isJavaLetter(char),isJavaLetterOrDigit(char),isLetter(char),isUnicodeIdentifierPart(char)
-
isLetterOrDigit
public static boolean isLetterOrDigit(int codePoint)
指定された文字(Unicodeコード・ポイント)が汎用文字または数字かどうかを判定します。ある文字が文字または数字とみなされるのは、その文字の
isLetter(codePoint)またはisDigit(codePoint)からtrueが返される場合です。- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が汎用文字または数字の場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.5
- 関連項目:
isDigit(int),isJavaIdentifierPart(int),isLetter(int),isUnicodeIdentifierPart(int)
-
isJavaLetter
@Deprecated(since="1.1") public static boolean isJavaLetter(char ch)
非推奨。isJavaIdentifierStart(char)に置き換えられました。指定された文字をJava識別子の最初の文字として指定可能かどうかを判定します。次のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。
-
isLetter(ch)がtrueを返す -
getType(ch)がLETTER_NUMBERを返す -
chが通貨記号である('$'など) -
chが連結句読点文字である('_'など)
- パラメータ:
ch- 判定対象の文字。- 戻り値:
- 文字をJava識別子の先頭で使用可能な場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.0.2
- 関連項目:
isJavaLetterOrDigit(char),isJavaIdentifierStart(char),isJavaIdentifierPart(char),isLetter(char),isLetterOrDigit(char),isUnicodeIdentifierStart(char)
-
-
isJavaLetterOrDigit
@Deprecated(since="1.1") public static boolean isJavaLetterOrDigit(char ch)
非推奨。isJavaIdentifierPart(char)に置き換えられました。指定された文字をJava識別子の最初の文字以外に使用可能かどうかを判定します。次のどれかに当てはまる場合にだけ、その文字をJava識別子の一部に指定できます。
- 汎用文字である
- それが通貨記号である(
'$'など) - それが連結句読点文字である(
'_'など) - 数字である
- 数値汎用文字である(ローマ数字文字など)
- 連結マークである
- 非スペーシング・マークである
- 文字の
isIdentifierIgnorableがtrueを返す。
- パラメータ:
ch- 判定対象の文字。- 戻り値:
- 文字をJava識別子の一部に使用可能な場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.0.2
- 関連項目:
isJavaLetter(char),isJavaIdentifierStart(char),isJavaIdentifierPart(char),isLetter(char),isLetterOrDigit(char),isUnicodeIdentifierPart(char),isIdentifierIgnorable(char)
-
isAlphabetic
public static boolean isAlphabetic(int codePoint)
指定された文字(Unicodeコード・ポイント)がアルファベットかどうかを判定します。getType(codePoint)の示す汎用カテゴリ型が次のどれかの場合に、文字はアルファベットと見なされます。-
UPPERCASE_LETTER -
LOWERCASE_LETTER -
TITLECASE_LETTER -
MODIFIER_LETTER -
OTHER_LETTER -
LETTER_NUMBER
- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がUnicodeアルファベット文字の場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.7
-
-
isIdeographic
public static boolean isIdeographic(int codePoint)
指定された文字(Unicodeコード・ポイント)が、Unicode標準で規定されたCJKV (中国語、日本語、韓国語、およびベトナム語)の表意文字かどうかを判定します。- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がUnicode表意文字の場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.7
-
isJavaIdentifierStart
public static boolean isJavaIdentifierStart(char ch)
指定された文字をJava識別子の最初の文字として指定可能かどうかを判定します。次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。
-
isLetter(ch)がtrueを返す -
getType(ch)がLETTER_NUMBERを返す -
chが通貨記号である('$'など) -
chが連結句読点文字である('_'など)
注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isJavaIdentifierStart(int)メソッドを使用してください。- パラメータ:
ch- 判定対象の文字。- 戻り値:
- 文字をJava識別子の先頭で使用可能な場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.1
- 関連項目:
isJavaIdentifierPart(char),isLetter(char),isUnicodeIdentifierStart(char),SourceVersion.isIdentifier(CharSequence)
-
-
isJavaIdentifierStart
public static boolean isJavaIdentifierStart(int codePoint)
文字(Unicodeコード・ポイント)をJava識別子の最初の文字として指定可能かどうかを判定します。次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。
-
isLetter(codePoint)が次を返す:true -
getType(codePoint)が次を返す:LETTER_NUMBER - 参照される文字が通貨記号である(
'$'など) - 参照文字が連結句読点文字である(
'_'など)
- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字をJava識別子の先頭で使用可能な場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.5
- 関連項目:
isJavaIdentifierPart(int),isLetter(int),isUnicodeIdentifierStart(int),SourceVersion.isIdentifier(CharSequence)
-
-
isJavaIdentifierPart
public static boolean isJavaIdentifierPart(char ch)
指定された文字をJava識別子の最初の文字以外に使用可能かどうかを判定します。次のどれかに当てはまる場合にだけ、その文字をJava識別子の一部に指定できます。
- 汎用文字である
- それが通貨記号である(
'$'など) - それが連結句読点文字である(
'_'など) - 数字である
- 数値汎用文字である(ローマ数字文字など)
- 連結マークである
- 非スペーシング・マークである
- 文字の
isIdentifierIgnorableがtrueを返す
注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isJavaIdentifierPart(int)メソッドを使用してください。- パラメータ:
ch- 判定対象の文字。- 戻り値:
- 文字をJava識別子の一部に使用可能な場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.1
- 関連項目:
isIdentifierIgnorable(char),isJavaIdentifierStart(char),isLetterOrDigit(char),isUnicodeIdentifierPart(char),SourceVersion.isIdentifier(CharSequence)
-
isJavaIdentifierPart
public static boolean isJavaIdentifierPart(int codePoint)
文字(Unicodeコード・ポイント)をJava識別子の最初の文字以外に使用可能かどうかを判定します。次のどれかに当てはまる場合にだけ、その文字をJava識別子の一部に指定できます。
- 汎用文字である
- それが通貨記号である(
'$'など) - それが連結句読点文字である(
'_'など) - 数字である
- 数値汎用文字である(ローマ数字文字など)
- 連結マークである
- 非スペーシング・マークである
- 文字の
isIdentifierIgnorable(codePoint)がtrueを返す
- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字をJava識別子の一部に使用可能な場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.5
- 関連項目:
isIdentifierIgnorable(int),isJavaIdentifierStart(int),isLetterOrDigit(int),isUnicodeIdentifierPart(int),SourceVersion.isIdentifier(CharSequence)
-
isUnicodeIdentifierStart
public static boolean isUnicodeIdentifierStart(char ch)
指定された文字をUnicode識別子の最初の文字として指定可能かどうかを判定します。次の条件のどれかに当てはまる場合にだけ、その文字をUnicode識別子の最初に指定できます。
-
isLetter(ch)がtrueを返す -
getType(ch)がLETTER_NUMBERを返す。
注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isUnicodeIdentifierStart(int)メソッドを使用してください。- パラメータ:
ch- 判定対象の文字。- 戻り値:
- 文字をUnicode識別子の先頭で使用可能な場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.1
- 関連項目:
isJavaIdentifierStart(char),isLetter(char),isUnicodeIdentifierPart(char)
-
-
isUnicodeIdentifierStart
public static boolean isUnicodeIdentifierStart(int codePoint)
指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字として指定可能かどうかを判定します。次の条件のどれかに当てはまる場合にだけ、その文字をUnicode識別子の最初に指定できます。
-
isLetter(codePoint)が次を返す:true -
getType(codePoint)がLETTER_NUMBERを返す。
- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字をUnicode識別子の先頭で使用可能な場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.5
- 関連項目:
isJavaIdentifierStart(int),isLetter(int),isUnicodeIdentifierPart(int)
-
-
isUnicodeIdentifierPart
public static boolean isUnicodeIdentifierPart(char ch)
指定された文字をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。次の文のどれかに当てはまる場合にだけ、その文字をUnicode識別子の一部に使用できます。
- 汎用文字である
- それが連結句読点文字である(
'_'など) - 数字である
- 数値汎用文字である(ローマ数字文字など)
- 連結マークである
- 非スペーシング・マークである
- この文字の
isIdentifierIgnorableがtrueを返す。
注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isUnicodeIdentifierPart(int)メソッドを使用してください。- パラメータ:
ch- 判定対象の文字。- 戻り値:
- 文字をUnicode識別子の一部に使用可能な場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.1
- 関連項目:
isIdentifierIgnorable(char),isJavaIdentifierPart(char),isLetterOrDigit(char),isUnicodeIdentifierStart(char)
-
isUnicodeIdentifierPart
public static boolean isUnicodeIdentifierPart(int codePoint)
指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。次の文のどれかに当てはまる場合にだけ、その文字をUnicode識別子の一部に使用できます。
- 汎用文字である
- それが連結句読点文字である(
'_'など) - 数字である
- 数値汎用文字である(ローマ数字文字など)
- 連結マークである
- 非スペーシング・マークである
- この文字の
isIdentifierIgnorableがtrueを返す。
- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字をUnicode識別子の一部に使用可能な場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.5
- 関連項目:
isIdentifierIgnorable(int),isJavaIdentifierPart(int),isLetterOrDigit(int),isUnicodeIdentifierStart(int)
-
isIdentifierIgnorable
public static boolean isIdentifierIgnorable(char ch)
指定された文字が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。次のUnicode文字は、Java識別子やUnicode識別子内で無視できます。
- 空白以外のISO制御文字
'\u0000'-'\u0008''\u000E'-'\u001B''\u007F'-'\u009F'
- 汎用カテゴリ値
FORMATを保持するすべての文字
注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isIdentifierIgnorable(int)メソッドを使用してください。- パラメータ:
ch- 判定対象の文字。- 戻り値:
- JavaまたはUnicode識別子の一部に使用可能な、無視できる制御文字の場合は
true、それ以外の場合はfalse。 - 導入されたバージョン:
- 1.1
- 関連項目:
isJavaIdentifierPart(char),isUnicodeIdentifierPart(char)
- 空白以外のISO制御文字
-
isIdentifierIgnorable
public static boolean isIdentifierIgnorable(int codePoint)
指定された文字(Unicodeコード・ポイント)が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。次のUnicode文字は、Java識別子やUnicode識別子内で無視できます。
- 空白以外のISO制御文字
'\u0000'-'\u0008''\u000E'-'\u001B''\u007F'-'\u009F'
- 汎用カテゴリ値
FORMATを保持するすべての文字
- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- JavaまたはUnicode識別子の一部に使用可能な、無視できる制御文字の場合は
true、それ以外の場合はfalse。 - 導入されたバージョン:
- 1.5
- 関連項目:
isJavaIdentifierPart(int),isUnicodeIdentifierPart(int)
- 空白以外のISO制御文字
-
toLowerCase
public static char toLowerCase(char ch)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を小文字に変換します。Character.isLowerCase(Character.toLowerCase(ch))は、ある範囲の文字(特に表意文字や記号)に対して常にtrueを返すわけではありません。一般に、文字を小文字にマッピングする際には
String.toLowerCase()を使用するようにしてください。Stringのケース・マッピング・メソッドにはCharacterのケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、Stringのケース・マッピング・メソッドでは実行できますが、Characterのケース・マッピング・メソッドでは実行できません。注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
toLowerCase(int)メソッドを使用してください。- パラメータ:
ch- 変換対象の文字。- 戻り値:
- 対応する小文字(存在する場合)。小文字がない場合は、指定された文字そのもの。
- 関連項目:
isLowerCase(char),String.toLowerCase()
-
toLowerCase
public static int toLowerCase(int codePoint)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を小文字に変換します。Character.isLowerCase(Character.toLowerCase(codePoint))は、ある範囲の文字(特に表意文字や記号)に対して常にtrueを返すわけではありません。一般に、文字を小文字にマッピングする際には
String.toLowerCase()を使用するようにしてください。Stringのケース・マッピング・メソッドにはCharacterのケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、Stringのケース・マッピング・メソッドでは実行できますが、Characterのケース・マッピング・メソッドでは実行できません。- パラメータ:
codePoint- 変換対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 指定された文字(Unicodeコード・ポイント)の対応する小文字。対応する小文字がない場合は、指定された文字そのもの。
- 導入されたバージョン:
- 1.5
- 関連項目:
isLowerCase(int),String.toLowerCase()
-
toUpperCase
public static char toUpperCase(char ch)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を大文字に変換します。Character.isUpperCase(Character.toUpperCase(ch))は、ある範囲の文字(特に表意文字や記号)に対して常にtrueを返すわけではありません。一般に、文字を大文字にマッピングする際には
String.toUpperCase()を使用するようにしてください。Stringのケース・マッピング・メソッドにはCharacterのケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、Stringのケース・マッピング・メソッドでは実行できますが、Characterのケース・マッピング・メソッドでは実行できません。注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
toUpperCase(int)メソッドを使用してください。- パラメータ:
ch- 変換対象の文字。- 戻り値:
- 対応する大文字(存在する場合)。大文字がない場合は、指定された文字そのもの。
- 関連項目:
isUpperCase(char),String.toUpperCase()
-
toUpperCase
public static int toUpperCase(int codePoint)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を大文字に変換します。Character.isUpperCase(Character.toUpperCase(codePoint))は、ある範囲の文字(特に表意文字や記号)に対して常にtrueを返すわけではありません。一般に、文字を大文字にマッピングする際には
String.toUpperCase()を使用するようにしてください。Stringのケース・マッピング・メソッドにはCharacterのケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、Stringのケース・マッピング・メソッドでは実行できますが、Characterのケース・マッピング・メソッドでは実行できません。- パラメータ:
codePoint- 変換対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 対応する大文字(存在する場合)。大文字がない場合は、指定された文字そのもの。
- 導入されたバージョン:
- 1.5
- 関連項目:
isUpperCase(int),String.toUpperCase()
-
toTitleCase
public static char toTitleCase(char ch)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数をタイトル・ケースに変換します。 文字が、明示的なタイトル・ケース・マッピングを保持せず、かつUnicodeDataに準拠したタイトル・ケースcharではない場合、等価なタイトル・ケースとして大文字へのマッピングが返されます。char引数がタイトル・ケースcharである場合には、同じchar値が返されます。Character.isTitleCase(Character.toTitleCase(ch))は、ある範囲の文字に対して常にtrueを返すわけではありません。注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
toTitleCase(int)メソッドを使用してください。- パラメータ:
ch- 変換対象の文字。- 戻り値:
- 対応するタイトル・ケース(存在する場合)。タイトル・ケースがない場合は、指定された文字そのもの。
- 導入されたバージョン:
- 1.0.2
- 関連項目:
isTitleCase(char),toLowerCase(char),toUpperCase(char)
-
toTitleCase
public static int toTitleCase(int codePoint)
UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数をタイトル・ケースに変換します。 文字が、明示的なタイトル・ケース・マッピングを保持せず、かつUnicodeDataに準拠したタイトル・ケースcharではない場合、等価なタイトル・ケースとして大文字へのマッピングが返されます。 文字の引数がタイトル・ケース文字である場合には、同じ文字値が返されます。Character.isTitleCase(Character.toTitleCase(codePoint))は、ある範囲の文字に対して常にtrueを返すわけではありません。- パラメータ:
codePoint- 変換対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 対応するタイトル・ケース(存在する場合)。タイトル・ケースがない場合は、指定された文字そのもの。
- 導入されたバージョン:
- 1.5
- 関連項目:
isTitleCase(int),toLowerCase(int),toUpperCase(int)
-
digit
public static int digit(char ch, int radix)指定された基数での、文字chの数値としての値を返します。基数が
MIN_RADIX≤radix≤MAX_RADIXの範囲外の場合、またはchの値が指定された基数の有効数字でない場合は、-1が返されます。 次のどれかに当てはまる場合、文字は有効数字です。- 文字についてメソッド
isDigitがtrueを返し、その文字のUnicode 10進数値(または単一文字の分解)が指定された基数よりも小さい。 この場合、10進値が返される。 - 文字が
'A'-'Z'のラテン大文字のどれかで、そのコードがradix+'A' - 10よりも小さい。 この場合、ch - 'A'+10が返される。 - 文字が
'a'-'z'のラテン小文字のどれかで、そのコードがradix+'a' - 10よりも小さい。 この場合、ch - 'a'+10が返される。 - 文字がA (
'\uFF21') - Z ('\uFF3A')の全角ラテン大文字のどれかで、そのコードがradix+'\uFF21' - 10よりも小さい。 この場合、ch - '\uFF21'+10が返される。 - 文字がa (
'\uFF41') - z ('\uFF5A')の全角ラテン小文字のどれかで、そのコードがradix+'\uFF41' - 10よりも小さい。 この場合、ch - '\uFF41'+10が返される。
注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
digit(int, int)メソッドを使用してください。- パラメータ:
ch- 変換対象の文字。radix- 基数。- 戻り値:
- 指定された基数での、文字によって表される数値
- 関連項目:
forDigit(int, int),isDigit(char)
- 文字についてメソッド
-
digit
public static int digit(int codePoint, int radix)指定された基数での、指定された文字(Unicodeコード・ポイント)の数値を返します。基数が
MIN_RADIX≤radix≤MAX_RADIXの範囲外の場合、または文字が指定された基数の有効数字でない場合は、-1が返されます。 次のどれかに当てはまる場合、文字は有効数字です。- 文字についてメソッド
isDigit(codePoint)がtrueを返し、その文字のUnicode 10進数値(または単一文字の分解)が指定された基数よりも小さい。 この場合、10進値が返される。 - 文字が
'A'-'Z'のラテン大文字のどれかで、そのコードがradix+'A' - 10よりも小さい。 この場合、codePoint - 'A'+10が返される。 - 文字が
'a'-'z'のラテン小文字のどれかで、そのコードがradix+'a' - 10よりも小さい。 この場合、codePoint - 'a'+10が返される。 - 文字がA (
'\uFF21') - Z ('\uFF3A')の全角ラテン大文字のどれかで、そのコードがradix+'\uFF21' - 10よりも小さい。 この場合、codePoint - '\uFF21'+10が返される。 - 文字がa (
'\uFF41') - z ('\uFF5A')の全角ラテン小文字のどれかで、そのコードがradix+'\uFF41'- 10よりも小さい。 この場合、codePoint - '\uFF41'+10が返される。
- パラメータ:
codePoint- 変換対象の文字(Unicodeコード・ポイント)。radix- 基数。- 戻り値:
- 指定された基数での、文字によって表される数値
- 導入されたバージョン:
- 1.5
- 関連項目:
forDigit(int, int),isDigit(int)
- 文字についてメソッド
-
getNumericValue
public static int getNumericValue(char ch)
指定されたUnicode文字が表すint値を返します。 たとえば、文字'\u216C'(ローマ数字の50)は、値50のintを返します。文字A - Zの大文字(
'\u0041'-'\u005A')、小文字('\u0061'-'\u007A')、全角バリアント('\uFF21'-'\uFF3A'および'\uFF41'-'\uFF5A')の各形式は、10 - 35の数値を持ちます。 これはUnicode仕様とは無関係であり、Unicode仕様ではこれらのchar値に数値は割り当てられません。文字が数値を持たない場合は、-1が返されます。 文字の数値を負でない整数として表現できない場合(小数値など)は、-2が返されます。
注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
getNumericValue(int)メソッドを使用してください。- パラメータ:
ch- 変換対象の文字。- 戻り値:
- 文字の数値を負でない
int値として返します。文字に数値が含まれていても値が非負のint値として表現できない場合は -2です。文字が数値を持たない場合は -1。 - 導入されたバージョン:
- 1.1
- 関連項目:
forDigit(int, int),isDigit(char)
-
getNumericValue
public static int getNumericValue(int codePoint)
指定された文字(Unicodeコード・ポイント)が表すint値を返します。 たとえば、文字'\u216C'(ローマ数字の50)は、値50のintを返します。文字A - Zの大文字(
'\u0041'-'\u005A')、小文字('\u0061'-'\u007A')、全角バリアント('\uFF21'-'\uFF3A'および'\uFF41'-'\uFF5A')の各形式は、10 - 35の数値を持ちます。 これはUnicode仕様とは無関係であり、Unicode仕様ではこれらのchar値に数値は割り当てられません。文字が数値を持たない場合は、-1が返されます。 文字の数値を負でない整数として表現できない場合(小数値など)は、-2が返されます。
- パラメータ:
codePoint- 変換対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字の数値を負でない
int値として返します。文字に数値が含まれていても値が非負のint値として表現できない場合は -2です。文字が数値を持たない場合は -1。 - 導入されたバージョン:
- 1.5
- 関連項目:
forDigit(int, int),isDigit(int)
-
isSpace
@Deprecated(since="1.1") public static boolean isSpace(char ch)
非推奨。isWhitespace(char)に置き換えられました。指定された文字がISO-LATIN-1の空白かどうかを判定します。 次の5つの文字についてだけ、このメソッドはtrueを返します。文字 コード 名 '\t'U+0009HORIZONTAL TABULATION'\n'U+000ANEW LINE'\f'U+000CFORM FEED'\r'U+000DCARRIAGE RETURN' 'U+0020SPACE- パラメータ:
ch- 判定対象の文字。- 戻り値:
- 文字がISO-LATIN-1の空白の場合は
true、そうでない場合はfalse。 - 関連項目:
isSpaceChar(char),isWhitespace(char)
-
isSpaceChar
public static boolean isSpaceChar(char ch)
指定された文字がUnicodeの空白文字かどうかを判定します。 空白文字と見なされるのは、Unicode標準で空白文字として指定されている場合だけです。 文字の汎用カテゴリ型が次のどれかの場合にだけ、このメソッドはtrueを返します。-
SPACE_SEPARATOR -
LINE_SEPARATOR -
PARAGRAPH_SEPARATOR
注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isSpaceChar(int)メソッドを使用してください。- パラメータ:
ch- 判定対象の文字。- 戻り値:
- 文字が空白文字の場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.1
- 関連項目:
isWhitespace(char)
-
-
isSpaceChar
public static boolean isSpaceChar(int codePoint)
指定された文字(Unicodeコード・ポイント)がUnicodeの空白文字かどうかを判定します。 空白文字と見なされるのは、Unicode標準で空白文字として指定されている場合だけです。 文字の汎用カテゴリ型が次のどれかの場合にだけ、このメソッドはtrueを返します。- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字が空白文字の場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.5
- 関連項目:
isWhitespace(int)
-
isWhitespace
public static boolean isWhitespace(char ch)
指定された文字がJavaの基準に従った空白かどうかを判定します。 次の基準のどれかを満たす場合にだけ、Javaの空白文字になります。- Unicodeの空白文字(
SPACE_SEPARATOR、LINE_SEPARATOR、またはPARAGRAPH_SEPARATOR)であるが、改行なしの空白('\u00A0'、'\u2007'、'\u202F')ではない。 -
'\t'(U+0009水平タブ)である。 -
'\n'(U+000A改行)である。 -
'\u000B'(U+000B垂直タブ)である。 -
'\f'(U+000Cフォーム・フィード)である。 -
'\r'(U+000D復帰)である。 -
'\u001C'(U+001Cファイル区切り文字)である。 -
'\u001D'(U+001Dグループ区切り文字)である。 -
'\u001E'(U+001Eレコード区切り文字)である。 -
'\u001F'(U+001F単位区切り文字)である。
注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isWhitespace(int)メソッドを使用してください。- パラメータ:
ch- 判定対象の文字。- 戻り値:
- 文字がJava空白文字の場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.1
- 関連項目:
isSpaceChar(char)
- Unicodeの空白文字(
-
isWhitespace
public static boolean isWhitespace(int codePoint)
指定された文字(Unicodeコード・ポイント)がJavaの基準に従った空白かどうかを判定します。 次の基準のどれかを満たす場合にだけ、Javaの空白文字になります。- Unicodeの空白文字(
SPACE_SEPARATOR、LINE_SEPARATOR、またはPARAGRAPH_SEPARATOR)であるが、改行なしの空白('\u00A0'、'\u2007'、'\u202F')ではない。 -
'\t'(U+0009水平タブ)である。 -
'\n'(U+000A改行)である。 -
'\u000B'(U+000B垂直タブ)である。 -
'\f'(U+000Cフォーム・フィード)である。 -
'\r'(U+000D復帰)である。 -
'\u001C'(U+001Cファイル区切り文字)である。 -
'\u001D'(U+001Dグループ区切り文字)である。 -
'\u001E'(U+001Eレコード区切り文字)である。 -
'\u001F'(U+001F単位区切り文字)である。
- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がJava空白文字の場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.5
- 関連項目:
isSpaceChar(int)
- Unicodeの空白文字(
-
isISOControl
public static boolean isISOControl(char ch)
指定された文字がISO制御文字かどうかを判定します。 コードが'\u0000'-'\u001F'の範囲、または'\u007F'-'\u009F'の範囲の場合は、ISO制御文字と見なされます。注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isISOControl(int)メソッドを使用してください。- パラメータ:
ch- 判定対象の文字。- 戻り値:
- 文字がISO制御文字の場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.1
- 関連項目:
isSpaceChar(char),isWhitespace(char)
-
isISOControl
public static boolean isISOControl(int codePoint)
参照された文字(Unicodeコード・ポイント)がISO制御文字かどうかを判定します。 コードが'\u0000'-'\u001F'の範囲、または'\u007F'-'\u009F'の範囲の場合は、ISO制御文字と見なされます。- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がISO制御文字の場合は
true、そうでない場合はfalse。 - 導入されたバージョン:
- 1.5
- 関連項目:
isSpaceChar(int),isWhitespace(int)
-
getType
public static int getType(char ch)
文字の汎用カテゴリを示す値を返します。注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
getType(int)メソッドを使用してください。- パラメータ:
ch- 判定対象の文字。- 戻り値:
- 文字の汎用カテゴリを表す
int型の値。 - 導入されたバージョン:
- 1.1
- 関連項目:
COMBINING_SPACING_MARK,CONNECTOR_PUNCTUATION,CONTROL,CURRENCY_SYMBOL,DASH_PUNCTUATION,DECIMAL_DIGIT_NUMBER,ENCLOSING_MARK,END_PUNCTUATION,FINAL_QUOTE_PUNCTUATION,FORMAT,INITIAL_QUOTE_PUNCTUATION,LETTER_NUMBER,LINE_SEPARATOR,LOWERCASE_LETTER,MATH_SYMBOL,MODIFIER_LETTER,MODIFIER_SYMBOL,NON_SPACING_MARK,OTHER_LETTER,OTHER_NUMBER,OTHER_PUNCTUATION,OTHER_SYMBOL,PARAGRAPH_SEPARATOR,PRIVATE_USE,SPACE_SEPARATOR,START_PUNCTUATION,SURROGATE,TITLECASE_LETTER,UNASSIGNED,UPPERCASE_LETTER
-
getType
public static int getType(int codePoint)
文字の汎用カテゴリを示す値を返します。- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字の汎用カテゴリを表す
int型の値。 - 導入されたバージョン:
- 1.5
- 関連項目:
COMBINING_SPACING_MARK,CONNECTOR_PUNCTUATION,CONTROL,CURRENCY_SYMBOL,DASH_PUNCTUATION,DECIMAL_DIGIT_NUMBER,ENCLOSING_MARK,END_PUNCTUATION,FINAL_QUOTE_PUNCTUATION,FORMAT,INITIAL_QUOTE_PUNCTUATION,LETTER_NUMBER,LINE_SEPARATOR,LOWERCASE_LETTER,MATH_SYMBOL,MODIFIER_LETTER,MODIFIER_SYMBOL,NON_SPACING_MARK,OTHER_LETTER,OTHER_NUMBER,OTHER_PUNCTUATION,OTHER_SYMBOL,PARAGRAPH_SEPARATOR,PRIVATE_USE,SPACE_SEPARATOR,START_PUNCTUATION,SURROGATE,TITLECASE_LETTER,UNASSIGNED,UPPERCASE_LETTER
-
forDigit
public static char forDigit(int digit, int radix)指定された基数での、指定された桁数の文字表現を判定します。radixの値が無効な基数の場合、またはdigitが指定された基数で無効な数字の場合は、null文字('\u0000')が返されます。radix引数は、MIN_RADIX以上MAX_RADIX以下の場合に有効です。digit引数は、0 <= digit < radixの場合に有効です。数字が10より小さいと、
'0'+digitが返されます。 そうでない場合は、値'a'+digit - 10が返されます。- パラメータ:
digit- 文字に変換する数。radix- 基数。- 戻り値:
- 指定された基数での、指定された数値の
char表現。 - 関連項目:
MIN_RADIX,MAX_RADIX,digit(char, int)
-
getDirectionality
public static byte getDirectionality(char ch)
指定された文字のUnicode方向性プロパティを返します。 文字の方向性は、テキストの表示順の計算に使用されます。 未定義のchar値の方向性値はDIRECTIONALITY_UNDEFINEDです。注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
getDirectionality(int)メソッドを使用してください。- パラメータ:
ch- 方向性プロパティが要求されたchar。- 戻り値:
char値の方向性プロパティ。- 導入されたバージョン:
- 1.4
- 関連項目:
DIRECTIONALITY_UNDEFINED,DIRECTIONALITY_LEFT_TO_RIGHT,DIRECTIONALITY_RIGHT_TO_LEFT,DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC,DIRECTIONALITY_EUROPEAN_NUMBER,DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR,DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR,DIRECTIONALITY_ARABIC_NUMBER,DIRECTIONALITY_COMMON_NUMBER_SEPARATOR,DIRECTIONALITY_NONSPACING_MARK,DIRECTIONALITY_BOUNDARY_NEUTRAL,DIRECTIONALITY_PARAGRAPH_SEPARATOR,DIRECTIONALITY_SEGMENT_SEPARATOR,DIRECTIONALITY_WHITESPACE,DIRECTIONALITY_OTHER_NEUTRALS,DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING,DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE,DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING,DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE,DIRECTIONALITY_POP_DIRECTIONAL_FORMAT,DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE,DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE,DIRECTIONALITY_FIRST_STRONG_ISOLATE,DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
-
getDirectionality
public static byte getDirectionality(int codePoint)
所定の文字(Unicodeコード・ポイント)のUnicode方向性プロパティを返します。 文字の方向性は、テキストの表示順の計算に使用されます。 未定義の文字の方向性値はDIRECTIONALITY_UNDEFINEDです。- パラメータ:
codePoint- 方向性プロパティが要求された文字(Unicodeコード・ポイント)。- 戻り値:
- 文字の方向性プロパティ
- 導入されたバージョン:
- 1.5
- 関連項目:
DIRECTIONALITY_UNDEFINED,DIRECTIONALITY_LEFT_TO_RIGHT,DIRECTIONALITY_RIGHT_TO_LEFT,DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC,DIRECTIONALITY_EUROPEAN_NUMBER,DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR,DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR,DIRECTIONALITY_ARABIC_NUMBER,DIRECTIONALITY_COMMON_NUMBER_SEPARATOR,DIRECTIONALITY_NONSPACING_MARK,DIRECTIONALITY_BOUNDARY_NEUTRAL,DIRECTIONALITY_PARAGRAPH_SEPARATOR,DIRECTIONALITY_SEGMENT_SEPARATOR,DIRECTIONALITY_WHITESPACE,DIRECTIONALITY_OTHER_NEUTRALS,DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING,DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE,DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING,DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE,DIRECTIONALITY_POP_DIRECTIONAL_FORMAT,DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE,DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE,DIRECTIONALITY_FIRST_STRONG_ISOLATE,DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
-
isMirrored
public static boolean isMirrored(char ch)
Unicode仕様に従って文字をミラー化するかどうかを判定します。 テキスト内で右から左に文字が描画される場合、文字のミラー化により、グリフが水平方向にミラー化されます。 たとえば、'\u0028'LEFT PARENTHESISは、セマンティックスでは開きカッコとして定義されています。 これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、
isMirrored(int)メソッドを使用してください。- パラメータ:
ch- ミラー化プロパティが要求されたchar- 戻り値:
- charがミラー化される場合は
true、charがミラー化されないか未定義の場合はfalse。 - 導入されたバージョン:
- 1.4
-
isMirrored
public static boolean isMirrored(int codePoint)
Unicode仕様に従って、指定された文字(Unicodeコード・ポイント)をミラー化するかどうかを判定します。 テキスト内で右から左に文字が描画される場合、文字のミラー化により、グリフが水平方向にミラー化されます。 たとえば、'\u0028'LEFT PARENTHESISは、セマンティックスでは開きカッコとして定義されています。 これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。- パラメータ:
codePoint- 判定対象の文字(Unicodeコード・ポイント)。- 戻り値:
- 文字がミラー化される場合は
true、文字がミラー化されないか未定義の場合はfalse。 - 導入されたバージョン:
- 1.5
-
compareTo
public int compareTo(Character anotherCharacter)
2つのCharacterオブジェクトを数値的に比較します。- 定義:
compareTo、インタフェース:Comparable<Character>- パラメータ:
anotherCharacter- 比較対象のCharacter。- 戻り値:
- 引数
CharacterがこのCharacterと等しい場合は値0、このCharacterがCharacter引数より小さい数値の場合は0より小さい値、このCharacterがCharacter引数より大きい数値の場合は0より大きい値(符号なしの比較)。 これは完全に数値の比較なので、ロケールに依存しない - 導入されたバージョン:
- 1.2
-
compare
public static int compare(char x, char y)2つのchar値を数値的に比較します。 返される値は、次から返される値と同じになります。Character.valueOf(x).compareTo(Character.valueOf(y))- パラメータ:
x- 比較する最初のchary- 比較する2番目のchar- 戻り値:
x == yの場合は値0、x < yの場合は0より小さい値、x> yの場合は0より大きい値- 導入されたバージョン:
- 1.7
-
reverseBytes
public static char reverseBytes(char ch)
指定されたchar値でバイト順を逆にして取得した値を返します。- パラメータ:
ch- そのバイト順を逆にするchar。- 戻り値:
- 指定された
char値でバイト順を逆にして(つまり入れ替えて)取得した値。 - 導入されたバージョン:
- 1.5
-
getName
public static String getName(int codePoint)
指定された文字codePointのUnicode名(コード・ポイントがunassignedの場合はnull)を返します。注: UnicodeDataファイル(Unicode Consortiumがメンテナンスを行っているUnicode Character Databaseの一部)で、指定された文字に名前が割り当てられていない場合、返される名前は次の式の結果と同じになります。
Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);- パラメータ:
codePoint- 文字(Unicodeコード・ポイント)- 戻り値:
- 指定された文字のUnicode名(コード・ポイントが未割当ての場合はnull)。
- 例外:
IllegalArgumentException- 指定されたcodePointが有効なUnicodeコード・ポイントでない場合。- 導入されたバージョン:
- 1.7
-
codePointOf
public static int codePointOf(String name)
指定されたUnicode文字名で指定されたUnicode文字のコード・ポイント値を返します。ノート: UnicodeDataファイル(ユニコード・コンソーシアムによって管理されているUnicode文字データベースの一部)で文字に名前が割り当てられていない場合、その名前は式の結果として定義されます
Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);nameのマッチングでは、大文字と小文字は区別されず、前後の空白文字は削除されます。- パラメータ:
name- Unicode文字の名前- 戻り値:
- その名前で指定された文字のコード・ポイント値。
- 例外:
IllegalArgumentException- 指定されたnameが有効なUnicode文字名でない場合。NullPointerException-nameがnullである場合- 導入されたバージョン:
- 9
-
-