モジュール java.base
パッケージ java.lang

クラスCharacter

java.lang.Object
java.lang.Character
すべての実装されたインタフェース:
Serializable, Comparable<Character>, Constable

public final class Character extends Object implements Serializable, Comparable<Character>, Constable
Characterクラスは、プリミティブ型charの値をオブジェクトにラップします。 クラスCharacterのオブジェクトには、タイプがcharである単一のフィールドが含まれます。

また、このクラスは、文字カテゴリ(小文字、数字など。)を決定するため、また大文字から小文字への変換やその逆のために多数の静的メソッドを提供します。

Unicode適合

Characterクラスのフィールドとメソッドは、Unicode規格(特にUnicode文字データベースの一部であるUnicodeDataファイル)からの文字情報に基づいて定義されます。 このファイルは、割り当てられたすべてのUnicodeコード・ポイントまたは文字範囲の名前およびカテゴリを含むプロパティを指定します。 このファイルは、http://www.unicode.orgのUnicode Consortiumから入手できます。

文字情報は、Unicode Standardバージョン13.0に基づいています。

Javaプラットフォームは、長期にわたって異なるバージョンのUnicode Standardをサポートしました。 新しいバージョンのUnicode Standardへのアップグレードは、それぞれ新しいバージョンを示す次のJavaリリースで行われました:

JavaリリースおよびサポートされているUnicodeバージョンを表示
Javaリリース Unicodeバージョン
Java SE 15 Unicode 13.0
Java SE 13 Unicode 12.1
Java SE 12 Unicode 11.0
Java SE 11 Unicode 10.0
JavaSE9 Unicode 8.0
Java SE 8 Unicode 6.2
Java SE 7 Unicode 6.0
Java SE 5.0 Unicode 4.0
Java SE 1.4 Unicode 3.0
JDK 1.1 Unicode 2.0
JDK 1.0.2 Unicode 1.1.5
これらの基本Unicodeバージョン(認識される付録など)のバリエーションについては、別の場所に記載されています。

Unicode文字表現

charデータ型(Characterオブジェクトにカプセル化される値)は、当初のUnicode仕様に基づいています。この仕様では、文字が固定幅16ビット・エンティティとして定義されていました。 Unicode標準はその後、16ビット以上の表現を必要とする文字を許容するように変更されています。 適正なコード・ポイントの範囲は、現在U+0000 - U+10FFFFであり、Unicodeスカラー値として知られています。 (Unicode標準のU+n表記の定義を参照。)

U+0000 - U+FFFFの文字セットは、基本多言語面(BMP)と呼ばれる場合もあります。 コード・ポイントがU+FFFFよりも大きい文字補助文字と呼ばれます。 Javaプラットフォームでは、char配列、Stringクラス、およびStringBufferクラスでUTF-16表現が使用されます。 この表現では、補助文字はchar値のペアとして表現され、上位サロゲート範囲(\uD800-\uDBFF)からの最初の値と、下位サロゲート範囲(\uDC00-\uDFFF)からの第2の値から構成されています。

したがって、char値は、サロゲート・コード・ポイントやUTF-16エンコーディングのコード単位を含む基本多言語面(BMP)コード・ポイントを表します。 int値は、補助コード・ポイントを含むすべてのUnicodeコード・ポイントを表します。 intの下位(最下位) 21ビットは、Unicodeコード・ポイントを表すために使用され、上位(最上位) 11ビットはゼロである必要があります。 特に指定されないかぎり、補助文字とサロゲートchar値に関する動作は次のとおりです。

  • char値だけを受け入れるメソッドは補助文字に対応できません。 これらのメソッドはサロゲート範囲のchar値を未定義の文字として扱います。 たとえば、Character.isLetter('\uD840')falseを返し、文字列でそのあとに下位サロゲート値が続く場合でも、この特定の値は文字を表します。
  • int値を受け入れるメソッドは、補助文字を含むすべてのUnicode文字に対応します。 たとえば、Character.isLetter(0x2F81A)は、コード・ポイント値が文字(CJK統合漢字)を表すため、trueを返します。

Java SE APIドキュメンテーションでは、U+0000 - U+10FFFFの範囲の文字値にUnicodeコード・ポイントを使用し、UTF-16エンコーディングのコード単位である16ビットchar値にUnicodeコード単位を使用します。 Unicode用語の詳細は、「Unicode Glossary」を参照してください。

これはvalue-basedクラスです。プログラマは、equalのインスタンスを交換可能として扱い、同期にインスタンスを使用しないようにする必要があります。そうしないと、予期しない動作が発生する可能性があります。 たとえば、将来のリリースでは、同期が失敗する可能性があります。

導入されたバージョン:
1.0
関連項目:
  • ネストされたクラスのサマリー

    ネストされたクラス
    修飾子と型
    クラス
    説明
    static class 
    このクラスのインスタンスは、Unicode文字セットの特定のサブセットを表します。
    static final class 
    Unicode仕様で定義されている文字ブロックを表す文字サブセットのファミリです。
    static enum 
    Unicode Standard Annex#24: Script Names」で定義された文字書体を表す文字サブセットのファミリです。
  • フィールドのサマリー

    フィールド
    修飾子と型
    フィールド
    説明
    static final int
    符号なしバイナリ形式でchar値を表すために使用されるバイト数。
    static final byte
    Unicode仕様の汎用カテゴリ「Mc」。
    static final byte
    Unicode仕様の汎用カテゴリ「Pc」。
    static final byte
    Unicode仕様の汎用カテゴリ「Cc」。
    static final byte
    Unicode仕様の汎用カテゴリ「Sc」。
    static final byte
    Unicode仕様の汎用カテゴリ「Pd」。
    static final byte
    Unicode仕様の汎用カテゴリ「Nd」。
    static final byte
    Unicode仕様の弱い双方向文字タイプ「AN」。
    static final byte
    Unicode仕様の弱い双方向文字タイプ「BN」。
    static final byte
    Unicode仕様の弱い双方向文字タイプ「CS」。
    static final byte
    Unicode仕様の弱い双方向文字タイプ「EN」。
    static final byte
    Unicode仕様の弱い双方向文字タイプ「ES」。
    static final byte
    Unicode仕様の弱い双方向文字タイプ「ET」。
    static final byte
    Unicode仕様の弱い双方向文字型"FSI"。
    static final byte
    Unicode仕様の強力な双方向文字タイプ「L」。
    static final byte
    Unicode仕様の強力な双方向文字タイプ「LRE」。
    static final byte
    Unicode仕様の弱い双方向文字型"LRI"。
    static final byte
    Unicode仕様の強力な双方向文字タイプ「LRO」。
    static final byte
    Unicode仕様の弱い双方向文字タイプ「NSM」。
    static final byte
    Unicode仕様のニュートラルな双方向文字タイプ「ON」。
    static final byte
    Unicode仕様のニュートラルな双方向文字タイプ「B」。
    static final byte
    Unicode仕様の弱い双方向文字タイプ「PDF」。
    static final byte
    Unicode仕様の弱い双方向文字型"PDI"。
    static final byte
    Unicode仕様の強力な双方向文字タイプ「R」。
    static final byte
    Unicode仕様の強力な双方向文字タイプ「AL」。
    static final byte
    Unicode仕様の強力な双方向文字タイプ「RLE」。
    static final byte
    Unicode仕様の弱い双方向文字型"RLI"。
    static final byte
    Unicode仕様の強力な双方向文字タイプ「RLO」。
    static final byte
    Unicode仕様のニュートラルな双方向文字タイプ「S」。
    static final byte
    未定義の双方向文字タイプ。
    static final byte
    Unicode仕様のニュートラルな双方向文字タイプ「WS」。
    static final byte
    Unicode仕様の汎用カテゴリ「Me」。
    static final byte
    Unicode仕様の汎用カテゴリ「Pe」。
    static final byte
    Unicode仕様の汎用カテゴリ「Pf」。
    static final byte
    Unicode仕様の汎用カテゴリ「Cf」。
    static final byte
    Unicode仕様の汎用カテゴリ「Pi」。
    static final byte
    Unicode仕様の汎用カテゴリ「Nl」。
    static final byte
    Unicode仕様の汎用カテゴリ「Zl」。
    static final byte
    Unicode仕様の汎用カテゴリ「Ll」。
    static final byte
    Unicode仕様の汎用カテゴリ「Sm」。
    static final int
    Unicodeコード・ポイントの最大値(定数U+10FFFF)。
    static final char
    UTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最大値(定数'\uDBFF')。
    static final char
    UTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最大値(定数'\uDFFF')。
    static final int
    文字列との変換に使用可能な最大基数です。
    static final char
    UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最大値(定数'\uDFFF')。
    static final char
    このフィールドの定数値は、char型の最大値'\uFFFF'です。
    static final int
    Unicodeコード・ポイントの最小値(定数U+0000)。
    static final char
    UTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最小値(定数'\uD800')。
    static final char
    UTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最小値(定数'\uDC00')。
    static final int
    文字列との変換に使用可能な最小基数です。
    static final int
    Unicode補助コード・ポイントの最小値(定数U+10000)。
    static final char
    UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最小値(定数'\uD800')。
    static final char
    このフィールドの定数値は、char型の最小値'\u0000'です。
    static final byte
    Unicode仕様の汎用カテゴリ「Lm」。
    static final byte
    Unicode仕様の汎用カテゴリ「Sk」。
    static final byte
    Unicode仕様の汎用カテゴリ「Mn」。
    static final byte
    Unicode仕様の汎用カテゴリ「Lo」。
    static final byte
    Unicode仕様の汎用カテゴリ「No」。
    static final byte
    Unicode仕様の汎用カテゴリ「Po」。
    static final byte
    Unicode仕様の汎用カテゴリ「So」。
    static final byte
    Unicode仕様の汎用カテゴリ「Zp」。
    static final byte
    Unicode仕様の汎用カテゴリ「Co」。
    static final int
    符号なしバイナリ形式でchar値を表すのに使用されるビット数(定数16)。
    static final byte
    Unicode仕様の汎用カテゴリ「Zs」。
    static final byte
    Unicode仕様の汎用カテゴリ「Ps」。
    static final byte
    Unicode仕様の汎用カテゴリ「Cs」。
    static final byte
    Unicode仕様の汎用カテゴリ「Lt」。
    static final Class<Character>
    プリミティブ型charを表すClassインスタンス。
    static final byte
    Unicode仕様の汎用カテゴリ「Cn」。
    static final byte
    Unicode仕様の汎用カテゴリ「Lu」。
  • コンストラクタのサマリー

    コンストラクタ
    コンストラクタ
    説明
    Character(char value)
    削除予定のため非推奨: このAPI要素は、将来のバージョンで削除される可能性があります。
    このコンストラクタを使用することはほとんどありません。
  • メソッドのサマリー

    修飾子と型
    メソッド
    説明
    static int
    charCount(int codePoint)
    指定された文字(Unicodeコード・ポイント)を表すのに必要なchar値の数を判定します。
    char
    このCharacterオブジェクトの値を返します。
    static int
    codePointAt(char[] a, int index)
    char配列の指定されたインデックスにあるコード・ポイントを返します。
    static int
    codePointAt(char[] a, int index, int limit)
    limitの長さ未満のindexを持つ配列要素のみを使用可能な、char配列の指定されたインデックスにあるコード・ポイントを返します。
    static int
    codePointAt(CharSequence seq, int index)
    CharSequenceの指定されたインデックスにあるコード・ポイントを返します。
    static int
    codePointBefore(char[] a, int index)
    char配列の指定されたインデックスの前にあるコード・ポイントを返します。
    static int
    codePointBefore(char[] a, int index, int start)
    start以上のindexを持つ配列要素のみを使用可能な、char配列の指定されたインデックスの前にあるコード・ポイントを返します。
    static int
    codePointBefore(CharSequence seq, int index)
    CharSequenceの指定されたインデックスの前にあるコード・ポイントを返します。
    static int
    codePointCount(char[] a, int offset, int count)
    char配列引数の部分配列内にあるUnicodeコード・ポイントの数を返します。
    static int
    codePointCount(CharSequence seq, int beginIndex, int endIndex)
    指定されたcharシーケンスのテキスト範囲内のUnicodeコード・ポイントの数を返します。
    static int
    指定された文字名で指定されたUnicode文字のコード・ポイント値を返します。
    static int
    compare(char x, char y)
    2つのchar値を数値的に比較します。
    int
    compareTo(Character anotherCharacter)
    2つのCharacterオブジェクトを数値的に比較します。
    このインスタンスの名目記述子を含むOptionalを返します。
    static int
    digit(char ch, int radix)
    指定された基数での、文字chの数値としての値を返します。
    static int
    digit(int codePoint, int radix)
    指定された基数での、指定された文字(Unicodeコード・ポイント)の数値を返します。
    boolean
    このオブジェクトと指定されたオブジェクトを比較します。
    static char
    forDigit(int digit, int radix)
    指定された基数での、指定された桁数の文字表現を判定します。
    static byte
    指定された文字のUnicode方向性プロパティを返します。
    static byte
    getDirectionality(int codePoint)
    所定の文字(Unicodeコード・ポイント)のUnicode方向性プロパティを返します。
    static String
    getName(int codePoint)
    指定された文字codePointの名前を返します。コード・ポイントがunassignedの場合はnullを返します。
    static int
    getNumericValue(char ch)
    指定されたUnicode文字が表すint値を返します。
    static int
    getNumericValue(int codePoint)
    指定された文字(Unicodeコード・ポイント)が表すint値を返します。
    static int
    getType(char ch)
    文字の汎用カテゴリを示す値を返します。
    static int
    getType(int codePoint)
    文字の汎用カテゴリを示す値を返します。
    int
    このCharacterのハッシュ・コード(charValue()を呼び出した場合の結果と等しくなる)を返します。
    static int
    hashCode(char value)
    Character.hashCode()との互換性がある、char値のハッシュ・コードを返します。
    static char
    highSurrogate(int codePoint)
    UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのリーディング・サロゲート(上位サロゲート・コード単位)を返します。
    static boolean
    isAlphabetic(int codePoint)
    指定された文字(Unicodeコード・ポイント)がアルファベットかどうかを判定します。
    static boolean
    isBmpCodePoint(int codePoint)
    指定された文字(Unicodeコード・ポイント)が基本多言語面(BMP)に含まれるかどうかを判定します。
    static boolean
    isDefined(char ch)
    文字がUnicodeで定義されているかどうかを判定します。
    static boolean
    isDefined(int codePoint)
    文字(Unicodeコード・ポイント)がUnicodeで定義されているかどうかを判定します。
    static boolean
    isDigit(char ch)
    指定された文字が数字かどうかを判定します。
    static boolean
    isDigit(int codePoint)
    指定された文字(Unicodeコード・ポイント)が数字かどうかを判定します。
    static boolean
    isHighSurrogate(char ch)
    指定されたchar値がUnicode上位サロゲート・コード単位 (リーディング・サロゲート・コード単位ともいう)であるかどうかを判定します。
    static boolean
    指定された文字が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。
    static boolean
    isIdentifierIgnorable(int codePoint)
    指定された文字(Unicodeコード・ポイント)が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。
    static boolean
    isIdeographic(int codePoint)
    指定された文字(Unicodeコード・ポイント)が、Unicode標準で規定されたCJKV (中国語、日本語、韓国語、およびベトナム語)の表意文字かどうかを判定します。
    static boolean
    isISOControl(char ch)
    指定された文字がISO制御文字かどうかを判定します。
    static boolean
    isISOControl(int codePoint)
    参照された文字(Unicodeコード・ポイント)がISO制御文字かどうかを判定します。
    static boolean
    指定された文字をJava識別子の最初の文字以外に使用可能かどうかを判定します。
    static boolean
    isJavaIdentifierPart(int codePoint)
    文字(Unicodeコード・ポイント)をJava識別子の最初の文字以外に使用可能かどうかを判定します。
    static boolean
    指定された文字をJava識別子の最初の文字として指定可能かどうかを判定します。
    static boolean
    isJavaIdentifierStart(int codePoint)
    文字(Unicodeコード・ポイント)をJava識別子の最初の文字として指定可能かどうかを判定します。
    static boolean
    isJavaLetter(char ch)
    非推奨。
    isJavaIdentifierStart(char)に置き換えられました。
    static boolean
    非推奨。
    isJavaIdentifierPart(char)に置き換えられました。
    static boolean
    isLetter(char ch)
    指定された文字が汎用文字かどうかを判定します。
    static boolean
    isLetter(int codePoint)
    指定された文字(Unicodeコード・ポイント)が汎用文字かどうかを判定します。
    static boolean
    isLetterOrDigit(char ch)
    指定された文字が汎用文字または数字かどうかを判定します。
    static boolean
    isLetterOrDigit(int codePoint)
    指定された文字(Unicodeコード・ポイント)が汎用文字または数字かどうかを判定します。
    static boolean
    isLowerCase(char ch)
    指定された文字が小文字かどうかを判定します。
    static boolean
    isLowerCase(int codePoint)
    指定された文字(Unicodeコード・ポイント)が小文字かどうかを判定します。
    static boolean
    isLowSurrogate(char ch)
    指定されたchar値がUnicode下位サロゲート・コード単位 (トレーリング・サロゲート・コード単位ともいう)であるかどうかを判定します。
    static boolean
    isMirrored(char ch)
    Unicode仕様に従って文字をミラー化するかどうかを判定します。
    static boolean
    isMirrored(int codePoint)
    Unicode仕様に従って、指定された文字(Unicodeコード・ポイント)をミラー化するかどうかを判定します。
    static boolean
    isSpace(char ch)
    非推奨。
    isWhitespace(char)に置き換えられました。
    static boolean
    isSpaceChar(char ch)
    指定された文字がUnicodeの空白文字かどうかを判定します。
    static boolean
    isSpaceChar(int codePoint)
    指定された文字(Unicodeコード・ポイント)がUnicodeの空白文字かどうかを判定します。
    static boolean
    isSupplementaryCodePoint(int codePoint)
    指定された文字(Unicodeコード・ポイント)が補助文字の範囲にあるかどうかを判定します。
    static boolean
    isSurrogate(char ch)
    指定されたchar値がUnicode サロゲート・コード単位かどうかを判定します。
    static boolean
    isSurrogatePair(char high, char low)
    指定されたchar値のペアが有効なUnicodeサロゲート・ペアであるかどうかを判定します。
    static boolean
    isTitleCase(char ch)
    指定された文字がタイトル・ケース文字かどうかを判定します。
    static boolean
    isTitleCase(int codePoint)
    指定された文字(Unicodeコード・ポイント)がタイトル・ケース文字かどうかを判定します。
    static boolean
    指定された文字をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。
    static boolean
    isUnicodeIdentifierPart(int codePoint)
    指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。
    static boolean
    指定された文字をUnicode識別子の最初の文字として指定可能かどうかを判定します。
    static boolean
    isUnicodeIdentifierStart(int codePoint)
    指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字として指定可能かどうかを判定します。
    static boolean
    isUpperCase(char ch)
    指定された文字が大文字がどうかを判定します。
    static boolean
    isUpperCase(int codePoint)
    指定された文字(Unicodeコード・ポイント)が大文字かどうかを判定します。
    static boolean
    isValidCodePoint(int codePoint)
    指定されたコード・ポイントが有効なUnicodeコード・ポイント値であるかどうかを判定します。
    static boolean
    isWhitespace(char ch)
    指定された文字がJavaの基準に従った空白かどうかを判定します。
    static boolean
    isWhitespace(int codePoint)
    指定された文字(Unicodeコード・ポイント)がJavaの基準に従った空白かどうかを判定します。
    static char
    lowSurrogate(int codePoint)
    UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのトレーリング・サロゲート(下位サロゲート・コード単位)を返します。
    static int
    offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)
    指定されたchar部分配列内で、指定されたindexからcodePointOffsetコード・ポイント分だけオフセットされた位置のインデックスを返します。
    static int
    offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
    指定された文字シーケンス内で、指定されたindexからcodePointOffsetコード・ポイント分だけオフセットされた位置のインデックスを返します。
    static char
    reverseBytes(char ch)
    指定されたchar値でバイト順を逆にして取得した値を返します。
    static char[]
    toChars(int codePoint)
    指定された文字(Unicodeコード・ポイント)をchar配列に格納されるUTF-16表現に変換します。
    static int
    toChars(int codePoint, char[] dst, int dstIndex)
    指定された文字(Unicodeコード・ポイント)をUTF-16表現に変換します。
    static int
    toCodePoint(char high, char low)
    指定されたサロゲート・ペアをその補助コード・ポイント値に変換します。
    static char
    toLowerCase(char ch)
    UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を小文字に変換します。
    static int
    toLowerCase(int codePoint)
    UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を小文字に変換します。
    このCharacterの値を表すStringオブジェクトを返します。
    static String
    toString(char c)
    指定されたcharを表すStringオブジェクトを返します。
    static String
    toString(int codePoint)
    指定された文字(Unicodeコード・ポイント)を表すStringオブジェクトを返します。
    static char
    toTitleCase(char ch)
    UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数をタイトル・ケースに変換します。
    static int
    toTitleCase(int codePoint)
    UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数をタイトル・ケースに変換します。
    static char
    toUpperCase(char ch)
    UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を大文字に変換します。
    static int
    toUpperCase(int codePoint)
    UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を大文字に変換します。
    static Character
    valueOf(char c)
    指定されたchar値を表すCharacterインスタンスを返します。

    クラス java.lang.Objectで宣言されたメソッド

    clone, finalize, getClass, notify, notifyAll, wait, wait, wait
  • フィールド詳細

    • MIN_RADIX

      public static final int MIN_RADIX
      文字列との変換に使用可能な最小基数です。 このフィールドの定数値は、Integerクラスのdigitメソッド、forDigitメソッド、およびtoStringメソッドなどの基数変換メソッドの最小許容値です。
      関連項目:
    • MAX_RADIX

      public static final int MAX_RADIX
      文字列との変換に使用可能な最大基数です。 このフィールドの定数値は、Integerクラスのdigitメソッド、forDigitメソッド、およびtoStringメソッドなどの基数変換メソッドの最大許容値です。
      関連項目:
    • MIN_VALUE

      public static final char MIN_VALUE
      このフィールドの定数値は、char型の最小値'\u0000'です。
      導入されたバージョン:
      1.0.2
      関連項目:
    • MAX_VALUE

      public static final char MAX_VALUE
      このフィールドの定数値は、char型の最大値'\uFFFF'です。
      導入されたバージョン:
      1.0.2
      関連項目:
    • TYPE

      public static final Class<Character> TYPE
      プリミティブ型charを表すClassインスタンス。
      導入されたバージョン:
      1.1
    • UNASSIGNED

      public static final byte UNASSIGNED
      Unicode仕様の汎用カテゴリ「Cn」。
      導入されたバージョン:
      1.1
      関連項目:
    • UPPERCASE_LETTER

      public static final byte UPPERCASE_LETTER
      Unicode仕様の汎用カテゴリ「Lu」。
      導入されたバージョン:
      1.1
      関連項目:
    • LOWERCASE_LETTER

      public static final byte LOWERCASE_LETTER
      Unicode仕様の汎用カテゴリ「Ll」。
      導入されたバージョン:
      1.1
      関連項目:
    • TITLECASE_LETTER

      public static final byte TITLECASE_LETTER
      Unicode仕様の汎用カテゴリ「Lt」。
      導入されたバージョン:
      1.1
      関連項目:
    • MODIFIER_LETTER

      public static final byte MODIFIER_LETTER
      Unicode仕様の汎用カテゴリ「Lm」。
      導入されたバージョン:
      1.1
      関連項目:
    • OTHER_LETTER

      public static final byte OTHER_LETTER
      Unicode仕様の汎用カテゴリ「Lo」。
      導入されたバージョン:
      1.1
      関連項目:
    • NON_SPACING_MARK

      public static final byte NON_SPACING_MARK
      Unicode仕様の汎用カテゴリ「Mn」。
      導入されたバージョン:
      1.1
      関連項目:
    • ENCLOSING_MARK

      public static final byte ENCLOSING_MARK
      Unicode仕様の汎用カテゴリ「Me」。
      導入されたバージョン:
      1.1
      関連項目:
    • COMBINING_SPACING_MARK

      public static final byte COMBINING_SPACING_MARK
      Unicode仕様の汎用カテゴリ「Mc」。
      導入されたバージョン:
      1.1
      関連項目:
    • DECIMAL_DIGIT_NUMBER

      public static final byte DECIMAL_DIGIT_NUMBER
      Unicode仕様の汎用カテゴリ「Nd」。
      導入されたバージョン:
      1.1
      関連項目:
    • LETTER_NUMBER

      public static final byte LETTER_NUMBER
      Unicode仕様の汎用カテゴリ「Nl」。
      導入されたバージョン:
      1.1
      関連項目:
    • OTHER_NUMBER

      public static final byte OTHER_NUMBER
      Unicode仕様の汎用カテゴリ「No」。
      導入されたバージョン:
      1.1
      関連項目:
    • SPACE_SEPARATOR

      public static final byte SPACE_SEPARATOR
      Unicode仕様の汎用カテゴリ「Zs」。
      導入されたバージョン:
      1.1
      関連項目:
    • LINE_SEPARATOR

      public static final byte LINE_SEPARATOR
      Unicode仕様の汎用カテゴリ「Zl」。
      導入されたバージョン:
      1.1
      関連項目:
    • PARAGRAPH_SEPARATOR

      public static final byte PARAGRAPH_SEPARATOR
      Unicode仕様の汎用カテゴリ「Zp」。
      導入されたバージョン:
      1.1
      関連項目:
    • CONTROL

      public static final byte CONTROL
      Unicode仕様の汎用カテゴリ「Cc」。
      導入されたバージョン:
      1.1
      関連項目:
    • FORMAT

      public static final byte FORMAT
      Unicode仕様の汎用カテゴリ「Cf」。
      導入されたバージョン:
      1.1
      関連項目:
    • PRIVATE_USE

      public static final byte PRIVATE_USE
      Unicode仕様の汎用カテゴリ「Co」。
      導入されたバージョン:
      1.1
      関連項目:
    • SURROGATE

      public static final byte SURROGATE
      Unicode仕様の汎用カテゴリ「Cs」。
      導入されたバージョン:
      1.1
      関連項目:
    • DASH_PUNCTUATION

      public static final byte DASH_PUNCTUATION
      Unicode仕様の汎用カテゴリ「Pd」。
      導入されたバージョン:
      1.1
      関連項目:
    • START_PUNCTUATION

      public static final byte START_PUNCTUATION
      Unicode仕様の汎用カテゴリ「Ps」。
      導入されたバージョン:
      1.1
      関連項目:
    • END_PUNCTUATION

      public static final byte END_PUNCTUATION
      Unicode仕様の汎用カテゴリ「Pe」。
      導入されたバージョン:
      1.1
      関連項目:
    • CONNECTOR_PUNCTUATION

      public static final byte CONNECTOR_PUNCTUATION
      Unicode仕様の汎用カテゴリ「Pc」。
      導入されたバージョン:
      1.1
      関連項目:
    • OTHER_PUNCTUATION

      public static final byte OTHER_PUNCTUATION
      Unicode仕様の汎用カテゴリ「Po」。
      導入されたバージョン:
      1.1
      関連項目:
    • MATH_SYMBOL

      public static final byte MATH_SYMBOL
      Unicode仕様の汎用カテゴリ「Sm」。
      導入されたバージョン:
      1.1
      関連項目:
    • CURRENCY_SYMBOL

      public static final byte CURRENCY_SYMBOL
      Unicode仕様の汎用カテゴリ「Sc」。
      導入されたバージョン:
      1.1
      関連項目:
    • MODIFIER_SYMBOL

      public static final byte MODIFIER_SYMBOL
      Unicode仕様の汎用カテゴリ「Sk」。
      導入されたバージョン:
      1.1
      関連項目:
    • OTHER_SYMBOL

      public static final byte OTHER_SYMBOL
      Unicode仕様の汎用カテゴリ「So」。
      導入されたバージョン:
      1.1
      関連項目:
    • INITIAL_QUOTE_PUNCTUATION

      public static final byte INITIAL_QUOTE_PUNCTUATION
      Unicode仕様の汎用カテゴリ「Pi」。
      導入されたバージョン:
      1.4
      関連項目:
    • FINAL_QUOTE_PUNCTUATION

      public static final byte FINAL_QUOTE_PUNCTUATION
      Unicode仕様の汎用カテゴリ「Pf」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_UNDEFINED

      public static final byte DIRECTIONALITY_UNDEFINED
      未定義の双方向文字タイプ。 Unicode仕様では、未定義のchar値の方向性は定義されていません。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_LEFT_TO_RIGHT

      public static final byte DIRECTIONALITY_LEFT_TO_RIGHT
      Unicode仕様の強力な双方向文字タイプ「L」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_RIGHT_TO_LEFT

      public static final byte DIRECTIONALITY_RIGHT_TO_LEFT
      Unicode仕様の強力な双方向文字タイプ「R」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC

      public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
      Unicode仕様の強力な双方向文字タイプ「AL」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_EUROPEAN_NUMBER

      public static final byte DIRECTIONALITY_EUROPEAN_NUMBER
      Unicode仕様の弱い双方向文字タイプ「EN」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR

      public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
      Unicode仕様の弱い双方向文字タイプ「ES」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR

      public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
      Unicode仕様の弱い双方向文字タイプ「ET」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_ARABIC_NUMBER

      public static final byte DIRECTIONALITY_ARABIC_NUMBER
      Unicode仕様の弱い双方向文字タイプ「AN」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_COMMON_NUMBER_SEPARATOR

      public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
      Unicode仕様の弱い双方向文字タイプ「CS」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_NONSPACING_MARK

      public static final byte DIRECTIONALITY_NONSPACING_MARK
      Unicode仕様の弱い双方向文字タイプ「NSM」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_BOUNDARY_NEUTRAL

      public static final byte DIRECTIONALITY_BOUNDARY_NEUTRAL
      Unicode仕様の弱い双方向文字タイプ「BN」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_PARAGRAPH_SEPARATOR

      public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
      Unicode仕様のニュートラルな双方向文字タイプ「B」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_SEGMENT_SEPARATOR

      public static final byte DIRECTIONALITY_SEGMENT_SEPARATOR
      Unicode仕様のニュートラルな双方向文字タイプ「S」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_WHITESPACE

      public static final byte DIRECTIONALITY_WHITESPACE
      Unicode仕様のニュートラルな双方向文字タイプ「WS」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_OTHER_NEUTRALS

      public static final byte DIRECTIONALITY_OTHER_NEUTRALS
      Unicode仕様のニュートラルな双方向文字タイプ「ON」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING

      public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
      Unicode仕様の強力な双方向文字タイプ「LRE」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE

      public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
      Unicode仕様の強力な双方向文字タイプ「LRO」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING

      public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
      Unicode仕様の強力な双方向文字タイプ「RLE」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE

      public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
      Unicode仕様の強力な双方向文字タイプ「RLO」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_POP_DIRECTIONAL_FORMAT

      public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
      Unicode仕様の弱い双方向文字タイプ「PDF」。
      導入されたバージョン:
      1.4
      関連項目:
    • DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE

      public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
      Unicode仕様の弱い双方向文字型"LRI"。
      導入されたバージョン:
      9
      関連項目:
    • DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE

      public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
      Unicode仕様の弱い双方向文字型"RLI"。
      導入されたバージョン:
      9
      関連項目:
    • DIRECTIONALITY_FIRST_STRONG_ISOLATE

      public static final byte DIRECTIONALITY_FIRST_STRONG_ISOLATE
      Unicode仕様の弱い双方向文字型"FSI"。
      導入されたバージョン:
      9
      関連項目:
    • DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE

      public static final byte DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
      Unicode仕様の弱い双方向文字型"PDI"。
      導入されたバージョン:
      9
      関連項目:
    • MIN_HIGH_SURROGATE

      public static final char MIN_HIGH_SURROGATE
      UTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最小値(定数'\uD800')。 上位サロゲートは、リーディング・サロゲートともいいます。
      導入されたバージョン:
      1.5
      関連項目:
    • MAX_HIGH_SURROGATE

      public static final char MAX_HIGH_SURROGATE
      UTF-16エンコーディングでのUnicode上位サロゲート・コード単位の最大値(定数'\uDBFF')。 上位サロゲートは、リーディング・サロゲートともいいます。
      導入されたバージョン:
      1.5
      関連項目:
    • MIN_LOW_SURROGATE

      public static final char MIN_LOW_SURROGATE
      UTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最小値(定数'\uDC00')。 下位サロゲートは、トレーリング・サロゲートともいいます。
      導入されたバージョン:
      1.5
      関連項目:
    • MAX_LOW_SURROGATE

      public static final char MAX_LOW_SURROGATE
      UTF-16エンコーディングでのUnicode下位サロゲート・コード単位の最大値(定数'\uDFFF')。 下位サロゲートは、トレーリング・サロゲートともいいます。
      導入されたバージョン:
      1.5
      関連項目:
    • MIN_SURROGATE

      public static final char MIN_SURROGATE
      UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最小値(定数'\uD800')。
      導入されたバージョン:
      1.5
      関連項目:
    • MAX_SURROGATE

      public static final char MAX_SURROGATE
      UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最大値(定数'\uDFFF')。
      導入されたバージョン:
      1.5
      関連項目:
    • MIN_SUPPLEMENTARY_CODE_POINT

      public static final int MIN_SUPPLEMENTARY_CODE_POINT
      Unicode補助コード・ポイントの最小値(定数U+10000)。
      導入されたバージョン:
      1.5
      関連項目:
    • MIN_CODE_POINT

      public static final int MIN_CODE_POINT
      Unicodeコード・ポイントの最小値(定数U+0000)。
      導入されたバージョン:
      1.5
      関連項目:
    • MAX_CODE_POINT

      public static final int MAX_CODE_POINT
      Unicodeコード・ポイントの最大値(定数U+10FFFF)。
      導入されたバージョン:
      1.5
      関連項目:
    • SIZE

      public static final int SIZE
      符号なしバイナリ形式でchar値を表すのに使用されるビット数(定数16)。
      導入されたバージョン:
      1.5
      関連項目:
    • BYTES

      public static final int BYTES
      符号なしバイナリ形式でchar値を表すために使用されるバイト数。
      導入されたバージョン:
      1.8
      関連項目:
  • コンストラクタの詳細

    • 文字

      @Deprecated(since="9", forRemoval=true) public Character(char value)
      削除予定のため非推奨: このAPI要素は、将来のバージョンで削除される可能性があります。
      このコンストラクタを使用することはほとんどありません。 静的ファクトリvalueOf(char)は、より良いスペースと時間のパフォーマンスをもたらす可能性が高いため、通常はより良い選択です。
      指定されたchar値を表す、新しく割り当てられたCharacterオブジェクトを構築します。
      パラメータ:
      value - Characterオブジェクトによって表される値。
  • メソッドの詳細

    • describeConstable

      public Optional<DynamicConstantDesc<Character>> describeConstable()
      このインスタンスの名目記述子を含むOptionalを返します。
      定義:
      インタフェースConstable内のdescribeConstable
      戻り値:
      Characterインスタンスを説明するOptional
      導入されたバージョン:
      15
    • valueOf

      public static Character valueOf(char c)
      指定されたchar値を表すCharacterインスタンスを返します。 新規Characterインスタンスが不要な場合、通常このメソッドがコンストラクタCharacter(char)に優先して使用されます。その理由は、このメソッドが頻繁に要求される値をキャッシュするので、操作に必要な領域や時間がはるかに少なくて済む場合が多いためです。 このメソッドは、 '\u0000'から'\u007F'の範囲(両端含む)の値を常にキャッシュしますが、この範囲に含まれないその他の値をキャッシュすることもあります。
      パラメータ:
      c - char値。
      戻り値:
      cを表すCharacterインスタンス。
      導入されたバージョン:
      1.5
    • charValue

      public char charValue()
      このCharacterオブジェクトの値を返します。
      戻り値:
      このオブジェクトが表すプリミティブchar値。
    • hashCode

      public int hashCode()
      このCharacterのハッシュ・コード(charValue()を呼び出した場合の結果と等しくなる)を返します。
      オーバーライド:
      hashCode 、クラス:  Object
      戻り値:
      このCharacterのハッシュ・コード値
      関連項目:
    • hashCode

      public static int hashCode(char value)
      Character.hashCode()との互換性がある、char値のハッシュ・コードを返します。
      パラメータ:
      value - ハッシュ・コードが返されるchar
      戻り値:
      char値のハッシュ・コード値。
      導入されたバージョン:
      1.8
    • equals

      public boolean equals(Object obj)
      このオブジェクトと指定されたオブジェクトを比較します。 結果がtrueになるのは、引数がnullではなく、このオブジェクトと同じchar値を表すCharacterオブジェクトである場合だけです。
      オーバーライド:
      equals 、クラス:  Object
      パラメータ:
      obj - 比較対象のオブジェクト。
      戻り値:
      オブジェクトが同じである場合はtrue、そうでない場合はfalse
      関連項目:
    • toString

      public String toString()
      このCharacterの値を表すStringオブジェクトを返します。 結果は、長さ1の文字列(構成要素はCharacterオブジェクトにより表されるプリミティブ型のchar値だけ)になります。
      オーバーライド:
      toString 、クラス:  Object
      戻り値:
      このオブジェクトの文字列表現。
    • toString

      public static String toString(char c)
      指定されたcharを表すStringオブジェクトを返します。 結果は、指定されたcharだけで構成される長さ1の文字列になります。
      APIのノート:
      このメソッドは「補助文字」を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、toString(int)メソッドを使用します。
      パラメータ:
      c - 変換するchar
      戻り値:
      指定されたcharの文字列表現
      導入されたバージョン:
      1.4
    • toString

      public static String toString(int codePoint)
      指定された文字(Unicodeコード・ポイント)を表すStringオブジェクトを返します。 結果は、指定されたcodePointのみで構成された1または2の長さの文字列です。
      パラメータ:
      codePoint - 変換するcodePoint
      戻り値:
      指定されたcodePointの文字列表現
      例外:
      IllegalArgumentException - 指定されたcodePoint「有効なUnicodeコード・ポイント」ではない場合。
      導入されたバージョン:
      11
    • isValidCodePoint

      public static boolean isValidCodePoint(int codePoint)
      指定されたコード・ポイントが有効なUnicodeコード・ポイント値であるかどうかを判定します。
      パラメータ:
      codePoint - 判定対象のUnicodeコード・ポイント
      戻り値:
      指定されたコード・ポイント値がMIN_CODE_POINT - MAX_CODE_POINTの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse
      導入されたバージョン:
      1.5
    • isBmpCodePoint

      public static boolean isBmpCodePoint(int codePoint)
      指定された文字(Unicodeコード・ポイント)が基本多言語面(BMP)に含まれるかどうかを判定します。 そのようなコード・ポイントは単一のcharを使って表せます。
      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)
      戻り値:
      指定されたコード・ポイントがMIN_VALUE - MAX_VALUEの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse
      導入されたバージョン:
      1.7
    • isSupplementaryCodePoint

      public static boolean isSupplementaryCodePoint(int codePoint)
      指定された文字(Unicodeコード・ポイント)が補助文字の範囲にあるかどうかを判定します。
      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)
      戻り値:
      指定されたコード・ポイントがMIN_SUPPLEMENTARY_CODE_POINT - MAX_CODE_POINTの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse
      導入されたバージョン:
      1.5
    • isHighSurrogate

      public static boolean isHighSurrogate(char ch)
      指定されたchar値がUnicode上位サロゲート・コード単位 (リーディング・サロゲート・コード単位ともいう)であるかどうかを判定します。

      これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。

      パラメータ:
      ch - 判定されるchar値。
      戻り値:
      charの値がMIN_HIGH_SURROGATE - MAX_HIGH_SURROGATEの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse
      導入されたバージョン:
      1.5
      関連項目:
    • isLowSurrogate

      public static boolean isLowSurrogate(char ch)
      指定されたchar値がUnicode下位サロゲート・コード単位 (トレーリング・サロゲート・コード単位ともいう)であるかどうかを判定します。

      これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。

      パラメータ:
      ch - 判定されるchar値。
      戻り値:
      char値がMIN_LOW_SURROGATE - MAX_LOW_SURROGATEの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse
      導入されたバージョン:
      1.5
      関連項目:
    • isSurrogate

      public static boolean isSurrogate(char ch)
      指定されたchar値がUnicode サロゲート・コード単位かどうかを判定します。

      これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。

      char値がサロゲート・コード単位になるのは、それが下位サロゲート・コード単位上位サロゲート・コード単位のいずれかである場合だけです。

      パラメータ:
      ch - 判定されるchar値。
      戻り値:
      char値がMIN_SURROGATE - MAX_SURROGATEの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse
      導入されたバージョン:
      1.7
    • isSurrogatePair

      public static boolean isSurrogatePair(char high, char low)
      指定されたchar値のペアが有効なUnicodeサロゲート・ペアであるかどうかを判定します。

      このメソッドは次の式と等価です。

      
       isHighSurrogate(high) && isLowSurrogate(low)
       

      パラメータ:
      high - 判定対象の上位サロゲート・コード値
      low - 判定対象の下位サロゲート・コード値
      戻り値:
      指定された上位/下位サロゲート・コード値が有効なサロゲート・ペアを表す場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.5
    • charCount

      public static int charCount(int codePoint)
      指定された文字(Unicodeコード・ポイント)を表すのに必要なchar値の数を判定します。 このメソッドは、指定された文字が0x10000以上である場合は2を返します。 それ以外の場合は1を返します。

      このメソッドは、指定された文字が有効なUnicodeコード・ポイントであることを検証しません。 呼出し側で、必要に応じてisValidCodePointを使用して、文字値を検証する必要があります。

      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字が有効な補助文字の場合は2、そうでない場合は1。
      導入されたバージョン:
      1.5
      関連項目:
    • toCodePoint

      public static int toCodePoint(char high, char low)
      指定されたサロゲート・ペアをその補助コード・ポイント値に変換します。 このメソッドは、指定されたサロゲート・ペアを検証しません。 呼出し側は必要に応じて、isSurrogatePairを使って検証する必要があります。
      パラメータ:
      high - 上位サロゲート・コード単位
      low - 下位サロゲート・コード単位
      戻り値:
      指定されたサロゲート・ペアから作成された補助コード・ポイント。
      導入されたバージョン:
      1.5
    • codePointAt

      public static int codePointAt(CharSequence seq, int index)
      CharSequenceの指定されたインデックスにあるコード・ポイントを返します。 CharSequence内の指定されたインデックス位置のchar値が上位サロゲート範囲に含まれており、それに続くインデックスがCharSequenceの長さ未満であり、かつそのインデックス位置のchar値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar値が返されます。
      パラメータ:
      seq - char値のシーケンス(Unicodeコード単位)
      index - 変換されるseq内のchar値(Unicodeコード単位)へのインデックス
      戻り値:
      所定のインデックス位置のUnicodeコード・ポイント
      例外:
      NullPointerException - seqがnullである場合。
      IndexOutOfBoundsException - 値indexが負であるかseq.length()以上である場合。
      導入されたバージョン:
      1.5
    • codePointAt

      public static int codePointAt(char[] a, int index)
      char配列の指定されたインデックスにあるコード・ポイントを返します。 char配列内の指定されたインデックス位置のchar値が上位サロゲート範囲に含まれており、それに続くインデックスがchar配列の長さ未満であり、かつそのインデックス位置のchar値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar値が返されます。
      パラメータ:
      a - char配列
      index - 変換されるchar配列内のchar値(Unicodeコード単位)へのインデックス
      戻り値:
      所定のインデックス位置のUnicodeコード・ポイント
      例外:
      NullPointerException - aがnullである場合。
      IndexOutOfBoundsException - indexが負の値、またはchar配列の長さ以上の値である場合。
      導入されたバージョン:
      1.5
    • codePointAt

      public static int codePointAt(char[] a, int index, int limit)
      limitの長さ未満のindexを持つ配列要素のみを使用可能な、char配列の指定されたインデックスにあるコード・ポイントを返します。 char配列内の指定されたインデックス位置のchar値が上位サロゲート範囲に含まれており、それに続くインデックスがlimit未満であり、かつそのインデックス位置のchar値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar値が返されます。
      パラメータ:
      a - char配列
      index - 変換されるchar配列内のchar値(Unicodeコード単位)へのインデックス
      limit - char配列で使用可能な最後の配列要素の後ろのインデックス
      戻り値:
      所定のインデックス位置のUnicodeコード・ポイント
      例外:
      NullPointerException - aがnullである場合。
      IndexOutOfBoundsException - index引数が負の値またはlimit引数以上である場合、またはlimit引数が負の値またはchar配列の長さより大きい場合。
      導入されたバージョン:
      1.5
    • codePointBefore

      public static int codePointBefore(CharSequence seq, int index)
      CharSequenceの指定されたインデックスの前にあるコード・ポイントを返します。 CharSequence内の(index - 1)char値が下位サロゲート範囲に含まれており、(index - 2)が負でなく、かつCharSequence内の(index - 2)char値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)char値が返されます。
      パラメータ:
      seq - CharSequenceインスタンス
      index - 返すべきコード・ポイントの直後のインデックス
      戻り値:
      指定されたインデックスの前にあるUnicodeコード・ポイント値。
      例外:
      NullPointerException - seqがnullである場合。
      IndexOutOfBoundsException - index引数が1より小さいかseq.length()より大きい場合。
      導入されたバージョン:
      1.5
    • codePointBefore

      public static int codePointBefore(char[] a, int index)
      char配列の指定されたインデックスの前にあるコード・ポイントを返します。 char配列内の(index - 1)char値が下位サロゲート範囲に含まれており、(index - 2)が負でなく、かつchar配列内の(index - 2)char値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)char値が返されます。
      パラメータ:
      a - char配列
      index - 返すべきコード・ポイントの直後のインデックス
      戻り値:
      指定されたインデックスの前にあるUnicodeコード・ポイント値。
      例外:
      NullPointerException - aがnullである場合。
      IndexOutOfBoundsException - index引数が1未満であるか、またはchar配列の長さより大きい値の場合
      導入されたバージョン:
      1.5
    • codePointBefore

      public static int codePointBefore(char[] a, int index, int start)
      start以上のindexを持つ配列要素のみを使用可能な、char配列の指定されたインデックスの前にあるコード・ポイントを返します。 char配列内の(index - 1)char値が下位サロゲート範囲に含まれており、(index - 2)start以上であり、かつchar配列内の(index - 2)char値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)char値が返されます。
      パラメータ:
      a - char配列
      index - 返すべきコード・ポイントの直後のインデックス
      start - char配列の最初の配列要素のインデックス
      戻り値:
      指定されたインデックスの前にあるUnicodeコード・ポイント値。
      例外:
      NullPointerException - aがnullである場合。
      IndexOutOfBoundsException - index引数がstart引数以下であるかchar配列の長さより大きい場合、またはstart引数が負の値であるかchar配列の長さ以上である場合。
      導入されたバージョン:
      1.5
    • highSurrogate

      public static char highSurrogate(int codePoint)
      UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのリーディング・サロゲート(上位サロゲート・コード単位)を返します。 指定された文字が補助文字でない場合は、未指定のcharが返されます。

      isSupplementaryCodePoint(x)trueの場合、isHighSurrogate(highSurrogate(x))およびtoCodePoint(highSurrogate(x), lowSurrogate(x))== xも常にtrueになります。

      パラメータ:
      codePoint - 補助文字(Unicodeコード・ポイント)
      戻り値:
      この文字をUTF-16エンコーディングで表すために使用されるリーディング・サロゲート・コード単位
      導入されたバージョン:
      1.7
    • lowSurrogate

      public static char lowSurrogate(int codePoint)
      UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのトレーリング・サロゲート(下位サロゲート・コード単位)を返します。 指定された文字が補助文字でない場合は、未指定のcharが返されます。

      isSupplementaryCodePoint(x)trueの場合、isLowSurrogate(lowSurrogate(x))およびtoCodePoint(highSurrogate(x), lowSurrogate(x))== xも常にtrueになります。

      パラメータ:
      codePoint - 補助文字(Unicodeコード・ポイント)
      戻り値:
      この文字をUTF-16エンコーディングで表すために使用されるトレーリング・サロゲート・コード単位
      導入されたバージョン:
      1.7
    • toChars

      public static int toChars(int codePoint, char[] dst, int dstIndex)
      指定された文字(Unicodeコード・ポイント)をUTF-16表現に変換します。 指定されたコード・ポイントがBMP (基本多言語面または第0面)値の場合は、同じ値がdst[dstIndex]に格納され、1が返されます。 指定されたコード・ポイントが補助文字の場合は、サロゲート値がdst[dstIndex] (上位サロゲート)とdst[dstIndex+1] (下位サロゲート)に格納され、2が返されます。
      パラメータ:
      codePoint - 変換対象の文字(Unicodeコード・ポイント)。
      dst - codePointのUTF-16値が格納されるcharの配列。
      dstIndex - 変換された値が格納されるdst配列の開始インデックス。
      戻り値:
      コード・ポイントがBMPコード・ポイントの場合は1、コード・ポイントが補助コード・ポイントの場合は2。
      例外:
      IllegalArgumentException - 指定されたcodePointが有効なUnicodeコード・ポイントでない場合。
      NullPointerException - 指定されたdstがnullの場合。
      IndexOutOfBoundsException - dstIndexが負の値であるかdst.length以上である場合、またはdstIndex位置のdstが結果として得られるchar値を格納する十分な配列要素を持たない場合。 (dstIndexdst.length-1と等価で、指定されたcodePointが補助文字の場合、上位サロゲート値はdst[dstIndex]に格納されない。)
      導入されたバージョン:
      1.5
    • toChars

      public static char[] toChars(int codePoint)
      指定された文字(Unicodeコード・ポイント)をchar配列に格納されるUTF-16表現に変換します。 指定されたコード・ポイントがBMP (基本多言語面または第0面)値の場合、結果として得られるchar配列はcodePointと同じ値を持ちます。 指定されたコード・ポイントが補助コード・ポイントの場合は、結果として得られるchar配列は対応するサロゲート・ペアを持ちます。
      パラメータ:
      codePoint - Unicodeコード・ポイント
      戻り値:
      codePointのUTF-16表現を持つchar配列。
      例外:
      IllegalArgumentException - 指定されたcodePointが有効なUnicodeコード・ポイントでない場合。
      導入されたバージョン:
      1.5
    • codePointCount

      public static int codePointCount(CharSequence seq, int beginIndex, int endIndex)
      指定されたcharシーケンスのテキスト範囲内のUnicodeコード・ポイントの数を返します。 テキスト範囲は、指定されたbeginIndexからインデックスendIndex - 1の位置のcharまでです。 したがって、テキスト範囲の長さ(char数)は、endIndex-beginIndexになります。 テキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。
      パラメータ:
      seq - 文字シーケンス
      beginIndex - テキスト範囲内の最初のcharへのインデックス。
      endIndex - テキスト範囲内の最後のcharの直後のインデックス。
      戻り値:
      指定されたテキスト範囲内のUnicodeコード・ポイントの数
      例外:
      NullPointerException - seqがnullである場合。
      IndexOutOfBoundsException - beginIndexが負であるか、endIndexが指定されたシーケンスの長さより大きいか、あるいはbeginIndexendIndexより大きい場合。
      導入されたバージョン:
      1.5
    • codePointCount

      public static int codePointCount(char[] a, int offset, int count)
      char配列引数の部分配列内にあるUnicodeコード・ポイントの数を返します。 offset引数は、部分配列の最初のcharのインデックスであり、count引数はchar間の部分配列の長さを指定します。 部分配列内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。
      パラメータ:
      a - char配列
      offset - 指定されたchar配列の最初のcharのインデックス
      count - 部分配列の長さ(char数)
      戻り値:
      指定された部分配列内のUnicodeコード・ポイントの数
      例外:
      NullPointerException - aがnullである場合。
      IndexOutOfBoundsException - offsetまたはcountが負の場合、またはoffset+countが指定された配列の長さより大きい場合。
      導入されたバージョン:
      1.5
    • offsetByCodePoints

      public static int offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
      指定された文字シーケンス内で、指定されたindexからcodePointOffsetコード・ポイント分だけオフセットされた位置のインデックスを返します。 indexcodePointOffsetで指定されるテキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。
      パラメータ:
      seq - 文字シーケンス
      index - オフセットされるインデックス
      codePointOffset - オフセット(コード・ポイント数)
      戻り値:
      charシーケンス内のインデックス
      例外:
      NullPointerException - seqがnullである場合。
      IndexOutOfBoundsException - indexがcharシーケンスの長さよりも負または大きい場合、またはcodePointOffsetが正で、indexで始まるサブ・シーケンスがcodePointOffsetコード・ポイントより少ない場合、またはcodePointOffsetが負でindexより前のサブ・シーケンスがcodePointOffsetコード・ポイントの絶対値より少ない場合。
      導入されたバージョン:
      1.5
    • offsetByCodePoints

      public static int offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)
      指定されたchar部分配列内で、指定されたindexからcodePointOffsetコード・ポイント分だけオフセットされた位置のインデックスを返します。 startおよびcount引数は、char配列の部分配列を指定します。 indexcodePointOffsetで指定されるテキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。
      パラメータ:
      a - char配列
      start - 部分配列内の最初のcharのインデックス
      count - 部分配列の長さ(char数)
      index - オフセットされるインデックス
      codePointOffset - オフセット(コード・ポイント数)
      戻り値:
      部分配列内のインデックス
      例外:
      NullPointerException - aがnullである場合。
      IndexOutOfBoundsException - startまたはcountが負の場合、またはstart+countが指定された配列の長さより大きい場合、またはindexstartより小さいかstart+countより大きい場合、またはcodePointOffsetが正で、indexから始まりstart+count - 1で終わるテキスト範囲内のコード・ポイント数がcodePointOffsetコード・ポイント数より少ない場合、またはcodePointOffsetが負で、startから始まりindex - 1で終わるテキスト範囲内のコード・ポイント数がcodePointOffsetコード・ポイントの絶対値より少ない場合。
      導入されたバージョン:
      1.5
    • isLowerCase

      public static boolean isLowerCase(char ch)
      指定された文字が小文字かどうかを判定します。

      ある文字が小文字になるのは、Character.getType(ch)によって提供される汎用カテゴリ型がLOWERCASE_LETTERである場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Lowercaseを持つ場合です。

      小文字の例を次に示します。

       a b c d e f g h i j k l m n o p q r s t u v w x y z
       '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6'
       '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE'
       '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6'
       '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
       

      Unicode文字には、ほかにも多数の小文字が存在します。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isLowerCase(int)メソッドを使用してください。

      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      文字が小文字の場合はtrue、そうでない場合はfalse
      関連項目:
    • isLowerCase

      public static boolean isLowerCase(int codePoint)
      指定された文字(Unicodeコード・ポイント)が小文字かどうかを判定します。

      ある文字が小文字になるのは、getType(codePoint)によって提供される汎用カテゴリ型がLOWERCASE_LETTERである場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Lowercaseを持つ場合です。

      小文字の例を次に示します。

       a b c d e f g h i j k l m n o p q r s t u v w x y z
       '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6'
       '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE'
       '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6'
       '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
       

      Unicode文字には、ほかにも多数の小文字が存在します。

      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字が小文字の場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.5
      関連項目:
    • isUpperCase

      public static boolean isUpperCase(char ch)
      指定された文字が大文字がどうかを判定します。

      ある文字が大文字になるのは、Character.getType(ch)によって提供される汎用カテゴリ型がUPPERCASE_LETTERである場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Uppercaseを持つ場合です。

      大文字の例を次に示します。

       A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
       '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7'
       '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF'
       '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8'
       '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
       

      Unicode文字には、ほかにも多数の大文字が存在します。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isUpperCase(int)メソッドを使用してください。

      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      文字が大文字の場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.0
      関連項目:
    • isUpperCase

      public static boolean isUpperCase(int codePoint)
      指定された文字(Unicodeコード・ポイント)が大文字かどうかを判定します。

      ある文字が大文字になるのは、getType(codePoint)によって提供される汎用カテゴリ型がUPPERCASE_LETTERである場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Uppercaseを持つ場合です。

      大文字の例を次に示します。

       A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
       '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7'
       '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF'
       '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8'
       '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
       

      Unicode文字には、ほかにも多数の大文字が存在します。

      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字が大文字の場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.5
      関連項目:
    • isTitleCase

      public static boolean isTitleCase(char ch)
      指定された文字がタイトル・ケース文字かどうかを判定します。

      Character.getType(ch)により示される汎用カテゴリ型がTITLECASE_LETTERの場合、文字はタイトル・ケース文字になります。

      文字の中には、ラテン文字のペアのように見えるものがあります。 たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。 「Lj」のように見える3つ目の形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。

      次に示すのは、このメソッドがtrueを返すUnicode文字の一部です。

      • LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
      • LATIN CAPITAL LETTER L WITH SMALL LETTER J
      • LATIN CAPITAL LETTER N WITH SMALL LETTER J
      • LATIN CAPITAL LETTER D WITH SMALL LETTER Z

      Unicode文字には、ほかにも多数のタイトル・ケース文字が存在します。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isTitleCase(int)メソッドを使用してください。

      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      文字がタイトル・ケースの場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.0.2
      関連項目:
    • isTitleCase

      public static boolean isTitleCase(int codePoint)
      指定された文字(Unicodeコード・ポイント)がタイトル・ケース文字かどうかを判定します。

      getType(codePoint)により示される汎用カテゴリ型がTITLECASE_LETTERの場合、文字はタイトル・ケース文字になります。

      文字の中には、ラテン文字のペアのように見えるものがあります。 たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。 「Lj」のように見える3つ目の形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。

      次に示すのは、このメソッドがtrueを返すUnicode文字の一部です。

      • LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
      • LATIN CAPITAL LETTER L WITH SMALL LETTER J
      • LATIN CAPITAL LETTER N WITH SMALL LETTER J
      • LATIN CAPITAL LETTER D WITH SMALL LETTER Z

      Unicode文字には、ほかにも多数のタイトル・ケース文字が存在します。

      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字がタイトル・ケースの場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.5
      関連項目:
    • isDigit

      public static boolean isDigit(char ch)
      指定された文字が数字かどうかを判定します。

      Character.getType(ch)により示される汎用カテゴリ型がDECIMAL_DIGIT_NUMBERの場合、文字は数字になります。

      Unicode文字範囲の中には、次の数字を含むものがあります。

      • '\u0030' - '\u0039'、ISO-LATIN-1数字('0' - '9')
      • '\u0660' - '\u0669'、アラビア数字
      • '\u06F0' - '\u06F9'、拡張アラビア数字
      • '\u0966' - '\u096F'、デヴァーナーガリ数字
      • '\uFF10' - '\uFF19'、全角数字
      そのほかにも多数の文字範囲に、数字が含まれます。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isDigit(int)メソッドを使用してください。

      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      文字が数字の場合はtrue、そうでない場合はfalse
      関連項目:
    • isDigit

      public static boolean isDigit(int codePoint)
      指定された文字(Unicodeコード・ポイント)が数字かどうかを判定します。

      getType(codePoint)により示される汎用カテゴリ型がDECIMAL_DIGIT_NUMBERの場合、文字は数字になります。

      Unicode文字範囲の中には、次の数字を含むものがあります。

      • '\u0030' - '\u0039'、ISO-LATIN-1数字('0' - '9')
      • '\u0660' - '\u0669'、アラビア数字
      • '\u06F0' - '\u06F9'、拡張アラビア数字
      • '\u0966' - '\u096F'、デヴァーナーガリ数字
      • '\uFF10' - '\uFF19'、全角数字
      そのほかにも多数の文字範囲に、数字が含まれます。

      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字が数字の場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.5
      関連項目:
    • isDefined

      public static boolean isDefined(char ch)
      文字がUnicodeで定義されているかどうかを判定します。

      少なくとも次のいずれかに当てはまる場合、文字は定義されています。

      • UnicodeDataファイル内にエントリがある
      • UnicodeDataファイルで定義された範囲に値を持つ

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isDefined(int)メソッドを使用してください。

      パラメータ:
      ch - 判定対象の文字
      戻り値:
      文字がUnicodeに定義されている場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.0.2
      関連項目:
    • isDefined

      public static boolean isDefined(int codePoint)
      文字(Unicodeコード・ポイント)がUnicodeで定義されているかどうかを判定します。

      少なくとも次のいずれかに当てはまる場合、文字は定義されています。

      • UnicodeDataファイル内にエントリがある
      • UnicodeDataファイルで定義された範囲に値を持つ

      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字がUnicodeに定義されている場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.5
      関連項目:
    • isLetter

      public static boolean isLetter(char ch)
      指定された文字が汎用文字かどうかを判定します。

      Character.getType(ch)の示す汎用カテゴリ型が次のどれかの場合に、文字は汎用文字と見なされます。

      • UPPERCASE_LETTER
      • LOWERCASE_LETTER
      • TITLECASE_LETTER
      • MODIFIER_LETTER
      • OTHER_LETTER
      すべての汎用文字に大文字と小文字があるわけではありません。 多くの文字は汎用文字ですが、大文字でも小文字でもタイトル・ケースでもありません。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isLetter(int)メソッドを使用してください。

      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      文字が汎用文字の場合はtrue、そうでない場合はfalse
      関連項目:
    • isLetter

      public static boolean isLetter(int codePoint)
      指定された文字(Unicodeコード・ポイント)が汎用文字かどうかを判定します。

      getType(codePoint)の示す汎用カテゴリ型が次のどれかの場合に、文字は汎用文字と見なされます。

      • UPPERCASE_LETTER
      • LOWERCASE_LETTER
      • TITLECASE_LETTER
      • MODIFIER_LETTER
      • OTHER_LETTER
      すべての汎用文字に大文字と小文字があるわけではありません。 多くの文字は汎用文字ですが、大文字でも小文字でもタイトル・ケースでもありません。

      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字が汎用文字の場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.5
      関連項目:
    • isLetterOrDigit

      public static boolean isLetterOrDigit(char ch)
      指定された文字が汎用文字または数字かどうかを判定します。

      ある文字が文字または数字とみなされるのは、その文字のCharacter.isLetter(char ch)またはCharacter.isDigit(char ch)からtrueが返される場合です。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isLetterOrDigit(int)メソッドを使用してください。

      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      文字が汎用文字または数字の場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.0.2
      関連項目:
    • isLetterOrDigit

      public static boolean isLetterOrDigit(int codePoint)
      指定された文字(Unicodeコード・ポイント)が汎用文字または数字かどうかを判定します。

      ある文字が文字または数字とみなされるのは、その文字のisLetter(codePoint)またはisDigit(codePoint)からtrueが返される場合です。

      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字が汎用文字または数字の場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.5
      関連項目:
    • isJavaLetter

      @Deprecated(since="1.1") public static boolean isJavaLetter(char ch)
      非推奨。
      isJavaIdentifierStart(char)に置き換えられました。
      指定された文字をJava識別子の最初の文字として指定可能かどうかを判定します。

      次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。

      • isLetter(ch)trueを返す
      • getType(ch)LETTER_NUMBERを返す
      • chが通貨記号である('$'など)
      • chが連結句読点文字である('_'など)

      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      文字をJava識別子の先頭で使用可能な場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.0.2
      関連項目:
    • isJavaLetterOrDigit

      @Deprecated(since="1.1") public static boolean isJavaLetterOrDigit(char ch)
      非推奨。
      isJavaIdentifierPart(char)に置き換えられました。
      指定された文字をJava識別子の最初の文字以外に使用可能かどうかを判定します。

      次のいずれかの条件に当てはまる場合のみ、Java識別子の一部を文字にすることができます:

      • 汎用文字である
      • それが通貨記号である('$'など)
      • それが連結句読点文字である('_'など)
      • 数字である
      • 数値汎用文字である(ローマ数字文字など)
      • 連結マークである
      • 非スペーシング・マークである
      • 文字のisIdentifierIgnorabletrueを返す。

      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      文字をJava識別子の一部に使用可能な場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.0.2
      関連項目:
    • isAlphabetic

      public static boolean isAlphabetic(int codePoint)
      指定された文字(Unicodeコード・ポイント)がアルファベットかどうかを判定します。

      getType(codePoint)の示す汎用カテゴリ型が次のどれかの場合に、文字はアルファベットと見なされます。

      • UPPERCASE_LETTER
      • LOWERCASE_LETTER
      • TITLECASE_LETTER
      • MODIFIER_LETTER
      • OTHER_LETTER
      • LETTER_NUMBER
      あるいは、それがUnicode標準で規定された寄与プロパティOther_Alphabeticを持つ。

      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字がUnicodeアルファベット文字の場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.7
    • isIdeographic

      public static boolean isIdeographic(int codePoint)
      指定された文字(Unicodeコード・ポイント)が、Unicode標準で規定されたCJKV (中国語、日本語、韓国語、およびベトナム語)の表意文字かどうかを判定します。
      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字がUnicode表意文字の場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.7
    • isJavaIdentifierStart

      public static boolean isJavaIdentifierStart(char ch)
      指定された文字をJava識別子の最初の文字として指定可能かどうかを判定します。

      次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。

      • isLetter(ch)trueを返す
      • getType(ch)LETTER_NUMBERを返す
      • chが通貨記号である('$'など)
      • chが連結句読点文字である('_'など)

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isJavaIdentifierStart(int)メソッドを使用してください。

      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      文字をJava識別子の先頭で使用可能な場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.1
      関連項目:
    • isJavaIdentifierStart

      public static boolean isJavaIdentifierStart(int codePoint)
      文字(Unicodeコード・ポイント)をJava識別子の最初の文字として指定可能かどうかを判定します。

      次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。

      • isLetter(codePoint)が次を返す: true
      • getType(codePoint)が次を返す: LETTER_NUMBER
      • 参照される文字が通貨記号である('$'など)
      • 参照文字が連結句読点文字である('_'など)

      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字をJava識別子の先頭で使用可能な場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.5
      関連項目:
    • isJavaIdentifierPart

      public static boolean isJavaIdentifierPart(char ch)
      指定された文字をJava識別子の最初の文字以外に使用可能かどうかを判定します。

      次のいずれかの条件が満たされる場合、文字はJava識別子の一部になることがあります:

      • 汎用文字である
      • それが通貨記号である('$'など)
      • それが連結句読点文字である('_'など)
      • 数字である
      • 数値汎用文字である(ローマ数字文字など)
      • 連結マークである
      • 非スペーシング・マークである
      • 文字のisIdentifierIgnorabletrueを返す

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isJavaIdentifierPart(int)メソッドを使用してください。

      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      文字をJava識別子の一部に使用可能な場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.1
      関連項目:
    • isJavaIdentifierPart

      public static boolean isJavaIdentifierPart(int codePoint)
      文字(Unicodeコード・ポイント)をJava識別子の最初の文字以外に使用可能かどうかを判定します。

      次のいずれかの条件が満たされる場合、文字はJava識別子の一部になることがあります:

      • 汎用文字である
      • それが通貨記号である('$'など)
      • それが連結句読点文字である('_'など)
      • 数字である
      • 数値汎用文字である(ローマ数字文字など)
      • 連結マークである
      • 非スペーシング・マークである
      • isIdentifierIgnorable(codePoint)は、コード・ポイントのtrueを返します。

      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字をJava識別子の一部に使用可能な場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.5
      関連項目:
    • isUnicodeIdentifierStart

      public static boolean isUnicodeIdentifierStart(char ch)
      指定された文字をUnicode識別子の最初の文字として指定可能かどうかを判定します。

      次の条件のどれかに当てはまる場合にだけ、その文字をUnicode識別子の最初に指定できます。

      このメソッドは、Unicode Standardの「UAX31-R1 : デフォルト識別子」要件に準拠します。次のプロファイルはUAX 31です:

       Start := ID_Start + 'VERTICAL TILDE' (U+2E2F)
       
      'VERTICAL TILDE'は、下位互換性のためにStartに追加されています。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isUnicodeIdentifierStart(int)メソッドを使用してください。

      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      文字をUnicode識別子の先頭で使用可能な場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.1
      関連項目:
    • isUnicodeIdentifierStart

      public static boolean isUnicodeIdentifierStart(int codePoint)
      指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字として指定可能かどうかを判定します。

      次の条件のどれかに当てはまる場合にだけ、その文字をUnicode識別子の最初に指定できます。

      このメソッドは、Unicode Standardの「UAX31-R1 : デフォルト識別子」要件に準拠します。次のプロファイルはUAX 31です:

       Start := ID_Start + 'VERTICAL TILDE' (U+2E2F)
       
      'VERTICAL TILDE'は、下位互換性のためにStartに追加されています。

      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字をUnicode識別子の先頭で使用可能な場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.5
      関連項目:
    • isUnicodeIdentifierPart

      public static boolean isUnicodeIdentifierPart(char ch)
      指定された文字をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。

      次の文のどれかに当てはまる場合にだけ、その文字をUnicode識別子の一部に使用できます。

      • 汎用文字である
      • それが連結句読点文字である('_'など)
      • 数字である
      • 数値汎用文字である(ローマ数字文字など)
      • 連結マークである
      • 非スペーシング・マークである
      • この文字のisIdentifierIgnorabletrueを返す。
      • これはOther_ID_Start文字です。
      • これはOther_ID_Continue文字です。

      このメソッドは、Unicode Standardの「UAX31-R1 : デフォルト識別子」要件に準拠します。次のプロファイルはUAX 31です:

       Continue := Start + ID_Continue + ignorable
       Medial := empty
       ignorable := isIdentifierIgnorable(char) returns true for the character
       
      ignorableは、下位互換性のためにContinueに追加されています。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isUnicodeIdentifierPart(int)メソッドを使用してください。

      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      文字をUnicode識別子の一部に使用可能な場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.1
      関連項目:
    • isUnicodeIdentifierPart

      public static boolean isUnicodeIdentifierPart(int codePoint)
      指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。

      次の文のどれかに当てはまる場合にだけ、その文字をUnicode識別子の一部に使用できます。

      • 汎用文字である
      • それが連結句読点文字である('_'など)
      • 数字である
      • 数値汎用文字である(ローマ数字文字など)
      • 連結マークである
      • 非スペーシング・マークである
      • この文字のisIdentifierIgnorabletrueを返す。
      • これはOther_ID_Start文字です。
      • これはOther_ID_Continue文字です。

      このメソッドは、Unicode Standardの「UAX31-R1 : デフォルト識別子」要件に準拠します。次のプロファイルはUAX 31です:

       Continue := Start + ID_Continue + ignorable
       Medial := empty
       ignorable := isIdentifierIgnorable(int) returns true for the character
       
      ignorableは、下位互換性のためにContinueに追加されています。

      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字をUnicode識別子の一部に使用可能な場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.5
      関連項目:
    • isIdentifierIgnorable

      public static boolean isIdentifierIgnorable(char ch)
      指定された文字が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。

      次のUnicode文字は、Java識別子やUnicode識別子内で無視できます。

      • 空白以外のISO制御文字
        • '\u0000' - '\u0008'
        • '\u000E' - '\u001B'
        • '\u007F' - '\u009F'
      • 汎用カテゴリ値FORMATを保持するすべての文字

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isIdentifierIgnorable(int)メソッドを使用してください。

      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      JavaまたはUnicode識別子の一部に使用可能な、無視できる制御文字の場合はtrue、それ以外の場合はfalse
      導入されたバージョン:
      1.1
      関連項目:
    • isIdentifierIgnorable

      public static boolean isIdentifierIgnorable(int codePoint)
      指定された文字(Unicodeコード・ポイント)が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。

      次のUnicode文字は、Java識別子やUnicode識別子内で無視できます。

      • 空白以外のISO制御文字
        • '\u0000' - '\u0008'
        • '\u000E' - '\u001B'
        • '\u007F' - '\u009F'
      • 汎用カテゴリ値FORMATを保持するすべての文字

      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      JavaまたはUnicode識別子の一部に使用可能な、無視できる制御文字の場合はtrue、それ以外の場合はfalse
      導入されたバージョン:
      1.5
      関連項目:
    • toLowerCase

      public static char toLowerCase(char ch)
      UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を小文字に変換します。

      Character.isLowerCase(Character.toLowerCase(ch))は、ある範囲の文字(特に表意文字や記号)に対して常にtrueを返すわけではありません。

      一般に、文字を小文字にマッピングする際にはString.toLowerCase()を使用するようにしてください。 Stringのケース・マッピング・メソッドにはCharacterのケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、Stringのケース・マッピング・メソッドでは実行できますが、Characterのケース・マッピング・メソッドでは実行できません。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、toLowerCase(int)メソッドを使用してください。

      パラメータ:
      ch - 変換対象の文字。
      戻り値:
      対応する小文字(存在する場合)。小文字がない場合は、指定された文字そのもの。
      関連項目:
    • toLowerCase

      public static int toLowerCase(int codePoint)
      UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を小文字に変換します。

      Character.isLowerCase(Character.toLowerCase(codePoint))は、ある範囲の文字(特に表意文字や記号)に対して常にtrueを返すわけではありません。

      一般に、文字を小文字にマッピングする際にはString.toLowerCase()を使用するようにしてください。 Stringのケース・マッピング・メソッドにはCharacterのケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、Stringのケース・マッピング・メソッドでは実行できますが、Characterのケース・マッピング・メソッドでは実行できません。

      パラメータ:
      codePoint - 変換対象の文字(Unicodeコード・ポイント)。
      戻り値:
      指定された文字(Unicodeコード・ポイント)の対応する小文字。対応する小文字がない場合は、指定された文字そのもの。
      導入されたバージョン:
      1.5
      関連項目:
    • toUpperCase

      public static char toUpperCase(char ch)
      UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を大文字に変換します。

      Character.isUpperCase(Character.toUpperCase(ch))は、ある範囲の文字(特に表意文字や記号)に対して常にtrueを返すわけではありません。

      一般に、文字を大文字にマッピングする際にはString.toUpperCase()を使用するようにしてください。 Stringのケース・マッピング・メソッドにはCharacterのケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、Stringのケース・マッピング・メソッドでは実行できますが、Characterのケース・マッピング・メソッドでは実行できません。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、toUpperCase(int)メソッドを使用してください。

      パラメータ:
      ch - 変換対象の文字。
      戻り値:
      対応する大文字(存在する場合)。大文字がない場合は、指定された文字そのもの。
      関連項目:
    • toUpperCase

      public static int toUpperCase(int codePoint)
      UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を大文字に変換します。

      Character.isUpperCase(Character.toUpperCase(codePoint))は、ある範囲の文字(特に表意文字や記号)に対して常にtrueを返すわけではありません。

      一般に、文字を大文字にマッピングする際にはString.toUpperCase()を使用するようにしてください。 Stringのケース・マッピング・メソッドにはCharacterのケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、Stringのケース・マッピング・メソッドでは実行できますが、Characterのケース・マッピング・メソッドでは実行できません。

      パラメータ:
      codePoint - 変換対象の文字(Unicodeコード・ポイント)。
      戻り値:
      対応する大文字(存在する場合)。大文字がない場合は、指定された文字そのもの。
      導入されたバージョン:
      1.5
      関連項目:
    • toTitleCase

      public static char toTitleCase(char ch)
      UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数をタイトル・ケースに変換します。 文字が、明示的なタイトル・ケース・マッピングを保持せず、かつUnicodeDataに準拠したタイトル・ケースcharではない場合、等価なタイトル・ケースとして大文字へのマッピングが返されます。 char引数がタイトル・ケースcharである場合には、同じchar値が返されます。

      Character.isTitleCase(Character.toTitleCase(ch))は、ある範囲の文字に対して常にtrueを返すわけではありません。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、toTitleCase(int)メソッドを使用してください。

      パラメータ:
      ch - 変換対象の文字。
      戻り値:
      対応するタイトル・ケース(存在する場合)。タイトル・ケースがない場合は、指定された文字そのもの。
      導入されたバージョン:
      1.0.2
      関連項目:
    • toTitleCase

      public static int toTitleCase(int codePoint)
      UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数をタイトル・ケースに変換します。 文字が、明示的なタイトル・ケース・マッピングを保持せず、かつUnicodeDataに準拠したタイトル・ケースcharではない場合、等価なタイトル・ケースとして大文字へのマッピングが返されます。 文字の引数がタイトル・ケース文字である場合には、同じ文字値が返されます。

      Character.isTitleCase(Character.toTitleCase(codePoint))は、ある範囲の文字に対して常にtrueを返すわけではありません。

      パラメータ:
      codePoint - 変換対象の文字(Unicodeコード・ポイント)。
      戻り値:
      対応するタイトル・ケース(存在する場合)。タイトル・ケースがない場合は、指定された文字そのもの。
      導入されたバージョン:
      1.5
      関連項目:
    • digit

      public static int digit(char ch, int radix)
      指定された基数での、文字chの数値としての値を返します。

      基数がMIN_RADIXradixMAX_RADIXの範囲外の場合、またはchの値が指定された基数の有効数字でない場合は、-1が返されます。 次のどれかに当てはまる場合、文字は有効数字です。

      • 文字についてメソッドisDigittrueを返し、その文字のUnicode 10進数値(または単一文字の分解)が指定された基数よりも小さい。 この場合、10進値が返される。
      • 文字が'A' - 'Z'のラテン大文字のどれかで、そのコードがradix+'A' - 10よりも小さい。 この場合、ch - 'A'+10が返される。
      • 文字が'a' - 'z'のラテン小文字のどれかで、そのコードがradix+'a' - 10よりも小さい。 この場合、ch - 'a'+10が返される。
      • 文字がA ('\uFF21') - Z ('\uFF3A')の全角ラテン大文字のどれかで、そのコードがradix+'\uFF21' - 10よりも小さい。 この場合、ch - '\uFF21'+10が返される。
      • 文字がa ('\uFF41') - z ('\uFF5A')の全角ラテン小文字のどれかで、そのコードがradix+'\uFF41' - 10よりも小さい。 この場合、ch - '\uFF41'+10が返される。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、digit(int, int)メソッドを使用してください。

      パラメータ:
      ch - 変換対象の文字。
      radix - 基数。
      戻り値:
      指定された基数での、文字によって表される数値
      関連項目:
    • digit

      public static int digit(int codePoint, int radix)
      指定された基数での、指定された文字(Unicodeコード・ポイント)の数値を返します。

      基数がMIN_RADIXradixMAX_RADIXの範囲外の場合、または文字が指定された基数の有効数字でない場合は、-1が返されます。 次のどれかに当てはまる場合、文字は有効数字です。

      • 文字についてメソッドisDigit(codePoint)trueを返し、その文字のUnicode 10進数値(または単一文字の分解)が指定された基数よりも小さい。 この場合、10進値が返される。
      • 文字が'A' - 'Z'のラテン大文字のどれかで、そのコードがradix+'A' - 10よりも小さい。 この場合、codePoint - 'A'+10が返される。
      • 文字が'a' - 'z'のラテン小文字のどれかで、そのコードがradix+'a' - 10よりも小さい。 この場合、codePoint - 'a'+10が返される。
      • 文字がA ('\uFF21') - Z ('\uFF3A')の全角ラテン大文字のどれかで、そのコードがradix+'\uFF21' - 10よりも小さい。 この場合、codePoint - '\uFF21'+10が返される。
      • 文字がa ('\uFF41') - z ('\uFF5A')の全角ラテン小文字のどれかで、そのコードがradix+'\uFF41'- 10よりも小さい。 この場合、codePoint - '\uFF41'+10が返される。

      パラメータ:
      codePoint - 変換対象の文字(Unicodeコード・ポイント)。
      radix - 基数。
      戻り値:
      指定された基数での、文字によって表される数値
      導入されたバージョン:
      1.5
      関連項目:
    • getNumericValue

      public static int getNumericValue(char ch)
      指定されたUnicode文字が表すint値を返します。 たとえば、文字'\u216C' (ローマ数字の50)は、値50のintを返します。

      文字A - Zの大文字('\u0041' - '\u005A')、小文字('\u0061' - '\u007A')、全角バリアント('\uFF21' - '\uFF3A'および'\uFF41' - '\uFF5A')の各形式は、10 - 35の数値を持ちます。 これはUnicode仕様とは無関係であり、Unicode仕様ではこれらのchar値に数値は割り当てられません。

      文字が数値を持たない場合は、-1が返されます。 文字の数値を負でない整数として表現できない場合(小数値など)は、-2が返されます。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、getNumericValue(int)メソッドを使用してください。

      パラメータ:
      ch - 変換対象の文字。
      戻り値:
      文字の数値を負でないint値として返します。文字に数値が含まれていても値が非負のint値として表現できない場合は -2です。文字が数値を持たない場合は -1。
      導入されたバージョン:
      1.1
      関連項目:
    • getNumericValue

      public static int getNumericValue(int codePoint)
      指定された文字(Unicodeコード・ポイント)が表すint値を返します。 たとえば、文字'\u216C' (ローマ数字の50)は、値50のintを返します。

      文字A - Zの大文字('\u0041' - '\u005A')、小文字('\u0061' - '\u007A')、全角バリアント('\uFF21' - '\uFF3A'および'\uFF41' - '\uFF5A')の各形式は、10 - 35の数値を持ちます。 これはUnicode仕様とは無関係であり、Unicode仕様ではこれらのchar値に数値は割り当てられません。

      文字が数値を持たない場合は、-1が返されます。 文字の数値を負でない整数として表現できない場合(小数値など)は、-2が返されます。

      パラメータ:
      codePoint - 変換対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字の数値を負でないint値として返します。文字に数値が含まれていても値が非負のint値として表現できない場合は -2です。文字が数値を持たない場合は -1。
      導入されたバージョン:
      1.5
      関連項目:
    • isSpace

      @Deprecated(since="1.1") public static boolean isSpace(char ch)
      非推奨。
      isWhitespace(char)に置き換えられました。
      指定された文字がISO-LATIN-1の空白かどうかを判定します。 次の5つの文字についてだけ、このメソッドはtrueを返します。
      truechars
      文字 コード 名前
      '\t' U+0009 HORIZONTAL TABULATION
      '\n' U+000A NEW LINE
      '\f' U+000C FORM FEED
      '\r' U+000D CARRIAGE RETURN
      ' ' U+0020 SPACE
      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      文字がISO-LATIN-1の空白の場合はtrue、そうでない場合はfalse
      関連項目:
    • isSpaceChar

      public static boolean isSpaceChar(char ch)
      指定された文字がUnicodeの空白文字かどうかを判定します。 空白文字と見なされるのは、Unicode標準で空白文字として指定されている場合だけです。 文字の汎用カテゴリ型が次のどれかの場合にだけ、このメソッドはtrueを返します。
      • SPACE_SEPARATOR
      • LINE_SEPARATOR
      • PARAGRAPH_SEPARATOR

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isSpaceChar(int)メソッドを使用してください。

      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      文字が空白文字の場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.1
      関連項目:
    • isSpaceChar

      public static boolean isSpaceChar(int codePoint)
      指定された文字(Unicodeコード・ポイント)がUnicodeの空白文字かどうかを判定します。 空白文字と見なされるのは、Unicode標準で空白文字として指定されている場合だけです。 文字の汎用カテゴリ型が次のどれかの場合にだけ、このメソッドはtrueを返します。
      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字が空白文字の場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.5
      関連項目:
    • isWhitespace

      public static boolean isWhitespace(char ch)
      指定された文字がJavaの基準に従った空白かどうかを判定します。 次の基準のどれかを満たす場合にだけ、Javaの空白文字になります。
      • Unicodeの空白文字(SPACE_SEPARATORLINE_SEPARATOR、またはPARAGRAPH_SEPARATOR)であるが、改行なしの空白('\u00A0''\u2007''\u202F')ではない。
      • '\t' (U+0009水平タブ)である。
      • '\n' (U+000A改行)である。
      • '\u000B' (U+000B垂直タブ)である。
      • '\f' (U+000Cフォーム・フィード)である。
      • '\r' (U+000D復帰)である。
      • '\u001C' (U+001Cファイル区切り文字)である。
      • '\u001D' (U+001Dグループ区切り文字)である。
      • '\u001E' (U+001Eレコード区切り文字)である。
      • '\u001F' (U+001F単位区切り文字)である。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isWhitespace(int)メソッドを使用してください。

      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      文字がJava空白文字の場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.1
      関連項目:
    • isWhitespace

      public static boolean isWhitespace(int codePoint)
      指定された文字(Unicodeコード・ポイント)がJavaの基準に従った空白かどうかを判定します。 次の基準のどれかを満たす場合にだけ、Javaの空白文字になります。
      • Unicodeの空白文字(SPACE_SEPARATORLINE_SEPARATOR、またはPARAGRAPH_SEPARATOR)であるが、改行なしの空白('\u00A0''\u2007''\u202F')ではない。
      • '\t' (U+0009水平タブ)である。
      • '\n' (U+000A改行)である。
      • '\u000B' (U+000B垂直タブ)である。
      • '\f' (U+000Cフォーム・フィード)である。
      • '\r' (U+000D復帰)である。
      • '\u001C' (U+001Cファイル区切り文字)である。
      • '\u001D' (U+001Dグループ区切り文字)である。
      • '\u001E' (U+001Eレコード区切り文字)である。
      • '\u001F' (U+001F単位区切り文字)である。
      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字がJava空白文字の場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.5
      関連項目:
    • isISOControl

      public static boolean isISOControl(char ch)
      指定された文字がISO制御文字かどうかを判定します。 コードが'\u0000' - '\u001F'の範囲、または'\u007F' - '\u009F'の範囲の場合は、ISO制御文字と見なされます。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isISOControl(int)メソッドを使用してください。

      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      文字がISO制御文字の場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.1
      関連項目:
    • isISOControl

      public static boolean isISOControl(int codePoint)
      参照された文字(Unicodeコード・ポイント)がISO制御文字かどうかを判定します。 コードが'\u0000' - '\u001F'の範囲、または'\u007F' - '\u009F'の範囲の場合は、ISO制御文字と見なされます。
      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字がISO制御文字の場合はtrue、そうでない場合はfalse
      導入されたバージョン:
      1.5
      関連項目:
    • getType

      public static int getType(char ch)
      文字の汎用カテゴリを示す値を返します。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、getType(int)メソッドを使用してください。

      パラメータ:
      ch - 判定対象の文字。
      戻り値:
      文字の汎用カテゴリを表すint型の値。
      導入されたバージョン:
      1.1
      関連項目:
    • getType

      public static int getType(int codePoint)
      文字の汎用カテゴリを示す値を返します。
      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字の汎用カテゴリを表すint型の値。
      導入されたバージョン:
      1.5
      関連項目:
    • forDigit

      public static char forDigit(int digit, int radix)
      指定された基数での、指定された桁数の文字表現を判定します。 radixの値が無効な基数の場合、またはdigitが指定された基数で無効な数字の場合は、null文字('\u0000')が返されます。

      radix引数は、MIN_RADIX以上MAX_RADIX以下の場合に有効です。 digit引数は、0 <= digit < radixの場合に有効です。

      数字が10より小さいと、'0'+digitが返されます。 そうでない場合は、値'a'+digit - 10が返されます。

      パラメータ:
      digit - 文字に変換する数。
      radix - 基数。
      戻り値:
      指定された基数での、指定された数値のchar表現。
      関連項目:
    • getDirectionality

      public static byte getDirectionality(char ch)
      指定された文字のUnicode方向性プロパティを返します。 文字の方向性は、テキストの表示順の計算に使用されます。 未定義のchar値の方向性値はDIRECTIONALITY_UNDEFINEDです。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、getDirectionality(int)メソッドを使用してください。

      パラメータ:
      ch - 方向性プロパティが要求されたchar
      戻り値:
      char値の方向性プロパティ。
      導入されたバージョン:
      1.4
      関連項目:
    • getDirectionality

      public static byte getDirectionality(int codePoint)
      所定の文字(Unicodeコード・ポイント)のUnicode方向性プロパティを返します。 文字の方向性は、テキストの表示順の計算に使用されます。 未定義の文字の方向性値はDIRECTIONALITY_UNDEFINEDです。
      パラメータ:
      codePoint - 方向性プロパティが要求された文字(Unicodeコード・ポイント)。
      戻り値:
      文字の方向性プロパティ
      導入されたバージョン:
      1.5
      関連項目:
    • isMirrored

      public static boolean isMirrored(char ch)
      Unicode仕様に従って文字をミラー化するかどうかを判定します。 テキスト内で右から左に文字が描画される場合、文字のミラー化により、グリフが水平方向にミラー化されます。 たとえば、'\u0028' LEFT PARENTHESISは、セマンティックスでは開きカッコとして定義されています。 これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。

      ノート: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isMirrored(int)メソッドを使用してください。

      パラメータ:
      ch - ミラー化プロパティが要求されたchar
      戻り値:
      charがミラー化される場合はtruecharがミラー化されないか未定義の場合はfalse
      導入されたバージョン:
      1.4
    • isMirrored

      public static boolean isMirrored(int codePoint)
      Unicode仕様に従って、指定された文字(Unicodeコード・ポイント)をミラー化するかどうかを判定します。 テキスト内で右から左に文字が描画される場合、文字のミラー化により、グリフが水平方向にミラー化されます。 たとえば、'\u0028' LEFT PARENTHESISは、セマンティックスでは開きカッコとして定義されています。 これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。
      パラメータ:
      codePoint - 判定対象の文字(Unicodeコード・ポイント)。
      戻り値:
      文字がミラー化される場合はtrue、文字がミラー化されないか未定義の場合はfalse
      導入されたバージョン:
      1.5
    • compareTo

      public int compareTo(Character anotherCharacter)
      2つのCharacterオブジェクトを数値的に比較します。
      定義:
      compareTo、インタフェース: Comparable<Character>
      パラメータ:
      anotherCharacter - 比較対象のCharacter
      戻り値:
      引数CharacterがこのCharacterと等しい場合は値0、このCharacterCharacter引数より小さい数値の場合は0より小さい値、このCharacterCharacter引数より大きい数値の場合は0より大きい値(符号なしの比較)。 これは完全に数値の比較なので、ロケールに依存しない
      導入されたバージョン:
      1.2
    • compare

      public static int compare(char x, char y)
      2つのchar値を数値的に比較します。 返される値は、次から返される値と同じになります。
          Character.valueOf(x).compareTo(Character.valueOf(y))
       
      パラメータ:
      x - 比較する最初のchar
      y - 比較する2番目のchar
      戻り値:
      x == yの場合は値0x < yの場合は0より小さい値、x> yの場合は0より大きい値
      導入されたバージョン:
      1.7
    • reverseBytes

      public static char reverseBytes(char ch)
      指定されたchar値でバイト順を逆にして取得した値を返します。
      パラメータ:
      ch - そのバイト順を逆にするchar
      戻り値:
      指定されたchar値でバイト順を逆にして(つまり入れ替えて)取得した値。
      導入されたバージョン:
      1.5
    • getName

      public static String getName(int codePoint)
      指定された文字codePointの名前を返します。コード・ポイントがunassignedの場合はnullを返します。

      指定した文字にUnicodeDataファイル(ユニコード・コンソーシアムによって管理されているUnicode文字データベースの一部)によって名前が割り当てられていない場合、返される名前は式の結果と同じです:

      Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);
      UnicodeDataファイルのcodePointの場合、このメソッドによって返される名前は、Unicode Standardの"Unicode名プロパティ"セクションのネーミング・スキームに従います。 Hangul/Ideographsなどの他のコード・ポイントの場合、前述の名前生成ルールはUnicode Standardで定義されているものとは異なります。

      パラメータ:
      codePoint - 文字(Unicodeコード・ポイント)
      戻り値:
      指定した文字の名前、またはコード・ポイントが割り当てられていない場合はnull。
      例外:
      IllegalArgumentException - 指定されたcodePointが有効なUnicodeコード・ポイントでない場合。
      導入されたバージョン:
      1.7
    • codePointOf

      public static int codePointOf(String name)
      指定された文字名で指定されたUnicode文字のコード・ポイント値を返します。

      文字にUnicodeDataファイル(ユニコード・コンソーシアムによって管理されているUnicode文字データベースの一部)によって名前が割り当てられていない場合、その名前は式の結果として定義されます:

      Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);

      nameのマッチングでは、大文字と小文字は区別されず、前後の空白文字は削除されます。 UnicodeDataファイルのコード・ポイントの場合、このメソッドは、Unicode Standardの"Unicode名プロパティ"セクションで定義された名前に準拠する名前を認識します。 他のコード・ポイントの場合、このメソッドはgetName(int)メソッドで生成された名前を認識します。

      パラメータ:
      name - 文字名
      戻り値:
      その名前で指定された文字のコード・ポイント値。
      例外:
      IllegalArgumentException - 指定したnameが有効な文字名でない場合。
      NullPointerException - namenullである場合
      導入されたバージョン:
      9