モジュール java.base
パッケージ java.lang

クラスCharacter

  • すべての実装されたインタフェース:
    Serializable, Comparable<Character>

    public final class Character
    extends Object
    implements Serializable, Comparable<Character>
    Characterクラスは、プリミティブ型charの値をオブジェクトにラップします。 Character型のオブジェクトには、型がcharの単一フィールドが含まれます。

    また、このクラスは、文字のカテゴリ(小文字、数字など)を決定したり、大文字から小文字(およびその逆)の変換を行ういくつかのメソッドも提供します。

    文字情報は、Unicode Standard、バージョン10.0.0に基づきます。

    Characterクラスのメソッドおよびデータは、UnicodeDataファイル内の情報により定義されます。このファイルは、Unicode Consortiumがメンテナンスを行っているUnicode Character Databaseの一部です。 このファイルは、定義済みのUnicodeコード・ポイントまたは文字範囲ごとの名前やカテゴリを含むさまざまなプロパティを指定します。

    ファイルおよびその説明は、次のサイトのUnicode Consortiumから入手できます。

    Unicode文字表現

    charデータ型(Characterオブジェクトにカプセル化される値)は、当初のUnicode仕様に基づいています。この仕様では、文字が固定幅16ビット・エンティティとして定義されていました。 Unicode標準はその後、16ビット以上の表現を必要とする文字を許容するように変更されています。 適正なコード・ポイントの範囲は、現在U+0000 - U+10FFFFであり、Unicodeスカラー値として知られています。 (Unicode標準のU+n表記の定義を参照。)

    U+0000 - U+FFFFの文字セットは、基本多言語面(BMP)と呼ばれる場合もあります。 コード・ポイントがU+FFFFよりも大きい文字補助文字と呼ばれます。 Javaプラットフォームでは、char配列、Stringクラス、およびStringBufferクラスでUTF-16表現が使用されます。 この表現では、補助文字はchar値のペアとして表現され、上位サロゲート範囲(\uD800-\uDBFF)からの最初の値と、下位サロゲート範囲(\uDC00-\uDFFF)からの第2の値から構成されています。

    したがって、char値は、サロゲート・コード・ポイントやUTF-16エンコーディングのコード単位を含む基本多言語面(BMP)コード・ポイントを表します。 int値は、補助コード・ポイントを含むすべてのUnicodeコード・ポイントを表します。 intの下位(最下位) 21ビットは、Unicodeコード・ポイントを表すために使用され、上位(最上位) 11ビットはゼロである必要があります。 特に指定されないかぎり、補助文字とサロゲートchar値に関する動作は次のとおりです。

    • char値だけを受け入れるメソッドは補助文字に対応できません。 これらのメソッドはサロゲート範囲のchar値を未定義の文字として扱います。 たとえば、Character.isLetter('\uD840')falseを返し、文字列でそのあとに下位サロゲート値が続く場合でも、この特定の値は文字を表します。
    • int値を受け入れるメソッドは、補助文字を含むすべてのUnicode文字に対応します。 たとえば、Character.isLetter(0x2F81A)は、コード・ポイント値が文字(CJK統合漢字)を表すため、trueを返します。

    Java SE APIドキュメンテーションでは、U+0000 - U+10FFFFの範囲の文字値にUnicodeコード・ポイントを使用し、UTF-16エンコーディングのコード単位である16ビットchar値にUnicodeコード単位を使用します。 Unicode用語の詳細は、「Unicode Glossary」を参照してください。

    導入されたバージョン:
    1.0
    関連項目:
    直列化された形式
    • ネストされたクラスのサマリー

      ネストされたクラス 
      修飾子と型 クラス 説明
      static class  Character.Subset
      このクラスのインスタンスは、Unicode文字セットの特定のサブセットを表します。
      static class  Character.UnicodeBlock
      Unicode仕様で定義されている文字ブロックを表す文字サブセットのファミリです。
      static class  Character.UnicodeScript
      Unicode Standard Annex#24: Script Names」で規定された文字スクリプトを表す文字サブセットのファミリです。
    • コンストラクタのサマリー

      コンストラクタ 
      コンストラクタ 説明
      Character​(char value)
      非推奨。
      このコンストラクタを使用することはほとんどありません。
    • メソッドのサマリー

      すべてのメソッド 静的メソッド インスタンス・メソッド 具象メソッド 非推奨のメソッド 
      修飾子と型 メソッド 説明
      static int charCount​(int codePoint)
      指定された文字(Unicodeコード・ポイント)を表すのに必要なchar値の数を判定します。
      char charValue()
      このCharacterオブジェクトの値を返します。
      static int codePointAt​(char[] a, int index)
      char配列の指定されたインデックスにあるコード・ポイントを返します。
      static int codePointAt​(char[] a, int index, int limit)
      limitの長さ未満のindexを持つ配列要素のみを使用可能な、char配列の指定されたインデックスにあるコード・ポイントを返します。
      static int codePointAt​(CharSequence seq, int index)
      CharSequenceの指定されたインデックスにあるコード・ポイントを返します。
      static int codePointBefore​(char[] a, int index)
      char配列の指定されたインデックスの前にあるコード・ポイントを返します。
      static int codePointBefore​(char[] a, int index, int start)
      start以上のindexを持つ配列要素のみを使用可能な、char配列の指定されたインデックスの前にあるコード・ポイントを返します。
      static int codePointBefore​(CharSequence seq, int index)
      CharSequenceの指定されたインデックスの前にあるコード・ポイントを返します。
      static int codePointCount​(char[] a, int offset, int count)
      char配列引数の部分配列内にあるUnicodeコード・ポイントの数を返します。
      static int codePointCount​(CharSequence seq, int beginIndex, int endIndex)
      指定されたcharシーケンスのテキスト範囲内のUnicodeコード・ポイントの数を返します。
      static int codePointOf​(String name)
      指定されたUnicode文字名で指定されたUnicode文字のコード・ポイント値を返します。
      static int compare​(char x, char y)
      2つのchar値を数値的に比較します。
      int compareTo​(Character anotherCharacter)
      2つのCharacterオブジェクトを数値的に比較します。
      static int digit​(char ch, int radix)
      指定された基数での、文字chの数値としての値を返します。
      static int digit​(int codePoint, int radix)
      指定された基数での、指定された文字(Unicodeコード・ポイント)の数値を返します。
      boolean equals​(Object obj)
      このオブジェクトと指定されたオブジェクトを比較します。
      static char forDigit​(int digit, int radix)
      指定された基数での、指定された桁数の文字表現を判定します。
      static byte getDirectionality​(char ch)
      指定された文字のUnicode方向性プロパティを返します。
      static byte getDirectionality​(int codePoint)
      所定の文字(Unicodeコード・ポイント)のUnicode方向性プロパティを返します。
      static String getName​(int codePoint)
      指定された文字codePointのUnicode名(コード・ポイントがunassignedの場合はnull)を返します。
      static int getNumericValue​(char ch)
      指定されたUnicode文字が表すint値を返します。
      static int getNumericValue​(int codePoint)
      指定された文字(Unicodeコード・ポイント)が表すint値を返します。
      static int getType​(char ch)
      文字の汎用カテゴリを示す値を返します。
      static int getType​(int codePoint)
      文字の汎用カテゴリを示す値を返します。
      int hashCode()
      このCharacterのハッシュ・コード(charValue()を呼び出した場合の結果と等しくなる)を返します。
      static int hashCode​(char value)
      Character.hashCode()との互換性がある、char値のハッシュ・コードを返します。
      static char highSurrogate​(int codePoint)
      UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのリーディング・サロゲート(上位サロゲート・コード単位)を返します。
      static boolean isAlphabetic​(int codePoint)
      指定された文字(Unicodeコード・ポイント)がアルファベットかどうかを判定します。
      static boolean isBmpCodePoint​(int codePoint)
      指定された文字(Unicodeコード・ポイント)が基本多言語面(BMP)に含まれるかどうかを判定します。
      static boolean isDefined​(char ch)
      文字がUnicodeで定義されているかどうかを判定します。
      static boolean isDefined​(int codePoint)
      文字(Unicodeコード・ポイント)がUnicodeで定義されているかどうかを判定します。
      static boolean isDigit​(char ch)
      指定された文字が数字かどうかを判定します。
      static boolean isDigit​(int codePoint)
      指定された文字(Unicodeコード・ポイント)が数字かどうかを判定します。
      static boolean isHighSurrogate​(char ch)
      指定されたchar値がUnicode上位サロゲート・コード単位 (リーディング・サロゲート・コード単位ともいう)であるかどうかを判定します。
      static boolean isIdentifierIgnorable​(char ch)
      指定された文字が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。
      static boolean isIdentifierIgnorable​(int codePoint)
      指定された文字(Unicodeコード・ポイント)が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。
      static boolean isIdeographic​(int codePoint)
      指定された文字(Unicodeコード・ポイント)が、Unicode標準で規定されたCJKV (中国語、日本語、韓国語、およびベトナム語)の表意文字かどうかを判定します。
      static boolean isISOControl​(char ch)
      指定された文字がISO制御文字かどうかを判定します。
      static boolean isISOControl​(int codePoint)
      参照された文字(Unicodeコード・ポイント)がISO制御文字かどうかを判定します。
      static boolean isJavaIdentifierPart​(char ch)
      指定された文字をJava識別子の最初の文字以外に使用可能かどうかを判定します。
      static boolean isJavaIdentifierPart​(int codePoint)
      文字(Unicodeコード・ポイント)をJava識別子の最初の文字以外に使用可能かどうかを判定します。
      static boolean isJavaIdentifierStart​(char ch)
      指定された文字をJava識別子の最初の文字として指定可能かどうかを判定します。
      static boolean isJavaIdentifierStart​(int codePoint)
      文字(Unicodeコード・ポイント)をJava識別子の最初の文字として指定可能かどうかを判定します。
      static boolean isJavaLetter​(char ch)
      非推奨。
      isJavaIdentifierStart(char)に置き換えられました。
      static boolean isJavaLetterOrDigit​(char ch)
      非推奨。
      isJavaIdentifierPart(char)に置き換えられました。
      static boolean isLetter​(char ch)
      指定された文字が汎用文字かどうかを判定します。
      static boolean isLetter​(int codePoint)
      指定された文字(Unicodeコード・ポイント)が汎用文字かどうかを判定します。
      static boolean isLetterOrDigit​(char ch)
      指定された文字が汎用文字または数字かどうかを判定します。
      static boolean isLetterOrDigit​(int codePoint)
      指定された文字(Unicodeコード・ポイント)が汎用文字または数字かどうかを判定します。
      static boolean isLowerCase​(char ch)
      指定された文字が小文字かどうかを判定します。
      static boolean isLowerCase​(int codePoint)
      指定された文字(Unicodeコード・ポイント)が小文字かどうかを判定します。
      static boolean isLowSurrogate​(char ch)
      指定されたchar値がUnicode下位サロゲート・コード単位 (トレーリング・サロゲート・コード単位ともいう)であるかどうかを判定します。
      static boolean isMirrored​(char ch)
      Unicode仕様に従って文字をミラー化するかどうかを判定します。
      static boolean isMirrored​(int codePoint)
      Unicode仕様に従って、指定された文字(Unicodeコード・ポイント)をミラー化するかどうかを判定します。
      static boolean isSpace​(char ch)
      非推奨。
      isWhitespace(char)に置き換えられました。
      static boolean isSpaceChar​(char ch)
      指定された文字がUnicodeの空白文字かどうかを判定します。
      static boolean isSpaceChar​(int codePoint)
      指定された文字(Unicodeコード・ポイント)がUnicodeの空白文字かどうかを判定します。
      static boolean isSupplementaryCodePoint​(int codePoint)
      指定された文字(Unicodeコード・ポイント)が補助文字の範囲にあるかどうかを判定します。
      static boolean isSurrogate​(char ch)
      指定されたchar値がUnicode サロゲート・コード単位かどうかを判定します。
      static boolean isSurrogatePair​(char high, char low)
      指定されたchar値のペアが有効なUnicodeサロゲート・ペアであるかどうかを判定します。
      static boolean isTitleCase​(char ch)
      指定された文字がタイトル・ケース文字かどうかを判定します。
      static boolean isTitleCase​(int codePoint)
      指定された文字(Unicodeコード・ポイント)がタイトル・ケース文字かどうかを判定します。
      static boolean isUnicodeIdentifierPart​(char ch)
      指定された文字をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。
      static boolean isUnicodeIdentifierPart​(int codePoint)
      指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。
      static boolean isUnicodeIdentifierStart​(char ch)
      指定された文字をUnicode識別子の最初の文字として指定可能かどうかを判定します。
      static boolean isUnicodeIdentifierStart​(int codePoint)
      指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字として指定可能かどうかを判定します。
      static boolean isUpperCase​(char ch)
      指定された文字が大文字がどうかを判定します。
      static boolean isUpperCase​(int codePoint)
      指定された文字(Unicodeコード・ポイント)が大文字かどうかを判定します。
      static boolean isValidCodePoint​(int codePoint)
      指定されたコード・ポイントが有効なUnicodeコード・ポイント値であるかどうかを判定します。
      static boolean isWhitespace​(char ch)
      指定された文字がJavaの基準に従った空白かどうかを判定します。
      static boolean isWhitespace​(int codePoint)
      指定された文字(Unicodeコード・ポイント)がJavaの基準に従った空白かどうかを判定します。
      static char lowSurrogate​(int codePoint)
      UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのトレーリング・サロゲート(下位サロゲート・コード単位)を返します。
      static int offsetByCodePoints​(char[] a, int start, int count, int index, int codePointOffset)
      指定されたchar部分配列内で、指定されたindexからcodePointOffsetコード・ポイント分だけオフセットされた位置のインデックスを返します。
      static int offsetByCodePoints​(CharSequence seq, int index, int codePointOffset)
      指定された文字シーケンス内で、指定されたindexからcodePointOffsetコード・ポイント分だけオフセットされた位置のインデックスを返します。
      static char reverseBytes​(char ch)
      指定されたchar値でバイト順を逆にして取得した値を返します。
      static char[] toChars​(int codePoint)
      指定された文字(Unicodeコード・ポイント)をchar配列に格納されるUTF-16表現に変換します。
      static int toChars​(int codePoint, char[] dst, int dstIndex)
      指定された文字(Unicodeコード・ポイント)をUTF-16表現に変換します。
      static int toCodePoint​(char high, char low)
      指定されたサロゲート・ペアをその補助コード・ポイント値に変換します。
      static char toLowerCase​(char ch)
      UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を小文字に変換します。
      static int toLowerCase​(int codePoint)
      UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を小文字に変換します。
      String toString()
      このCharacterの値を表すStringオブジェクトを返します。
      static String toString​(char c)
      指定されたcharを表すStringオブジェクトを返します。
      static String toString​(int codePoint)
      指定された文字(Unicodeコード・ポイント)を表すStringオブジェクトを返します。
      static char toTitleCase​(char ch)
      UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数をタイトル・ケースに変換します。
      static int toTitleCase​(int codePoint)
      UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数をタイトル・ケースに変換します。
      static char toUpperCase​(char ch)
      UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を大文字に変換します。
      static int toUpperCase​(int codePoint)
      UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を大文字に変換します。
      static Character valueOf​(char c)
      指定されたchar値を表すCharacterインスタンスを返します。
    • フィールドの詳細

      • MIN_VALUE

        public static final char MIN_VALUE
        このフィールドの定数値は、char型の最小値'\u0000'です。
        導入されたバージョン:
        1.0.2
        関連項目:
        定数フィールド値
      • MAX_VALUE

        public static final char MAX_VALUE
        このフィールドの定数値は、char型の最大値'\uFFFF'です。
        導入されたバージョン:
        1.0.2
        関連項目:
        定数フィールド値
      • TYPE

        public static final Class<Character> TYPE
        プリミティブ型charを表すClassインスタンス。
        導入されたバージョン:
        1.1
      • UNASSIGNED

        public static final byte UNASSIGNED
        Unicode仕様の汎用カテゴリ「Cn」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • UPPERCASE_LETTER

        public static final byte UPPERCASE_LETTER
        Unicode仕様の汎用カテゴリ「Lu」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • LOWERCASE_LETTER

        public static final byte LOWERCASE_LETTER
        Unicode仕様の汎用カテゴリ「Ll」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • TITLECASE_LETTER

        public static final byte TITLECASE_LETTER
        Unicode仕様の汎用カテゴリ「Lt」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • MODIFIER_LETTER

        public static final byte MODIFIER_LETTER
        Unicode仕様の汎用カテゴリ「Lm」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • OTHER_LETTER

        public static final byte OTHER_LETTER
        Unicode仕様の汎用カテゴリ「Lo」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • NON_SPACING_MARK

        public static final byte NON_SPACING_MARK
        Unicode仕様の汎用カテゴリ「Mn」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • ENCLOSING_MARK

        public static final byte ENCLOSING_MARK
        Unicode仕様の汎用カテゴリ「Me」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • COMBINING_SPACING_MARK

        public static final byte COMBINING_SPACING_MARK
        Unicode仕様の汎用カテゴリ「Mc」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • DECIMAL_DIGIT_NUMBER

        public static final byte DECIMAL_DIGIT_NUMBER
        Unicode仕様の汎用カテゴリ「Nd」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • LETTER_NUMBER

        public static final byte LETTER_NUMBER
        Unicode仕様の汎用カテゴリ「Nl」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • OTHER_NUMBER

        public static final byte OTHER_NUMBER
        Unicode仕様の汎用カテゴリ「No」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • SPACE_SEPARATOR

        public static final byte SPACE_SEPARATOR
        Unicode仕様の汎用カテゴリ「Zs」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • LINE_SEPARATOR

        public static final byte LINE_SEPARATOR
        Unicode仕様の汎用カテゴリ「Zl」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • PARAGRAPH_SEPARATOR

        public static final byte PARAGRAPH_SEPARATOR
        Unicode仕様の汎用カテゴリ「Zp」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • CONTROL

        public static final byte CONTROL
        Unicode仕様の汎用カテゴリ「Cc」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • FORMAT

        public static final byte FORMAT
        Unicode仕様の汎用カテゴリ「Cf」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • PRIVATE_USE

        public static final byte PRIVATE_USE
        Unicode仕様の汎用カテゴリ「Co」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • SURROGATE

        public static final byte SURROGATE
        Unicode仕様の汎用カテゴリ「Cs」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • DASH_PUNCTUATION

        public static final byte DASH_PUNCTUATION
        Unicode仕様の汎用カテゴリ「Pd」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • START_PUNCTUATION

        public static final byte START_PUNCTUATION
        Unicode仕様の汎用カテゴリ「Ps」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • END_PUNCTUATION

        public static final byte END_PUNCTUATION
        Unicode仕様の汎用カテゴリ「Pe」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • CONNECTOR_PUNCTUATION

        public static final byte CONNECTOR_PUNCTUATION
        Unicode仕様の汎用カテゴリ「Pc」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • OTHER_PUNCTUATION

        public static final byte OTHER_PUNCTUATION
        Unicode仕様の汎用カテゴリ「Po」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • MATH_SYMBOL

        public static final byte MATH_SYMBOL
        Unicode仕様の汎用カテゴリ「Sm」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • CURRENCY_SYMBOL

        public static final byte CURRENCY_SYMBOL
        Unicode仕様の汎用カテゴリ「Sc」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • MODIFIER_SYMBOL

        public static final byte MODIFIER_SYMBOL
        Unicode仕様の汎用カテゴリ「Sk」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • OTHER_SYMBOL

        public static final byte OTHER_SYMBOL
        Unicode仕様の汎用カテゴリ「So」。
        導入されたバージョン:
        1.1
        関連項目:
        定数フィールド値
      • INITIAL_QUOTE_PUNCTUATION

        public static final byte INITIAL_QUOTE_PUNCTUATION
        Unicode仕様の汎用カテゴリ「Pi」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • FINAL_QUOTE_PUNCTUATION

        public static final byte FINAL_QUOTE_PUNCTUATION
        Unicode仕様の汎用カテゴリ「Pf」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_UNDEFINED

        public static final byte DIRECTIONALITY_UNDEFINED
        未定義の双方向文字タイプ。 Unicode仕様では、未定義のchar値の方向性は定義されていません。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_LEFT_TO_RIGHT

        public static final byte DIRECTIONALITY_LEFT_TO_RIGHT
        Unicode仕様の強力な双方向文字タイプ「L」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_RIGHT_TO_LEFT

        public static final byte DIRECTIONALITY_RIGHT_TO_LEFT
        Unicode仕様の強力な双方向文字タイプ「R」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC

        public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
        Unicode仕様の強力な双方向文字タイプ「AL」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_EUROPEAN_NUMBER

        public static final byte DIRECTIONALITY_EUROPEAN_NUMBER
        Unicode仕様の弱い双方向文字タイプ「EN」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR

        public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
        Unicode仕様の弱い双方向文字タイプ「ES」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR

        public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
        Unicode仕様の弱い双方向文字タイプ「ET」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_ARABIC_NUMBER

        public static final byte DIRECTIONALITY_ARABIC_NUMBER
        Unicode仕様の弱い双方向文字タイプ「AN」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_COMMON_NUMBER_SEPARATOR

        public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
        Unicode仕様の弱い双方向文字タイプ「CS」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_NONSPACING_MARK

        public static final byte DIRECTIONALITY_NONSPACING_MARK
        Unicode仕様の弱い双方向文字タイプ「NSM」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_BOUNDARY_NEUTRAL

        public static final byte DIRECTIONALITY_BOUNDARY_NEUTRAL
        Unicode仕様の弱い双方向文字タイプ「BN」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_PARAGRAPH_SEPARATOR

        public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
        Unicode仕様のニュートラルな双方向文字タイプ「B」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_SEGMENT_SEPARATOR

        public static final byte DIRECTIONALITY_SEGMENT_SEPARATOR
        Unicode仕様のニュートラルな双方向文字タイプ「S」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_WHITESPACE

        public static final byte DIRECTIONALITY_WHITESPACE
        Unicode仕様のニュートラルな双方向文字タイプ「WS」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_OTHER_NEUTRALS

        public static final byte DIRECTIONALITY_OTHER_NEUTRALS
        Unicode仕様のニュートラルな双方向文字タイプ「ON」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING

        public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
        Unicode仕様の強力な双方向文字タイプ「LRE」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE

        public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
        Unicode仕様の強力な双方向文字タイプ「LRO」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING

        public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
        Unicode仕様の強力な双方向文字タイプ「RLE」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE

        public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
        Unicode仕様の強力な双方向文字タイプ「RLO」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_POP_DIRECTIONAL_FORMAT

        public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
        Unicode仕様の弱い双方向文字タイプ「PDF」。
        導入されたバージョン:
        1.4
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE

        public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
        Unicode仕様の弱い双方向文字型"LRI"。
        導入されたバージョン:
        9
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE

        public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
        Unicode仕様の弱い双方向文字型"RLI"。
        導入されたバージョン:
        9
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_FIRST_STRONG_ISOLATE

        public static final byte DIRECTIONALITY_FIRST_STRONG_ISOLATE
        Unicode仕様の弱い双方向文字型"FSI"。
        導入されたバージョン:
        9
        関連項目:
        定数フィールド値
      • DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE

        public static final byte DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
        Unicode仕様の弱い双方向文字型"PDI"。
        導入されたバージョン:
        9
        関連項目:
        定数フィールド値
      • MIN_SURROGATE

        public static final char MIN_SURROGATE
        UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最小値(定数'\uD800')。
        導入されたバージョン:
        1.5
        関連項目:
        定数フィールド値
      • MAX_SURROGATE

        public static final char MAX_SURROGATE
        UTF-16エンコーディングでのUnicodeサロゲート・コード単位の最大値(定数'\uDFFF')。
        導入されたバージョン:
        1.5
        関連項目:
        定数フィールド値
      • SIZE

        public static final int SIZE
        符号なしバイナリ形式でchar値を表すのに使用されるビット数(定数16)。
        導入されたバージョン:
        1.5
        関連項目:
        定数フィールド値
      • BYTES

        public static final int BYTES
        符号なしバイナリ形式でchar値を表すために使用されるバイト数。
        導入されたバージョン:
        1.8
        関連項目:
        定数フィールド値
    • コンストラクタの詳細

      • Character

        @Deprecated(since="9")
        public Character​(char value)
        非推奨。
        このコンストラクタを使用することはほとんどありません。 静的ファクトリvalueOf(char)は、より良いスペースと時間のパフォーマンスをもたらす可能性が高いため、通常はより良い選択です。
        指定されたchar値を表す、新しく割り当てられたCharacterオブジェクトを構築します。
        パラメータ:
        value - Characterオブジェクトによって表される値。
    • メソッドの詳細

      • valueOf

        public static Character valueOf​(char c)
        指定されたchar値を表すCharacterインスタンスを返します。 新規Characterインスタンスが不要な場合、通常このメソッドがコンストラクタCharacter(char)に優先して使用されます。その理由は、このメソッドが頻繁に要求される値をキャッシュするので、操作に必要な領域や時間がはるかに少なくて済む場合が多いためです。 このメソッドは、 '\u0000'から'\u007F'の範囲(両端含む)の値を常にキャッシュしますが、この範囲に含まれないその他の値をキャッシュすることもあります。
        パラメータ:
        c - char値。
        戻り値:
        cを表すCharacterインスタンス。
        導入されたバージョン:
        1.5
      • charValue

        public char charValue()
        このCharacterオブジェクトの値を返します。
        戻り値:
        このオブジェクトが表すプリミティブchar値。
      • hashCode

        public static int hashCode​(char value)
        Character.hashCode()との互換性がある、char値のハッシュ・コードを返します。
        パラメータ:
        value - ハッシュ・コードが返されるchar
        戻り値:
        char値のハッシュ・コード値。
        導入されたバージョン:
        1.8
      • equals

        public boolean equals​(Object obj)
        このオブジェクトと指定されたオブジェクトを比較します。 結果がtrueになるのは、引数がnullではなく、このオブジェクトと同じchar値を表すCharacterオブジェクトである場合だけです。
        オーバーライド:
        equals 、クラス:  Object
        パラメータ:
        obj - 比較対象のオブジェクト
        戻り値:
        オブジェクトが同じである場合はtrue、そうでない場合はfalse
        関連項目:
        Object.hashCode()HashMap
      • toString

        public String toString()
        このCharacterの値を表すStringオブジェクトを返します。 結果は、長さ1の文字列(構成要素はCharacterオブジェクトにより表されるプリミティブ型のchar値だけ)になります。
        オーバーライド:
        toString 、クラス:  Object
        戻り値:
        このオブジェクトの文字列表現。
      • toString

        public static String toString​(char c)
        指定されたcharを表すStringオブジェクトを返します。 結果は、指定されたcharだけで構成される長さ1の文字列になります。
        APIの注:
        このメソッドは「補助文字」を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、toString(int)メソッドを使用します。
        パラメータ:
        c - 変換するchar
        戻り値:
        指定されたcharの文字列表現
        導入されたバージョン:
        1.4
      • toString

        public static String toString​(int codePoint)
        指定された文字(Unicodeコード・ポイント)を表すStringオブジェクトを返します。 結果は、指定されたcodePointのみで構成された1または2の長さの文字列です。
        パラメータ:
        codePoint - 変換するcodePoint
        戻り値:
        指定されたcodePointの文字列表現
        例外:
        IllegalArgumentException - 指定されたcodePoint「有効なUnicodeコード・ポイント」ではない場合。
        導入されたバージョン:
        11
      • isValidCodePoint

        public static boolean isValidCodePoint​(int codePoint)
        指定されたコード・ポイントが有効なUnicodeコード・ポイント値であるかどうかを判定します。
        パラメータ:
        codePoint - 判定対象のUnicodeコード・ポイント
        戻り値:
        指定されたコード・ポイント値がMIN_CODE_POINT - MAX_CODE_POINTの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse
        導入されたバージョン:
        1.5
      • isBmpCodePoint

        public static boolean isBmpCodePoint​(int codePoint)
        指定された文字(Unicodeコード・ポイント)が基本多言語面(BMP)に含まれるかどうかを判定します。 そのようなコード・ポイントは単一のcharを使って表せます。
        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)
        戻り値:
        指定されたコード・ポイントがMIN_VALUE - MAX_VALUEの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse
        導入されたバージョン:
        1.7
      • isSupplementaryCodePoint

        public static boolean isSupplementaryCodePoint​(int codePoint)
        指定された文字(Unicodeコード・ポイント)が補助文字の範囲にあるかどうかを判定します。
        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)
        戻り値:
        指定されたコード・ポイントがMIN_SUPPLEMENTARY_CODE_POINT - MAX_CODE_POINTの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse
        導入されたバージョン:
        1.5
      • isLowSurrogate

        public static boolean isLowSurrogate​(char ch)
        指定されたchar値がUnicode下位サロゲート・コード単位 (トレーリング・サロゲート・コード単位ともいう)であるかどうかを判定します。

        これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。

        パラメータ:
        ch - 判定されるchar値。
        戻り値:
        char値がMIN_LOW_SURROGATE - MAX_LOW_SURROGATEの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse
        導入されたバージョン:
        1.5
        関連項目:
        isHighSurrogate(char)
      • isSurrogate

        public static boolean isSurrogate​(char ch)
        指定されたchar値がUnicode サロゲート・コード単位かどうかを判定します。

        これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。

        char値がサロゲート・コード単位になるのは、それが下位サロゲート・コード単位上位サロゲート・コード単位のいずれかである場合だけです。

        パラメータ:
        ch - 判定されるchar値。
        戻り値:
        char値がMIN_SURROGATE - MAX_SURROGATEの範囲(両端含む)に含まれる場合はtrue、それ以外の場合はfalse
        導入されたバージョン:
        1.7
      • isSurrogatePair

        public static boolean isSurrogatePair​(char high,
                                              char low)
        指定されたchar値のペアが有効なUnicodeサロゲート・ペアであるかどうかを判定します。

        このメソッドは次の式と等価です。

        
         isHighSurrogate(high) && isLowSurrogate(low)
         

        パラメータ:
        high - 判定対象の上位サロゲート・コード値
        low - 判定対象の下位サロゲート・コード値
        戻り値:
        指定された上位/下位サロゲート・コード値が有効なサロゲート・ペアを表す場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.5
      • charCount

        public static int charCount​(int codePoint)
        指定された文字(Unicodeコード・ポイント)を表すのに必要なchar値の数を判定します。 このメソッドは、指定された文字が0x10000以上である場合は2を返します。 それ以外の場合は1を返します。

        このメソッドは、指定された文字が有効なUnicodeコード・ポイントであることを検証しません。 呼出し側で、必要に応じてisValidCodePointを使用して、文字値を検証する必要があります。

        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字が有効な補助文字の場合は2、そうでない場合は1。
        導入されたバージョン:
        1.5
        関連項目:
        isSupplementaryCodePoint(int)
      • toCodePoint

        public static int toCodePoint​(char high,
                                      char low)
        指定されたサロゲート・ペアをその補助コード・ポイント値に変換します。 このメソッドは、指定されたサロゲート・ペアを検証しません。 呼出し側は必要に応じて、isSurrogatePairを使って検証する必要があります。
        パラメータ:
        high - 上位サロゲート・コード単位
        low - 下位サロゲート・コード単位
        戻り値:
        指定されたサロゲート・ペアから作成された補助コード・ポイント。
        導入されたバージョン:
        1.5
      • codePointAt

        public static int codePointAt​(CharSequence seq,
                                      int index)
        CharSequenceの指定されたインデックスにあるコード・ポイントを返します。 CharSequence内の指定されたインデックス位置のchar値が上位サロゲート範囲に含まれており、それに続くインデックスがCharSequenceの長さ未満であり、かつそのインデックス位置のchar値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar値が返されます。
        パラメータ:
        seq - char値のシーケンス(Unicodeコード単位)
        index - 変換されるseq内のchar値(Unicodeコード単位)へのインデックス
        戻り値:
        所定のインデックス位置のUnicodeコード・ポイント
        例外:
        NullPointerException - seqがnullである場合。
        IndexOutOfBoundsException - 値indexが負であるかseq.length()以上である場合。
        導入されたバージョン:
        1.5
      • codePointAt

        public static int codePointAt​(char[] a,
                                      int index)
        char配列の指定されたインデックスにあるコード・ポイントを返します。 char配列内の指定されたインデックス位置のchar値が上位サロゲート範囲に含まれており、それに続くインデックスがchar配列の長さ未満であり、かつそのインデックス位置のchar値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar値が返されます。
        パラメータ:
        a - char配列
        index - 変換されるchar配列内のchar値(Unicodeコード単位)へのインデックス
        戻り値:
        所定のインデックス位置のUnicodeコード・ポイント
        例外:
        NullPointerException - aがnullである場合。
        IndexOutOfBoundsException - indexが負の値、またはchar配列の長さ以上の値である場合。
        導入されたバージョン:
        1.5
      • codePointAt

        public static int codePointAt​(char[] a,
                                      int index,
                                      int limit)
        limitの長さ未満のindexを持つ配列要素のみを使用可能な、char配列の指定されたインデックスにあるコード・ポイントを返します。 char配列内の指定されたインデックス位置のchar値が上位サロゲート範囲に含まれており、それに続くインデックスがlimit未満であり、かつそのインデックス位置のchar値が下位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 それ以外の場合は、指定されたインデックスにあるchar値が返されます。
        パラメータ:
        a - char配列
        index - 変換されるchar配列内のchar値(Unicodeコード単位)へのインデックス
        limit - char配列で使用可能な最後の配列要素の後ろのインデックス
        戻り値:
        所定のインデックス位置のUnicodeコード・ポイント
        例外:
        NullPointerException - aがnullである場合。
        IndexOutOfBoundsException - index引数が負の値またはlimit引数以上である場合、またはlimit引数が負の値またはchar配列の長さより大きい場合。
        導入されたバージョン:
        1.5
      • codePointBefore

        public static int codePointBefore​(CharSequence seq,
                                          int index)
        CharSequenceの指定されたインデックスの前にあるコード・ポイントを返します。 CharSequence内の(index - 1)char値が下位サロゲート範囲に含まれており、(index - 2)が負でなく、かつCharSequence内の(index - 2)char値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)char値が返されます。
        パラメータ:
        seq - CharSequenceインスタンス
        index - 返すべきコード・ポイントの直後のインデックス
        戻り値:
        指定されたインデックスの前にあるUnicodeコード・ポイント値。
        例外:
        NullPointerException - seqがnullである場合。
        IndexOutOfBoundsException - index引数が1より小さいかseq.length()より大きい場合。
        導入されたバージョン:
        1.5
      • codePointBefore

        public static int codePointBefore​(char[] a,
                                          int index)
        char配列の指定されたインデックスの前にあるコード・ポイントを返します。 char配列内の(index - 1)char値が下位サロゲート範囲に含まれており、(index - 2)が負でなく、かつchar配列内の(index - 2)char値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)char値が返されます。
        パラメータ:
        a - char配列
        index - 返すべきコード・ポイントの直後のインデックス
        戻り値:
        指定されたインデックスの前にあるUnicodeコード・ポイント値。
        例外:
        NullPointerException - aがnullである場合。
        IndexOutOfBoundsException - index引数が1未満であるか、またはchar配列の長さより大きい値の場合
        導入されたバージョン:
        1.5
      • codePointBefore

        public static int codePointBefore​(char[] a,
                                          int index,
                                          int start)
        start以上のindexを持つ配列要素のみを使用可能な、char配列の指定されたインデックスの前にあるコード・ポイントを返します。 char配列内の(index - 1)char値が下位サロゲート範囲に含まれており、(index - 2)start以上であり、かつchar配列内の(index - 2)char値が上位サロゲート範囲に含まれている場合、このサロゲート・ペアに対応する補助コード・ポイントが返されます。 そうでない場合は、(index - 1)char値が返されます。
        パラメータ:
        a - char配列
        index - 返すべきコード・ポイントの直後のインデックス
        start - char配列の最初の配列要素のインデックス
        戻り値:
        指定されたインデックスの前にあるUnicodeコード・ポイント値。
        例外:
        NullPointerException - aがnullである場合。
        IndexOutOfBoundsException - index引数がstart引数以下であるかchar配列の長さより大きい場合、またはstart引数が負の値であるかchar配列の長さ以上である場合。
        導入されたバージョン:
        1.5
      • highSurrogate

        public static char highSurrogate​(int codePoint)
        UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのリーディング・サロゲート(上位サロゲート・コード単位)を返します。 指定された文字が補助文字でない場合は、未指定のcharが返されます。

        isSupplementaryCodePoint(x)trueの場合、isHighSurrogate(highSurrogate(x))およびtoCodePoint(highSurrogate(x), lowSurrogate(x))== xも常にtrueになります。

        パラメータ:
        codePoint - 補助文字(Unicodeコード・ポイント)
        戻り値:
        この文字をUTF-16エンコーディングで表すために使用されるリーディング・サロゲート・コード単位
        導入されたバージョン:
        1.7
      • lowSurrogate

        public static char lowSurrogate​(int codePoint)
        UTF-16エンコーディングの指定された補助文字(Unicodeコード・ポイント)を表すサロゲート・ペアのトレーリング・サロゲート(下位サロゲート・コード単位)を返します。 指定された文字が補助文字でない場合は、未指定のcharが返されます。

        isSupplementaryCodePoint(x)trueの場合、isLowSurrogate(lowSurrogate(x))およびtoCodePoint(highSurrogate(x), lowSurrogate(x))== xも常にtrueになります。

        パラメータ:
        codePoint - 補助文字(Unicodeコード・ポイント)
        戻り値:
        この文字をUTF-16エンコーディングで表すために使用されるトレーリング・サロゲート・コード単位
        導入されたバージョン:
        1.7
      • toChars

        public static int toChars​(int codePoint,
                                  char[] dst,
                                  int dstIndex)
        指定された文字(Unicodeコード・ポイント)をUTF-16表現に変換します。 指定されたコード・ポイントがBMP (基本多言語面または第0面)値の場合は、同じ値がdst[dstIndex]に格納され、1が返されます。 指定されたコード・ポイントが補助文字の場合は、サロゲート値がdst[dstIndex] (上位サロゲート)とdst[dstIndex+1] (下位サロゲート)に格納され、2が返されます。
        パラメータ:
        codePoint - 変換対象の文字(Unicodeコード・ポイント)。
        dst - codePointのUTF-16値が格納されるcharの配列。
        dstIndex - 変換された値が格納されるdst配列の開始インデックス。
        戻り値:
        コード・ポイントがBMPコード・ポイントの場合は1、コード・ポイントが補助コード・ポイントの場合は2。
        例外:
        IllegalArgumentException - 指定されたcodePointが有効なUnicodeコード・ポイントでない場合。
        NullPointerException - 指定されたdstがnullの場合。
        IndexOutOfBoundsException - dstIndexが負の値であるかdst.length以上である場合、またはdstIndex位置のdstが結果として得られるchar値を格納する十分な配列要素を持たない場合。 (dstIndexdst.length-1と等価で、指定されたcodePointが補助文字の場合、上位サロゲート値はdst[dstIndex]に格納されない。)
        導入されたバージョン:
        1.5
      • toChars

        public static char[] toChars​(int codePoint)
        指定された文字(Unicodeコード・ポイント)をchar配列に格納されるUTF-16表現に変換します。 指定されたコード・ポイントがBMP (基本多言語面または第0面)値の場合、結果として得られるchar配列はcodePointと同じ値を持ちます。 指定されたコード・ポイントが補助コード・ポイントの場合は、結果として得られるchar配列は対応するサロゲート・ペアを持ちます。
        パラメータ:
        codePoint - Unicodeコード・ポイント
        戻り値:
        codePointのUTF-16表現を持つchar配列。
        例外:
        IllegalArgumentException - 指定されたcodePointが有効なUnicodeコード・ポイントでない場合。
        導入されたバージョン:
        1.5
      • codePointCount

        public static int codePointCount​(CharSequence seq,
                                         int beginIndex,
                                         int endIndex)
        指定されたcharシーケンスのテキスト範囲内のUnicodeコード・ポイントの数を返します。 テキスト範囲は、指定されたbeginIndexからインデックスendIndex - 1の位置のcharまでです。 したがって、テキスト範囲の長さ(char数)は、endIndex-beginIndexになります。 テキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。
        パラメータ:
        seq - 文字シーケンス
        beginIndex - テキスト範囲内の最初のcharへのインデックス
        endIndex - テキスト範囲内の最後のcharの直後のインデックス
        戻り値:
        指定されたテキスト範囲内のUnicodeコード・ポイントの数
        例外:
        NullPointerException - seqがnullである場合。
        IndexOutOfBoundsException - beginIndexが負であるか、endIndexが指定されたシーケンスの長さより大きいか、あるいはbeginIndexendIndexより大きい場合。
        導入されたバージョン:
        1.5
      • codePointCount

        public static int codePointCount​(char[] a,
                                         int offset,
                                         int count)
        char配列引数の部分配列内にあるUnicodeコード・ポイントの数を返します。 offset引数は、部分配列の最初のcharのインデックスであり、count引数はchar間の部分配列の長さを指定します。 部分配列内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。
        パラメータ:
        a - char配列
        offset - 指定されたchar配列の最初のcharのインデックス
        count - 部分配列の長さ(char数)
        戻り値:
        指定された部分配列内のUnicodeコード・ポイントの数
        例外:
        NullPointerException - aがnullである場合。
        IndexOutOfBoundsException - offsetまたはcountが負の場合、またはoffset+countが指定された配列の長さより大きい場合。
        導入されたバージョン:
        1.5
      • offsetByCodePoints

        public static int offsetByCodePoints​(CharSequence seq,
                                             int index,
                                             int codePointOffset)
        指定された文字シーケンス内で、指定されたindexからcodePointOffsetコード・ポイント分だけオフセットされた位置のインデックスを返します。 indexcodePointOffsetで指定されるテキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。
        パラメータ:
        seq - 文字シーケンス
        index - オフセットされるインデックス
        codePointOffset - オフセット(コード・ポイント数)
        戻り値:
        charシーケンス内のインデックス
        例外:
        NullPointerException - seqがnullである場合。
        IndexOutOfBoundsException - indexが負の値または文字シーケンスの長さよりも大きい場合、codePointOffsetが正の値でありindexで始まるサブシーケンスの持つコード・ポイント数がcodePointOffsetコード・ポイント数よりも少ない場合、あるいはcodePointOffsetが負の値でindexの前のサブシーケンスの持つ値がcodePointOffsetコード・ポイントの絶対値よりも小さい場合。
        導入されたバージョン:
        1.5
      • offsetByCodePoints

        public static int offsetByCodePoints​(char[] a,
                                             int start,
                                             int count,
                                             int index,
                                             int codePointOffset)
        指定されたchar部分配列内で、指定されたindexからcodePointOffsetコード・ポイント分だけオフセットされた位置のインデックスを返します。 startおよびcount引数は、char配列の部分配列を指定します。 indexcodePointOffsetで指定されるテキスト範囲内でペアになっていないサロゲートは、それぞれ1つのコード・ポイントとして数えられます。
        パラメータ:
        a - char配列
        start - 部分配列内の最初のcharのインデックス
        count - 部分配列の長さ(char数)
        index - オフセットされるインデックス
        codePointOffset - オフセット(コード・ポイント数)
        戻り値:
        部分配列内のインデックス
        例外:
        NullPointerException - aがnullである場合。
        IndexOutOfBoundsException - startまたはcountが負の場合、またはstart+countが指定された配列の長さより大きい場合、またはindexstartより小さいかstart+countより大きい場合、またはcodePointOffsetが正で、indexから始まりstart+count - 1で終わるテキスト範囲内のコード・ポイント数がcodePointOffsetコード・ポイント数より少ない場合、またはcodePointOffsetが負で、startから始まりindex - 1で終わるテキスト範囲内のコード・ポイント数がcodePointOffsetコード・ポイントの絶対値より少ない場合。
        導入されたバージョン:
        1.5
      • isLowerCase

        public static boolean isLowerCase​(char ch)
        指定された文字が小文字かどうかを判定します。

        ある文字が小文字になるのは、Character.getType(ch)によって提供される汎用カテゴリ型がLOWERCASE_LETTERである場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Lowercaseを持つ場合です。

        小文字の例を次に示します。

         a b c d e f g h i j k l m n o p q r s t u v w x y z
         '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6'
         '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE'
         '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6'
         '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
         

        Unicode文字には、ほかにも多数の小文字が存在します。

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isLowerCase(int)メソッドを使用してください。

        パラメータ:
        ch - 判定対象の文字。
        戻り値:
        文字が小文字の場合はtrue、そうでない場合はfalse
        関連項目:
        isLowerCase(char), isTitleCase(char), toLowerCase(char), getType(char)
      • isLowerCase

        public static boolean isLowerCase​(int codePoint)
        指定された文字(Unicodeコード・ポイント)が小文字かどうかを判定します。

        ある文字が小文字になるのは、getType(codePoint)によって提供される汎用カテゴリ型がLOWERCASE_LETTERである場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Lowercaseを持つ場合です。

        小文字の例を次に示します。

         a b c d e f g h i j k l m n o p q r s t u v w x y z
         '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6'
         '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE'
         '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6'
         '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
         

        Unicode文字には、ほかにも多数の小文字が存在します。

        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字が小文字の場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.5
        関連項目:
        isLowerCase(int), isTitleCase(int), toLowerCase(int), getType(int)
      • isUpperCase

        public static boolean isUpperCase​(char ch)
        指定された文字が大文字がどうかを判定します。

        ある文字が大文字になるのは、Character.getType(ch)によって提供される汎用カテゴリ型がUPPERCASE_LETTERである場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Uppercaseを持つ場合です。

        大文字の例を次に示します。

         A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
         '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7'
         '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF'
         '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8'
         '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
         

        Unicode文字には、ほかにも多数の大文字が存在します。

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isUpperCase(int)メソッドを使用してください。

        パラメータ:
        ch - 判定対象の文字。
        戻り値:
        文字が大文字の場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.0
        関連項目:
        isLowerCase(char), isTitleCase(char), toUpperCase(char), getType(char)
      • isUpperCase

        public static boolean isUpperCase​(int codePoint)
        指定された文字(Unicodeコード・ポイント)が大文字かどうかを判定します。

        ある文字が大文字になるのは、getType(codePoint)によって提供される汎用カテゴリ型がUPPERCASE_LETTERである場合と、その文字が、Unicode標準で規定された寄与プロパティOther_Uppercaseを持つ場合です。

        大文字の例を次に示します。

         A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
         '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7'
         '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF'
         '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8'
         '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
         

        Unicode文字には、ほかにも多数の大文字が存在します。

        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字が大文字の場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.5
        関連項目:
        isLowerCase(int), isTitleCase(int), toUpperCase(int), getType(int)
      • isTitleCase

        public static boolean isTitleCase​(char ch)
        指定された文字がタイトル・ケース文字かどうかを判定します。

        Character.getType(ch)により示される汎用カテゴリ型がTITLECASE_LETTERの場合、文字はタイトル・ケース文字になります。

        文字の中には、ラテン文字のペアのように見えるものがあります。 たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。 「Lj」のように見える3つ目の形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。

        次に示すのは、このメソッドがtrueを返すUnicode文字の一部です。

        • LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
        • LATIN CAPITAL LETTER L WITH SMALL LETTER J
        • LATIN CAPITAL LETTER N WITH SMALL LETTER J
        • LATIN CAPITAL LETTER D WITH SMALL LETTER Z

        Unicode文字には、ほかにも多数のタイトル・ケース文字が存在します。

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isTitleCase(int)メソッドを使用してください。

        パラメータ:
        ch - 判定対象の文字。
        戻り値:
        文字がタイトル・ケースの場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.0.2
        関連項目:
        isLowerCase(char), isUpperCase(char), toTitleCase(char), getType(char)
      • isTitleCase

        public static boolean isTitleCase​(int codePoint)
        指定された文字(Unicodeコード・ポイント)がタイトル・ケース文字かどうかを判定します。

        getType(codePoint)により示される汎用カテゴリ型がTITLECASE_LETTERの場合、文字はタイトル・ケース文字になります。

        文字の中には、ラテン文字のペアのように見えるものがあります。 たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。 「Lj」のように見える3つ目の形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。

        次に示すのは、このメソッドがtrueを返すUnicode文字の一部です。

        • LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
        • LATIN CAPITAL LETTER L WITH SMALL LETTER J
        • LATIN CAPITAL LETTER N WITH SMALL LETTER J
        • LATIN CAPITAL LETTER D WITH SMALL LETTER Z

        Unicode文字には、ほかにも多数のタイトル・ケース文字が存在します。

        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字がタイトル・ケースの場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.5
        関連項目:
        isLowerCase(int), isUpperCase(int), toTitleCase(int), getType(int)
      • isDigit

        public static boolean isDigit​(char ch)
        指定された文字が数字かどうかを判定します。

        Character.getType(ch)により示される汎用カテゴリ型がDECIMAL_DIGIT_NUMBERの場合、文字は数字になります。

        Unicode文字範囲の中には、次の数字を含むものがあります。

        • '\u0030' - '\u0039'、ISO-LATIN-1数字('0' - '9')
        • '\u0660' - '\u0669'、アラビア数字
        • '\u06F0' - '\u06F9'、拡張アラビア数字
        • '\u0966' - '\u096F'、デヴァーナーガリ数字
        • '\uFF10' - '\uFF19'、全角数字
        そのほかにも多数の文字範囲に、数字が含まれます。

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isDigit(int)メソッドを使用してください。

        パラメータ:
        ch - 判定対象の文字。
        戻り値:
        文字が数字の場合はtrue、そうでない場合はfalse
        関連項目:
        digit(char, int), forDigit(int, int), getType(char)
      • isDigit

        public static boolean isDigit​(int codePoint)
        指定された文字(Unicodeコード・ポイント)が数字かどうかを判定します。

        getType(codePoint)により示される汎用カテゴリ型がDECIMAL_DIGIT_NUMBERの場合、文字は数字になります。

        Unicode文字範囲の中には、次の数字を含むものがあります。

        • '\u0030' - '\u0039'、ISO-LATIN-1数字('0' - '9')
        • '\u0660' - '\u0669'、アラビア数字
        • '\u06F0' - '\u06F9'、拡張アラビア数字
        • '\u0966' - '\u096F'、デヴァーナーガリ数字
        • '\uFF10' - '\uFF19'、全角数字
        そのほかにも多数の文字範囲に、数字が含まれます。

        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字が数字の場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.5
        関連項目:
        forDigit(int, int), getType(int)
      • isDefined

        public static boolean isDefined​(char ch)
        文字がUnicodeで定義されているかどうかを判定します。

        少なくとも次のいずれかに当てはまる場合、文字は定義されています。

        • UnicodeDataファイル内にエントリがある
        • UnicodeDataファイルで定義された範囲に値を持つ

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isDefined(int)メソッドを使用してください。

        パラメータ:
        ch - 判定対象の文字
        戻り値:
        文字がUnicodeに定義されている場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.0.2
        関連項目:
        isDigit(char), isLetter(char), isLetterOrDigit(char), isLowerCase(char), isTitleCase(char), isUpperCase(char)
      • isDefined

        public static boolean isDefined​(int codePoint)
        文字(Unicodeコード・ポイント)がUnicodeで定義されているかどうかを判定します。

        少なくとも次のいずれかに当てはまる場合、文字は定義されています。

        • UnicodeDataファイル内にエントリがある
        • UnicodeDataファイルで定義された範囲に値を持つ

        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字がUnicodeに定義されている場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.5
        関連項目:
        isDigit(int), isLetter(int), isLetterOrDigit(int), isLowerCase(int), isTitleCase(int), isUpperCase(int)
      • isLetter

        public static boolean isLetter​(char ch)
        指定された文字が汎用文字かどうかを判定します。

        Character.getType(ch)の示す汎用カテゴリ型が次のどれかの場合に、文字は汎用文字と見なされます。

        • UPPERCASE_LETTER
        • LOWERCASE_LETTER
        • TITLECASE_LETTER
        • MODIFIER_LETTER
        • OTHER_LETTER
        すべての汎用文字に大文字と小文字があるわけではありません。 多くの文字は汎用文字ですが、大文字でも小文字でもタイトル・ケースでもありません。

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isLetter(int)メソッドを使用してください。

        パラメータ:
        ch - 判定対象の文字。
        戻り値:
        文字が汎用文字の場合はtrue、そうでない場合はfalse
        関連項目:
        isDigit(char), isJavaIdentifierStart(char), isJavaLetter(char), isJavaLetterOrDigit(char), isLetterOrDigit(char), isLowerCase(char), isTitleCase(char), isUnicodeIdentifierStart(char), isUpperCase(char)
      • isLetter

        public static boolean isLetter​(int codePoint)
        指定された文字(Unicodeコード・ポイント)が汎用文字かどうかを判定します。

        getType(codePoint)の示す汎用カテゴリ型が次のどれかの場合に、文字は汎用文字と見なされます。

        • UPPERCASE_LETTER
        • LOWERCASE_LETTER
        • TITLECASE_LETTER
        • MODIFIER_LETTER
        • OTHER_LETTER
        すべての汎用文字に大文字と小文字があるわけではありません。 多くの文字は汎用文字ですが、大文字でも小文字でもタイトル・ケースでもありません。

        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字が汎用文字の場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.5
        関連項目:
        isDigit(int), isJavaIdentifierStart(int), isLetterOrDigit(int), isLowerCase(int), isTitleCase(int), isUnicodeIdentifierStart(int), isUpperCase(int)
      • isLetterOrDigit

        public static boolean isLetterOrDigit​(char ch)
        指定された文字が汎用文字または数字かどうかを判定します。

        ある文字が文字または数字とみなされるのは、その文字のCharacter.isLetter(char ch)またはCharacter.isDigit(char ch)からtrueが返される場合です。

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isLetterOrDigit(int)メソッドを使用してください。

        パラメータ:
        ch - 判定対象の文字。
        戻り値:
        文字が汎用文字または数字の場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.0.2
        関連項目:
        isDigit(char), isJavaIdentifierPart(char), isJavaLetter(char), isJavaLetterOrDigit(char), isLetter(char), isUnicodeIdentifierPart(char)
      • isLetterOrDigit

        public static boolean isLetterOrDigit​(int codePoint)
        指定された文字(Unicodeコード・ポイント)が汎用文字または数字かどうかを判定します。

        ある文字が文字または数字とみなされるのは、その文字のisLetter(codePoint)またはisDigit(codePoint)からtrueが返される場合です。

        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字が汎用文字または数字の場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.5
        関連項目:
        isDigit(int), isJavaIdentifierPart(int), isLetter(int), isUnicodeIdentifierPart(int)
      • isJavaLetterOrDigit

        @Deprecated(since="1.1")
        public static boolean isJavaLetterOrDigit​(char ch)
        非推奨。
        isJavaIdentifierPart(char)に置き換えられました。
        指定された文字をJava識別子の最初の文字以外に使用可能かどうかを判定します。

        次のどれかに当てはまる場合にだけ、その文字をJava識別子の一部に指定できます。

        • 汎用文字である
        • それが通貨記号である('$'など)
        • それが連結句読点文字である('_'など)
        • 数字である
        • 数値汎用文字である(ローマ数字文字など)
        • 連結マークである
        • 非スペーシング・マークである
        • 文字のisIdentifierIgnorabletrueを返す。

        パラメータ:
        ch - 判定対象の文字。
        戻り値:
        文字をJava識別子の一部に使用可能な場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.0.2
        関連項目:
        isJavaLetter(char), isJavaIdentifierStart(char), isJavaIdentifierPart(char), isLetter(char), isLetterOrDigit(char), isUnicodeIdentifierPart(char), isIdentifierIgnorable(char)
      • isAlphabetic

        public static boolean isAlphabetic​(int codePoint)
        指定された文字(Unicodeコード・ポイント)がアルファベットかどうかを判定します。

        getType(codePoint)の示す汎用カテゴリ型が次のどれかの場合に、文字はアルファベットと見なされます。

        • UPPERCASE_LETTER
        • LOWERCASE_LETTER
        • TITLECASE_LETTER
        • MODIFIER_LETTER
        • OTHER_LETTER
        • LETTER_NUMBER
        あるいは、それがUnicode標準で規定された寄与プロパティOther_Alphabeticを持つ。

        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字がUnicodeアルファベット文字の場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.7
      • isIdeographic

        public static boolean isIdeographic​(int codePoint)
        指定された文字(Unicodeコード・ポイント)が、Unicode標準で規定されたCJKV (中国語、日本語、韓国語、およびベトナム語)の表意文字かどうかを判定します。
        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字がUnicode表意文字の場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.7
      • isJavaIdentifierStart

        public static boolean isJavaIdentifierStart​(char ch)
        指定された文字をJava識別子の最初の文字として指定可能かどうかを判定します。

        次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。

        • isLetter(ch)trueを返す
        • getType(ch)LETTER_NUMBERを返す
        • chが通貨記号である('$'など)
        • chが連結句読点文字である('_'など)

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isJavaIdentifierStart(int)メソッドを使用してください。

        パラメータ:
        ch - 判定対象の文字。
        戻り値:
        文字をJava識別子の先頭で使用可能な場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.1
        関連項目:
        isJavaIdentifierPart(char), isLetter(char), isUnicodeIdentifierStart(char), SourceVersion.isIdentifier(CharSequence)
      • isJavaIdentifierStart

        public static boolean isJavaIdentifierStart​(int codePoint)
        文字(Unicodeコード・ポイント)をJava識別子の最初の文字として指定可能かどうかを判定します。

        次の条件のどれかに当てはまる場合にだけ、その文字をJava識別子の最初に指定できます。

        • isLetter(codePoint)が次を返す: true
        • getType(codePoint)が次を返す: LETTER_NUMBER
        • 参照される文字が通貨記号である('$'など)
        • 参照文字が連結句読点文字である('_'など)

        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字をJava識別子の先頭で使用可能な場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.5
        関連項目:
        isJavaIdentifierPart(int), isLetter(int), isUnicodeIdentifierStart(int), SourceVersion.isIdentifier(CharSequence)
      • isJavaIdentifierPart

        public static boolean isJavaIdentifierPart​(char ch)
        指定された文字をJava識別子の最初の文字以外に使用可能かどうかを判定します。

        次のどれかに当てはまる場合にだけ、その文字をJava識別子の一部に指定できます。

        • 汎用文字である
        • それが通貨記号である('$'など)
        • それが連結句読点文字である('_'など)
        • 数字である
        • 数値汎用文字である(ローマ数字文字など)
        • 連結マークである
        • 非スペーシング・マークである
        • 文字のisIdentifierIgnorabletrueを返す

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isJavaIdentifierPart(int)メソッドを使用してください。

        パラメータ:
        ch - 判定対象の文字。
        戻り値:
        文字をJava識別子の一部に使用可能な場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.1
        関連項目:
        isIdentifierIgnorable(char), isJavaIdentifierStart(char), isLetterOrDigit(char), isUnicodeIdentifierPart(char), SourceVersion.isIdentifier(CharSequence)
      • isJavaIdentifierPart

        public static boolean isJavaIdentifierPart​(int codePoint)
        文字(Unicodeコード・ポイント)をJava識別子の最初の文字以外に使用可能かどうかを判定します。

        次のどれかに当てはまる場合にだけ、その文字をJava識別子の一部に指定できます。

        • 汎用文字である
        • それが通貨記号である('$'など)
        • それが連結句読点文字である('_'など)
        • 数字である
        • 数値汎用文字である(ローマ数字文字など)
        • 連結マークである
        • 非スペーシング・マークである
        • 文字のisIdentifierIgnorable(codePoint)trueを返す

        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字をJava識別子の一部に使用可能な場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.5
        関連項目:
        isIdentifierIgnorable(int), isJavaIdentifierStart(int), isLetterOrDigit(int), isUnicodeIdentifierPart(int), SourceVersion.isIdentifier(CharSequence)
      • isUnicodeIdentifierStart

        public static boolean isUnicodeIdentifierStart​(char ch)
        指定された文字をUnicode識別子の最初の文字として指定可能かどうかを判定します。

        次の条件のどれかに当てはまる場合にだけ、その文字をUnicode識別子の最初に指定できます。

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isUnicodeIdentifierStart(int)メソッドを使用してください。

        パラメータ:
        ch - 判定対象の文字。
        戻り値:
        文字をUnicode識別子の先頭で使用可能な場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.1
        関連項目:
        isJavaIdentifierStart(char), isLetter(char), isUnicodeIdentifierPart(char)
      • isUnicodeIdentifierStart

        public static boolean isUnicodeIdentifierStart​(int codePoint)
        指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字として指定可能かどうかを判定します。

        次の条件のどれかに当てはまる場合にだけ、その文字をUnicode識別子の最初に指定できます。

        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字をUnicode識別子の先頭で使用可能な場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.5
        関連項目:
        isJavaIdentifierStart(int), isLetter(int), isUnicodeIdentifierPart(int)
      • isUnicodeIdentifierPart

        public static boolean isUnicodeIdentifierPart​(char ch)
        指定された文字をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。

        次の文のどれかに当てはまる場合にだけ、その文字をUnicode識別子の一部に使用できます。

        • 汎用文字である
        • それが連結句読点文字である('_'など)
        • 数字である
        • 数値汎用文字である(ローマ数字文字など)
        • 連結マークである
        • 非スペーシング・マークである
        • この文字のisIdentifierIgnorabletrueを返す。

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isUnicodeIdentifierPart(int)メソッドを使用してください。

        パラメータ:
        ch - 判定対象の文字。
        戻り値:
        文字をUnicode識別子の一部に使用可能な場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.1
        関連項目:
        isIdentifierIgnorable(char), isJavaIdentifierPart(char), isLetterOrDigit(char), isUnicodeIdentifierStart(char)
      • isUnicodeIdentifierPart

        public static boolean isUnicodeIdentifierPart​(int codePoint)
        指定された文字(Unicodeコード・ポイント)をUnicode識別子の最初の文字以外に使用可能かどうかを判定します。

        次の文のどれかに当てはまる場合にだけ、その文字をUnicode識別子の一部に使用できます。

        • 汎用文字である
        • それが連結句読点文字である('_'など)
        • 数字である
        • 数値汎用文字である(ローマ数字文字など)
        • 連結マークである
        • 非スペーシング・マークである
        • この文字のisIdentifierIgnorabletrueを返す。

        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字をUnicode識別子の一部に使用可能な場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.5
        関連項目:
        isIdentifierIgnorable(int), isJavaIdentifierPart(int), isLetterOrDigit(int), isUnicodeIdentifierStart(int)
      • isIdentifierIgnorable

        public static boolean isIdentifierIgnorable​(char ch)
        指定された文字が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。

        次のUnicode文字は、Java識別子やUnicode識別子内で無視できます。

        • 空白以外のISO制御文字
          • '\u0000' - '\u0008'
          • '\u000E' - '\u001B'
          • '\u007F' - '\u009F'
        • 汎用カテゴリ値FORMATを保持するすべての文字

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isIdentifierIgnorable(int)メソッドを使用してください。

        パラメータ:
        ch - 判定対象の文字。
        戻り値:
        JavaまたはUnicode識別子の一部に使用可能な、無視できる制御文字の場合はtrue、それ以外の場合はfalse
        導入されたバージョン:
        1.1
        関連項目:
        isJavaIdentifierPart(char), isUnicodeIdentifierPart(char)
      • isIdentifierIgnorable

        public static boolean isIdentifierIgnorable​(int codePoint)
        指定された文字(Unicodeコード・ポイント)が、Java識別子またはUnicode識別子内で無視可能な文字かどうかを判定します。

        次のUnicode文字は、Java識別子やUnicode識別子内で無視できます。

        • 空白以外のISO制御文字
          • '\u0000' - '\u0008'
          • '\u000E' - '\u001B'
          • '\u007F' - '\u009F'
        • 汎用カテゴリ値FORMATを保持するすべての文字

        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        JavaまたはUnicode識別子の一部に使用可能な、無視できる制御文字の場合はtrue、それ以外の場合はfalse
        導入されたバージョン:
        1.5
        関連項目:
        isJavaIdentifierPart(int), isUnicodeIdentifierPart(int)
      • toLowerCase

        public static char toLowerCase​(char ch)
        UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を小文字に変換します。

        Character.isLowerCase(Character.toLowerCase(ch))は、ある範囲の文字(特に表意文字や記号)に対して常にtrueを返すわけではありません。

        一般に、文字を小文字にマッピングする際にはString.toLowerCase()を使用するようにしてください。 Stringのケース・マッピング・メソッドにはCharacterのケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、Stringのケース・マッピング・メソッドでは実行できますが、Characterのケース・マッピング・メソッドでは実行できません。

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、toLowerCase(int)メソッドを使用してください。

        パラメータ:
        ch - 変換対象の文字。
        戻り値:
        対応する小文字(存在する場合)。小文字がない場合は、指定された文字そのもの。
        関連項目:
        isLowerCase(char), String.toLowerCase()
      • toLowerCase

        public static int toLowerCase​(int codePoint)
        UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を小文字に変換します。

        Character.isLowerCase(Character.toLowerCase(codePoint))は、ある範囲の文字(特に表意文字や記号)に対して常にtrueを返すわけではありません。

        一般に、文字を小文字にマッピングする際にはString.toLowerCase()を使用するようにしてください。 Stringのケース・マッピング・メソッドにはCharacterのケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、Stringのケース・マッピング・メソッドでは実行できますが、Characterのケース・マッピング・メソッドでは実行できません。

        パラメータ:
        codePoint - 変換対象の文字(Unicodeコード・ポイント)。
        戻り値:
        指定された文字(Unicodeコード・ポイント)の対応する小文字。対応する小文字がない場合は、指定された文字そのもの。
        導入されたバージョン:
        1.5
        関連項目:
        isLowerCase(int), String.toLowerCase()
      • toUpperCase

        public static char toUpperCase​(char ch)
        UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数を大文字に変換します。

        Character.isUpperCase(Character.toUpperCase(ch))は、ある範囲の文字(特に表意文字や記号)に対して常にtrueを返すわけではありません。

        一般に、文字を大文字にマッピングする際にはString.toUpperCase()を使用するようにしてください。 Stringのケース・マッピング・メソッドにはCharacterのケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、Stringのケース・マッピング・メソッドでは実行できますが、Characterのケース・マッピング・メソッドでは実行できません。

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、toUpperCase(int)メソッドを使用してください。

        パラメータ:
        ch - 変換対象の文字。
        戻り値:
        対応する大文字(存在する場合)。大文字がない場合は、指定された文字そのもの。
        関連項目:
        isUpperCase(char), String.toUpperCase()
      • toUpperCase

        public static int toUpperCase​(int codePoint)
        UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数を大文字に変換します。

        Character.isUpperCase(Character.toUpperCase(codePoint))は、ある範囲の文字(特に表意文字や記号)に対して常にtrueを返すわけではありません。

        一般に、文字を大文字にマッピングする際にはString.toUpperCase()を使用するようにしてください。 Stringのケース・マッピング・メソッドにはCharacterのケース・マッピング・メソッドと比べて、いくつかの利点があります。 ロケール依存マッピング、コンテキスト依存マッピング、および1:M文字マッピングは、Stringのケース・マッピング・メソッドでは実行できますが、Characterのケース・マッピング・メソッドでは実行できません。

        パラメータ:
        codePoint - 変換対象の文字(Unicodeコード・ポイント)。
        戻り値:
        対応する大文字(存在する場合)。大文字がない場合は、指定された文字そのもの。
        導入されたバージョン:
        1.5
        関連項目:
        isUpperCase(int), String.toUpperCase()
      • toTitleCase

        public static char toTitleCase​(char ch)
        UnicodeDataファイル内のケース・マッピング情報を使用して、文字引数をタイトル・ケースに変換します。 文字が、明示的なタイトル・ケース・マッピングを保持せず、かつUnicodeDataに準拠したタイトル・ケースcharではない場合、等価なタイトル・ケースとして大文字へのマッピングが返されます。 char引数がタイトル・ケースcharである場合には、同じchar値が返されます。

        Character.isTitleCase(Character.toTitleCase(ch))は、ある範囲の文字に対して常にtrueを返すわけではありません。

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、toTitleCase(int)メソッドを使用してください。

        パラメータ:
        ch - 変換対象の文字。
        戻り値:
        対応するタイトル・ケース(存在する場合)。タイトル・ケースがない場合は、指定された文字そのもの。
        導入されたバージョン:
        1.0.2
        関連項目:
        isTitleCase(char), toLowerCase(char), toUpperCase(char)
      • toTitleCase

        public static int toTitleCase​(int codePoint)
        UnicodeDataファイル内のケース・マッピング情報を使用して、文字(Unicodeコード・ポイント)引数をタイトル・ケースに変換します。 文字が、明示的なタイトル・ケース・マッピングを保持せず、かつUnicodeDataに準拠したタイトル・ケースcharではない場合、等価なタイトル・ケースとして大文字へのマッピングが返されます。 文字の引数がタイトル・ケース文字である場合には、同じ文字値が返されます。

        Character.isTitleCase(Character.toTitleCase(codePoint))は、ある範囲の文字に対して常にtrueを返すわけではありません。

        パラメータ:
        codePoint - 変換対象の文字(Unicodeコード・ポイント)。
        戻り値:
        対応するタイトル・ケース(存在する場合)。タイトル・ケースがない場合は、指定された文字そのもの。
        導入されたバージョン:
        1.5
        関連項目:
        isTitleCase(int), toLowerCase(int), toUpperCase(int)
      • digit

        public static int digit​(char ch,
                                int radix)
        指定された基数での、文字chの数値としての値を返します。

        基数がMIN_RADIXradixMAX_RADIXの範囲外の場合、またはchの値が指定された基数の有効数字でない場合は、-1が返されます。 次のどれかに当てはまる場合、文字は有効数字です。

        • 文字についてメソッドisDigittrueを返し、その文字のUnicode 10進数値(または単一文字の分解)が指定された基数よりも小さい。 この場合、10進値が返される。
        • 文字が'A' - 'Z'のラテン大文字のどれかで、そのコードがradix+'A' - 10よりも小さい。 この場合、ch - 'A'+10が返される。
        • 文字が'a' - 'z'のラテン小文字のどれかで、そのコードがradix+'a' - 10よりも小さい。 この場合、ch - 'a'+10が返される。
        • 文字がA ('\uFF21') - Z ('\uFF3A')の全角ラテン大文字のどれかで、そのコードがradix+'\uFF21' - 10よりも小さい。 この場合、ch - '\uFF21'+10が返される。
        • 文字がa ('\uFF41') - z ('\uFF5A')の全角ラテン小文字のどれかで、そのコードがradix+'\uFF41' - 10よりも小さい。 この場合、ch - '\uFF41'+10が返される。

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、digit(int, int)メソッドを使用してください。

        パラメータ:
        ch - 変換対象の文字。
        radix - 基数。
        戻り値:
        指定された基数での、文字によって表される数値
        関連項目:
        forDigit(int, int), isDigit(char)
      • digit

        public static int digit​(int codePoint,
                                int radix)
        指定された基数での、指定された文字(Unicodeコード・ポイント)の数値を返します。

        基数がMIN_RADIXradixMAX_RADIXの範囲外の場合、または文字が指定された基数の有効数字でない場合は、-1が返されます。 次のどれかに当てはまる場合、文字は有効数字です。

        • 文字についてメソッドisDigit(codePoint)trueを返し、その文字のUnicode 10進数値(または単一文字の分解)が指定された基数よりも小さい。 この場合、10進値が返される。
        • 文字が'A' - 'Z'のラテン大文字のどれかで、そのコードがradix+'A' - 10よりも小さい。 この場合、codePoint - 'A'+10が返される。
        • 文字が'a' - 'z'のラテン小文字のどれかで、そのコードがradix+'a' - 10よりも小さい。 この場合、codePoint - 'a'+10が返される。
        • 文字がA ('\uFF21') - Z ('\uFF3A')の全角ラテン大文字のどれかで、そのコードがradix+'\uFF21' - 10よりも小さい。 この場合、codePoint - '\uFF21'+10が返される。
        • 文字がa ('\uFF41') - z ('\uFF5A')の全角ラテン小文字のどれかで、そのコードがradix+'\uFF41'- 10よりも小さい。 この場合、codePoint - '\uFF41'+10が返される。

        パラメータ:
        codePoint - 変換対象の文字(Unicodeコード・ポイント)。
        radix - 基数。
        戻り値:
        指定された基数での、文字によって表される数値
        導入されたバージョン:
        1.5
        関連項目:
        forDigit(int, int), isDigit(int)
      • getNumericValue

        public static int getNumericValue​(char ch)
        指定されたUnicode文字が表すint値を返します。 たとえば、文字'\u216C' (ローマ数字の50)は、値50のintを返します。

        文字A - Zの大文字('\u0041' - '\u005A')、小文字('\u0061' - '\u007A')、全角バリアント('\uFF21' - '\uFF3A'および'\uFF41' - '\uFF5A')の各形式は、10 - 35の数値を持ちます。 これはUnicode仕様とは無関係であり、Unicode仕様ではこれらのchar値に数値は割り当てられません。

        文字が数値を持たない場合は、-1が返されます。 文字の数値を負でない整数として表現できない場合(小数値など)は、-2が返されます。

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、getNumericValue(int)メソッドを使用してください。

        パラメータ:
        ch - 変換対象の文字。
        戻り値:
        文字の数値を負でないint値として返します。文字に数値が含まれていても値が非負のint値として表現できない場合は -2です。文字が数値を持たない場合は -1。
        導入されたバージョン:
        1.1
        関連項目:
        forDigit(int, int), isDigit(char)
      • getNumericValue

        public static int getNumericValue​(int codePoint)
        指定された文字(Unicodeコード・ポイント)が表すint値を返します。 たとえば、文字'\u216C' (ローマ数字の50)は、値50のintを返します。

        文字A - Zの大文字('\u0041' - '\u005A')、小文字('\u0061' - '\u007A')、全角バリアント('\uFF21' - '\uFF3A'および'\uFF41' - '\uFF5A')の各形式は、10 - 35の数値を持ちます。 これはUnicode仕様とは無関係であり、Unicode仕様ではこれらのchar値に数値は割り当てられません。

        文字が数値を持たない場合は、-1が返されます。 文字の数値を負でない整数として表現できない場合(小数値など)は、-2が返されます。

        パラメータ:
        codePoint - 変換対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字の数値を負でないint値として返します。文字に数値が含まれていても値が非負のint値として表現できない場合は -2です。文字が数値を持たない場合は -1。
        導入されたバージョン:
        1.5
        関連項目:
        forDigit(int, int), isDigit(int)
      • isSpace

        @Deprecated(since="1.1")
        public static boolean isSpace​(char ch)
        非推奨。
        isWhitespace(char)に置き換えられました。
        指定された文字がISO-LATIN-1の空白かどうかを判定します。 次の5つの文字についてだけ、このメソッドはtrueを返します。
        truechars
        文字 コード
        '\t' U+0009 HORIZONTAL TABULATION
        '\n' U+000A NEW LINE
        '\f' U+000C FORM FEED
        '\r' U+000D CARRIAGE RETURN
        ' ' U+0020 SPACE
        パラメータ:
        ch - 判定対象の文字。
        戻り値:
        文字がISO-LATIN-1の空白の場合はtrue、そうでない場合はfalse
        関連項目:
        isSpaceChar(char), isWhitespace(char)
      • isSpaceChar

        public static boolean isSpaceChar​(char ch)
        指定された文字がUnicodeの空白文字かどうかを判定します。 空白文字と見なされるのは、Unicode標準で空白文字として指定されている場合だけです。 文字の汎用カテゴリ型が次のどれかの場合にだけ、このメソッドはtrueを返します。
        • SPACE_SEPARATOR
        • LINE_SEPARATOR
        • PARAGRAPH_SEPARATOR

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isSpaceChar(int)メソッドを使用してください。

        パラメータ:
        ch - 判定対象の文字。
        戻り値:
        文字が空白文字の場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.1
        関連項目:
        isWhitespace(char)
      • isSpaceChar

        public static boolean isSpaceChar​(int codePoint)
        指定された文字(Unicodeコード・ポイント)がUnicodeの空白文字かどうかを判定します。 空白文字と見なされるのは、Unicode標準で空白文字として指定されている場合だけです。 文字の汎用カテゴリ型が次のどれかの場合にだけ、このメソッドはtrueを返します。
        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字が空白文字の場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.5
        関連項目:
        isWhitespace(int)
      • isWhitespace

        public static boolean isWhitespace​(char ch)
        指定された文字がJavaの基準に従った空白かどうかを判定します。 次の基準のどれかを満たす場合にだけ、Javaの空白文字になります。
        • Unicodeの空白文字(SPACE_SEPARATORLINE_SEPARATOR、またはPARAGRAPH_SEPARATOR)であるが、改行なしの空白('\u00A0''\u2007''\u202F')ではない。
        • '\t' (U+0009水平タブ)である。
        • '\n' (U+000A改行)である。
        • '\u000B' (U+000B垂直タブ)である。
        • '\f' (U+000Cフォーム・フィード)である。
        • '\r' (U+000D復帰)である。
        • '\u001C' (U+001Cファイル区切り文字)である。
        • '\u001D' (U+001Dグループ区切り文字)である。
        • '\u001E' (U+001Eレコード区切り文字)である。
        • '\u001F' (U+001F単位区切り文字)である。

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isWhitespace(int)メソッドを使用してください。

        パラメータ:
        ch - 判定対象の文字。
        戻り値:
        文字がJava空白文字の場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.1
        関連項目:
        isSpaceChar(char)
      • isWhitespace

        public static boolean isWhitespace​(int codePoint)
        指定された文字(Unicodeコード・ポイント)がJavaの基準に従った空白かどうかを判定します。 次の基準のどれかを満たす場合にだけ、Javaの空白文字になります。
        • Unicodeの空白文字(SPACE_SEPARATORLINE_SEPARATOR、またはPARAGRAPH_SEPARATOR)であるが、改行なしの空白('\u00A0''\u2007''\u202F')ではない。
        • '\t' (U+0009水平タブ)である。
        • '\n' (U+000A改行)である。
        • '\u000B' (U+000B垂直タブ)である。
        • '\f' (U+000Cフォーム・フィード)である。
        • '\r' (U+000D復帰)である。
        • '\u001C' (U+001Cファイル区切り文字)である。
        • '\u001D' (U+001Dグループ区切り文字)である。
        • '\u001E' (U+001Eレコード区切り文字)である。
        • '\u001F' (U+001F単位区切り文字)である。
        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字がJava空白文字の場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.5
        関連項目:
        isSpaceChar(int)
      • isISOControl

        public static boolean isISOControl​(char ch)
        指定された文字がISO制御文字かどうかを判定します。 コードが'\u0000' - '\u001F'の範囲、または'\u007F' - '\u009F'の範囲の場合は、ISO制御文字と見なされます。

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isISOControl(int)メソッドを使用してください。

        パラメータ:
        ch - 判定対象の文字。
        戻り値:
        文字がISO制御文字の場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.1
        関連項目:
        isSpaceChar(char), isWhitespace(char)
      • isISOControl

        public static boolean isISOControl​(int codePoint)
        参照された文字(Unicodeコード・ポイント)がISO制御文字かどうかを判定します。 コードが'\u0000' - '\u001F'の範囲、または'\u007F' - '\u009F'の範囲の場合は、ISO制御文字と見なされます。
        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字がISO制御文字の場合はtrue、そうでない場合はfalse
        導入されたバージョン:
        1.5
        関連項目:
        isSpaceChar(int), isWhitespace(int)
      • forDigit

        public static char forDigit​(int digit,
                                    int radix)
        指定された基数での、指定された桁数の文字表現を判定します。 radixの値が無効な基数の場合、またはdigitが指定された基数で無効な数字の場合は、null文字('\u0000')が返されます。

        radix引数は、MIN_RADIX以上MAX_RADIX以下の場合に有効です。 digit引数は、0 <= digit < radixの場合に有効です。

        数字が10より小さいと、'0'+digitが返されます。 そうでない場合は、値'a'+digit - 10が返されます。

        パラメータ:
        digit - 文字に変換する数。
        radix - 基数。
        戻り値:
        指定された基数での、指定された数値のchar表現。
        関連項目:
        MIN_RADIX, MAX_RADIX, digit(char, int)
      • isMirrored

        public static boolean isMirrored​(char ch)
        Unicode仕様に従って文字をミラー化するかどうかを判定します。 テキスト内で右から左に文字が描画される場合、文字のミラー化により、グリフが水平方向にミラー化されます。 たとえば、'\u0028' LEFT PARENTHESISは、セマンティックスでは開きカッコとして定義されています。 これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。

        注: このメソッドは、補助文字を処理できません。 補助文字を含むすべてのUnicode文字をサポートするには、isMirrored(int)メソッドを使用してください。

        パラメータ:
        ch - ミラー化プロパティが要求されたchar
        戻り値:
        charがミラー化される場合はtruecharがミラー化されないか未定義の場合はfalse
        導入されたバージョン:
        1.4
      • isMirrored

        public static boolean isMirrored​(int codePoint)
        Unicode仕様に従って、指定された文字(Unicodeコード・ポイント)をミラー化するかどうかを判定します。 テキスト内で右から左に文字が描画される場合、文字のミラー化により、グリフが水平方向にミラー化されます。 たとえば、'\u0028' LEFT PARENTHESISは、セマンティックスでは開きカッコとして定義されています。 これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。
        パラメータ:
        codePoint - 判定対象の文字(Unicodeコード・ポイント)。
        戻り値:
        文字がミラー化される場合はtrue、文字がミラー化されないか未定義の場合はfalse
        導入されたバージョン:
        1.5
      • compareTo

        public int compareTo​(Character anotherCharacter)
        2つのCharacterオブジェクトを数値的に比較します。
        定義:
        compareTo、インタフェース: Comparable<Character>
        パラメータ:
        anotherCharacter - 比較対象のCharacter
        戻り値:
        引数CharacterがこのCharacterと等しい場合は値0、このCharacterCharacter引数より小さい数値の場合は0より小さい値、このCharacterCharacter引数より大きい数値の場合は0より大きい値(符号なしの比較)。 これは完全に数値の比較なので、ロケールに依存しない
        導入されたバージョン:
        1.2
      • compare

        public static int compare​(char x,
                                  char y)
        2つのchar値を数値的に比較します。 返される値は、次から返される値と同じになります。
            Character.valueOf(x).compareTo(Character.valueOf(y))
         
        パラメータ:
        x - 比較する最初のchar
        y - 比較する2番目のchar
        戻り値:
        x == yの場合は値0x < yの場合は0より小さい値、x> yの場合は0より大きい値
        導入されたバージョン:
        1.7
      • reverseBytes

        public static char reverseBytes​(char ch)
        指定されたchar値でバイト順を逆にして取得した値を返します。
        パラメータ:
        ch - そのバイト順を逆にするchar
        戻り値:
        指定されたchar値でバイト順を逆にして(つまり入れ替えて)取得した値。
        導入されたバージョン:
        1.5
      • getName

        public static String getName​(int codePoint)
        指定された文字codePointのUnicode名(コード・ポイントがunassignedの場合はnull)を返します。

        注: UnicodeDataファイル(Unicode Consortiumがメンテナンスを行っているUnicode Character Databaseの一部)で、指定された文字に名前が割り当てられていない場合、返される名前は次の式の結果と同じになります。

        Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);

        パラメータ:
        codePoint - 文字(Unicodeコード・ポイント)
        戻り値:
        指定された文字のUnicode名(コード・ポイントが未割当ての場合はnull)。
        例外:
        IllegalArgumentException - 指定されたcodePointが有効なUnicodeコード・ポイントでない場合。
        導入されたバージョン:
        1.7
      • codePointOf

        public static int codePointOf​(String name)
        指定されたUnicode文字名で指定されたUnicode文字のコード・ポイント値を返します。

        ノート: UnicodeDataファイル(ユニコード・コンソーシアムによって管理されているUnicode文字データベースの一部)で文字に名前が割り当てられていない場合、その名前は式の結果として定義されます

        Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);

        nameのマッチングでは、大文字と小文字は区別されず、前後の空白文字は削除されます。

        パラメータ:
        name - Unicode文字の名前
        戻り値:
        その名前で指定された文字のコード・ポイント値。
        例外:
        IllegalArgumentException - 指定されたnameが有効なUnicode文字名でない場合。
        NullPointerException - namenullである場合
        導入されたバージョン:
        9