プライマリ・コンテンツに移動
Oracle® Big Data Discovery Cloud Serviceデータ処理ガイド

E65369-05
目次へ
目次
索引へ移動
索引

前
次
機械翻訳について

サポートされている言語

Dgraphでは、言語コードを使用して特定の属性の言語を識別します。

言語コードは、有効なRFC-3066言語コード識別子として指定する必要があります。 サポートされている言語とその言語コード識別子は次のとおりです:
アフリカーンス語: af デンマーク語: da インド・ネシア語: id ノルウェー語(ブークモール): nb スペイン語、ラテン・アメリカ: es_lam
アルバニア語: sq ディベヒ語: nl イタリア語: it ノルウェー・ニーノシュク語: nn スペイン語、メキシコ: es_mx
アムハラ語: am オランダ語: nl 日本語: ja オリヤー語: or スワヒリ語: sw
アラビア語: ar 英語、米国: en カンナダ語: kn ペ・ルシア語: fa スウェーデン語: sv
ニア語: hy 英語(イギリス): en_GB カザフ語、キリル語: kk ペ・ルシア語、ダリル語: prs タガ・ログ語: tl
アッサム語: as ニア語: et ク・メール語: km ポーランド語: pl タミル語: ta
アゼルバイジャン: az フィンランド語: fi 韓国語: ko ポルトガル語: pt テルグ語: te
バングラ語: bn フランス語: fr キルギス: ky ポルトガル語、ブラジル: pt_BR タイ語: th
バス・ク語: eu フランス語、カナダ: fr_ca ラオ語: lo パン・ジャブ語: pa トルコ語: tr
ベラルーシ語: be ガリシア語: gl ラトビア語: lv ルーマニア語: ro トルクメン語: tk
ボスニア語: bs ジョージア語: ka ニア語: lt ロシア語: ru ウクライナ語: uk
ブル・ガリア語: bg ドイツ語: de ニア語: mk セルビア語、キリル語: sr_Cyrl ウルドゥ語: ur
ニア語: ca ギリシャ語: el マレー語: ms セルビア語(ラテン): sr_Latn ウズベク語、キリル語: uz
中国語(簡体字): zh_CN グジャラト語: gu マラヤーラム語: ml シン・ハラ語: si ウズベク語(ラテン): uz_latin
中国語(繁体字): zh_TW ヘブライ語: he マルタ語: mt スロバキア語: sk バレンシア語: vc
クロアチア語: hr ハンガリ語: hu マラーティ語: mr ニア語: sl ベトナム語: vn
チェコ語: cs アイスランド語: is ネパール語: ne スペイン語: es 不明(前述の言語のいずれでもない): unknown

言語コードでは、大文字と小文字は区別されません。

無効な言語コードを指定すると、エラーが返されます。

言語コードを使用すると、レコード検索または値検索問合せ時にテキストの言語をDgraphに指定できるため、言語固有の操作を正しく実行できます。

国のロケール・コードの処理方法

国のロケール・コードは、言語コード(スペイン語はesなど)と国コード(メキシコの場合はMX、アルゼンチンの場合はAR)の組合せです。 したがって、es_MXの国ロケールは、es_ARがスペイン語の場合のスペイン語(メキシコ)を意味します。

「言語」要素に国のロケール・コードを指定した場合、ソフトウェアは国コードを無視しますが、言語コード部分は受け入れます。 つまり、国のロケール・コードはその言語コードにマップされ、その部分のみが問合せのトークン化または検索索引の生成に使用されます。 たとえば、es_MXを指定することは、esのみを指定することと同じです。 このルールの例外は、前述のコード(pt_BRなど)です。

ただし、Dgraph属性を作成し、Languageフィールドで国のロケール・コードを指定した場合、属性は、索引付けおよび問合せ中に国コードが無視されても、国のロケール・コードでタグ付けされます。

言語固有辞書およびDgraphデータベース

Dgraphには2つのスペル修正エンジンがあります:
  • 属性のLanguageプロパティがenに設定されている場合、スペル修正は英語のスペル・エンジン(およびその英語のスペル辞書)を使用して処理されます。
  • Languageプロパティがその他の値に設定されている場合、スペル修正では英語以外のスペル・エンジン(およびその言語固有のディクショナリ)が使用されます。

すべてのディクショナリはDgraphのデータ・レコードから生成されるため、属性定義に言語コードのタグを付ける必要があります。

データ・セット・ディクショナリ・ファイルは、そのデータ・セットのDgraphデータベース・ディレクトリに格納されます。

データ・セットの言語の指定

データ・セットを作成するときは、次に示すように、そのデータ・セットのすべての属性の言語を指定できます:
  • Studio: データ・セット作成ウィザードでファイルをアップロードする際、「プレビュー」ページの「詳細設定」 > 「言語」フィールドで言語を選択できます。
  • DP CLI: edp.properties構成ファイルのdefaultLanguageプロパティは、言語を設定します。

属性ごとに言語を設定することはできません。