サポートされている言語

言語コードは、有効なRFC-3066言語コード識別子として指定する必要があります。サポートされる言語および対応する言語コード識別子は、次のとおりです。

アラビア語: ar
バスク語: eu
ベラルーシ語: be
ボスニア語: bs
ブルガリア語: bg
カタロニア語: ca
中国語(簡体字): zh_CN
中国語(繁体字): zh_TW
クロアチア語: hr
チェコ語: cs
デンマーク語: da
オランダ語: nl
米国英語: en
イギリス英語: en_GB
エストニア語: et
フィンランド語: fi
フランス語: fr
フランス語(カナダ): fr_ca
ガリシア語: gl
ドイツ語: de
ギリシャ語: el
ヘブライ語: he
ハンガリー語: hu
インドネシア語: id
イタリア語: it
日本語: ja
韓国語: ko
ラトビア語: lv
リトアニア語: lt
マケドニア語: mk
マレー語: ms
ノルウェー語(ブークモール): nb
ノルウェー語(ニーノシュク): nn
ペルシャ語: fa
ポーランド語: pl
ポルトガル語: pt
ポルトガル語(ブラジル): pt_BR
ルーマニア語: ro
ロシア語: ru
セルビア語(キリル): sr_Cyrl
セルビア語(ラテン): sr_Latn
スロバキア語: sk
スロベニア語: sl
スペイン語: es
スウェーデン語: sv
タイ語: th
トルコ語: tr
ウクライナ語: uk
バレンシア語: vc
ベトナム語: vn
不明(上記のいずれにも該当なし): unknown

言語コードでは大/小文字が区別されません。

無効な言語コードを指定すると、エラーが返されます。

言語コードを使用すると、レコード検索時や値検索問合せ時にテキストの言語をDgraphに指定できるため、言語固有の操作を正しく実行できるようになります。

国ロケール・コードの処理方法

国ロケール・コードは、言語コード(スペイン語を表すesなど)と国コード(メキシコを表すMXやアルゼンチンを表すARなど)の組合せです。このため、es_MX国ロケールはメキシコのスペイン語を意味し、es_ARはアルゼンチンのスペイン語を意味します。

「言語」要素に対して国ロケール・コードを指定すると、国コードは無視されますが、言語コード部分は受け入れられます。つまり、国ロケール・コードは言語コードにマップされ、この部分のみが問合せのトークン化や検索索引の生成に使用されます。たとえば、es_MXを指定することは、esのみを指定することと同じです。このルールの例外は、上記のpt_BRなどのコードです。

ただし、Dgraph属性を作成し、mdex-property_Languageフィールドに国ロケール・コードを指定すると、索引付け時および問合せ時に国コードが無視される場合でも、この属性には国ロケール・コードがタグ付けられます。

言語固有のディクショナリおよび索引

Dgraphには、2つのスペル修正エンジンがあります。属性の「言語」プロパティがenに設定されている場合、スペル修正は英語スペル・エンジン(および英語スペル・ディクショナリ)を介して処理されます。それ以外の値に設定されている場合、スペル修正には英語以外のスペル・エンジン(および言語固有のディクショナリ)が使用されます。ディクショナリはすべてDgraph内のデータ・レコードから生成されるため、属性定義に言語コードをタグ付けることが必要になります。

ディクショナリ・ファイルはすべてデータ・アプリケーションの索引ディクショナリ内に格納されます。