サポートされる言語

言語コードは、有効なRFC-3066言語コード識別子で指定する必要があります。サポートされる言語とその言語コード識別子は次のとおりです。

アラビア語 — ar
カタロニア語 — ca
中国語(簡体字) — zh_CN
中国語(繁体字) — zh_TW
クロアチア語 — hr
チェコ語 — cs
デンマーク語 — da
オランダ語 — nl
英語(アメリカ) — en
英語(イギリス) — en_GB
フィンランド語 — fi
フランス語 — fr
ドイツ語 — de
ギリシャ語 — el
ヘブライ語 — he
ハンガリー語 — hu
イタリア語 — it
日本語 — ja
韓国語 — ko
ノルウェー語(ブークモール) — nb
ノルウェー語(ニューノルスク) — nn
ペルシア語 — fa
ポーランド語 — pl
ポルトガル語 — pt
ポルトガル語(ブラジル) — pt_BR
ルーマニア語 — ro
ロシア語 — ru
セルビア語(キリル) — sr_Cyrl
セルビア語(ラテン) — sr_Latn
スロバキア語 — sk
スロベニア語 — sl
スペイン語 — es
スウェーデン語 — sv
タイ語 — th
トルコ語 — tr
不明(つまり、前述の言語以外) — unknown

言語コードの大文字と小文字は区別されません。

無効な言語コードを指定するとエラーが返されることに注意してください。

言語コードを使用すると、レコード検索や値検索の問合せ時にテキストの言語をDgraphに指定できるため、言語に固有の操作を正しく実行できます。

国のロケール・コードの扱い

国のロケール・コードは、言語コード(たとえば、スペイン語はes)と国コード(たとえば、メキシコはMX、アルゼンチンはAR)の組合せです。つまり、es_MXという国のロケールはスペイン語(メキシコ)を意味し、es_ARはスペイン語(アルゼンチン)を意味します。

Language要素に国のロケール・コードを指定すると、国コードは無視されて言語コードの部分のみが受け入れられます。つまり、国のロケール・コードがその言語コードにマッピングされ、言語コードの部分のみが問合せのトークン化や検索索引の生成に使用されます。たとえば、es_MXと指定してもesのみを指定しても同じです。このルールに対する例外は、前述のリストにあるコードです(pt_BRなど)。

ただし、標準属性を作成して、mdex-property_Languageフィールドに国のロケール・コードを指定すると、属性に国のロケール・コードがタグ付けされることに注意してください(この場合も、国コードは索引作成と問合せの際に無視されます)。

言語に固有の辞書と索引

Dgraphには、2つのスペル修正エンジンがあります。PDRのmdex-property_Languageプロパティをenに設定する場合、スペル修正は、英語のスペル・エンジン(およびその英語スペル辞書)によって処理され、このプロパティを他の値に設定する場合、スペル修正は、英語以外のスペル・エンジン(およびその言語に固有の辞書)を使用します。すべての辞書がDgraphのデータ・レコードから生成されるため、標準属性のPDRに言語IDをタグ付けする必要があります。

すべての辞書ファイルは、データ・ドメインの索引ディレクトリに格納されます。