サポートされる言語

言語コードを使用して言語を識別します。

言語コードは、有効なRFC-3066言語コード識別子で指定する必要があります。サポートされる言語とその言語コード識別子は次のとおりです。
  • アラビア語 — ar
  • カタロニア語 — ca
  • 中国語(簡体字) — zh_CN
  • 中国語(繁体字) — zh_TW
  • クロアチア語 — hr
  • チェコ語 — cs
  • デンマーク語 — da
  • オランダ語 — nl
  • 英語(アメリカ) — en
  • 英語(イギリス) — en_GB
  • フィンランド語 — fi
  • フランス語 — fr
  • ドイツ語 — de
  • ギリシャ語 — el
  • ヘブライ語 — he
  • ハンガリー語 — hu
  • イタリア語 — it
  • 日本語 — ja
  • 韓国語 — ko
  • ノルウェー語(ブークモール) — nb
  • ノルウェー語(ニューノルスク) — nn
  • ペルシア語 — fa
  • ポーランド語 — pl
  • ポルトガル語 — pt
  • ポルトガル語(ブラジル) — pt_BR
  • ルーマニア語 — ro
  • ロシア語 — ru
  • セルビア語(キリル) — sr_Cyrl
  • セルビア語(ラテン) — sr_Latn
  • スロバキア語 — sk
  • スロベニア語 — sl
  • スペイン語 — es
  • スウェーデン語 — sv
  • タイ語 — th
  • トルコ語 — tr
  • 不明(つまり、前述の言語以外) — unknown

言語コードの大文字と小文字は区別されません。

無効な言語コードを指定するとエラーが返されることに注意してください。

言語コードを使用すると、レコード検索や値検索の問合せ時にテキストの言語をDgraphに指定できるため、言語に固有の操作を正しく実行できます。

国のロケール・コードの扱い

国のロケール・コードは、言語コード(たとえば、スペイン語はes)と国コード(たとえば、メキシコはMX、アルゼンチンはAR)の組合せです。つまり、es_MXという国のロケールはスペイン語(メキシコ)を意味し、es_ARはスペイン語(アルゼンチン)を意味します。

Language要素に国のロケール・コードを指定すると、国コードは無視されて言語コードの部分のみが受け入れられます。つまり、国のロケール・コードがその言語コードにマッピングされ、言語コードの部分のみが問合せのトークン化や検索索引の生成に使用されます。たとえば、es_MXと指定してもesのみを指定しても同じです。このルールに対する例外は、前述のリストにあるコードです(pt_BRなど)。

ただし、標準属性を作成して、mdex-property_Languageフィールドに国のロケール・コードを指定すると、属性に国のロケール・コードがタグ付けされることに注意してください(この場合も、国コードは索引作成と問合せの際に無視されます)。

言語に固有の辞書と索引

Dgraphには、2つのスペル修正エンジンがあります。PDRのmdex-property_Languageプロパティをenに設定する場合、スペル修正は、英語のスペル・エンジン(およびその英語スペル辞書)によって処理され、このプロパティを他の値に設定する場合、スペル修正は、英語以外のスペル・エンジン(およびその言語に固有の辞書)を使用します。すべての辞書がDgraphのデータ・レコードから生成されるため、標準属性のPDRに言語IDをタグ付けする必要があります。

すべての辞書ファイルは、データ・ドメインの索引ディレクトリに格納されます。