サポートされている言語

Dgraphでは、言語コードを使用して特定の属性の言語を識別します。

言語コードは、有効なRFC-3066言語コード識別子として指定する必要があります。サポートされる言語および対応する言語コード識別子は、次のとおりです。
  • アラビア語: ar
  • バスク語: eu
  • ベラルーシ語: be
  • ボスニア語: bs
  • ブルガリア語: bg
  • カタロニア語: ca
  • 中国語(簡体字): zh_CN
  • 中国語(繁体字): zh_TW
  • クロアチア語: hr
  • チェコ語: cs
  • デンマーク語: da
  • オランダ語: nl
  • 米国英語: en
  • イギリス英語: en_GB
  • エストニア語: et
  • フィンランド語: fi
  • フランス語: fr
  • フランス語(カナダ): fr_ca
  • ガリシア語: gl
  • ドイツ語: de
  • ギリシャ語: el
  • ヘブライ語: he
  • ハンガリー語: hu
  • インドネシア語: id
  • イタリア語: it
  • 日本語: ja
  • 韓国語: ko
  • ラトビア語: lv
  • リトアニア語: lt
  • マケドニア語: mk
  • マレー語: ms
  • ノルウェー語(ブークモール): nb
  • ノルウェー語(ニーノシュク): nn
  • ペルシャ語: fa
  • ポーランド語: pl
  • ポルトガル語: pt
  • ポルトガル語(ブラジル): pt_BR
  • ルーマニア語: ro
  • ロシア語: ru
  • セルビア語(キリル): sr_Cyrl
  • セルビア語(ラテン): sr_Latn
  • スロバキア語: sk
  • スロベニア語: sl
  • スペイン語: es
  • スウェーデン語: sv
  • タイ語: th
  • トルコ語: tr
  • ウクライナ語: uk
  • バレンシア語: vc
  • ベトナム語: vn
  • 不明(上記のいずれにも該当なし): unknown

言語コードでは大/小文字が区別されません。

無効な言語コードを指定すると、エラーが返されます。

言語コードを使用すると、レコード検索時や値検索問合せ時にテキストの言語をDgraphに指定できるため、言語固有の操作を正しく実行できるようになります。

国ロケール・コードの処理方法

国ロケール・コードは、言語コード(スペイン語を表すesなど)と国コード(メキシコを表すMXやアルゼンチンを表すARなど)の組合せです。このため、es_MX国ロケールはメキシコのスペイン語を意味し、es_ARはアルゼンチンのスペイン語を意味します。

「言語」要素に対して国ロケール・コードを指定すると、国コードは無視されますが、言語コード部分は受け入れられます。つまり、国ロケール・コードは言語コードにマップされ、この部分のみが問合せのトークン化や検索索引の生成に使用されます。たとえば、es_MXを指定することは、esのみを指定することと同じです。このルールの例外は、上記のpt_BRなどのコードです。

ただし、Dgraph属性を作成し、mdex-property_Languageフィールドに国ロケール・コードを指定すると、索引付け時および問合せ時に国コードが無視される場合でも、この属性には国ロケール・コードがタグ付けられます。

言語固有のディクショナリおよび索引

Dgraphには、2つのスペル修正エンジンがあります。属性の「言語」プロパティがenに設定されている場合、スペル修正は英語スペル・エンジン(および英語スペル・ディクショナリ)を介して処理されます。それ以外の値に設定されている場合、スペル修正には英語以外のスペル・エンジン(および言語固有のディクショナリ)が使用されます。ディクショナリはすべてDgraph内のデータ・レコードから生成されるため、属性定義に言語コードをタグ付けることが必要になります。

ディクショナリ・ファイルはすべてデータ・アプリケーションの索引ディクショナリ内に格納されます。