# 言語モデルデータストア

Tisaneの言語モデルはディレクトリに格納されています。これは次のように分類できます。

1. 特定の言語を説明する**言語固有のデータ**。
2. すべての言語で利用される**クロスリンガルデータ**（例：概念間の意味論的な関連性）。


### 言語固有のデータ

言語固有のデータストアは、以下の慣習に従って命名されます。`(language_code)-(data_store_name)`

* 言語コード：言語コードの規格ISO-639-1に基づく。方言を含む場合もあります。
* データストア名：保存された構造。


例：

* `en-phrase`：英語のフレーズパターン
* `fr-nondic`：フランス語の辞書に載っていないエンティティのヒューリスティック
* `zh_CN-phrase`：中国語（簡体字）のフレーズパターン


### クロスリンガルデータストア

これらのデータストアは、全言語で使用されています。**

* `family`
* `role`
* `pragma`


**重要：**言語用のすべてのデータストアは、同じディレクトリ内に配置する必要があります。**

### 部分的な配布

スペースを節約するため、またはその他の理由により、デプロイメントから言語やコンポーネントを除外することが可能です。

## 選択された言語のみを提供

特定の言語のみを含めるには、適切な言語コード（例： `en`、`de`、`zh_CN`）を特定し、対応する言語固有のデータストアを、3つの共有データストア（`family`、`role`、`pragma`）と共に含めます。

## 一部機能の提供

`xx-famlex`と`xx-famphrase`のストアは翻訳専用に使用され、Tisaneを翻訳に利用しない場合、配布から除外可能です。

## スペルチェック

スペルチェックのデータは、`xx-spell`ストアに格納されています。省略した場合、スペルチェックは機能しません。