Tisaneの言語モデルはディレクトリに格納されています。これは次のように分類できます。
- 特定の言語を説明する言語固有のデータ。
- すべての言語で利用されるクロスリンガルデータ(例:概念間の意味論的な関連性)。
言語固有のデータストアは、以下の慣習に従って命名されます。(language_code)-(data_store_name)
- 言語コード:言語コードの規格ISO-639-1に基づく。方言を含む場合もあります。
- データストア名:保存された構造。
例:
en-phrase:英語のフレーズパターンfr-nondic:フランス語の辞書に載っていないエンティティのヒューリスティックzh_CN-phrase:中国語(簡体字)のフレーズパターン
これらのデータストアは、全言語で使用されています。**
familyrolepragma
**重要:言語用のすべてのデータストアは、同じディレクトリ内に配置する必要があります。
スペースを節約するため、またはその他の理由により、デプロイメントから言語やコンポーネントを除外することが可能です。
特定の言語のみを含めるには、適切な言語コード(例: en、de、zh_CN)を特定し、対応する言語固有のデータストアを、3つの共有データストア(family、role、pragma)と共に含めます。
xx-famlexとxx-famphraseのストアは翻訳専用に使用され、Tisaneを翻訳に利用しない場合、配布から除外可能です。
スペルチェックのデータは、xx-spellストアに格納されています。省略した場合、スペルチェックは機能しません。