コンテンツへスキップ
最終更新

言語モデルデータストア

Tisaneの言語モデルはディレクトリに格納されています。これは次のように分類できます。

  1. 特定の言語を説明する言語固有のデータ
  2. すべての言語で利用されるクロスリンガルデータ(例:概念間の意味論的な関連性)。

言語固有のデータ

言語固有のデータストアは、以下の慣習に従って命名されます。(language_code)-(data_store_name)

  • 言語コード:言語コードの規格ISO-639-1に基づく。方言を含む場合もあります。
  • データストア名:保存された構造。

例:

  • en-phrase:英語のフレーズパターン
  • fr-nondic:フランス語の辞書に載っていないエンティティのヒューリスティック
  • zh_CN-phrase:中国語(簡体字)のフレーズパターン

クロスリンガルデータストア

これらのデータストアは、全言語で使用されています。**

  • family
  • role
  • pragma

**重要:言語用のすべてのデータストアは、同じディレクトリ内に配置する必要があります。

部分的な配布

スペースを節約するため、またはその他の理由により、デプロイメントから言語やコンポーネントを除外することが可能です。

選択された言語のみを提供

特定の言語のみを含めるには、適切な言語コード(例: endezh_CN)を特定し、対応する言語固有のデータストアを、3つの共有データストア(familyrolepragma)と共に含めます。

一部機能の提供

xx-famlexxx-famphraseのストアは翻訳専用に使用され、Tisaneを翻訳に利用しない場合、配布から除外可能です。

スペルチェック

スペルチェックのデータは、xx-spellストアに格納されています。省略した場合、スペルチェックは機能しません。