Языковые модели Tisane хранятся в каталогах. Их можно разделить на:
- Данные, специфичные для языка, описывающие определенный язык.
- Межъязыковые данные, которые используются всеми языками (например, семантические связи между понятиями).
Хранилища данных, специфичные для конкретного языка, именуются в соответствии со следующим правилом: (language_code)-(data_store_name)
- Код языка: на основе стандарта кодов языков ISO-639-1, в который по желанию можно включить диалекты.
- Имя хранилища данных: сохраняемые конструкции.
Примеры:
en-phrase: английские фразовые моделиfr-nondic: эвристика несловарных сущностей французского языкаzh_CN-phrase: китайские (упрощенные) фразовые модели
Эти хранилища данных используются всеми языками:
familyrolepragma
Важно: все хранилища данных для языка должны находиться в одном и том же каталоге.
В целях экономии места или по другим соображениям можно исключить языки или компоненты из развертывания.
Чтобы включить только определенные языки, определите соответствующие языковые коды (например, en, de,zh_CN ) и укажите соответствующие хранилища данных, специфичные для конкретного языка, вместе с тремя общими хранилищами данных (family, role, pragma).
Хранилища xx-famlex и xx-famphrase используются только для перевода и могут быть исключены из дистрибутива, если Tisane не используется для перевода.
Данные проверки орфографии хранятся в хранилищах xx-spell. Если этот параметр пропущен, проверка орфографии работать не будет.