{"templateId":"markdown","sharedDataIds":{"sidebar":"sidebar-@l10n/ru/sidebars.yaml"},"props":{"metadata":{"markdoc":{"tagList":[]},"type":"markdown"},"seo":{"title":"Алгоязык и состязательные текстовые манипуляции","projectTitle":"Tisane Developer Documentation","description":"Tisane is an NLP platform, used for content moderation & more.","llmstxt":{"hide":false,"sections":[{"title":"Table of contents","includeFiles":["**/*"],"excludeFiles":[]}],"excludeFiles":[]}},"dynamicMarkdocComponents":[],"compilationErrors":[],"ast":{"$$mdtype":"Tag","name":"article","attributes":{},"children":[{"$$mdtype":"Tag","name":"Heading","attributes":{"level":1,"id":"алгоязык-и-состязательные-текстовые-манипуляции","__idx":0},"children":["Алгоязык и состязательные текстовые манипуляции"]},{"$$mdtype":"Tag","name":"p","attributes":{},"children":["Tisane использует специальный тип встроенного модуля проверки орфографии для обработки текста как с непреднамеренными ошибками (опечатками), так и с противоречащими манипуляциями текстом (например, algospeak)."]},{"$$mdtype":"Tag","name":"p","attributes":{},"children":["Проверка орфографии использует несколько различных методов для обработки различных типов манипуляций (маскировка символов, замены и т. д.). Эти исправления не ограничиваются ненормативной лексикой или оскорблениями и учитывают контекст. Одно и то же слово с ошибкой может быть истолковано по-разному в разных предложениях."]},{"$$mdtype":"Tag","name":"p","attributes":{},"children":["Если исправления в предложении были признаны необходимыми, предложение получает атрибут ",{"$$mdtype":"Tag","name":"code","attributes":{},"children":["corrected_text"]},", в котором регистрируется исправленный текст. (Установите для ",{"$$mdtype":"Tag","name":"code","attributes":{},"children":["words"]}," значение ",{"$$mdtype":"Tag","name":"code","attributes":{},"children":["true"]},", чтобы вывести свдеения о преждложениях)"]},{"$$mdtype":"Tag","name":"Heading","attributes":{"level":2,"id":"ограничения","__idx":1},"children":["Ограничения"]},{"$$mdtype":"Tag","name":"p","attributes":{},"children":["Проверка орфографии не является ",{"$$mdtype":"Tag","name":"MarkdownLink","attributes":{"href":"https://stackoverflow.com/questions/307291/how-does-the-google-did-you-mean-algorithm-work"},"children":["инструментом «вы имели в виду»"]}," , как многие люди, похоже, считают:"]},{"$$mdtype":"Tag","name":"ul","attributes":{},"children":[{"$$mdtype":"Tag","name":"li","attributes":{},"children":["Если слово является допустимым, неважно, употребляется ли оно неправильно или является эзотерическим, Tisane не исправит его. Например, если ",{"$$mdtype":"Tag","name":"em","attributes":{},"children":["noun"]}," неправильно написано как ",{"$$mdtype":"Tag","name":"em","attributes":{},"children":["nun"]},"  или ",{"$$mdtype":"Tag","name":"em","attributes":{},"children":["home"]}," как ",{"$$mdtype":"Tag","name":"em","attributes":{},"children":["horse"]},", Tisane не поможет (если только это не часть известной, часто запутанной концепции, например, ",{"$$mdtype":"Tag","name":"em","attributes":{},"children":["corn star"]}," в английском)."]},{"$$mdtype":"Tag","name":"li","attributes":{},"children":["Основная цель проверки орфографии — расшифровка запутанных текстов. Поэтому проверка орфографии смещена в сторону более непристойных, предосудительных или часто используемых понятий."]}]},{"$$mdtype":"Tag","name":"Heading","attributes":{"level":2,"id":"исключение-эзотерических-чувств-и-слов-для-получения-лучших-результатов","__idx":2},"children":["Исключение эзотерических чувств и слов для получения лучших результатов"]},{"$$mdtype":"Tag","name":"p","attributes":{},"children":["Чтобы обойти эту проблему, вы можете использовать",{"$$mdtype":"Tag","name":"code","attributes":{},"children":[" мин_ общий_ частота"]}," параметр."]},{"$$mdtype":"Tag","name":"p","attributes":{},"children":["Это позволяет исключить наиболее эзотерические смыслы и слова."]},{"$$mdtype":"Tag","name":"p","attributes":{},"children":["Частота оценивается по шкале от 0 до 10, где 10 соответствует наибольшей частоте."]},{"$$mdtype":"Tag","name":"p","attributes":{},"children":["Некоторые эзотерические чувства также оцениваются в -10."]},{"$$mdtype":"Tag","name":"p","attributes":{},"children":["Мы рекомендуем вам изначально установить для параметра ",{"$$mdtype":"Tag","name":"code","attributes":{},"children":["min_generic_ "]}," значение ",{"$$mdtype":"Tag","name":"code","attributes":{},"children":["1"]}," или ",{"$$mdtype":"Tag","name":"code","attributes":{},"children":["2"]},", чтобы увидеть, сработает ли оно в вашей ситуации."]},{"$$mdtype":"Tag","name":"Heading","attributes":{"level":2,"id":"исключая-потенциальные-имена-собственные","__idx":3},"children":["Исключая потенциальные имена собственные"]},{"$$mdtype":"Tag","name":"p","attributes":{},"children":["Если вам нужно избежать проверки орфографии потенциальных имен собственных, установите для параметра ",{"$$mdtype":"Tag","name":"code","attributes":{},"children":["lowercase_spellcheck_only"]}," значение ",{"$$mdtype":"Tag","name":"code","attributes":{},"children":["true"]},"."]},{"$$mdtype":"Tag","name":"Heading","attributes":{"level":2,"id":"пример","__idx":4},"children":["Пример"]},{"$$mdtype":"Tag","name":"p","attributes":{},"children":["Запрос:"]},{"$$mdtype":"Tag","name":"CodeBlock","attributes":{"data-language":"json","header":{"controls":{"copy":{}}},"source":"{\n  \"language\":\"en\",\n  \"content\":\"I will br*k his neck and kll him\",\n  \"settings\": \n  {\n    \"words\":true,\"topics\":false,\"sentiment\":false,\"snippets\":true\n  }\n}\n","lang":"json"},"children":[]},{"$$mdtype":"Tag","name":"p","attributes":{},"children":["Ответ:"]},{"$$mdtype":"Tag","name":"CodeBlock","attributes":{"data-language":"json","header":{"controls":{"copy":{}}},"source":"\n\t\"text\": \"I will br*k his neck and kll him\",\n\t\"abuse\": [\n\t\t{\n\t\t\t\"sentence_index\": 0,\n\t\t\t\"offset\": 0,\n\t\t\t\"length\": 32,\n\t\t\t\"text\": \"I will br*k his neck and kll him\",\n\t\t\t\"type\": \"criminal_activity\",\n\t\t\t\"severity\": \"medium\",\n\t\t\t\"tags\": [\n\t\t\t\t\"threat\",\n\t\t\t\t\"violence\",\n\t\t\t\t\"death\"\n\t\t\t]\n\t\t}\n\t],\n\t\"sentence_list\": [\n\t\t{\n\t\t\t\"offset\": 0,\n\t\t\t\"text\": \"I will br*k his neck and kll him\",\n\t\t\t\"words\": [\n\t\t\t\t{\n\t\t\t\t\t\"type\": \"word\",\n\t\t\t\t\t\"offset\": 0,\n\t\t\t\t\t\"text\": \"I\",\n\t\t\t\t\t\"lettercase\": \"capitalized\",\n\t\t\t\t\t\"role\": \"agent\",\n\t\t\t\t\t\"lexeme\": 63061,\n\t\t\t\t\t\"family\": 301,\n\t\t\t\t\t\"grammar\": [\n\t\t\t\t\t\t\"PRON\"\n\t\t\t\t\t],\n\t\t\t\t\t\"stopword\": true\n\t\t\t\t},\n\t\t\t\t{\n\t\t\t\t\t\"type\": \"word\",\n\t\t\t\t\t\"offset\": 2,\n\t\t\t\t\t\"text\": \"will\",\n\t\t\t\t\t\"lexeme\": 146938,\n\t\t\t\t\t\"family\": 316,\n\t\t\t\t\t\"grammar\": [\n\t\t\t\t\t\t\"VERB\"\n\t\t\t\t\t],\n\t\t\t\t\t\"stopword\": true\n\t\t\t\t},\n\t\t\t\t{\n\t\t\t\t\t\"type\": \"word\",\n\t\t\t\t\t\"offset\": 7,\n\t\t\t\t\t\"text\": \"br*k\",\n\t\t\t\t\t\"role\": \"verb\",\n\t\t\t\t\t\"lexeme\": 20996,\n\t\t\t\t\t\"family\": 107846,\n\t\t\t\t\t\"grammar\": [\n\t\t\t\t\t\t\"VERB\"\n\t\t\t\t\t]\n\t\t\t\t},\n\t\t\t\t{\n\t\t\t\t\t\"type\": \"word\",\n\t\t\t\t\t\"offset\": 12,\n\t\t\t\t\t\"text\": \"his\",\n\t\t\t\t\t\"lexeme\": 63064,\n\t\t\t\t\t\"family\": 303,\n\t\t\t\t\t\"grammar\": [\n\t\t\t\t\t\t\"DET\"\n\t\t\t\t\t],\n\t\t\t\t\t\"stopword\": true\n\t\t\t\t},\n\t\t\t\t{\n\t\t\t\t\t\"type\": \"word\",\n\t\t\t\t\t\"offset\": 16,\n\t\t\t\t\t\"text\": \"neck\",\n\t\t\t\t\t\"lexeme\": 93293,\n\t\t\t\t\t\"family\": 40510,\n\t\t\t\t\t\"wikidata\": \"Q9633\",\n\t\t\t\t\t\"grammar\": [\n\t\t\t\t\t\t\"NOUN\"\n\t\t\t\t\t]\n\t\t\t\t},\n\t\t\t\t{\n\t\t\t\t\t\"type\": \"word\",\n\t\t\t\t\t\"offset\": 21,\n\t\t\t\t\t\"text\": \"and\",\n\t\t\t\t\t\"lexeme\": 4096,\n\t\t\t\t\t\"family\": 322,\n\t\t\t\t\t\"grammar\": [\n\t\t\t\t\t\t\"CCONJ\"\n\t\t\t\t\t],\n\t\t\t\t\t\"stopword\": true\n\t\t\t\t},\n\t\t\t\t{\n\t\t\t\t\t\"type\": \"word\",\n\t\t\t\t\t\"offset\": 25,\n\t\t\t\t\t\"text\": \"kll\",\n\t\t\t\t\t\"role\": \"verb\",\n\t\t\t\t\t\"lexeme\": 77380,\n\t\t\t\t\t\"family\": 113102,\n\t\t\t\t\t\"grammar\": [\n\t\t\t\t\t\t\"VERB\"\n\t\t\t\t\t]\n\t\t\t\t},\n\t\t\t\t{\n\t\t\t\t\t\"type\": \"word\",\n\t\t\t\t\t\"offset\": 29,\n\t\t\t\t\t\"text\": \"him\",\n\t\t\t\t\t\"role\": \"patient\",\n\t\t\t\t\t\"lexeme\": 63062,\n\t\t\t\t\t\"family\": 303,\n\t\t\t\t\t\"grammar\": [\n\t\t\t\t\t\t\"PRON\"\n\t\t\t\t\t],\n\t\t\t\t\t\"stopword\": true\n\t\t\t\t}\n\t\t\t],\n\t\t\t\"corrected_text\": \"I will break his neck and kill him\"\n\t\t}\n\t]\n}\n","lang":"json"},"children":[]}]},"headings":[{"value":"Алгоязык и состязательные текстовые манипуляции","id":"алгоязык-и-состязательные-текстовые-манипуляции","depth":1},{"value":"Ограничения","id":"ограничения","depth":2},{"value":"Исключение эзотерических чувств и слов для получения лучших результатов","id":"исключение-эзотерических-чувств-и-слов-для-получения-лучших-результатов","depth":2},{"value":"Исключая потенциальные имена собственные","id":"исключая-потенциальные-имена-собственные","depth":2},{"value":"Пример","id":"пример","depth":2}],"frontmatter":{"seo":{"title":"Алгоязык и состязательные текстовые манипуляции"}},"lastModified":"2025-07-07T02:26:37.000Z","pagePropGetterError":{"message":"","name":""}},"slug":"/ru/guides/features/algospeak","userData":{"isAuthenticated":false,"teams":["anonymous"]},"isPublic":true}