Случаи проблемного контента регистрируются в разделе abuse.
Этот раздел появляется, если:
- Обнаружены проблемные типы контента;
- Для настройки
abuseустановлено значениеtrue(или она пропущена).
Элемент массива abuse содержит:
- данные о местоположении
offset— позиция, отсчитываемая от нуля, где начинается фрагментlength— длина фрагментаsentence_index— предложение, в котором находится фрагмент
type— тип проблемного контентаseverity— серьезность проблемы, которую можно использовать для определения приоритетности обнаруженных случаевexplanation— понятное человеку объяснение, почему система считает контент проблемным. (Если для настройкиexplainустановлено значениеtrue)text— проблемный фрагмент. (Если для настройкиsnippetsустановлено значениеtrue)
**Не реагируйте на все типы записей ** в разделе abuse без разбора.
Модераторы или создатели политики обязаны решить, действительно ли отмеченный контент является проблемным в контексте сообщества. Например: Возможно, нецелесообразно ограничивать сексуальные домогательства в приложении для знакомств или цензурировать ненормативную лексику в сообществах, где она является общепринятой.
Различные типы проблемного контента требуют различных действий. Например, обнаруженное суицидальное поведение, безусловно, не должно приводить к блокировке пользователя.
Для таких приложений, как исследовательские пакеты, это еще один тип извлекаемой информации. Однако в целях удобства использования рекомендуется учитывать реальные потребности и не перегружать пользователей данными, которые им могут не понадобиться.
Информацию о типах проблемного контента см. в следующих источниках: Проблемный контент .
Если проблемный контент неважен, либо явно укажите для настройки abuse значение false или просто проигнорируйте этот раздел.
Чтобы извлечь точный фрагмент текста, содержащий оскорбительный контент, используйте данные о местоположении, предоставленные в ответе.
См. подробнее в статье: Как найти фрагмент на основе данных о местоположении
Если вам нужен только сам фрагмент текста, просто добавьте "snippets":true в объект settings и используйте атрибут text на уровне отдельного объекта abuse.
Оскорбительный контент и анализ настроений — это две разные вещи.
Действительно, оскорбительный и проблемный контент часто переплетается с негативными настроениями. Но это не всегда так. Например, когда кто-то рекламирует «высококачественный кокаин», это явно позитивное отношение, но это преступная деятельность, которую необходимо пометить как abuse.
Когда кто-то обменивается контактными данными, отношение нейтральное; однако его все равно можно обозначить как external_contact. Расовые оскорбления также могут легко использоваться в высказываниях с положительным настроем.
С другой стороны, «крайне негативные настроения» не обязательно означают кибербуллинг или разжигание ненависти. Даже высказывания вроде «Я его ненавижу» не являются личными оскорблениями, поскольку они не направлены на кого-то из участников текущего разговора. Рекомендуем ознакомиться: Личные нападки