Перейти к содержимому

Анализ, проверка и сравнение имен

Синтаксический анализ полных имен

Tisane может разбить полные имена на ключевые компоненты:

АтрибутОписание
given_nameИмя (например, Джон)
middle_nameсреднее имя (если уместно)
surnameФамилия (например, * Доу*)
titleПочтительные обращения (например, доктор, господин, госпожа)
suffixсуффикс имени (например, младший, старший, III )
social_roleРоли, как хаджи или доктор.

Как выполнить синтаксический анализ имени

Чтобы выполнить синтаксический анализ полного имени, отправьте запрос POST/parse с:

  • "entity": "person"
  • "words": true

В ответе компоненты имени будут отнесены к атрибуту role.

Пример синтаксического анализа имени: tisaneAliKilicoglu.png

Проверка настоящих имен

Хотя Tisane не может проверить, является ли указанное пользователем имя реальным, он распознает множество имен, связанных с:

  • известными личностями (important_person);
  • вымышленными персонажами (fictional_character);
  • духовными существами (spiritual_being);
  • именами, которые не кажутся именами (например: User-13789026152908425434).

Список распространенных поддельных имен см. в этой публикации на Quora.

Атрибут subtype в структуре entity указывает тип обнаруженного имени с идентификатором Wikidata, если он доступен.

Пример синтаксического анализа имени вымышленного персонажа:

tisaneFictionalCharacter.png

Сравнение имен

Метод /compare/entities позволяет сравнить два имени (даже на разных языках) и обнаружить различия.

Примеры сравнений

Имя 1Имя 2Результат
Уильям СмитУилл Смит{"result":"different","differences":["variation"]}
Муса бин ОсманХадж Муса бин Осман{"result":"different","differences":["social_role"]}
Уильям СмитВилл Смит (т.е. Уилл Смит){"result":"different","differences":["variation"]}
Кевин ТанТАН Кевин{"result":"same"}

Как сравнивать имена

Отправить запрос конечной точке /compare/entities с именами для сравнения, и ответ вернет различия в атрибутах, например:

  • variation (например, Уильям по сранвнию с Уилл)
  • social_role (например, Хаджи Муса по сравнению с Муса)
  • case_difference (например, Джон Доу по сравнению с ДЖОН ДОУ)
  • same (идентичные имена, даже если порядок разный)

Проверка ников и псевдонимов

Имена пользователей и псевдонимы могут быть вводящими в заблуждение, оскорбительными или непристойными. Tisane обнаруживает неподходящие имена пользователей (например, Гитлер, Пользователь Джон_является_ лжецом).

Как проверить псевдоним

Отправьте запрос POST /parse вместе с:

  • "format": "alias"

  • Настройка subscope гарантирует правильную сегментацию имен, даже если они написаны слитно заглавными буквами, с подчеркиваниями или без пробелов.

Пример проверки псевдонима:

tisaneAliasCreep.png