エイリアス、ユーザー名、ニックネームのモデレートは、チャットやメッセージのモデレートとは異なります。
エイリアスに含まれるURLは、スパマーであることを明らかに表しています。_BtcKing111_という名前だとしたら、その目的が何であるのかはとても明確です。_第三帝国_についてチャットで言及することと、それをユーザー名として使用することは別物です。
そのため、Tisaneはエイリアス用の特別なモードを備えています。エイリアスのモデレーション・ロジックを起動するには、設定構造で **"format":"alias"**を指定してください。
よく使われる「gotcha」を例にとってみましょう。Tisaneには便利な自動言語識別オプションがあるため、アスタリスク("language":"*")を使いたくなるかもしれません。しかし、これはしないでください。
第一に、言語判定は30~50文字より短い文字列ではうまく機能しません。何の言語であるか理解できないこともあります。「status」(地位)という言葉を考えてみましょう。これは、フランス語、スペイン語、英語、その他多くの言語で同じ単語が使われています。「status」という言葉だけで判断して言語を判定するとしたら、正解は何でしょうか。言語とはそういうものであり、明確な答えはありません。(ある開発者から、数字やスペースを末尾に加えることで問題が解決するか、という質問がありましたが、答えはノーです。)
エイリアスの場合はさらに複雑で、エイリアスはどの言語でも必ずしも正当な言葉であるとは限りません。他の単語をベースにした文字がミックスされている場合もあります。異なる名前の構成要素が混ざっていることもあります(言語によっては、Peter、Johnなど、正当であるかもしれません)。
それでは、エイリアスの言語をどうやって知ることができるのでしょうか?一つに、ユーザーの設定やIPを見る方法があります。しかし、この信頼性は極めて低いものです。さらに、ほとんどの場合、エイリアスは他のコミュニティメンバー(今日ではたいていグローバルなオーディエンス)に理解されるように作られています。英語のエイリアスがアメリカやイギリスのものであるとは限りません。意図的な難読用語や言葉の混ぜ合わせなども加わっています。
そして、オーディエンスの問題もあります。たとえばユーザーが、ドイツ語では問題ない名前を付けた場合でも、これが英語では不快に取られることもあります。言うまでもなく、言語の組み合わせは自由です。マーケティング担当者はこの問題を嫌というほど把握しています。
Tisaneは、すべての言語をスキャンして攻撃的なものを見つけることができるのでしょうか?当社はこのオプションを検討しましたが、多くの地域の反対を受け、実施しないことにしました。
推奨する方法は以下の通りです。
- ラテン文字であれば、エイリアスは英語か、所属コミュニティの主要言語のいずれかであるのかを仮定します。承認が必要な言語にはすべて、個別のリクエストを送信してください。(en fr esなどのバーティカルバーで区切られた表記法はその方法ではありませんのでご注意|ください。|その目的は言語判定を呼び出すことです。)
- ラテン文字以外であれば、その文字に関連する主な言語をスキャンします。
URLやEメールなどのフィルタリングを心配する必要はありません。これらはどの言語にも含まれています。ニックネームを構成要素に自動トークン化(例:cryptorajah1244 -> crypto|rajah)する機能も搭載されています。
例
リクエスト:
{
"language": "en",
"content": "cryptorajah1244 ",
"settings": {
"format": "alias"
}
}レスポンス:
{
"text": "cryptorajah1244 ",
"topics": [
"cryptocurrency",
"finance",
"aristocracy"
],
"abuse": [
{
"sentence_index": 0,
"offset": 0,
"length": 11,
"type": "spam",
"severity": "high",
"tags": [
"cryptocurrency"
]
}
],
"entities_summary": [
{
"type": "role",
"name": "rajah",
"mentions": [
{
"sentence_index": 0,
"offset": 6,
"length": 5
}
]
},
{
"type": [
"username",
"person",
"identifier"
],
"name": "cryptorajah1244",
"mentions": [
{
"sentence_index": 0,
"offset": 0,
"length": 15
}
]
}
]
}