Tisaneは、フラグが付けられたテキストフラグメントを特定するのに役立つ、構造化されたロケーションデータを提供します。
主な3つのロケーション属性は以下の通りです。
sentence_index: スニペットを含む文章のゼロベースのインデックス。offset: 文章中のスニペットの最初の文字のゼロベースの位置。length: スニペットの文字数。
- スニペットを含む文章を見つける:
sentence_listノードに移動する。index=sentence_indexのノードを選択する。- あるいは、文章リストの配列から文章を直接取得する。
- サブストリングを取得する:
offsetとlengthの値を使用して、文章からサブストリングを取得する。
当社は、絶対的なオフセットではなく文章ベースのインデックスを使用しています。これは、多くのユーザーがコンテキストのためにスニペットのある実際の文章を必要とするからです。