コンテンツへスキップ

ロケーションデータを使用してスニペットの場所を特定する

Tisaneは、フラグが付けられたテキストフラグメントを特定するのに役立つ、構造化されたロケーションデータを提供します。

主な3つのロケーション属性は以下の通りです。

  • sentence_index : スニペットを含む文章のゼロベースのインデックス。
  • offset: 文章中のスニペットの最初の文字のゼロベースの位置。
  • length : スニペットの文字数。

文字列の入手方法

  1. スニペットを含む文章を見つける:
    • sentence_listノードに移動する。
    • index = sentence_indexのノードを選択する。
    • あるいは、文章リストの配列から文章を直接取得する。
  2. サブストリングを取得する:
    • offsetlengthの値を使用して、文章からサブストリングを取得する。

絶対位置ではなく相対オフセットである理由

当社は、絶対的なオフセットではなく文章ベースのインデックスを使用しています。これは、多くのユーザーがコンテキストのためにスニペットのある実際の文章を必要とするからです。