Supametas.AIは、データ収集方法を再定義する自然言語対話型データ抽出機能を開発した。この技術により、ユーザーは、例えば日常的な言葉によるコマンドを通じて、データ抽出プロセスを正確に制御することができる:
- 商品価格と在庫状況を取得」を入力すると、eコマースページの要素と自動的に一致します。
- 会議議事録から決定事項を抽出を使用して文書内の重要な段落を解析する
- 動画からキャラクターの台詞を取得」を指定して、構造化された字幕を生成する。
この基盤技術は、大規模言語モデルと従来のクローラーアルゴリズムを組み合わせることで、システムがユーザーの意図を理解し、正確に実行することを可能にします。テストデータによると、この機能により、複雑なページのデータ構成時間を従来の方法の2~3時間から10分未満に短縮することができ、92%以上の精度が得られています。この技術革新は、急速に変化するウェブページ構造や多様な文書形式に特に適しています。
この答えは記事から得たものである。Supametas.AI:非構造化データをLLMの高可用性データに抽出するについて