プラットフォームは4つの主要な統合方法を提供し、開発者は技術スタックに応じて柔軟に選択することができる:
- ネイティブ・ナレッジベース・ドッキング::
- Integrate画面で、設定済みのプラットフォーム(OpenAI Storage/Dify Datasets)を選択します。
- 対象プラットフォームのAPIキーを入力(要事前申請)
- フィールドマッピング関係の設定(自動マッチングまたは手動調整)
- APIコール::
- プラットフォームが提供する固有のエンドポイントを取得する
- POSTリクエストで最新データを取得(時間/キーワードによるフィルタリングに対応)
- 例に戻る:
{"status": 200, "data": [{"title": "...", "embedding": [...]}]}
- ウェブフック・プッシュ時間指定されたタスクが完了したときに、自動的にデータ同期をトリガーするように通知アドレスを設定します。
- ファイルのエクスポートと再インポート(セマンティックタグを含む)JSON-LD形式のファイルをダウンロードする。
カスタマイズが必要な場合は、これを推奨する:
- customKeys "パラメータを使用して、ビジネス固有のフィールド(顧客の業種など)を定義します。
- 自然言語抽出」機能と連動したデータ構造の動的調整(「次回は著者のタイトルを入れてください」)。
- DifyなどのプラットフォームでWeb Appを作成する際に、コンテキストソースとしてデータセットを直接参照することができます。
すべての統合方法は、データの系譜、元の文書と変更記録のトレーサビリティを保持し、企業の監査要件を満たします。
この答えは記事から得たものである。Supametas.AI:非構造化データをLLMの高可用性データに抽出するについて