基本ステップの紹介
Instructorを使った自然言語からの構造化データの抽出は、主に3つのステップに分けられる:
- パイダンティック・データモデルの定義
- OpenAIクライアントの初期化とInstructorとの統合
- chat.completes.createメソッドの呼び出し
詳しい取扱説明書
具体的な実装例のポイントは以下の通り:
- モデルの定義BaseModelを継承したクラスを作成し、フィールドタイプを明示的に指定する必要があります。
- 顧客統合: コンストラクタ.from_openai()メソッドを使用した標準OpenAIクライアントのラッピング
- APIコールresponse_modelパラメータは、出力構造を関連付けるために指定する必要があります。
ベストプラクティスの推奨
- モデルの理解を深めるために、主要なフィールドに詳細な説明を追加する。
- 不確実性に対処するためのオプション・フィールドの追加を検討する
- 複雑な構造の場合、入れ子モデル設計を使用することができる。
この答えは記事から得たものである。講師:大規模言語モデルの構造化出力ワークフローを簡素化するPythonライブラリについて































