この問題は、llmwareのDRAGONシリーズを使えば効率的に解決できる。操作ステップ
- 契約知識ベースを作成する:
lib = Library().create_new_library('contracts')
- 契約ファイルの一括インポート
lib.add_files('/path/to/contracts')
- 業界に最適化された埋め込みモデルを使用:
q.generate_embeddings('industry-bert-contracts')
- セマンティッククエリを実行する:
results = q.text_query_with_document_filter('termination', {'file_source':'contract.pdf'})
- 用語の要約の生成:DRAGONモデルをロードした後に呼び出す。
prompt_with_source
この方法により、構造化された結果を得ることができる。全プロセスはバッチ処理をサポートし、典型的なシナリオでは1時間に数百の契約を処理することができる。
この答えは記事から得たものである。llmware: エンタープライズクラスのRAGアプリケーションを迅速に構築するためのオープンソースフレームワークについて