RAGLightは主に2つのデータソースをサポートしている:
- ローカルフォルダPDF、テキストファイル、その他のフォーマットで文書を取り込むことができます。設定には
FolderSource
フォルダパスを指定します。FolderSource(path="/path/to/your/folder/knowledge_base")
. - GitHubリポジトリ公開リポジトリからの文書抽出をサポート。設定には
GitHubSource
のように、リポジトリのURLを指定する。GitHubSource(url="https://github.com/Bessouat40/RAGLight")
.
ユーザーは、これらのデータソースをRAGパイプラインに追加することができます。 knowledge_base
リストが表示されると、RAGLightは自動的にドキュメントを処理し、ベクターストアを生成します。
この答えは記事から得たものである。RAGLight: 軽量検索拡張生成Pythonライブラリについて