RAGLight unterstützt zwei Hauptdatenquellen:
- lokaler OrdnerDokumente können in PDF, Textdateien und anderen Formaten importiert werden. Die Konfiguration erfordert die Verwendung von
FolderSource
Geben Sie den Ordnerpfad an, z. B.FolderSource(path="/path/to/your/folder/knowledge_base")
. - GitHub-RepositorienUnterstützung für die Extraktion von Dokumenten aus öffentlichen Repositories. Die Konfiguration erfordert die Verwendung des
GitHubSource
und geben Sie die Repository-URL an, z. B.GitHubSource(url="https://github.com/Bessouat40/RAGLight")
.
Benutzer können diese Datenquellen der RAG-Pipeline hinzufügen, wenn sie die knowledge_base
Liste, verarbeitet RAGLight das Dokument automatisch und erzeugt den Vektorspeicher.
Diese Antwort stammt aus dem ArtikelRAGLight: Leichtgewichtige Python-Bibliothek zur Generierung von AbruferweiterungenDie