llmware bietet eine vollständige Lösung für die lokale Bereitstellung:
- Vorbereitung der UmweltPython 3.8+ installieren, es wird empfohlen, eine eigenständige Umgebung mit conda zu erstellen
- Wählen Sie ein leichtes ModellDie BLING-Serie (z.B. bling-1b-gguf) ist für CPUs optimiert und kann mit 4GB RAM betrieben werden!
- Isolierte DatenspeicherungSQLite oder lokale MongoDB-Instanzen konfigurieren, um sicherzustellen, dass die Daten nicht aus dem Rahmen fallen
- SicherheitsverbesserungAktivieren Sie die Verschlüsselung des Promptverlaufs (
prompter.set_encryption_key()
) - Leistungsoptimierung: Einstellungen
ulimit -s 160000
Verhinderung von Stapelüberläufen. Die Lösung wurde für Penetrationstests in der Finanzbranche zertifiziert
Diese Antwort stammt aus dem Artikelllmware: ein Open-Source-Framework für die schnelle Erstellung von RAG-Anwendungen der UnternehmensklasseDie