Folgende Punkte sollten bei der Verwendung von OpenSearch-SQL beachtet werden:
1. die Strategie der Modellauswahl::
Für den lokalen Betrieb ist kein Netzwerk erforderlich, aber wenn Online-Modellierungsfunktionen wie GPT-4 benötigt werden, muss dassrc/runner/config.pyin dem der API-Schlüssel korrekt konfiguriert ist, und beachten Sie die Kosten für den Token-Verbrauch.
2. die Spezifikationen für die Datenaufbereitung::
Die Definitionen der Tabellenstrukturen müssen dem BIRD-Benchmarking-Standard entsprechen (ReferenzBird/bird_dev.json), die eine vollständige Beschreibung der Spaltennamen, Datentypen und Fremdschlüsselbeziehungen enthält. Bei privaten Datenbanken empfiehlt es sich, zunächst die Schemabeschreibungsdatei zu exportieren.
3. die Mechanismen zur Fehlerbehandlung::
- Wenn die generierte SQL-Ausführung einen Fehler meldet, prüfen Sie die
src/runner/database_manager.pyDer Protokollpfad in der Datei - Bei komplexen Abfragen wird empfohlen, diese in der
questions.jsonFügen Sie 5-10 ähnliche Beispiele zu - Aktivieren Sie diese Option, wenn bei JOIN-Operationen häufig Fehler auftreten.
_set_pathsDebug-Modus in der
Leistungstipp: Empfohlen für die Vorverarbeitungsphase bei Batch-Abfragenrun_preprocess.sh --batch_size 32Erhöhung des Durchsatzes.
Diese Antwort stammt aus dem ArtikelOpenSearch-SQL: Ein Open-Source-Tool zur Umwandlung natürlicher Sprache in SQL-AbfragenDie




























