Das Qualitätsbewertungssystem von Promptfoo verwendet eine testgetriebene Entwicklungsmethodik mit einem umfangreichen Workflow:
- Die Entwickler beginnen mit der Definition der wichtigsten Anwendungsfälle und möglicher Fehlerarten.
- Bereiten Sie einen repräsentativen Satz von Prompts und Testfällen vor.
- Festlegung von Prompts, Variablen und API-Anbietern zum Testen über YAML-Konfigurationsdatei
- ausnutzen
promptfoo evaluateBewertung der Auftragsausführung
Die Bewertung konzentriert sich auf die folgenden Dimensionen:
- AntwortgenauigkeitOb die Modellleistung den Erwartungen entspricht
- KonsistenzOb die gleiche Eingabe eine stabile Ausgabe erzeugt
- SicherheitOb sie schädliche oder voreingenommene Inhalte produziert
- Leistung:: Beinhaltet Antwortzeit und Ressourcenverbrauch
- PraktikabilitätVerwendbarkeit der Ergebnisse in realen Szenarien
Die Auswertungsergebnisse können visuell in einer Web-UI angezeigt oder in ein strukturiertes Format zur weiteren Analyse exportiert werden. Entwickler können diese Daten nutzen, um das Modell und die Cueing-Strategie auszuwählen, die für ihren Anwendungsfall am besten geeignet sind.
Diese Antwort stammt aus dem ArtikelPromptfoo: Ein sicheres und zuverlässiges Werkzeug zum Testen von LLM-AnwendungenDie































