Ein typischer Prozess zur Erzeugung synthetischer Daten sieht wie folgt aus (am Beispiel der Erstellung einer virtuellen Kunden-E-Mail):
- Generierung von Basisdaten::
- Geben Sie die Aufforderung "Erstelle Lebensläufe von 5 Fachleuten aus der Pharmaindustrie" in das leere Formular ein.
- AI erstellt automatisch Tabellen mit Spalten für Name, Position, Fachwissen usw.
- Erweiterte Datenspalten::
- Fügen Sie eine neue Spalte hinzu und geben Sie die Aufforderung "Schreiben Sie professionelle Geschäfts-E-Mails auf der Grundlage von {{person_bio}}" ein.
- Wählen Sie ein Kreativmodell (z. B. GPT-OSS) zur Erstellung von E-Mail-Inhalten
- Qualitätskontrolle::
- Prüfen Sie, ob die E-Mail-Formatierung eingehalten wird
- Ziehen Sie den unteren Rand der Spalte, um mehr Proben zu erzeugen (bis zu 1000 Zeilen)
- Batch-Export::
- Exportieren des Datensatzes und der Datei config.yml
- Skalierung auf Zehntausende von Daten mit HF Jobs Run Scripts
Die Methode ist besonders geeignet:
- Datenschutzsensible Szenarien (vermeiden Sie die Verwendung echter Kundendaten)
- Modell Trainingsdaten Erweiterung
- Geschäftsprozess-Simulationstest
Diese Antwort stammt aus dem ArtikelAI Sheets: Erstellung und Verarbeitung von Datensätzen mit AI-Modellen in Tabellen ohne CodeDie