Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite

Metabase AI Dataset Generator ist ein Open-Source-Tool, mit dem Benutzer schnell realistisch aussehende Datensätze für die Präsentation, das Lernen und die Datenanalyse erstellen können. Es generiert Datenstrukturen und Regeln auf der Grundlage des GPT-4o-Modells von OpenAI, kombiniert mit Faker zum Auffüllen der Daten, und unterstützt benutzerdefinierte Geschäftstypen, Datenvolumen und Schemata. Die Benutzer können eine Vorschau der Daten anzeigen, in CSV- oder SQL-Dateien exportieren oder die Daten direkt über Metabase untersuchen. Das Tool nutzt Next.js und Tailwind CSS für die Erstellung der Benutzeroberfläche, und Docker ermöglicht Entwicklern, Datenanalysten und Unternehmensanwendern eine einfache Bereitstellung von Metabase für die schnelle Erstellung von Demodaten.

 

Funktionsliste

  • Dialoggestützter Aufbau: Die Benutzer erstellen maßgeschneiderte Datensätze, indem sie den Geschäftstyp, das Datenschema und die Anzahl der Zeilen über Dropdown-Menüs auswählen.
  • Datenvorschau in Echtzeit: Sehen Sie sich die generierten Datenproben sofort in Ihrem Browser an.
  • Datenexportfunktion: Unterstützt den Export von Datensätzen in CSV-Dateien (Einzel- oder Mehrtabellen-ZIP) oder SQL-Insert-Anweisungen.
  • Ein-Klick-Start der Metabase: Stellen Sie die Metabase schnell über Docker bereit und untersuchen Sie die generierten Daten.
  • Integration mit OpenAI GPT-4o: Generieren Sie detaillierte Datenmuster und Geschäftsregeln mit KI.
  • Unterstützung für mehrsprachige Schnittstellen: Das Crowdin-Projekt bietet Unterstützung für mehrsprachige Übersetzungen.

 

Hilfe verwenden

Einbauverfahren

Um den Metabase AI Dataset Generator zu verwenden, müssen Benutzer das GitHub-Repository klonen und die Umgebung konfigurieren. Nachfolgend finden Sie die detaillierten Schritte:

  1. Klon-Lager
    Führen Sie den folgenden Befehl im Terminal aus, um das Projekt lokal zu klonen:

    git clone https://github.com/metabase/dataset-generator.git
    cd dataset-generator
    
  2. Umgebungsvariablen konfigurieren
    Kopieren Sie die Beispiel-Umgebungsdatei und fügen Sie den OpenAI-API-Schlüssel hinzu:

    cp .env.example .env.local
    

    zeigen (eine Eintrittskarte) .env.local Datei, in die Sie Ihren OpenAI-API-Schlüssel eintragen. Der Schlüssel kann heruntergeladen werden von der OpenAI-Plattform Erhalten. Ein Beispiel für den Inhalt der Datei ist unten abgebildet:

    OPENAI_API_KEY=your-api-key-here
    
  3. Installation von Abhängigkeiten
    Stellen Sie sicher, dass Node.js und Docker installiert sind. Führen Sie den folgenden Befehl aus, um die JavaScript-Abhängigkeit zu installieren:

    npm install
    
  4. Initiierung von Projekten
    Verwenden Sie den folgenden Befehl, um den Entwicklungsserver zu starten:

    npm run dev
    

    Besuchen Sie dann in Ihrem Browser http://localhost:3000 Zeigen Sie die Anwendungsschnittstelle an.

  5. Metabase starten (optional)
    Wenn Sie die Daten mit Metabase untersuchen möchten, führen Sie den folgenden Befehl aus, um den Docker-Container zu starten:

    npm run metabase:start
    

    Nachdem Sie den Start von Metabase abgewartet haben, klicken Sie in der Benutzeroberfläche auf die Schaltfläche "Metabase öffnen", um das Dashboard von Metabase aufzurufen. Wenn Sie fertig sind, führen Sie den folgenden Befehl aus, um den Docker-Container zu beenden und zu bereinigen:

    npm run metabase:stop
    

Hauptfunktionen

1. die Erstellung von Datensätzen

  • Aufrufen des Bildschirms für die EingabeaufforderungNach dem Öffnen der Anwendung zeigt die Schnittstelle einen Dialog zur Eingabeaufforderung an. Der Benutzer kann die Art des Unternehmens (z. B. Einzelhandel, Gesundheitswesen, Finanzwesen usw.), das Datenschema (z. B. einzelne oder mehrere Tabellen) und die Anzahl der Zeilen (z. B. 100 oder 1.000) auswählen.
  • Daten generierenKlicken Sie auf die Schaltfläche Datenvorschau und OpenAI GPT-4o wird aufgerufen, um das Datenschema und die Geschäftsregeln zu generieren und die spezifischen Daten mit Faker aufzufüllen. Das Ergebnis der Vorschau wird im Browser mit Feldnamen, Datentypen und Beispieldaten angezeigt.
  • AnpassungsparameterWenn die Ergebnisse der Vorschau nicht zufriedenstellend sind, kann der Benutzer zum Hint Builder zurückkehren, die Parameter anpassen und neu erstellen.

2) Datenexport

  • CSV exportierenAuf dem Vorschaubildschirm klicken Sie auf die Schaltfläche "CSV exportieren" und das System erzeugt eine einzelne CSV-Datei (einzelne Tabelle) oder eine ZIP-Datei (mehrere Tabellen). Die Datei enthält den kompletten Datensatz und eignet sich für den Import in andere Tools.
  • SQL exportierenWählen Sie die Option "SQL exportieren", um eine SQL-Einfügeanweisung für den direkten Datenbankimport zu erstellen.
  • Speichern von DateienDie exportierte Datei wird automatisch lokal heruntergeladen und der Benutzer kann den Inhalt der Datei überprüfen, um sicherzustellen, dass die Daten den Anforderungen entsprechen.

3. die Erforschung von Daten

  • Metabase startenKlicken Sie in der Anwendungsschnittstelle auf "Metabase starten", und Docker stellt automatisch die Metabase-Umgebung bereit. Klicken Sie nach dem Start auf "Metabase öffnen", um die Datenanalyseoberfläche aufzurufen.
  • Visualisierung der DatenMetabase bietet intuitive Dashboard-Funktionen, mit denen Benutzer Diagramme erstellen, Daten filtern oder komplexe Abfragen erstellen können. Für die Bedienung sind keine SQL-Kenntnisse erforderlich, so dass sie sich auch für technisch nicht versierte Benutzer eignet.
  • Metabasis anhaltenWenn die Analyse abgeschlossen ist, klicken Sie auf "Stop Metabase", um den Docker-Container zu löschen und Systemressourcen freizugeben.

Ausgewählte Funktionen

  • KI-gesteuerte DatengenerierungDas Tool nutzt GPT-4o zur Generierung komplexer Datenschemata, einschließlich Feldbeziehungen, Geschäftsregeln und Ereignislogik. Bei der Generierung von Einzelhandelsdaten definiert AI beispielsweise automatisch Beziehungen zwischen Bestell-, Kunden- und Produkttabellen und stellt so sicher, dass die Daten authentisch und konsistent sind.
  • Vorschau in EchtzeitBenutzer können Datenproben ohne Wartezeit einsehen und schnell überprüfen, ob die generierten Ergebnisse den Erwartungen entsprechen.
  • Nahtlose Metabase-IntegrationDie Metabase lässt sich mit einem Klick starten und ermöglicht die Analyse von Daten ohne zusätzliche Konfiguration, was sie ideal für schnelle Präsentationen oder Unterrichtsszenarien macht.
  • Flexibler ExportCSV- und SQL-Formate werden unterstützt, um den Anforderungen verschiedener Benutzer gerecht zu werden, wie z. B. Entwickler für Datenbankpopulationen und Analysten für Excel-Analysen.

caveat

  • Stellen Sie eine stabile Netzwerkverbindung sicher, die für OpenAI-API-Aufrufe und Docker-Bereitstellungen erforderlich ist.
  • Überprüfen Sie, ob der OpenAI-API-Schlüssel gültig ist, andernfalls schlägt die Datengenerierung fehl.
  • Docker muss vorinstalliert und konfiguriert sein, sonst kann Metabase nicht gestartet werden.

 

Anwendungsszenario

  1. Lehre und Ausbildung
    Lehrkräfte oder Ausbilder können mit dem Dataset Builder benutzerdefinierte Datensätze erstellen, die reale Geschäftsszenarien simulieren, damit die Schüler Datenanalyse und -visualisierung lernen. Generieren Sie zum Beispiel Einzelhandelsdaten für den SQL-Unterricht.
  2. Produkt-Demo
    Entwickler oder Unternehmen können in Produktdemos schnell realistische Datensätze generieren, um die Fähigkeiten von Datenanalysetools zu zeigen, ohne Daten manuell vorbereiten zu müssen.
  3. Prototyp der Datenanalyse
    Datenanalysten können die generierten Datensätze nutzen, um analytische Modelle in einem frühen Stadium des Projekts zu testen, um Hypothesen zu validieren und Zeit für die Erfassung von Echtdaten zu sparen.
  4. Software-Entwicklung Testen
    Entwickler können Testdatenbanken mit generierten SQL-Daten bestücken, um Produktionsumgebungen zu simulieren und die Leistung und Funktionalität von Anwendungen zu testen.

 

QA

  1. Muss ich für die Nutzung bezahlen?
    Das Tool ist quelloffen und kann kostenlos genutzt werden. Es erfordert jedoch einen OpenAI-API-Schlüssel und es können je nach Nutzung API-Aufrufgebühren anfallen.
  2. Welche Geschäftsarten werden unterstützt?
    Es werden mehrere Geschäftsarten unterstützt, darunter Einzelhandel, Gesundheitswesen, Finanzen, Logistik und mehr. Die Benutzer können auch andere Szenarien über den Prompt Builder anpassen.
  3. Wie stellen Sie sicher, dass die generierten Daten authentisch sind?
    Das von GPT-4o generierte Schema basiert auf echten Geschäftsregeln, und die von Faker befüllten Daten folgen diesen Regeln, wodurch sichergestellt wird, dass die Daten logisch konsistent und realitätsnah sind.
  4. Was soll ich tun, wenn die Metabase nicht gestartet werden kann?
    Überprüfen Sie, ob Docker installiert ist und ordnungsgemäß läuft und ob Ihre Netzwerkverbindung funktioniert. Wenn das Problem weiterhin besteht, prüfen Sie die Terminalprotokolle oder melden Sie einen Fehler im GitHub-Repository.
  5. Kann es offline verwendet werden?
    Die Datengenerierung erfordert Aufrufe der OpenAI-API und muss mit dem Internet verbunden sein, während die Metabasis- und Exportfunktionen lokal ausgeführt werden können, aber vorkonfigurierte Umgebungen erfordern.
0Lesezeichen
0Gelobt

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

Posteingang

Kontakt

zurück zum Anfang

de_DEDeutsch