Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite

FLUX.1 Krea [dev] ist ein Open-Source-Tool zur Bilderzeugung, das von Black Forest Labs in Zusammenarbeit mit Krea AI entwickelt und auf der Hugging Face-Plattform gehostet wird. Es basiert auf einem gleichgerichteten Fluss von 12 Milliarden Parametern Transformator Ein Modell, das hochrealistische Bilder aus Textbeschreibungen erzeugt. Das Modell konzentriert sich auf die Verbesserung der Bildästhetik, die Lösung des allgemeinen "AI Generation Sense"-Problems und die Erzeugung natürlicher, detaillierter Bilder für Künstler, Entwickler und Forscher. Das Modell ist für die nicht-kommerzielle Nutzung freigegeben und bietet die Integration der Comfy UI- und Diffusoren-Bibliothek für den lokalen Einsatz und die individuelle Entwicklung.

 

Funktionsliste

  • Text zu Bild: Geben Sie Textbeschreibungen ein, um hochauflösende, realistische Bilder zu erzeugen.
  • Ästhetische Optimierung: Der Schwerpunkt liegt auf der Erzeugung natürlicher, detaillierter Bilder im fotografischen Stil, wobei das "KI-Gefühl" vermieden wird.
  • Open-Source-Gewichte: Bereitstellung offener Modellgewichte zur Unterstützung der kundenspezifischen Entwicklung für Forschung und nichtkommerzielle Nutzung.
  • Effiziente Inferenz: Optimiert durch geführte Destillationstechniken für schnelle Inferenz und geringen Ressourcenverbrauch.
  • Multiplattform-Unterstützung: Kompatibel mit Comfy UI und Diffuser-Bibliotheken für die lokale oder Cloud-Bereitstellung.
  • Sicherheitsfilterung: Integrierter Filtermechanismus zur Verringerung des Risikos, dass ungeeignete Inhalte erstellt werden.

Hilfe verwenden

Installation und Nutzung

FLUX.1 Krea [dev] kann auf verschiedene Arten genutzt werden, z. B. lokal oder online. Nachfolgend finden Sie eine ausführliche Anleitung zur Installation und zum Betrieb.

1. lokaler Einsatz (unter Verwendung der Diffuser-Bibliothek)

FLUX.1 Krea [dev] kann über die Diffuser-Bibliothek von Python ausgeführt werden. Hier sind die Installationsschritte:

  • Installation von AbhängigkeitenStellen Sie sicher, dass Python 3.8+ und PyTorch auf Ihrem System installiert sind; GPU-Beschleunigung wird empfohlen und CUDA-fähiges PyTorch ist erforderlich.
    pip install torch diffusers
    
  • Modelle laden: Verwenden Sie den folgenden Code, um das Modell FLUX.1 Krea [dev] zu laden und ein Bild zu erzeugen:
    import torch
    from diffusers import FluxPipeline
    # 初始化管道
    pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-Krea-dev", torch_dtype=torch.bfloat16)
    pipe.enable_model_cpu_offload()  # 若 GPU 显存不足,启用 CPU 卸载
    # 输入文本提示
    prompt = "一只猫举着写有‘你好世界’的标牌"
    image = pipe(
    prompt,
    height=1024,
    width=1024,
    guidance_scale=4.5,
    ).images[0]
    # 保存生成图像
    image.save("flux-krea-dev.png")
    

    Parameter Beschreibung:

    • height im Gesang antworten widthLegen Sie die Auflösung des Ausgabebildes fest, empfohlen wird 1024 x 1024.
    • guidance_scaleSteuert den Grad der Befolgung der Textaufforderungen und reicht von 0 bis 10, mit einer Empfehlung von 4,5.
    • torch_dtype=torch.bfloat16Halbgenaue Gleitkommazahlen verwenden, um den Grafikspeicherverbrauch zu reduzieren.
  • BetriebsumgebungEs wird empfohlen, einen Grafikprozessor mit mindestens 12 GB RAM zu verwenden, aber wenn Sie nicht genug haben, können Sie die Option enable_model_cpu_offload()aber die Geschwindigkeit des Denkens wird reduziert.

2. mit Comfy UI

Comfy UI ist ein knotenbasiertes Workflow-Tool zur lokalen Ausführung von FLUX.1 Krea [dev].

  • Download Modellgewichte: Heruntergeladen vom Hugging Face Repository https://huggingface.co/black-forest-labs/FLUX.1-Krea-dev *.safetensors Dokumentation.
  • Konfigurieren der Comfy UI::
    1. Installieren Sie Comfy UI (siehe das offizielle GitHub-Repository https://github.com/comfyanonymous/ComfyUI).
    2. Hinzufügen der heruntergeladenen *.safetensors Datei in das Modellverzeichnis von Comfy UI (normalerweise das models/checkpoints).
    3. Laden Sie in der Comfy UI-Schnittstelle den Knoten FLUX.1 Krea [dev] und stellen Sie die Textaufforderungen und Parameter ein.
  • Bilder generierenStellen Sie Parameter wie Cue-Word, Auflösung usw. über Knotenverbindungen ein und klicken Sie auf Ausführen, um das Bild zu erzeugen.

3. online Erfahrung

Eine lokale Bereitstellung ist nicht erforderlich und kann über Hugging Face Space oder Partnerplattformen (z. B. Replicate, FAL) erfolgen:

  • Besuchen Sie https://huggingface.co/spaces/black-forest-labs/FLUX.1-Krea-Dev.
  • Geben Sie eine Textaufforderung ein, passen Sie die Auflösung oder den Stil an und klicken Sie auf Generieren.
  • Laden Sie das erzeugte Bild herunter.

Hauptfunktionen

Text zu Bild

Die Kernfunktion von FLUX.1 Krea [dev] ist es, Bilder aus Text zu generieren. Nachfolgend sind die wichtigsten Punkte der Funktionsweise aufgeführt:

  • Vorbereitung der StichwörterSeien Sie klar und spezifisch in Ihren Aufforderungen, z. B. "Ein Mädchen in einem blauen Pullover geht in einem Herbstwald spazieren, in dem die Sonne auf die Blätter scheint". Vermeiden Sie vage Beschreibungen wie "schöne Bilder".
  • Anpassungsparameter::
    • Auflösung: 1024 x 1024 empfohlen für die meisten Szenarien.
    • Guidance_scale: steuert die Anpassung des Bildes an den Hinweis, 4,5 ist der Standardwert, erhöhen Sie ihn, um die Anpassung zu verbessern, aber ein zu hoher Wert kann zu Bildverzerrungen führen.
  • Ergebnisse generierenNach der Erstellung kann es im PNG-Format gespeichert werden und eignet sich zur weiteren Bearbeitung oder Weitergabe.

Ästhetische Optimierung

FLUX.1 Krea [dev] ist auf die Erstellung von Bildern im fotografischen Stil mit den folgenden Merkmalen spezialisiert:

  • Natürliche DetailsErzeugt Bilder, die keine überbelichteten Glanzlichter oder verzerrte Farben aufweisen und somit einen realistischen Eindruck vermitteln.
  • StilkontrolleSie können einen Stil mit Hilfe von Stichworten wie "Filmisch" und "Vintage-Fotografie" festlegen. Zum Beispiel erzeugt das Stichwort "Stadtstraßen bei Nacht, Neonlicht, Filmstil" Bilder mit Filmcharakter.
  • Die Vermeidung des "AI-Sinns"Modelle werden ästhetisch trainiert, um die stereotypen Spuren gängiger KI-Bilder, wie unnatürliche Texturen oder Beleuchtung, zu reduzieren.

Sicherheitskontrolle

Um die Erstellung unangemessener Inhalte zu verhindern, verfügt das Modell über integrierte Filtermechanismen:

  • Filter vor dem Training: NSFW und illegale Inhalte wurden aus den Trainingsdaten entfernt.
  • Optimierung der NachschulungVerringern Sie das Risiko, verbotene Inhalte zu generieren, durch Feinabstimmung.
  • Empfehlungen für die VerwendungBenutzer sollten es vermeiden, Aufforderungswörter einzugeben, die unangemessene Inhalte auslösen könnten, wie z. B. gewalttätige oder pornografische Beschreibungen.

caveat

  • nichtkommerzielle NutzungBilder dürfen nur für den persönlichen Gebrauch, zu Forschungszwecken oder für gemeinnützige Zwecke im Rahmen der FluxDev Non-Commercial Licence verwendet werden. Für die kommerzielle Nutzung ist eine Lizenz erforderlich, die bei Black Forest Labs zu beantragen ist. [](https://huggingface.co/black-forest-labs/FLUX.1-Krea-dev)
  • Hardware-VoraussetzungFür den lokalen Betrieb sind leistungsstarke GPUs erforderlich, empfohlen werden NVIDIA A100 oder RTX 3090.
  • SchlagworttechnikEnglischsprachige Aufforderungen sind effektiver und es wird empfohlen, eine detaillierte Beschreibung in Kombination mit stilistischen Schlüsselwörtern zu verwenden.

Anwendungsszenario

  1. Kunst
    Künstler können durch die Eingabe von Textbeschreibungen inspirierende Skizzen oder endgültige Kunstwerke erstellen. Geben Sie z. B. "Zukunftsstadt, himmelwärts schwebendes Gebäude, Cyberpunk-Stil" ein, um einen konzeptionellen Entwurf zu erstellen und so Zeit bei der Vorkomposition zu sparen.
  2. akademische Forschung
    Forscher können offene Gewichte zur Feinabstimmung des Modells oder zur Analyse verwenden, um die Leistungsgrenzen des generierten Modells zu erkunden. Zum Beispiel, um die Wirkung verschiedener Cue-Wörter auf die Bildqualität zu testen.
  3. Bildung und Ausbildung
    Lehrer können FLUX.1 Krea [dev] verwenden, um die Prinzipien der KI-Bilderzeugung zu demonstrieren und den Schülern zu helfen, Deep-Learning-Anwendungen zu verstehen. Über die Online-Plattform können die SchülerInnen die Erzeugung von Bildern ausprobieren und etwas über das Design von Schlagwörtern lernen.
  4. Erstellung von Inhalten
    Ersteller von Inhalten können Blog-Grafiken oder Material für soziale Medien erstellen. Geben Sie zum Beispiel "tropischer Strand, Sonnenuntergang, Kokospalme" ein, um ein hochwertiges Hintergrundbild zu generieren.

QA

  1. Ist FLUX.1 Krea [dev] kostenlos?
    Ja, Modellgewichte sind frei und offen und werden bei Hugging Face für die nicht-kommerzielle Nutzung gehostet. Für die kommerzielle Nutzung ist eine Lizenz erforderlich.
  2. Wie lässt sich die Qualität der erzeugten Bilder verbessern?
    Verwenden Sie detaillierte Hinweise, um Stile und Details festzulegen, z. B. "Wald bei Nacht, Mondlicht auf dem See, realistische Fotografie". Anpassungen guidance_scale zwischen 4,5 und 6, um Qualität und Passform in Einklang zu bringen.
  3. Welche Sprachen werden für Stichwortwörter unterstützt?
    Unterstützt hauptsächlich englische Eingabeaufforderungen, chinesische Eingabeaufforderungen können etwas weniger effektiv sein. Es wird empfohlen, sie ins Englische zu übersetzen und einzugeben.
  4. Wie lange dauert es, ein Bild zu erstellen?
    Es dauert etwa 10-20 Sekunden, um ein 1024×1024 großes Bild mit einer GPU (z. B. RTX 3090) zu erzeugen, und kann im CPU-Offload-Modus 1-2 Minuten dauern.
0Lesezeichen
0Gelobt

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang

de_DEDeutsch