Technische Anwendungsspezifikationen für Textwarnungen
Das Text-Prompting-System von MultiTalk verwendet eine einzigartige Szenenbeschreibungssprache (Scene Description Language, SDL), die drei Ebenen enthält:
- BasisschichtRollenbeziehungen definieren (z. B. "Arzt spricht mit Patient")
- Szenenebene:: Beschreiben Sie Einzelheiten des Schauplatzes (z. B. "in einem Krankenhausflur mit Krankenschwestern, die im Hintergrund laufen").
- VerhaltensebeneDie Aktionen werden zugewiesen (z. B. "Arzt zeigt auf Röntgenfilm, Patient nickt").
Bewährte Praktiken zeigen:
- Kombinierte Hinweise sind 47% wirksamer als einzelne Befehle (z. B. "Kaffeehaus + zwei streitende Personen + gelegentliches Überprüfen des Mobiltelefons")
- Das Hinzufügen von Emotionsbezeichnungen erhöht die Natürlichkeit der Handlung um 351 TP3T (z. B. "[wütend] Warum sind Sie zu spät? [Lächelt] Wegen des Staus")
- Vermeiden Sie lange Sätze mit mehr als 20 Token; eine durch Semikolon getrennte Mehrphrasenstruktur ist effektiver
Typische Beispiele:
"Konferenzraum; drei Personen, die abwechselnd sprechen; CEO steht und zeigt auf ein Diagramm; CTO bedient Laptop; Nachtansicht der Stadt im Hintergrund".
Diese Antwort stammt aus dem ArtikelMultiTalk: ein audiogestütztes Tool zur Erstellung von Videos von Gesprächen mit mehreren PersonenDie































