Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite

Flüstern App ist ein kostenloses und quelloffenes Tool, das es Nutzern ermöglicht, Notizen per Sprache aufzunehmen und mithilfe von KI-Technologie in Text umzuwandeln, um Inhalte wie Listen, Blogs oder Aufgaben zu erstellen. Das Projekt wird von Nutlope entwickelt, auf GitHub gehostet und basiert auf dem GemeinsamDie Whisper- und Llama-Modelle von ai ermöglichen eine effiziente Transkription und Textverarbeitung. Die Whisper-App ist einfach zu bedienen, mit einer intuitiven Schnittstelle für Benutzer, die schnell Inhalte aufnehmen und organisieren möchten. Der Code ist vollständig quelloffen und kann von den Nutzern frei eingesetzt werden, und die Daten werden lokal gespeichert, wobei der Schutz der Privatsphäre im Vordergrund steht.

 

Funktionsliste

  • Sprachaufnahme und Transkription: Nehmen Sie Sprache über das Mikrofon auf und wandeln Sie sie schnell in Text um.
  • AI Text Organiser: Konvertiert transkribierten Text in eine Liste, einen Blog oder eine Aufgabenliste.
  • Mehrsprachige Unterstützung: unterstützt die Sprachtranskription in mehreren Sprachen, z. B. Englisch und Chinesisch.
  • Lokale Speicherung: Aufnahmen und Texte werden zum Schutz der Privatsphäre auf dem Gerät des Nutzers gespeichert.
  • Open-Source-Bereitstellung: Bietet vollständigen Code zur Unterstützung der lokalen oder Cloud-Bereitstellung.
  • Integration von Drittanbieterdiensten: Kombination von Together.ai und Convex zur Verbesserung der KI- und Datenbankleistung.
  • Benutzerdefinierte Ausgabe: Unterstützung für die Anpassung der Textformatierung, z. B. Listenstile oder Blogstrukturen.

Hilfe verwenden

Einbauverfahren

Um die Whisper App zu verwenden, müssen die Nutzer das Projekt lokal oder in der Cloud bereitstellen. Nachfolgend finden Sie die detaillierten Schritte:

  1. Projektcode klonen
    Führen Sie den folgenden Befehl im Terminal aus, um den Code der Whisper-App zu erhalten:

    git clone https://github.com/Nutlope/whisper.git
    

    Rufen Sie den Projektkatalog auf:

    cd whisper
    
  2. Installation von Abhängigkeiten
    Stellen Sie sicher, dass Node.js installiert ist (neueste LTS-Version empfohlen). Führen Sie den folgenden Befehl aus, um die Abhängigkeiten zu installieren:

    npm install
    

    Dadurch werden die erforderlichen Pakete wie Next.js, Vercel AI SDK usw. installiert.

  3. Umgebungsvariablen konfigurieren
    Whisper App verwendet Clerk für die Authentifizierung und Convex für die Datenbankunterstützung. Die Konfigurationsschritte sind wie folgt:

    • Registrieren Sie sich für ein Clerk-Konto (https://clerk.com), erhalten CLERK_SECRET_KEY im Gesang antworten NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY.
    • Erstellen Sie im Stammverzeichnis des Projekts die Datei .env.local Datei, hinzufügen:
      CLERK_SECRET_KEY=your_clerk_secret_key
      NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY=your_clerk_publishable_key
      
    • Anmeldung Konvex (https://convex.dev), erstellen Sie das Projekt, rufen Sie CLERK_ISSUER_URL(z.B.. https://some-animal-123.clerk.accounts.dev).
    • In konvexes Armaturenbrett einfügen CLERK_ISSUER_URLKlicken Sie auf "Speichern".
  4. Laufende Projekte
    Sobald die Konfiguration abgeschlossen ist, starten Sie den Entwicklungsserver:

    npm run dev
    

    Das Projekt läuft unter http://localhost:3000. Öffnen Sie einfach Ihren Browser und besuchen Sie uns.

Verwendung

Die Whisper App hat eine einfache Benutzeroberfläche, die sich für einen schnellen Einstieg eignet. Nachfolgend finden Sie eine Übersicht über die wichtigsten Funktionen:

1. die Aufnahme und Transkription

  • Besuchen Sie die Whisper-App-Seite und melden Sie sich mit Clerk bei Ihrem Konto an.
  • Klicken Sie auf die Schaltfläche "Aufnehmen", um den Zugriff auf das Browser-Mikrofon zu erlauben.
  • Starten Sie die Aufnahme und klicken Sie auf "Stopp", wenn Sie fertig sind. Es wird empfohlen, nicht mehr als 5 Minuten am Stück aufzunehmen, um eine genaue Transkription zu gewährleisten.
  • Das System wandelt die Sprache mit dem Whisper-Modell von Together.ai in Text um, und das Ergebnis wird auf der Seite angezeigt.

2. die Textsortierung

  • Sobald die Transkription abgeschlossen ist, wählen Sie das Ausgabeformat (z. B. Liste, Blog, Aufgabenliste).
  • Wenn Sie "Liste" wählen, wird eine Liste von Einträgen erstellt; wenn Sie "Blog" wählen, werden diese in Beiträge mit Titeln gegliedert.
  • Die Nutzer können den Text bearbeiten, den Inhalt anpassen oder Details hinzufügen.
  • Klicken Sie auf Speichern, um die Ergebnisse in Ihrer lokalen IndexedDB-Datenbank zu speichern.

3. die Anpassung und Optimierung

  • Passen Sie auf dem Bildschirm Einstellungen die Ausgabeformatierung an, z. B. die Aufzählungspunkte der Liste oder den Absatzstil des Blogs.
  • Unterstützung der Textoptimierung durch Llama-Modelle, z.B. zur Grammatikkorrektur oder Übersetzung von Sprachen.
  • Die Zielsprache (z.B. Chinesisch, Englisch) kann in den Einstellungen für die Transkription oder Übersetzung ausgewählt werden.

4 Datenverwaltung und Datenschutz

  • Die Whisper App speichert Aufnahmen und Texte standardmäßig lokal in IndexedDB und lädt sie nicht in die Cloud hoch.
  • So löschen Sie die Daten: Löschen Sie IndexedDB in den Entwicklertools Ihres Browsers, oder löschen Sie den lokalen Pfad. %APPDATA%\..\Local\com.bradenwong.whispering(Windows).
  • Für den Transkriptionsprozess ist eine Verbindung zu Together.ai erforderlich. Es wird daher empfohlen, ein stabiles Netzwerk zu gewährleisten.

caveat

  • Für den Zugriff auf die Dienste von Together.ai und Convex ist eine stabile Internetverbindung erforderlich.
  • Wenn das Mikrofon nicht funktioniert, überprüfen Sie die Systemberechtigungen (Windows: Einstellungen > Datenschutz > Mikrofon; Mac: Systemeinstellungen > Sicherheit & Datenschutz > Mikrofon).
  • Projekte, die auf externe APIs angewiesen sind, müssen den Status der kostenlosen Credits oder des Abonnements von Together.ai überprüfen.
  • Bei der erstmaligen Bereitstellung kann es erforderlich sein, die Umgebungsvariablen zu debuggen, weshalb wir empfehlen, die GitHub-Dokumentation zu Rate zu ziehen.

Anwendungsszenario

  1. Zusammenstellung der Sitzungsunterlagen
    Benutzer zeichnen Diskussionen in Besprechungen auf, und die Whisper App erstellt schnell Protokolle oder Aufgabenlisten für die Zusammenarbeit im Team.
  2. Aufzeichnung von Studiennotizen
    Die Schüler nehmen Audiodateien von Klassen oder Vorlesungen auf, die von der Whisper App in strukturierte Notizen umgewandelt werden, um die Wiederholung und Organisation zu erleichtern.
  3. Erstellung von Blog-Inhalten
    Die Autoren von Inhalten geben ihre Inspirationen per Stimme ein, und die Whisper App fasst sie zu Artikelentwürfen zusammen, um die Effizienz beim Schreiben zu verbessern.
  4. Individuelle Einsatzplanung
    Die Benutzer nehmen täglich eine Aufgabe auf, die von der Whisper App in eine Aufgabenliste umgewandelt wird, um das Zeitmanagement zu erleichtern.

QA

  1. Welche Sprachen unterstützt die Whisper App?
    Es basiert auf dem Whisper-Modell von Together.ai und unterstützt Englisch, Chinesisch, Spanisch und andere Sprachen. Eine detaillierte Liste der unterstützten Sprachen finden Sie auf der Website von Together.ai.
  2. Muss ich für die Nutzung der Whisper App bezahlen?
    Die Whisper App ist kostenlos und quelloffen. Für externe Dienste (z. B. Together.ai, Convex) können je nach Nutzung Gebühren anfallen.
  3. Wie wird der Datenschutz gewährleistet?
    Die Aufnahmen und der transkribierte Text werden lokal in der IndexedDB gespeichert, und die Audiodaten werden nur zur Transkription an Together.ai gesendet, ohne dass weitere Daten auf dem Server gespeichert werden.
  4. Welche technische Grundlage ist für den Einsatz erforderlich?
    Grundlegende Kenntnisse von Node.js und Kommandozeilenoperationen sind ausreichend, und die GitHub-Dokumentation bietet detaillierte Anweisungen für Anfänger.
0Lesezeichen
0Gelobt

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

Posteingang

Kontakt

zurück zum Anfang

de_DEDeutsch