BreezeApp ist eine von MediaTek Research entwickelte mobile KI-App für Android- und iOS-Plattformen. Ihre Hauptfunktion besteht darin, den Nutzern zu ermöglichen, Large Language Models (LLMs) auf ihren Mobiltelefonen auszuführen und eine breite Palette von KI-Funktionen zu nutzen, ohne dass eine Internetverbindung erforderlich ist. BreezeApp unterstützt Sprache-zu-Text, Text-zu-Sprache, Text-Chatbot und Bild-Q&A und verwendet standardmäßig die Modelle der Breeze 2-Serie von MediaTek Creative Base, kann aber auch zu anderen Modellen wie Llama 3.2 wechseln. KI-Modelle frei zu wählen und Entwicklern die Erstellung mobiler KI-Anwendungen zu erleichtern.
Funktionsliste
- Offline AI-VerarbeitungAlle KI-Funktionen werden lokal auf dem Telefon ausgeführt, um die Privatsphäre des Benutzers zu schützen.
- Sprache-zu-TextKonvertiert die Sprache des Benutzers in Echtzeit in Text und unterstützt mehrere Sprachszenarien.
- Text-to-SpeechUmwandlung von Text in natürliche Sprache mit Unterstützung für individuelle Sprachstile.
- Text-ChatbotBietet intelligente Dialogfunktionen auf der Grundlage eines umfangreichen Sprachmodells, das Aufgaben wie Fragen und Antworten und Zusammenfassungen bewältigen kann.
- Bild Q&ABenutzer laden Bilder hoch und die App beantwortet bildbezogene Fragen, die für die visuelle Inhaltsanalyse geeignet sind.
- ModellwechselUnterstützung für den Wechsel zwischen verschiedenen großen Sprachmodellen wie Breeze 2 oder Llama 3.2.
- Modell DownloadAutomatische Aufforderung zum Herunterladen des erforderlichen AI-Modells beim ersten Start, um den Konfigurationsprozess zu vereinfachen.
Hilfe verwenden
Einbauverfahren
BreezeApp kann aus dem App Store oder dem Google Play Store heruntergeladen werden und die Installation ist einfach und unkompliziert. Nachfolgend finden Sie die detaillierten Schritte:
- Apps herunterladen::
- Öffnen Sie den App Store (iOS) oder den Google Play Store (Android) auf Ihrem Telefon.
- Suchen Sie nach "BreezeApp", um die von MediaTek Research veröffentlichte App zu finden.
- Klicken Sie auf "Installieren" und warten Sie, bis der Download abgeschlossen ist. Die Größe der Anwendung hängt vom Gerät und Modell ab und erfordert etwa 500 MB bis 2 GB Speicherplatz.
- Ersteinführung und Modell-Download::
- Öffnen Sie die BreezeApp, und beim ersten Start werden Sie aufgefordert, die Standardmodelle der Breeze 2-Serie herunterzuladen.
- Stellen Sie sicher, dass Ihr Gerät über genügend Speicherplatz und ein stabiles Netzwerk verfügt (eine Internetverbindung ist nur für den ersten Download erforderlich).
- Sobald der Download abgeschlossen ist, konfiguriert die App das Modell automatisch, ohne dass es manuell eingerichtet werden muss.
- Modelle schalten (optional)::
- Wenn Sie ein anderes Modell (z. B. Llama 3.2) verwenden möchten, gehen Sie zu Anwendungseinstellungen.
- Wählen Sie "Modellverwaltung" und folgen Sie den Anweisungen, um das gewünschte Modell herunterzuladen und zu wechseln.
- Details zum Umstieg finden Sie im offiziellen GitHub-Repository.
<README.md>
Dokumentation, die detaillierte Installationsanweisungen enthält.
Funktion Betriebsablauf
1. in Text umgewandelte Sprache
- Verfahren::
- Öffnen Sie die BreezeApp und rufen Sie das Modul "Speech to Text" auf.
- Klicken Sie auf das Mikrofonsymbol, um die Aufnahme zu starten. Versuchen Sie, die Umgebung während der Aufnahme so ruhig wie möglich zu halten.
- Sobald die Aufnahme abgeschlossen ist, wandelt die App die Stimme automatisch in Text um und zeigt ihn auf dem Bildschirm an.
- Unterstützung für die Bearbeitung von Text oder dessen Export in andere Anwendungen (z. B. Notes oder Mail).
- caveat::
- Unterstützt Taiwanesisch-Mandarin, Mandarin und gemischte Chinesisch/Englisch-Szenarien für mehrsprachige Umgebungen.
- Im Offline-Modus hängen Geschwindigkeit und Genauigkeit der Spracherkennung von der Geräteleistung ab.
2. text-to-speech
- Verfahren::
- Rufen Sie das Modul "Text-to-Speech" auf und geben Sie den zu konvertierenden Text ein oder fügen Sie ihn ein.
- Wählen Sie einen Sprachstil (z. B. männlich, weiblich) oder laden Sie ein individuelles Sprachmuster hoch.
- Klicken Sie auf die Schaltfläche "Erzeugen", und die App wandelt den Text in Sprache um und spielt ihn ab.
- Audiodateien können gespeichert oder für andere Anwendungen freigegeben werden.
- Erweiterte Funktionen::
- Unterstützung für die Anpassung der Geschwindigkeit und Tonhöhe der Sprache, geeignet für die Produktion von Podcasts oder Hörbüchern.
- Beratung
<BreezyVoice>
Anweisungen zum Einrichten von Sprachsamples im Repository zur Optimierung der Ausgabe.
3. textbasierte Chatbots
- Verfahren::
- Öffnen Sie das Chat-Modul und geben Sie eine Frage oder einen Dialog ein.
- Die Anwendung generiert Antworten auf der Grundlage des lokalen großen Sprachmodells und unterstützt mehrere Dialogrunden.
- Kann für Quizfragen, Textzusammenfassungen oder die Erstellung kreativer Inhalte verwendet werden.
- Charakterisierung::
- Unterstützt traditionelles Chinesisch, geeignet für Benutzer aus Taiwan und Hongkong.
- Bewältigung komplexer Aufgaben wie die Zusammenfassung von Dokumenten oder das Schließen von Schlussfolgerungen in mehreren Runden.
4. ein Image-Quiz
- Verfahren::
- Gehen Sie zum Modul "Bild-Quiz" und klicken Sie auf die Schaltfläche "Bild hochladen".
- Wählen Sie Bilder aus einem Album aus oder nehmen Sie sie direkt auf.
- Geben Sie eine Frage zum Bild ein, und die App wird das Bild analysieren und eine Antwort generieren.
- Anwendungsszenario::
- Ideal zum Erkennen von Gegenständen, Beschreiben von Szenen oder Beantworten von Fragen zu Details auf Bildern.
- Laden Sie z. B. ein Reisefoto hoch und fragen Sie: "Was ist das Gebäude auf dem Foto?". .
5. modellhafte Vermittlung und Verwaltung
- Verfahren::
- Gehen Sie zu Einstellungen > Modellverwaltung.
- Zeigen Sie die Liste der installierten Modelle an und klicken Sie auf "Modell hinzufügen", um weitere unterstützte Modelle herunterzuladen.
- Nach einem Modellwechsel startet die App automatisch neu, um das neue Modell zu laden.
- caveat::
- Verschiedene Modelle haben unterschiedliche Anforderungen an die Geräteleistung, daher wird empfohlen, die Hinweise zur Gerätekompatibilität zu prüfen.
- Das offizielle GitHub bietet Installationsanleitungen für Modelle wie Llama 3.2 unter
<BreezeApp/docs/installation.md>
.
caveat
- Anforderungen an die AusrüstungGeräte mit mehr als 4 GB RAM werden empfohlen, um einen reibungslosen Betrieb zu gewährleisten.
- DatenschutzAlle Funktionen laufen standardmäßig offline und die Daten werden nicht in die Cloud hochgeladen.
- Unterstützung der GemeinschaftFür Fragen, besuchen Sie die GitHub-Seite auf
<Discussions>
Foren zur Kommunikation mit Entwicklern und anderen Benutzern.
Anwendungsszenario
- Datenschutzsensible Szenarien
Wenn Benutzer mit sensiblen Informationen wie persönlichen Notizen oder Audioaufnahmen arbeiten müssen, sorgt die Offline-Funktionalität von BreezeApp dafür, dass keine Daten nach außen dringen, so dass die App auch für Berufe wie Rechtsanwälte, Journalisten oder Ärzte geeignet ist. - Keine Netzwerkumgebung
Im Flugzeug, in abgelegenen Gebieten oder bei instabilen Netzen können die Benutzer die Voice-to-Text- oder Chat-Funktion nutzen, um ihre Arbeit zu erledigen, z. B. eine Besprechung aufzuzeichnen oder einen Textentwurf zu erstellen. - Bildung und Lernen
Die Schüler können die Bildquizfunktion nutzen, um Lehrbuchillustrationen oder Laborbilder zu analysieren, um schnell auf Erklärungen zugreifen zu können; der Chatbot kann genutzt werden, um Quizfragen zu überprüfen oder Notizen zusammenzufassen. - Entwickler-Tests
Entwickler können BreezeApp nutzen, um lokale KI-Modelle zu testen, die Entwicklungsmöglichkeiten von KI-Anwendungen für Mobiltelefone zu erkunden und die offizielle Dokumentation zu Rate zu ziehen, um schnell loszulegen.
QA
- Benötigt BreezeApp eine Internetverbindung?
Eine Internetverbindung ist erforderlich, um das Modell zum ersten Mal herunterzuladen. Danach können alle Funktionen offline genutzt werden, d.h. auch ohne Netzwerk. - Wie kann ich auf das Modell Llama 3.2 umsteigen?
Wählen Sie Llama 3.2 unter Einstellungen > Modellverwaltung aus, laden Sie es herunter und installieren Sie es, und lesen Sie das GitHub-Repository für Details.<README.md>
Dokumentation. - Welche Sprachen werden unterstützt?
Es unterstützt hauptsächlich traditionelles Chinesisch, Mandarin und gemischte Chinesisch/Englisch-Szenarien, wobei die Spracherkennung und Texterstellung für taiwanesisches Mandarin optimiert sind. - Was ist mit unzureichender Leistung der Geräte?
Es wird empfohlen, Geräte mit mehr als 4 GB RAM zu verwenden oder ein leichtes Modell zu wählen, um die Leistungsanforderungen zu senken.