O BreezeApp é um aplicativo de IA para telefones celulares desenvolvido pela MediaTek Research para as plataformas Android e iOS. Sua principal função é permitir que os usuários executem modelos de linguagem grande (LLMs) em seus telefones celulares e usem uma ampla gama de funções de IA sem a necessidade de uma conexão com a Internet. O aplicativo se concentra na proteção da privacidade, e todo o processamento de dados é feito localmente no dispositivo, garantindo que os dados não saiam do telefone. O BreezeApp é compatível com fala para texto, texto para fala, chatbot de texto e perguntas e respostas de imagens, e tem como padrão a série de modelos Breeze 2 da MediaTek Innovation Base, ou o usuário pode mudar para outros modelos, como o Llama 3.2. livre para escolher modelos de IA e ajudar os desenvolvedores a criar facilmente aplicativos móveis de IA.
Lista de funções
- Processamento de IA off-lineNão é necessária conexão com a Internet e todas as funções de IA são executadas localmente no telefone para proteger a privacidade do usuário.
- conversão de voz em textoConverte a fala do usuário em texto em tempo real, com suporte a cenários de vários idiomas.
- conversão de texto em falaConversão de texto em fala natural com suporte para estilos de fala personalizados.
- chatbot de textoFornece funções de diálogo inteligentes com base em um modelo de linguagem amplo que pode lidar com tarefas como perguntas e respostas e resumo.
- Imagem Q&AO aplicativo responde a perguntas relacionadas a imagens, adequadas para análise de conteúdo visual.
- Mudança de modeloSuporte para alternar entre diferentes modelos de idiomas grandes, como o Breeze 2 ou o Llama 3.2.
- Download do modeloSolicita automaticamente o download do modelo de IA necessário na primeira inicialização, simplificando o processo de configuração.
Usando a Ajuda
Processo de instalação
O BreezeApp pode ser baixado da App Store ou da Google Play Store e o processo de instalação é simples e direto. Veja abaixo as etapas detalhadas:
- Baixar aplicativos::
- Abra a App Store (iOS) ou a Google Play Store (Android) em seu telefone.
- Procure por "BreezeApp" para encontrar o aplicativo publicado pela MediaTek Research.
- Clique em "Install" (Instalar) e aguarde a conclusão do download. O tamanho do aplicativo depende do dispositivo e do modelo, e requer cerca de 500 MB a 2 GB de espaço de armazenamento.
- Lançamento inicial e download do modelo::
- Abra o BreezeApp e, na primeira inicialização, você será solicitado a fazer o download dos modelos padrão da série Breeze 2.
- Certifique-se de que seu dispositivo tenha espaço de armazenamento suficiente e uma rede estável (a conexão com a Internet é necessária apenas para o primeiro download).
- Após a conclusão do download, o aplicativo configura automaticamente o modelo sem a necessidade de configurá-lo manualmente.
- Modelos de comutação (opcional)::
- Se você quiser usar outro modelo (por exemplo, Llama 3.2), vá para Application Settings (Configurações do aplicativo).
- Selecione "Model Management" e siga as instruções para fazer o download e mudar para o modelo desejado.
- Consulte o repositório oficial do GitHub para obter detalhes sobre como fazer a troca.
<README.md>
que fornece instruções detalhadas de instalação.
Função Fluxo de operação
1. fala para texto
- procedimento::
- Abra o BreezeApp e entre no módulo "Speech to Text".
- Clique no ícone do microfone para iniciar a gravação; tente manter o ambiente o mais silencioso possível durante a gravação.
- Após a conclusão da gravação, o aplicativo converte automaticamente a voz em texto e a exibe na tela.
- Suporte para edição de texto ou exportação para outros aplicativos (como o Notes ou o Mail).
- advertência::
- Oferece suporte a cenários de mandarim taiwanês, mandarim e chinês/inglês mistos para ambientes multilíngues.
- No modo off-line, a velocidade e a precisão do reconhecimento de fala dependem do desempenho do dispositivo.
2. conversão de texto em fala
- procedimento::
- Entre no módulo "Text-to-Speech", insira ou cole o texto a ser convertido.
- Selecione um estilo de voz (por exemplo, masculino, feminino) ou carregue uma amostra de voz personalizada.
- Clique no botão "Generate" (Gerar) e o aplicativo converterá o texto em fala e o reproduzirá.
- Os arquivos de áudio podem ser salvos ou compartilhados com outros aplicativos.
- Recursos avançados::
- Suporte para ajustar a velocidade e o tom da fala, adequado para a produção de podcasts ou audiolivros.
- consulta
<BreezyVoice>
Instruções para configurar amostras de voz no repositório para otimizar a saída.
3. chatbots de texto
- procedimento::
- Abra o módulo Chat e digite uma pergunta ou diálogo.
- O aplicativo gera respostas com base no modelo local de big language e oferece suporte a várias rodadas de diálogo.
- Pode ser usado para questionários, resumos de textos ou geração de conteúdo criativo.
- caracterização::
- Suporte ao chinês tradicional, adequado para usuários de Taiwan e Hong Kong.
- Pode lidar com tarefas complexas, como resumo de documentos ou raciocínio de várias rodadas.
4. teste de imagem
- procedimento::
- Vá até o módulo "Image Quiz" e clique no botão "Upload Image".
- Selecione fotos de um álbum ou tire-as diretamente.
- Digite uma pergunta relacionada à imagem e o aplicativo analisará a imagem e gerará uma resposta.
- cenário do aplicativo::
- Ideal para reconhecer objetos, descrever cenas ou responder a perguntas sobre detalhes em imagens.
- Por exemplo, carregue uma foto de viagem e pergunte "Qual é o prédio da foto?". .
5. comutação e gerenciamento de modelos
- procedimento::
- Vá para Configurações > Gerenciamento de modelos.
- Visualize a lista de modelos instalados e clique em "Add Model" (Adicionar modelo) para fazer download de outros modelos compatíveis.
- Após a troca de modelos, o aplicativo é reiniciado automaticamente para carregar o novo modelo.
- advertência::
- Modelos diferentes têm requisitos de desempenho de equipamento diferentes, portanto, é recomendável verificar as notas de compatibilidade do equipamento.
- O GitHub oficial fornece guias de instalação para modelos como o Llama 3.2 em
<BreezeApp/docs/installation.md>
.
advertência
- Requisitos de equipamentoRecomendamos dispositivos com mais de 4 GB de RAM para garantir uma operação tranquila.
- PrivacidadeTodas as funções são executadas off-line por padrão e os dados não são carregados na nuvem.
- Suporte à comunidade: Em caso de dúvidas, visite a página do GitHub em
<Discussions>
Fóruns para comunicação com desenvolvedores e outros usuários.
cenário do aplicativo
- Cenários sensíveis à privacidade
Quando os usuários precisam trabalhar com informações confidenciais, como anotações pessoais ou gravações de áudio, o recurso off-line do BreezeApp garante que nenhum dado seja vazado, tornando-o adequado para profissões como advogados, jornalistas ou médicos. - Nenhum ambiente de rede
Em aviões, áreas remotas ou quando a rede estiver instável, os usuários podem usar a função de voz para texto ou bate-papo para realizar o trabalho, como gravar uma reunião ou gerar um rascunho de texto. - Educação e aprendizado
Os alunos podem usar a função de teste de imagem para analisar ilustrações de livros didáticos ou imagens de laboratório para acesso rápido a explicações; o chatbot pode ser usado para revisar testes ou resumir anotações. - Teste de desenvolvedor
Os desenvolvedores podem usar o BreezeApp para testar modelos locais de IA, explorar as possibilidades de desenvolvimento de aplicativos de IA para telefones celulares e consultar a documentação oficial para começar rapidamente.
QA
- O BreezeApp requer uma conexão com a Internet?
É necessária uma conexão com a Internet para fazer o download do modelo pela primeira vez. Depois disso, todas as funções podem ser usadas off-line, o que é adequado para ambientes sem rede. - Como faço para mudar para o modelo Llama 3.2?
Selecione Llama 3.2 em Settings > Model Management, faça o download e instale-o e consulte o repositório do GitHub para obter detalhes.<README.md>
Documentação. - Quais são os idiomas suportados?
Ele suporta principalmente cenários de chinês tradicional, mandarim e chinês misto/inglês, com reconhecimento de fala e geração de texto otimizados para mandarim taiwanês. - E quanto ao desempenho inadequado do equipamento?
Recomenda-se usar dispositivos com mais de 4 GB de RAM ou escolher um modelo leve para reduzir os requisitos de desempenho.