BreezeApp 是一款由联发创新基地(MediaTek Research)开发的手机AI应用,支持 Android 和 iOS 平台。它的核心功能是让用户在手机上运行大型语言模型(LLM),无需联网即可使用多种AI功能。应用主打隐私保护,所有数据处理都在设备本地完成,确保数据不离开手机。BreezeApp 支持语音转文字、文字转语音、文本聊天机器人和图像问答等功能,默认使用联发创新基地的 Breeze 2 系列模型,用户也可切换到其他模型如 Llama 3.2。它的目标是让普通用户自由选择AI模型,并帮助开发者轻松创建手机端AI应用。
功能列表
- 离线AI处理:无需联网,所有AI功能在手机本地运行,保护用户隐私。
- 语音转文字:将用户语音实时转换为文本,支持多种语言场景。
- 文字转语音:将文本转化为自然语音,支持自定义语音风格。
- 文本聊天机器人:提供基于大语言模型的智能对话功能,可处理问答、总结等任务。
- 图像问答:用户上传图片,应用回答图片相关问题,适合视觉内容分析。
- 模型切换:支持切换不同大语言模型,如 Breeze 2 或 Llama 3.2。
- 模型下载:首次启动时自动提示下载所需AI模型,简化配置流程。
使用帮助
安装流程
BreezeApp 可从 App Store 或 Google Play Store 下载,安装过程简单直接。以下是详细步骤:
- 下载应用:
- 打开手机上的 App Store(iOS)或 Google Play Store(Android)。
- 搜索“BreezeApp”,找到由 MediaTek Research 发布的应用。
- 点击“安装”,等待下载完成。应用大小因设备和模型不同,约需 500MB-2GB 存储空间。
- 首次启动与模型下载:
- 打开 BreezeApp,首次启动会提示下载默认的 Breeze 2 系列模型。
- 确保设备有足够存储空间和稳定的网络(仅首次下载需要联网)。
- 下载完成后,应用会自动配置模型,无需手动设置。
- 切换模型(可选):
- 如果想使用其他模型(如 Llama 3.2),进入应用设置。
- 选择“模型管理”,按照提示下载并切换到所需模型。
- 具体切换步骤参考官方 GitHub 仓库的
<README.md>
文件,提供详细的安装说明。
功能操作流程
1. 语音转文字
- 操作步骤:
- 打开 BreezeApp,进入“语音转文字”模块。
- 点击麦克风图标开始录音,录音时尽量保持环境安静。
- 录音完成后,应用会自动将语音转为文本,显示在屏幕上。
- 支持编辑文本或将其导出到其他应用(如笔记或邮件)。
- 注意事项:
- 支持台湾华语、普通话及中英混杂场景,适合多种语言环境。
- 离线模式下,语音识别速度和准确度依赖设备性能。
2. 文字转语音
- 操作步骤:
- 进入“文字转语音”模块,输入或粘贴需要转换的文本。
- 选择语音风格(如男声、女声)或上传自定义语音样本。
- 点击“生成”按钮,应用会将文本转为语音并播放。
- 可保存音频文件或分享到其他应用。
- 高级功能:
- 支持调整语速和音调,适合制作播客或有声读物。
- 参考
<BreezyVoice>
仓库中的语音样本设置说明,优化输出效果。
3. 文本聊天机器人
- 操作步骤:
- 打开“聊天”模块,输入问题或对话内容。
- 应用会基于本地大语言模型生成回答,支持多轮对话。
- 可用于问答、文本总结或生成创意内容。
- 特色:
- 支持繁体中文,适合台湾及香港用户。
- 可处理复杂任务,如文档摘要或多轮推理。
4. 图像问答
- 操作步骤:
- 进入“图像问答”模块,点击“上传图片”按钮。
- 从相册选择图片或直接拍摄。
- 输入与图片相关的问题,应用会分析图片并生成回答。
- 应用场景:
- 适合识别物体、描述场景或回答图片中的细节问题。
- 例如,上传旅游照片,询问“照片中的建筑是什么?”。
5. 模型切换与管理
- 操作步骤:
- 进入“设置” > “模型管理”。
- 查看已安装模型列表,点击“添加模型”下载其他支持的模型。
- 切换模型后,应用会自动重启以加载新模型。
- 注意事项:
- 不同模型对设备性能要求不同,建议查看设备兼容性说明。
- 官方 GitHub 提供 Llama 3.2 等模型的安装指南,路径为
<BreezeApp/docs/installation.md>
。
注意事项
- 设备要求:建议使用配备 4GB 以上内存的设备以确保流畅运行。
- 隐私保护:所有功能默认离线运行,数据不上传云端。
- 社区支持:遇到问题可访问 GitHub 上的
<Discussions>
论坛,与开发者和其他用户交流。
应用场景
- 隐私敏感场景
用户需要处理敏感信息(如个人笔记或录音)时,BreezeApp 的离线功能确保数据不外泄,适合律师、记者或医生等职业。 - 无网络环境
在飞机、偏远地区或网络不稳定时,用户可使用语音转文字或聊天功能完成工作,如记录会议或生成文本草稿。 - 教育与学习
学生可通过图像问答功能分析课本插图或实验图片,快速获取解释;聊天机器人可用于复习问答或总结笔记。 - 开发者测试
开发者可利用 BreezeApp 测试本地AI模型,探索手机端AI应用的开发可能性,参考官方文档快速上手。
QA
- BreezeApp 是否需要联网?
首次下载模型需要联网,之后所有功能均可离线使用,适合无网络环境。 - 如何切换到 Llama 3.2 模型?
在“设置” > “模型管理”中选择 Llama 3.2,下载并安装,具体步骤参考 GitHub 仓库的<README.md>
文件。 - 支持哪些语言?
主要支持繁体中文、普通话及中英混杂场景,语音识别和文本生成针对台湾华语优化。 - 设备性能不足怎么办?
建议使用内存 4GB 以上的设备,或选择轻量级模型以降低性能需求。