Whisper App 是一个免费的开源工具,允许用户通过语音录制笔记,并利用 AI 技术将语音转为文字,生成清单、博客或任务等内容。项目由 Nutlope 开发,托管在 GitHub,基于 Together.ai 的 Whisper 模型和 Llama 模型实现高效转录与文本处理。Whisper App 操作简单,界面直观,适合快速记录和整理内容的用户。代码完全开源,用户可自由部署,数据存储在本地,注重隐私保护。
功能列表
- 语音录制与转录:通过麦克风录制语音,快速转为文字。
- AI 文本整理:将转录文字转换为清单、博客或任务列表。
- 多语言支持:支持多种语言的语音转录,如英语、中文等。
- 本地存储:录音和文字存储在用户设备,保护隐私。
- 开源部署:提供完整代码,支持本地或云端部署。
- 第三方服务集成:结合 Together.ai 和 Convex,提升 AI 和数据库性能。
- 自定义输出:支持调整文本格式,如清单样式或博客结构。
使用帮助
安装流程
要使用 Whisper App,用户需在本地或云端部署项目。以下是详细步骤:
- 克隆项目代码
在终端运行以下命令,获取 Whisper App 代码:git clone https://github.com/Nutlope/whisper.git
进入项目目录:
cd whisper
- 安装依赖
确保安装 Node.js(建议最新 LTS 版本)。运行以下命令安装依赖:npm install
这会安装 Next.js、Vercel AI SDK 等必要包。
- 配置环境变量
Whisper App 使用 Clerk 进行身份验证,Convex 提供数据库支持。配置步骤如下:- 注册 Clerk 账户(
https://clerk.com
),获取CLERK_SECRET_KEY
和NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY
。 - 在项目根目录创建
.env.local
文件,添加:CLERK_SECRET_KEY=your_clerk_secret_key NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY=your_clerk_publishable_key
- 登录 Convex(
https://convex.dev
),创建项目,获取CLERK_ISSUER_URL
(如https://some-animal-123.clerk.accounts.dev
)。 - 在 Convex 仪表板添加
CLERK_ISSUER_URL
,点击“保存”。
- 注册 Clerk 账户(
- 运行项目
配置完成后,启动开发服务器:npm run dev
项目运行在
http://localhost:3000
。打开浏览器访问即可。
使用方法
Whisper App 界面简洁,适合快速上手。以下是主要功能操作指南:
1. 录制与转录
- 访问 Whisper App 页面,使用 Clerk 登录账户。
- 点击“录音”按钮,授权浏览器麦克风访问。
- 开始录音,完成后点击“停止”。建议每次录音不超过5分钟,确保转录准确。
- 系统通过 Together.ai 的 Whisper 模型将语音转为文字,结果显示在页面。
2. 文本整理
- 转录完成后,选择输出格式(如清单、博客、任务列表)。
- 选择“清单”可生成条目式列表;选择“博客”会整理为带标题的文章。
- 用户可编辑文本,调整内容或补充细节。
- 点击“保存”将结果存储在本地 IndexedDB 数据库。
3. 自定义与优化
- 在“设置”页面,调整输出格式,如清单的项目符号或博客的段落样式。
- 支持通过 Llama 模型优化文本,例如修正语法或翻译语言。
- 可在设置中选择目标语言(如中文、英文)进行转录或翻译。
4. 数据管理与隐私
- Whisper App 默认将录音和文本存储在本地 IndexedDB,不上传至云端。
- 清空数据方法:在浏览器开发者工具中清除 IndexedDB,或删除本地路径
%APPDATA%\..\Local\com.bradenwong.whispering
(Windows)。 - 转录过程需连接 Together.ai,建议确保网络稳定。
注意事项
- 网络连接需稳定,以访问 Together.ai 和 Convex 服务。
- 若麦克风无法使用,检查系统权限(Windows: 设置 > 隐私 > 麦克风;Mac: 系统偏好设置 > 安全与隐私 > 麦克风)。
- 项目依赖外部 API,需确认 Together.ai 的免费额度或订阅状态。
- 初次部署可能需调试环境变量,建议参考 GitHub 文档。
应用场景
- 会议记录整理
用户在会议中录制讨论内容,Whisper App 快速生成会议纪要或任务清单,适合团队协作。 - 学习笔记记录
学生录制课堂或讲座语音,Whisper App 转为结构化笔记,便于复习和整理。 - 博客内容创作
内容创作者通过语音输入灵感,Whisper App 整理为文章草稿,提升写作效率。 - 个人任务规划
用户录制每日待办,Whisper App 转为任务清单,帮助管理时间。
QA
- Whisper App 支持哪些语言?
基于 Together.ai 的 Whisper 模型,支持英语、中文、西班牙语等多种语言。具体支持列表可查阅 Together.ai 官网。 - 使用 Whisper App 需要付费吗?
Whisper App 免费且开源。外部服务(如 Together.ai、Convex)可能产生费用,视使用量而定。 - 如何保护数据隐私?
录音和转录文本存储在本地 IndexedDB,仅转录时发送音频至 Together.ai,无其他服务器存储。 - 部署需要什么技术基础?
熟悉基本的 Node.js 和命令行操作即可。GitHub 文档提供详细指导,适合初学者。