海外访问:www.kdjingpai.com
Ctrl + D 收藏本站

Whisper App 是一个免费的开源工具,允许用户通过语音录制笔记,并利用 AI 技术将语音转为文字,生成清单、博客或任务等内容。项目由 Nutlope 开发,托管在 GitHub,基于 Together.ai 的 Whisper 模型和 Llama 模型实现高效转录与文本处理。Whisper App 操作简单,界面直观,适合快速记录和整理内容的用户。代码完全开源,用户可自由部署,数据存储在本地,注重隐私保护。

 

功能列表

  • 语音录制与转录:通过麦克风录制语音,快速转为文字。
  • AI 文本整理:将转录文字转换为清单、博客或任务列表。
  • 多语言支持:支持多种语言的语音转录,如英语、中文等。
  • 本地存储:录音和文字存储在用户设备,保护隐私。
  • 开源部署:提供完整代码,支持本地或云端部署。
  • 第三方服务集成:结合 Together.ai 和 Convex,提升 AI 和数据库性能。
  • 自定义输出:支持调整文本格式,如清单样式或博客结构。

使用帮助

安装流程

要使用 Whisper App,用户需在本地或云端部署项目。以下是详细步骤:

  1. 克隆项目代码
    在终端运行以下命令,获取 Whisper App 代码:

    git clone https://github.com/Nutlope/whisper.git
    

    进入项目目录:

    cd whisper
    
  2. 安装依赖
    确保安装 Node.js(建议最新 LTS 版本)。运行以下命令安装依赖:

    npm install
    

    这会安装 Next.js、Vercel AI SDK 等必要包。

  3. 配置环境变量
    Whisper App 使用 Clerk 进行身份验证,Convex 提供数据库支持。配置步骤如下:

    • 注册 Clerk 账户(https://clerk.com),获取 CLERK_SECRET_KEY 和 NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY
    • 在项目根目录创建 .env.local 文件,添加:
      CLERK_SECRET_KEY=your_clerk_secret_key
      NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY=your_clerk_publishable_key
      
    • 登录 Convex(https://convex.dev),创建项目,获取 CLERK_ISSUER_URL(如 https://some-animal-123.clerk.accounts.dev)。
    • 在 Convex 仪表板添加 CLERK_ISSUER_URL,点击“保存”。
  4. 运行项目
    配置完成后,启动开发服务器:

    npm run dev
    

    项目运行在 http://localhost:3000。打开浏览器访问即可。

使用方法

Whisper App 界面简洁,适合快速上手。以下是主要功能操作指南:

1. 录制与转录

  • 访问 Whisper App 页面,使用 Clerk 登录账户。
  • 点击“录音”按钮,授权浏览器麦克风访问。
  • 开始录音,完成后点击“停止”。建议每次录音不超过5分钟,确保转录准确。
  • 系统通过 Together.ai 的 Whisper 模型将语音转为文字,结果显示在页面。

2. 文本整理

  • 转录完成后,选择输出格式(如清单、博客、任务列表)。
  • 选择“清单”可生成条目式列表;选择“博客”会整理为带标题的文章。
  • 用户可编辑文本,调整内容或补充细节。
  • 点击“保存”将结果存储在本地 IndexedDB 数据库。

3. 自定义与优化

  • 在“设置”页面,调整输出格式,如清单的项目符号或博客的段落样式。
  • 支持通过 Llama 模型优化文本,例如修正语法或翻译语言。
  • 可在设置中选择目标语言(如中文、英文)进行转录或翻译。

4. 数据管理与隐私

  • Whisper App 默认将录音和文本存储在本地 IndexedDB,不上传至云端。
  • 清空数据方法:在浏览器开发者工具中清除 IndexedDB,或删除本地路径 %APPDATA%\..\Local\com.bradenwong.whispering(Windows)。
  • 转录过程需连接 Together.ai,建议确保网络稳定。

注意事项

  • 网络连接需稳定,以访问 Together.ai 和 Convex 服务。
  • 若麦克风无法使用,检查系统权限(Windows: 设置 > 隐私 > 麦克风;Mac: 系统偏好设置 > 安全与隐私 > 麦克风)。
  • 项目依赖外部 API,需确认 Together.ai 的免费额度或订阅状态。
  • 初次部署可能需调试环境变量,建议参考 GitHub 文档。

应用场景

  1. 会议记录整理
    用户在会议中录制讨论内容,Whisper App 快速生成会议纪要或任务清单,适合团队协作。
  2. 学习笔记记录
    学生录制课堂或讲座语音,Whisper App 转为结构化笔记,便于复习和整理。
  3. 博客内容创作
    内容创作者通过语音输入灵感,Whisper App 整理为文章草稿,提升写作效率。
  4. 个人任务规划
    用户录制每日待办,Whisper App 转为任务清单,帮助管理时间。

QA

  1. Whisper App 支持哪些语言?
    基于 Together.ai 的 Whisper 模型,支持英语、中文、西班牙语等多种语言。具体支持列表可查阅 Together.ai 官网。
  2. 使用 Whisper App 需要付费吗?
    Whisper App 免费且开源。外部服务(如 Together.ai、Convex)可能产生费用,视使用量而定。
  3. 如何保护数据隐私?
    录音和转录文本存储在本地 IndexedDB,仅转录时发送音频至 Together.ai,无其他服务器存储。
  4. 部署需要什么技术基础?
    熟悉基本的 Node.js 和命令行操作即可。GitHub 文档提供详细指导,适合初学者。
0已收藏
0已赞

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

邮箱

联系我们

回顶部

zh_CN简体中文