海外访问:www.kdjingpai.com
Ctrl + D 收藏本站

Very Fast Dictation 是一个专为 Mac 用户设计的开源语音转文字工具。它通过快速的语音识别技术,将用户说的话实时转化为文字,适用于任何需要输入文字的场景。项目托管在 GitHub,由开发者 Avi Aryan 开发,采用 Parakeet MLX 技术,确保高效的语音处理。用户只需按两次 Control 键即可启动或停止录音,操作简单,适合日常办公、写作或笔记记录。工具支持系统级集成,文字会自动复制到剪贴板并粘贴到当前窗口,提升工作效率。整个项目轻量,安装便捷,适合追求效率的 Mac 用户。

 

功能列表

  • 实时语音转文字:使用 Parakeet MLX 技术,快速将语音转化为文字。
  • 快捷键操作:按两次 Control 键启动或停止录音,操作直观。
  • 剪贴板集成:转录的文字自动复制到剪贴板,并粘贴到活动窗口。
  • 系统级兼容:可在任意 Mac 应用的文本框中使用。
  • 视觉提示:录音时屏幕中央显示“Recording…”标签,清晰反馈状态。
  • 开源免费:代码公开,允许用户自由修改和优化。

 

使用帮助

安装流程

要使用 Very Fast Dictation,用户需要先在 Mac 上安装并配置环境。以下是详细步骤:

  1. 克隆代码库
    打开终端,运行以下命令以克隆项目到本地:

    git clone https://github.com/aviaryan/Very-Fast-Dictation.git
    cd Very-Fast-Dictation
    
  2. 安装依赖
    项目使用 uv 作为包管理工具。首先确保已安装 uv(可通过 pip install uv 安装)。然后运行以下命令安装依赖:

    uv sync
    

    这将自动安装包括 parakeet-mlxpynput 和 pyside6 在内的必要依赖包。确保网络连接正常,安装过程通常只需几分钟。

  3. 运行应用
    安装依赖后,运行以下命令启动程序:

    uv run main.py
    

    程序启动后会在后台运行,用户无需额外打开界面。

使用方法

安装完成后,Very Fast Dictation 即可在 Mac 上随时使用。以下是具体操作指南:

  1. 启动录音
    在任意应用的文本输入框中(例如文本编辑器、浏览器或聊天工具),快速按两次 Control 键。屏幕中央会出现“Recording…”提示,表示录音已开始。此时,用户可以直接说话,语音会实时转录为文字。
  2. 停止录音
    再次快速按两次 Control 键,录音停止。转录的文字会自动复制到剪贴板,并粘贴到当前活动的文本框中。整个过程无需手动复制粘贴,操作流畅。
  3. 检查状态
    录音时,屏幕中央的“Recording…”标签会持续显示,提醒用户程序正在工作。如果标签未出现,可能是快捷键未正确触发,建议检查程序是否在后台运行。
  4. 兼容性说明
    Very Fast Dictation 支持任何 Mac 应用的文本输入场景,例如 Pages、Word、Notion 或浏览器中的输入框。用户无需切换应用,工具会自动适配当前焦点窗口。

特色功能操作

  • 快捷键操作:按两次 Control 键的设计极大简化了操作,用户无需打开额外界面即可快速切换录音状态。
  • 剪贴板集成:转录完成后,文字自动复制到剪贴板并粘贴,适合需要快速记录的场景,例如会议笔记或临时想法。
  • 实时转录:依托 Parakeet MLX 技术,语音转文字几乎无延迟,适合快速输入长段文字。
  • 轻量设计:程序占用资源少,后台运行不影响其他应用性能。

注意事项

  • 麦克风权限:首次运行时,Mac 系统会提示授予麦克风访问权限,请确保允许权限以正常录音。
  • 网络要求:安装依赖时需要联网,但运行时无需网络,适合离线环境。
  • 调试问题:如果快捷键无效,可检查 pynput 依赖是否正确安装,或尝试重启程序。
  • 自定义修改:作为开源项目,用户可根据需要修改代码,例如调整快捷键或添加新功能,具体参考 GitHub 仓库的文档。

 

应用场景

  1. 会议记录
    在会议或课堂中,用户可以通过 Very Fast Dictation 快速记录讨论内容。启动录音后,工具将演讲或对话实时转为文字,自动粘贴到笔记应用中,节省手动输入时间。
  2. 写作辅助
    对于需要快速记录灵感的作家或创作者,Very Fast Dictation 提供便捷的语音输入方式。用户只需口述内容,文字即可直接输入到写作软件中,适合头脑风暴或初稿创作。
  3. 无障碍输入
    对于不方便手动打字的用户(例如手部受伤或视障人士),该工具通过语音输入实现高效文字录入,提升无障碍体验。
  4. 多任务处理
    在需要同时处理多项任务时,用户可通过语音输入快速记录待办事项或邮件内容,无需停下手头工作切换到键盘输入。

 

QA

  1. Very Fast Dictation 支持哪些操作系统?
    目前仅支持 macOS,专为 Mac 用户设计,暂无 Windows 或 Linux 版本。
  2. 需要联网才能使用吗?
    安装依赖时需要联网,但运行时无需网络,支持离线使用。
  3. 如何修改默认快捷键?
    用户需修改项目代码中的 pynput 快捷键配置。具体可在 GitHub 仓库的 main.py 文件中找到相关代码并调整。
  4. 录音质量不好会影响转录吗?
    是的,建议使用清晰的麦克风并在安静环境中录音,以确保转录准确性。
  5. 可以用于其他语言的语音转录吗?
    目前主要支持英语转录,其他语言的支持需依赖 Parakeet MLX 模型的能力,建议查阅官方文档确认。
0已收藏
0已赞

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

邮箱

联系我们

回顶部

zh_CN简体中文