Very Fast Dictation 是一个专为 Mac 用户设计的开源语音转文字工具。它通过快速的语音识别技术,将用户说的话实时转化为文字,适用于任何需要输入文字的场景。项目托管在 GitHub,由开发者 Avi Aryan 开发,采用 Parakeet MLX 技术,确保高效的语音处理。用户只需按两次 Control 键即可启动或停止录音,操作简单,适合日常办公、写作或笔记记录。工具支持系统级集成,文字会自动复制到剪贴板并粘贴到当前窗口,提升工作效率。整个项目轻量,安装便捷,适合追求效率的 Mac 用户。
功能列表
- 实时语音转文字:使用 Parakeet MLX 技术,快速将语音转化为文字。
- 快捷键操作:按两次 Control 键启动或停止录音,操作直观。
- 剪贴板集成:转录的文字自动复制到剪贴板,并粘贴到活动窗口。
- 系统级兼容:可在任意 Mac 应用的文本框中使用。
- 视觉提示:录音时屏幕中央显示“Recording…”标签,清晰反馈状态。
- 开源免费:代码公开,允许用户自由修改和优化。
使用帮助
安装流程
要使用 Very Fast Dictation,用户需要先在 Mac 上安装并配置环境。以下是详细步骤:
- 克隆代码库
打开终端,运行以下命令以克隆项目到本地:git clone https://github.com/aviaryan/Very-Fast-Dictation.git cd Very-Fast-Dictation
- 安装依赖
项目使用uv
作为包管理工具。首先确保已安装uv
(可通过pip install uv
安装)。然后运行以下命令安装依赖:uv sync
这将自动安装包括
parakeet-mlx
、pynput
和pyside6
在内的必要依赖包。确保网络连接正常,安装过程通常只需几分钟。 - 运行应用
安装依赖后,运行以下命令启动程序:uv run main.py
程序启动后会在后台运行,用户无需额外打开界面。
使用方法
安装完成后,Very Fast Dictation 即可在 Mac 上随时使用。以下是具体操作指南:
- 启动录音
在任意应用的文本输入框中(例如文本编辑器、浏览器或聊天工具),快速按两次 Control 键。屏幕中央会出现“Recording…”提示,表示录音已开始。此时,用户可以直接说话,语音会实时转录为文字。 - 停止录音
再次快速按两次 Control 键,录音停止。转录的文字会自动复制到剪贴板,并粘贴到当前活动的文本框中。整个过程无需手动复制粘贴,操作流畅。 - 检查状态
录音时,屏幕中央的“Recording…”标签会持续显示,提醒用户程序正在工作。如果标签未出现,可能是快捷键未正确触发,建议检查程序是否在后台运行。 - 兼容性说明
Very Fast Dictation 支持任何 Mac 应用的文本输入场景,例如 Pages、Word、Notion 或浏览器中的输入框。用户无需切换应用,工具会自动适配当前焦点窗口。
特色功能操作
- 快捷键操作:按两次 Control 键的设计极大简化了操作,用户无需打开额外界面即可快速切换录音状态。
- 剪贴板集成:转录完成后,文字自动复制到剪贴板并粘贴,适合需要快速记录的场景,例如会议笔记或临时想法。
- 实时转录:依托 Parakeet MLX 技术,语音转文字几乎无延迟,适合快速输入长段文字。
- 轻量设计:程序占用资源少,后台运行不影响其他应用性能。
注意事项
- 麦克风权限:首次运行时,Mac 系统会提示授予麦克风访问权限,请确保允许权限以正常录音。
- 网络要求:安装依赖时需要联网,但运行时无需网络,适合离线环境。
- 调试问题:如果快捷键无效,可检查
pynput
依赖是否正确安装,或尝试重启程序。 - 自定义修改:作为开源项目,用户可根据需要修改代码,例如调整快捷键或添加新功能,具体参考 GitHub 仓库的文档。
应用场景
- 会议记录
在会议或课堂中,用户可以通过 Very Fast Dictation 快速记录讨论内容。启动录音后,工具将演讲或对话实时转为文字,自动粘贴到笔记应用中,节省手动输入时间。 - 写作辅助
对于需要快速记录灵感的作家或创作者,Very Fast Dictation 提供便捷的语音输入方式。用户只需口述内容,文字即可直接输入到写作软件中,适合头脑风暴或初稿创作。 - 无障碍输入
对于不方便手动打字的用户(例如手部受伤或视障人士),该工具通过语音输入实现高效文字录入,提升无障碍体验。 - 多任务处理
在需要同时处理多项任务时,用户可通过语音输入快速记录待办事项或邮件内容,无需停下手头工作切换到键盘输入。
QA
- Very Fast Dictation 支持哪些操作系统?
目前仅支持 macOS,专为 Mac 用户设计,暂无 Windows 或 Linux 版本。 - 需要联网才能使用吗?
安装依赖时需要联网,但运行时无需网络,支持离线使用。 - 如何修改默认快捷键?
用户需修改项目代码中的pynput
快捷键配置。具体可在 GitHub 仓库的main.py
文件中找到相关代码并调整。 - 录音质量不好会影响转录吗?
是的,建议使用清晰的麦克风并在安静环境中录音,以确保转录准确性。 - 可以用于其他语言的语音转录吗?
目前主要支持英语转录,其他语言的支持需依赖 Parakeet MLX 模型的能力,建议查阅官方文档确认。