gpt-oss-space-game：使用开源AI模型打造的本地语音交互太空游戏

2025-08-07

1.6 K 0

https://github.com/kwindla/gpt-oss-space-game

复制

gpt-oss-space-game 是一个开源的太空主题游戏项目，托管在 GitHub 上，由开发者 kwindla 创建。它结合了 OpenAI 的开源语言模型 gpt-oss、语音识别技术 Whisper、语音合成技术 Kokoro TTS 以及 Pipecat 框架，构建了一个可以在本地运行的语音交互游戏。玩家通过语音与游戏中的 AI 角色对话，体验沉浸式的太空冒险。项目设计灵活，允许开发者替换组件或连接云服务，适合本地运行和定制化开发。整个项目遵循 Apache 2.0 许可证，免费开放，鼓励开发者参与贡献和实验。

功能列表

语音交互：玩家通过麦克风与游戏中的 AI 角色进行实时对话，控制游戏进程。
本地运行：游戏支持在本地设备上运行，无需依赖云服务，保护数据隐私。
模块化设计：支持替换 gpt-oss、Whisper 等组件，适配云端或自托管 API。
开源模型支持：使用 OpenAI 的 gpt-oss-20b 或 gpt-oss-120b 模型，优化低延迟和本地推理。
灵活配置：开发者可调整 AI 模型的推理水平，适配不同硬件性能。
跨平台兼容：支持在多种操作系统上运行，适合开发者调试和部署。

使用帮助

安装流程

要运行 gpt-oss-space-game，需要在本地设备上配置环境并安装依赖。以下是详细的安装步骤，适用于熟悉命令行操作的用户。

1. 克隆项目仓库

首先，使用 Git 克隆项目到本地：

git clone https://github.com/kwindla/gpt-oss-space-game.git
cd gpt-oss-space-game

确保 Git 已安装。如果没有，可从 Git 官网下载并安装。

2. 安装依赖

项目依赖 Python 环境和多个开源组件。推荐使用 Python 3.11 或更高版本。以下是依赖安装步骤：

安装 Python：从 Python 官网下载并安装 Python 3.11+，确保添加 Python 到系统 PATH。
安装 Pipecat：Pipecat 是语音交互的核心框架，运行以下命令安装：
```
pip install pipecat
```
安装 Whisper：Whisper 用于语音识别，安装方式：
```
pip install openai-whisper
```
确保安装 FFmpeg（Whisper 的依赖），Windows 用户可通过包管理器（如 Chocolatey）安装，Linux 用户运行：
```
sudo apt-get install ffmpeg
```
安装 Kokoro TTS：用于语音合成，安装命令：
```
pip install kokoro-tts
```
安装 gpt-oss 模型：项目支持 gpt-oss-20b 和 gpt-oss-120b 模型。推荐使用 llama.cpp 的 llama-server 运行模型。下载 llama.cpp：
```
git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
make
```
然后下载 gpt-oss 模型文件（可在 Hugging Face 找到，例如 ggml-org/gpt-oss-20b-GGUF 或 ggml-org/gpt-oss-120b-GGUF）。

3. 配置模型推理

项目默认使用本地推理，需配置 gpt-oss 模型的推理水平为“低”以优化语音交互。运行 llama-server：

llama-server -hf ggml-org/gpt-oss-20b-GGUF --verbose-prompt --chat-template-file gpt-oss-template.jinja --jinja --cache-reuse 128 -fa

-hf 指定模型文件路径。
--chat-template-file 使用项目提供的 gpt-oss-template.jinja 文件，设置推理水平为低。
--cache-reuse 128 优化内存使用。
如果使用 gpt-oss-120b，需确保设备有至少 80GB GPU 内存；gpt-oss-20b 需 16GB 内存。

4. 运行游戏

所有依赖安装完成后，在项目目录运行：

python main.py

游戏启动后，系统会加载语音交互模块。确保麦克风已连接并正常工作。

操作主要功能

语音交互

启动对话：游戏开始后，玩家通过麦克风说出指令，如“启动飞船”或“导航到火星”。Whisper 将语音转换为文本，gpt-oss 处理指令并生成响应，Kokoro TTS 将响应转为语音输出。
控制游戏：支持多种指令，例如“查看星图”“发射武器”等。具体指令集可在项目文档中查看。
实时反馈：AI 会根据玩家指令即时响应，例如描述太空环境或执行任务。

自定义配置

替换云服务：开发者可在代码中修改 API 端点，连接云端 gpt-oss 或其他模型。例如，编辑 config.py 文件，替换本地模型路径为云端 API 地址。
调整推理水平：若需更高推理能力，可修改 gpt-oss-template.jinja，将推理水平设为“medium”或“high”，但需更强硬件支持。
添加新功能：项目支持扩展新模块，例如增加新的语音指令或游戏场景，开发者可编辑 main.py 和相关脚本。

注意事项

硬件要求：gpt-oss-20b 适合普通 PC（16GB 内存），gpt-oss-120b 需高性能 GPU（如 NVIDIA H100）。
调试：若遇到模型加载失败，检查 GPU 内存是否充足，或启用 PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True。
文档支持：项目 README 和 GitHub 页面提供详细配置说明，建议仔细阅读。

应用场景

AI 游戏开发实验
开发者可利用 gpt-oss-space-game 学习如何将开源 AI 模型集成到游戏中。项目展示语音识别、语言模型和语音合成的协同工作，适合研究 AI 在交互式应用中的潜力。
本地隐私保护游戏
用户希望在无网络环境下玩游戏，同时保护数据隐私。项目完全本地运行，语音和文本数据不上传云端，适合隐私敏感用户。
教育与技术演示
学校或技术社区可使用该项目展示 AI 技术。学生通过搭建和修改游戏，学习语音处理、AI 推理和开源软件开发。
游戏原型开发
独立开发者可基于此项目开发新游戏。模块化设计允许添加新场景、角色或交互方式，快速构建太空冒险游戏原型。

QA

游戏需要联网吗？
不需要。gpt-oss-space-game 支持完全本地运行，所有模型和处理都在本地完成。但开发者可选择连接云端 API 替换本地模型。
支持哪些语言？
当前主要支持英语语音交互，中文支持需额外配置 Whisper 和 Kokoro TTS 的中文模型。开发者可在项目中替换模型文件。
如何贡献代码？
在 GitHub 上 fork 项目，修改代码后提交 pull request。建议先阅读 CONTRIBUTING.md 文件，了解代码规范。
模型加载失败怎么办？
检查硬件是否满足要求（gpt-oss-20b 需 16GB 内存，gpt-oss-120b 需 80GB GPU）。确保模型文件路径正确，或查看日志中的错误提示。

AI开源项目 AI角色扮演

AI生产力工具 » gpt-oss-space-game：使用开源AI模型打造的本地语音交互太空游戏发布于 2025-08-07，如发现网址过期，或无法访问，请联系我们。

0已收藏

0已赞

gpt-oss-space-game：使用开源AI模型打造的本地语音交互太空游戏

功能列表

使用帮助

安装流程

1. 克隆项目仓库

2. 安装依赖

3. 配置模型推理

4. 运行游戏

操作主要功能

语音交互

自定义配置

注意事项

应用场景

QA

相关推荐

找不到AI工具？在这试试！

热门AI工具

最新发布

最新AI工具

gpt-oss-space-game：使用开源AI模型打造的本地语音交互太空游戏

功能列表

使用帮助

安装流程

1. 克隆项目仓库

2. 安装依赖

3. 配置模型推理

4. 运行游戏

操作主要功能

语音交互

自定义配置

注意事项

应用场景

QA

相关推荐

找不到AI工具？在这试试！

热门AI工具

最新发布

最新AI工具

快速查询站内AI工具