O jogo foi projetado com uma arquitetura altamente modular, em que cada componente funcional principal pode ser substituído ou atualizado de forma independente. Os componentes principais incluem o sistema Whisper para reconhecimento de fala, o serviço Kokoro TTS para síntese de fala e o modelo de linguagem gpt-oss. Os desenvolvedores podem usar modelos implantados localmente ou conectar-se a APIs de nuvem de acordo com suas próprias condições e necessidades de hardware.
Para implantação local, o projeto suporta a execução do modelo gpt-oss-20b/120b via llama.cpp, mas requer a configuração de hardware adequada. Para dispositivos de baixo desempenho, o arquivo de configuração .jinja pode ser ajustado para reduzir o nível de inferência; para usuários que buscam alto desempenho, a API da nuvem pode ser substituída ou o nível de inferência pode ser modificado. Essa flexibilidade torna o projeto adequado tanto para usuários individuais sensíveis à privacidade quanto para necessidades de desenvolvimento que exigem maior desempenho.
Essa resposta foi extraída do artigogpt-oss-space-game: um jogo espacial local interativo por voz criado usando modelos de IA de código abertoO