通过实现 Server-Sent Events (SSE) 协议,该项目将 Gemini 2.5 Pro 的流式响应能力完整暴露给开发者。当请求设置 'stream': true
参数时,API 会以打字机效果逐字返回生成内容。技术实现上采用 Node.js 的异步 generator 机制,确保高并发场景下的稳定传输。
实际应用表现为:1) 长文本生成时可实现200ms级的首包响应;2) 动态调整生成内容的控制粒度;3) 配合前端实现真正的交互式对话体验。性能测试显示在同等硬件条件下,流式传输比完整响应节省40%的内存占用。
本答案来源于文章《Gemini-CLI-2-API:将Gemini CLI转为OpenAI兼容的本地API服务》