通过负载均衡倍增 Gemini API 免费额度
Google 为开发者提供了慷慨的 Gemini
API 免费使用额度,通过 Google AI Studio
即可轻松获取 API 密钥。免费套餐通常包含每分钟速率限制和每日的总 Token 调用量。虽然单一密钥的额度有限,但通过注册不同账号申请多个密钥,再借助负载均衡工具,可以有效突破这一限制,实现额度的成倍增长。
本文将介绍 gemini-balance
,一个旨在为 Google Gemini
API 提供代理和负载均衡功能的应用程序。该项目由开发者 snailyp
创建,基于 Python FastAPI
构建,允许用户管理多个 Gemini
API 密钥,实现轮询、认证、模型过滤和状态监控。
我们将通过免费的 ClawCloud
容器服务来部署 gemini-balance
,从而搭建一个稳定、免代理且能整合多个 Gemini
API 密钥的个人专属接口。
- 项目地址: https://github.com/snailyp/gemini-balance
- 部署文档: https://gb-docs.snaily.top/guide/setup-clawcloud-sqlite.html
一、准备多个 Gemini API 密钥
获取 Gemini
API 密钥是部署服务的前提。
- 访问
Google AI Studio
申请页面:https://aistudio.google.com/ - 使用您的 Google 账户登录,然后创建 API 密钥。
- 如有需要,可注册并登录多个不同的 Google 账户,重复此过程以获取多个独立的 API 密钥。
二、注册 ClawCloud 账号
ClawCloud
是一家成立于 2024 年的云计算平台,总部位于新加坡,专注于为开发者提供高性能的云基础设施服务。 其 ClawCloud Run
是一个平台即服务 (PaaS) 产品,可以极大简化应用的部署流程。 对于 Github 注册时间超过180天的用户,ClawCloud
提供每月5美元的赠送额度,这足以支持 gemini-balance
项目的持续运行。
- 访问
ClawCloud
官方网站并使用您的GitHub
账户登录。 - 登录后,在用户中心的
Account Center
可以查看到每月赠送的额度以及当前的使用情况。
三、在 ClawCloud 部署 gemini-balance
接下来,我们将使用 ClawCloud Run
来容器化部署 gemini-balance
。
- 选择服务器区域
在ClawCloud
主界面,点击左上角的Region
,推荐选择Singapore
。页面刷新后,确保该区域前有复选标记。 - 创建应用
点击App Launchpad
,然后点击页面右上角的Create App
进入应用配置页面。 - 配置应用参数
在配置页面中,按以下说明填写各项参数:- Image Name:
ghcr.io/snailyp/gemini-balance:latest
- Application Name:
geminibalance
(或任何你喜欢的名称) - Image:
Public
- Usage:
Fixed
- Replicas:
1
- CPU:
1
- Memory:
512
说明:此配置适用于免费额度,每月提供 10G 免费流量。 - Network
- Container Port:
8000
- Enable Internet: 点选为
Access
状态
- Container Port:
- Image Name:
- 配置环境变量
在Advanced Configura
->Environment Variables
部分,点击Add
,添加以下变量。其中API_KEYS
和ALLOWED_TOKENS
需要替换为您自己的密钥和访问令牌。DATABASE_TYPE=sqlite SQLITE_DATABASE=default_db API_KEYS=["YOUR_GEMINI_API_KEY_1","YOUR_GEMINI_API_KEY_2"] ALLOWED_TOKENS=["YOUR_ACCESS_TOKEN_1"] AUTH_TOKEN= TZ=Asia/Shanghai
变量说明:
变量名 | 说明 | 格式及示例 |
---|---|---|
API_KEYS |
Gemini API 密钥列表,用于负载均衡 | ["key-1","key-2"] |
ALLOWED_TOKENS |
允许访问此服务的授权令牌列表 | ["token-1","token-2"] |
AUTH_TOKEN |
(可选) 超级管理员令牌,拥有所有权限。若不填,则默认使用 ALLOWED_TOKENS 的第一个值。 |
sk-123456 |
- 配置存储
点击Add Storage
,按图示设置,将容器内的/app/db
路径挂载出来,以持久化存储数据。 - 部署应用
返回页面顶部,点击Deploy Application
。在弹出的确认窗口中选择Yes
。 - 检查部署状态
等待几秒后,页面将跳转到应用状态界面。请确认左上角显示running
。在下方的Network
选项卡中,公网地址 (Public address
) 初始状态可能为pending
。请等待 2-5 分钟,直至其变为Available
。此时,即可通过该地址访问您的服务。 - (可选) 设置自定义域名
如果您希望使用自己的域名访问,可以在Cloudflare
等 DNS 服务商处添加一条CNAME
记录,指向ClawCloud
提供的公网地址。然后在ClawCloud
的域名设置中添加您的自定义域名。
四、管理和监控 gemini-balance
gemini-balance
提供了一个便捷的管理后台,用于配置和监控 API 密钥。
- 在浏览器中打开您部署好的公网地址,进入登录界面。输入您在环境变量
ALLOWED_TOKENS
中设置的访问令牌(默认为your-access-token-1
)即可登录。 - 登录后,您可以动态添加或删除
Gemini
API 密钥,而无需重启服务。 - 管理后台同时提供了每个密钥的调用情况监控,方便您追踪使用状态。
五、在 AI 客户端中使用代理服务
部署完成后,您可以在任何支持 OpenAI
API 格式的客户端中使用这个代理服务。以 Cherry Studio
为例,它是一款支持多平台的 AI
桌面客户端,能方便地集成和切换不同的 AI
模型。
- 添加提供商
在Cherry Studio
中,进入模型提供商设置,新增一个提供商,名称可自定义。 - 配置接口信息
- API 密钥: 填写您在
gemini-balance
环境变量ALLOWED_TOKENS
中设置的访问令牌。 - API 地址: 填写
ClawCloud
提供的公网访问地址,注意末尾不要加/
。
- API 密钥: 填写您在
- 管理并使用模型
保存后,点击“管理”,客户端会自动从您的gemini-balance
服务拉取并显示可用的模型列表。现在,您就可以在客户端中选择并使用Gemini
模型了,所有请求都将通过您搭建的负载均衡服务进行分发。