API利用制御戦略
Gemini API無料版の60QPM制限では、以下のコントロールを推奨する:
- 基本構成プログラム::
- Cloudflare Workerでwrangler.tomlを設定する:
限界
リクエスト=1000件/日 - X-RateLimit-Limitレスポンス・ヘッダーの追加
- D1データベースを使用したユーザー通話記録
- Cloudflare Workerでwrangler.tomlを設定する:
- 高度なコントロール::
- Google CloudのQuotas APIを統合し、使用量をリアルタイムで監視。
- 自動アラートの設定:15分間に500件以上の通話があった場合、Slack通知をトリガーする。
- 自動劣化の設定:オーバーラン後に大きな言語モデルのローカル操作に切り替える
- 顧客制限のヒント::
- フロントエンドにデバウンス・ブレ防止制御を追加(最小間隔1.5秒)
- 当月の使用率を表示する使用率プロンプトバーの実装
- 長い会話は、間隔をあけて送信される複数のAPIリクエストに自動的に分割される
原価計算デフォルト設定で1日あたり約300回のフル会話をサポート
この答えは記事から得たものである。Gemini Playground: Geminiマルチモーダル対話サイトのサーバーレス展開について































