このツールはSSE(Server-Sent Events)技術を使用して真のリアルタイム・ストリーミングを実現し、各トークンは生成直後にクライアントにプッシュされる。性能テストデータによると、1000個のトークンを生成した場合、最初のバイト到着までの時間(TTFB)はわずか50msで、これは従来のAPIの8倍の速さである。ストリーミングAPIのデザインは2つのレイヤーから構成されている。デルタコンテンツ補強層を通過させる。delta.reasoning_contentGeminiのリアルタイム推論プロセスを公開。対話ボットの場合、このメカニズムにより、ユーザーの待ち知覚時間が761 TP3T短縮される一方、ユーザーがリアルタイムで生成方向を修正できる中間結果介入機能がサポートされる。
この答えは記事から得たものである。geminicli2api: Gemini CLIをOpenAI互換APIに変換するプロキシツールについて































