GenAIプロセッサーを通じて GenaiModel
歌で応える LiveProcessor
このモジュールは3段階の統合を可能にする:
- 環境設定設定
GOOGLE_API_KEY
歌で応えるGOOGLE_PROJECT_ID
環境変数 - 事前設定されたインターフェース・コールなどの内蔵プロセッサーを使用する。
live_model.LiveProcessor
Gemini Live APIへのダイレクトインターフェース - ストリーミング・インタラクションスルー
terminal_input()
リアルタイムの対話を可能にし、ビデオ/オーディオプロセッサを組み合わせてマルチモーダルエージェントを構築する。
リアルタイム音声エージェントの例:live_agent = video.VideoIn() + LiveProcessor() + audio_io.PyAudioOut()
async for part in live_agent(text.terminal_input()):
play_audio(part)
この答えは記事から得たものである。GenAI Processors:マルチモーダルコンテンツの効率的な並列処理をサポートする軽量Pythonライブラリについて