通过 GenAI Processors 的 GenaiModel 和 LiveProcessor 模块可实现三步集成:
- 环境配置:设置
GOOGLE_API_KEY和GOOGLE_PROJECT_ID环境变量 - 预置接口调用:使用内置处理器如
live_model.LiveProcessor直接对接 Gemini Live API - 流式交互:通过
terminal_input()实现实时对话,或组合视频/音频处理器构建多模态代理
实时语音代理示例:live_agent = video.VideoIn() + LiveProcessor() + audio_io.PyAudioOut()
async for part in live_agent(text.terminal_input()):
play_audio(part)
本答案来源于文章《GenAI Processors:轻量级Python库支持高效并行处理多模态内容》




























