TEN框架是一个开源软件平台,具有以下几个核心功能特点:
- interação de voz em tempo real:支持全双工对话、实时语音识别和文本转语音
- suporte multimodal:可以结合语音、视觉和文本处理能力构建综合AI智能体
- 模块化扩展系统:提供可复用扩展,轻松集成外部工具和服务
- Operação entre plataformas:支持Windows、Mac、Linux和移动设备,兼容边缘设备如ESP32
- 工作流构建工具:通过TMAN Designer提供低代码/无代码开发界面
- 大模型集成:支持Llama 4、Google Gemini、DeepSeek R1等主流模型
- Geração de imagens em tempo real:通过StoryTeller扩展实现与内容相关的图像生成
Essa resposta foi extraída do artigoTEN: uma ferramenta de código aberto para criar inteligências de IA de fala multimodal em tempo realO