通过 Whisper 模型实现视频转录可分为四个关键步骤:
1. 应用初始化
einrichten. app.py
并导入 SDK:from aana.sdk import AanaSDK
app = AanaSDK(name="video_app")
2. 模型部署配置
注册 Whisper 部署实例(支持 GPU 资源分配):app.register_deployment(
"whisper",
WhisperDeployment.options(
ray_actor_options={"num_gpus": 0.25},
user_config=WhisperConfig(...)
)
)
3. 定义API端点
创建转录处理函数:@app.aana_endpoint(name="transcribe_video")
async def transcribe_video(self, video: VideoInput):
audio = await self.download(video.url)
return await self.whisper.transcribe(audio)
4. 启动与测试
in Bewegung sein python app.py serve
后,可通过:
– Swagger UI(/docs
路径)交互测试
– cURL 发送视频 URL 请求
实时结果会以 JSON 格式返回。
Diese Antwort stammt aus dem ArtikelAana SDK: Ein Open-Source-Tool für den einfachen Einsatz von multimodalen KI-ModellenDie