海外访问:www.kdjingpai.com
Ctrl + D 收藏本站
当前位置:首页 » AI答疑

在AIRouter中,如何处理多模态输入(如图像+文本)和函数调用?

2025-08-21 213

AIRouter通过扩展API支持多模态输入和函数调用,具体操作如下:

  • 多模态输入
    1. 图像需转换为Base64格式,例如:
    with open("image.jpg", "rb") as f: img_base64 = base64.b64encode(f.read()).decode()
    2. 调用generate_mm方法,指定支持多模态的模型(如GPT-4o):
    LLM_Wrapper.generate_mm(model_name="gpt4o_mini", prompt="描述图片", img_base64=img_base64)
  • 函数调用
    1. 定义工具列表(如天气查询函数),包含名称、描述和参数。
    2. 通过function_calling方法触发,例如:
    LLM_Wrapper.function_calling(model_name="gpt4o_mini", prompt="北京天气", tools=tools)

注意:需确保所选模型支持对应功能(如GPT-4o支持多模态),否则会返回错误。

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

回顶部

zh_CN简体中文