Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito
Posição atual:fig. início " Respostas da IA

Como você lida com entradas multimodais (por exemplo, imagem + texto) e chamadas de função no AIRouter?

2025-08-21 212

O AIRouter suporta entradas multimodais e chamadas de função estendendo a API da seguinte forma:

  • Entradas multimodais::
    1. as imagens precisam ser convertidas para o formato Base64, por exemplo:
    with open("image.jpg", "rb") as f: img_base64 = base64.b64encode(f.read()).decode()
    2. chamadasgenerate_mmque especifica um modelo compatível com multimodalidade (por exemplo, GPT-4o):
    LLM_Wrapper.generate_mm(model_name="gpt4o_mini", prompt="描述图片", img_base64=img_base64)
  • chamada de função::
    1. defina uma lista de ferramentas (por exemplo, funções de consulta meteorológica) com nomes, descrições e parâmetros.
    2. adoçãofunction_callingpor exemplo:
    LLM_Wrapper.function_calling(model_name="gpt4o_mini", prompt="北京天气", tools=tools)

tomar nota deÉ necessário ter certeza de que o modelo selecionado é compatível com a função correspondente (por exemplo, o GPT-4o é compatível com multimodal), caso contrário, será retornado um erro.

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

Novos lançamentos

voltar ao topo

pt_BRPortuguês do Brasil