Os tipos de arquivos compatíveis com o processamento pelo recurso multimodal do easy-llm-cli incluem:
- arquivo de imagemJPEG, PNG e outros formatos comuns
- arquivo de documentaçãoPDF (suporta extração de texto)
Os cenários de aplicação prática incluem:
- Do projeto ao códigoCarregar esboços para gerar automaticamente o quadro de código do aplicativo da Web (por exemplo, execução)
elc "生成Web应用" -f sketch.jpg) - análise de documentosExtrair informações importantes de um documento ou relatório em PDF
- Auditoria de conteúdoAnálise de conteúdo sensível em imagens
Observação: esse recurso depende do suporte do próprio modelo, por exemplo, o Gemini-2.5-pro e o GPT-4.1 são totalmente compatíveis, enquanto alguns modelos podem oferecer suporte apenas à interação de texto. Recomenda-se verificar o formulário de teste oficial para verificar a compatibilidade.
Essa resposta foi extraída do artigoeasy-llm-cli: ativação da CLI do Gemini para oferecer suporte a chamadas para vários modelos de idiomas grandesO





























