easy-llm-cliのマルチモーダル機能で処理できるファイルタイプは以下の通りです:
- イメージファイルJPEG、PNG、その他一般的なフォーマット
- ドキュメントファイルPDF(テキスト抽出に対応)
実用的な応用シナリオは以下の通り:
- デザイン・トゥ・コードスケッチをアップロードして、ウェブ・アプリケーション・コード・フレームワークを自動生成(実行など)。
elc "生成Web应用" -f sketch.jpg) - 文書分析PDF文書やレポートから重要な情報を抽出します。
- コンテンツ監査画像中のセンシティブコンテンツの分析
注:この機能は、モデル自体のサポートに依存します。例えば、Gemini-2.5-proおよびGPT-4.1は完全にサポートされていますが、モデルによってはテキストインタラクションのみをサポートしている場合があります。公式テストフォームで互換性を確認することをお勧めします。
この答えは記事から得たものである。easy-llm-cli: Gemini CLIが複数の大規模言語モデルへの呼び出しをサポートできるようにするについて





























