gpt-ossモデルをvLLMやOllama経由で素早くデプロイするには？

2025-08-14

169

このリポジトリは、vLLMとOllamaを介したモデルの迅速な展開をサポートしている：

vLLMの展開::
1. vLLMをインストールするにはuv pip install --pre vllm==0.10.1+gptoss --extra-index-url https://wheels.vllm.ai/gpt-oss/.
2. サーバーの起動：実行vllm serve openai/gpt-oss-20bOpenAI互換のAPIサービスを提供する。
オッラマの配備::
1. プルモデル：ランollama pull gpt-oss:20bモデルをダウンロードする。
2. スタートアップ・モデル：実施ollama run gpt-oss:20bコンシューマーグレードのハードウェアでモデルを実行する。

vLLMは本番環境のAPIデプロイに適しており、Ollamaはローカルのテストや開発に適している。

クイック照会ステーションAIツール