海外からのアクセス：www.kdjingpai.com

Ctrl + D このサイトをブックマークする

現在の場所図頭 " AIアンサー

24GBのビデオメモリGPUでDeepCoder-14Bを効率的に実行し、ビデオメモリのオーバーフローを回避するには？

2025-08-25

1.4 K

限られたグラフィックスメモリ環境におけるモデル最適化スキーム

24GBのビデオメモリ制限には、以下のオプションの組み合わせを推奨します：

定量的負荷使用torch_dtype=torch.float16もしかしたらload_in_8bit=Trueメモリ使用量を減らすパラメータ
スライス戦略設定device_map="balanced"GPU/CPUリソースを自動的に割り当てる、または手動で割り当てるmax_memory={0:"24GiB"}
KVキャッシュの最適化イネーブルuse_cache=Trueと制限max_length=32000パフォーマンスとメモリのバランス
オルタナティブvLLM推論エンジン(pip install vllm)はPagedAttentionを実装し、ピーク時のビデオメモリを30%削減する。

測定データによると、4ビット量子化＋KVキャッシュの組み合わせの場合、24GBのメモリで40Kコンテキストを安定して処理できる。それでもOOMエラーが発生する場合は、以下を試してください。no_split_module_classes=["GPTBlock"]パラメータでモデルのビニングを最適化する。

この答えは記事から得たものである。DeepCoder-14B-Preview：コード生成に優れたオープンソースモデルについて

無断転載を禁じます：AI生産性ツール " 24GBのビデオメモリGPUでDeepCoder-14Bを効率的に実行し、ビデオメモリのオーバーフローを回避するには？

おすすめ