ハードウェアリソース最適化ガイド
低コンフィギュレーション環境向けのソリューション:
- モデル選択戦略: .envファイルでMODEL_SIZE=mediumを設定し、ライト版の言語モデル(オリジナルモデルより40%小さい)を使用する。
- バッチ構成: Docker-compose.ymlのBATCH_SIZE=2を調整し、ピーク時のメモリ使用量を減らす。
- ディスクキャッシュ使用率モデルの重複ダウンロードを避けるため、最初の実行後にPERSIST_CACHE=trueパラメータを追加する。
- ポートの最適化単一タスク実行時のエージェント数を制限する MAX_AGENTS=3
実測データ:最適化後の4GBメモリデバイスでは、文書処理速度は65%の標準構成に達することができます。 GPUを占有する他のプロセスを終了し、組み込みモデルの実行を優先して保証することをお勧めします。
この答えは記事から得たものである。MAESTRO:ローカルナレッジベースとマルチエージェントコラボレーションによる綿密なリサーチアシスタントについて