ローカルLLMメモ帳の準備と実行には、以下の4つのステップしか必要ない:
- プログラムファイルを取得する:最新バージョンはGitHub Releasesページからダウンロードしてください。
Local_LLM_Notepad-portable.exe(約50MB) - 対応機種をダウンロードする:以下のようなGGUF形式の軽量モデルを入手することを推奨する。
gemma-3-1b-it-Q4_K_M.gguf(~0.8GB)、これらのモデルはHugging Faceなどのプラットフォームで見ることができる。 - ストレージ構成:モデルファイルとともにEXEファイルをUSBメモリのルートディレクトリにコピーします(推奨空き容量≥2GB)。
- 稼働中:任意のWindowsコンピュータでEXEファイルをダブルクリックすると、モデルをロードするための最初の時間は30〜60秒(ハードウェアの性能に依存)、応答速度のその後の使用を取る!
警告だ:デバイスに少なくとも4GBの空きRAMがあることを確認してください。20トークン/秒の生成速度を得るには8GB以上を推奨します。モデルはロード後RAMに常駐し、プログラムを終了するとリソースが解放されます。モデルを変更する必要がある場合はファイル → モデルの選択異なるGGUFファイルをいつでも切り替えられる機能。
この答えは記事から得たものである。ローカルLLMメモ帳:ローカル大規模言語モデルをオフラインで実行するポータブルツールについて































