基本的なセキュリティ評価を実施するには、以下の項目を完了する必要がある。環境設定歌で応える評価の実施2段階だ:
環境準備
- とおす
uv venvPython仮想環境を作成する(uvパッケージマネージャ推奨) - GitHubリポジトリをクローンし、コアの依存関係をインストールします:
uv pip install -e packages/alignlab-core -e packages/alignlab-cli
実施評価
次のコマンドを使って実行する。セーフティコアテスト・スイート:alignlab eval run --suite alignlab:safety_core_v1 --model meta-llama/Llama-3.1-8B-Instruct --provider hf --guards llama_guard_3 --max-samples 200 --report out/safety_core_v1
- 主要パラメータの説明::
-スイート プリセットテストの組み合わせを指定する(毒性/バイアス/真実性テストを含む)
-セキュリティフィルターとしてラマガード3を有効にする。
-max-samples 高速検証のためのテストサイズを制御する。 - 結果処理::
利用するalignlab report build out/safety_core_v1 --format html,pdf視覚化レポートの作成
この答えは記事から得たものである。AlignLab:大規模言語モデルの整列のための包括的なツールセットについて































