WhiteLightningには、モデルのパフォーマンスを最適化するための高度な設定パラメータがいくつか用意されています:
- キューの最適化ループスルー
-r 3パラメータで最適化の回数を増やし(デフォルトは1)、合成データの質を向上させる。 - エッジケースの生成デフォルトはオン(
--generate-edge-cases True)、モデルのロバスト性を高めるために1クラスあたり50のエッジケースを生成する。 - データ拡張使用
--target-volume-per-class 100クラスあたりのトレーニングデータ量を増やす - LLMオプションGrok-3-betaやGPT-4o-miniなど、さまざまな大規模言語モデルを設定ファイルに指定して、データを生成することができます。
精度と損失値をログで監視することが推奨される(例. Accuracy: 1.0000)、パラメータを徐々に調整する。複雑な分類タスクでは、より多くの学習データと最適化ループが必要になることがある。
この答えは記事から得たものである。WhiteLightning: 軽量なオフラインテキスト分類モデルをワンクリックで生成するオープンソースツールについて































