WhiteLightningは、開発者が実データを用意する必要が全くない点で革新的である。Grok-3-βやGPT-4o-miniのような大規模な言語モデルを呼び出して合成学習データを自動生成し、教員と学生の蒸留を使用して軽量な分類モデルを学習します。デフォルトでは、1クラスあたり50個のデータが生成され、モデルのロバスト性を確保するためにエッジケースの生成がサポートされています。学習プロセスは完全に透過的で、ログには進捗、精度、損失値が表示されるため、開発者は学習品質を簡単に監視できます。
この答えは記事から得たものである。WhiteLightning: 軽量なオフラインテキスト分類モデルをワンクリックで生成するオープンソースツールについて