WhiteLightningの最大の特徴は、実際のトレーニングデータを用意する必要がないことです。Grok-3-βやGPT-4o-miniのような大規模な言語モデルを用いて、通常のサンプルやエッジケースを含む合成学習データを自動生成します。デフォルトでは、各クラスにつき50個のデータが生成されますが、パラメータでデータ量を調整することも可能です。このゼロ・データ・モデリング・アプローチは、使用の敷居を大幅に下げ、ラピッド・プロトタイピングやデータ取得が困難なシナリオに特に適しています。
この答えは記事から得たものである。WhiteLightning: 軽量なオフラインテキスト分類モデルをワンクリックで生成するオープンソースツールについて