Não. O melhor recurso do WhiteLightning é que não há necessidade de preparar dados de treinamento reais. A ferramenta gera automaticamente dados de treinamento sintéticos usando um modelo de linguagem grande, como o Grok-3-beta ou o GPT-4o-mini, incluindo amostras regulares e casos extremos. Por padrão, são gerados 50 dados para cada classe, e o usuário também pode ajustar a quantidade de dados por meio de parâmetros. Essa abordagem de modelagem de dados zero reduz bastante o limite de uso e é particularmente adequada para prototipagem rápida ou cenários em que a aquisição de dados é difícil.
Essa resposta foi extraída do artigoWhiteLightning: uma ferramenta de código aberto para gerar modelos leves de classificação de texto off-line em um cliqueO