Um processo típico de geração de dados sintéticos é o seguinte (usando o exemplo da criação de um e-mail de cliente virtual):
- Geração de dados básicos::
- Digite o prompt "Generate resumes of 5 pharmaceutical company professionals" (Gerar currículos de 5 profissionais de empresas farmacêuticas) no formulário em branco.
- A IA cria automaticamente tabelas com colunas para nome, cargo, especialização etc.
- Colunas de dados estendidos::
- Adicione uma nova coluna e digite o prompt "Write professional business emails based on {{person_bio}}" (Escreva e-mails comerciais profissionais com base em {{person_bio}}).
- Selecione um modelo criativo (por exemplo, GPT-OSS) para gerar conteúdo de e-mail
- controle de qualidade::
- Verificar a conformidade da formatação do e-mail
- Arraste a parte inferior da coluna para gerar mais amostras (até 1.000 linhas)
- Exportação em lote::
- Exportação do conjunto de dados e do arquivo config.yml
- Dimensione para dezenas de milhares de dados com scripts de execução de trabalhos em HF
O método é particularmente adequado:
- Cenários sensíveis à privacidade (evite usar dados reais de clientes)
- Expansão dos dados de treinamento do modelo
- Teste de simulação de processos de negócios
Essa resposta foi extraída do artigoAI Sheets: criação e processamento de conjuntos de dados usando modelos de IA em tabelas sem códigoO