Para garantir uma experiência inicial tranquila, os usuários são aconselhados a prestar atenção especial aos três pontos a seguir:
- Especificações de preparação de dados
- Certifique-se de que a codificação do arquivo CSV seja UTF-8
- Recomenda-se que as colunas de data e hora estejam em um formato uniforme, como AAAA-MM-DD.
- Remover formatação complexa, como células mescladas
- Seleção da variável-alvo
- Os problemas de classificação precisam garantir uma amostra equilibrada de categorias (pelo menos 50 registros por categoria)
- O problema de regressão exige a verificação de que não há exceções anômalas no valor-alvo
- Validação dos resultados
- Preste atenção aos alertas da plataforma que avisam sobre problemas de qualidade de dados
- Para decisões críticas para os negócios, recomenda-se analisar a eficácia do modelo dividindo o conjunto de validação.
A plataforma fornece conjuntos de dados de amostra e assistentes passo a passo, e recomenda-se que os usuários iniciantes se familiarizem com o processo usando projetos de demonstração como o "Titanic Survival Prediction".
Essa resposta foi extraída do artigoDataFawn: uma plataforma de análise de dados para criar modelos de aprendizado de máquina sem escrever códigoO





























