初めてプレーされる方は、以下の3点にご注意ください:
- データ作成仕様
- CSVファイルのエンコーディングがUTF-8であることを確認する。
- 日付と時刻の列は、YYYY-MM-DDのような統一されたフォーマットにすることを推奨する。
- 結合されたセルなどの複雑な書式を削除する
- ターゲット変数の選択
- 分類の問題は、バランスの取れたカテゴリーのサンプルを確保する必要がある(各カテゴリーにつき少なくとも50レコード)
- 回帰問題では、目標値に異常な異常値がないことをチェックする必要がある。
- 結果の検証
- データ品質の問題を警告するプラットフォームのアラートに注意を払う
- ビジネスクリティカルな意思決定については、検証セットを分割してモデルの有効性をレビューすることが推奨される。
このプラットフォームは、サンプルデータセットとステップバイステップのウィザードを提供しており、初めてのユーザーは、「タイタニック号の生存予測」などのデモプロジェクトを使ってプロセスに慣れることが推奨される。
この答えは記事から得たものである。DataFawn: コードを書かずに機械学習モデルを構築するデータ分析プラットフォームについて





























