合成データを生成する典型的なプロセスは以下の通りである(仮想顧客Eメールを作成する例):
- 基本データ作成::
- 空白のフォームに「製薬会社のプロフェッショナル5名の履歴書を作成」と入力してください。
- AIは、名前、ポジション、専門知識などの列を持つテーブルを自動的に作成する。
- 拡張データ・カラム::
- 新しい列を追加し、「{{person_bio}}に基づいてプロフェッショナルなビジネスメールを書く」というプロンプトを入力する。
- クリエイティブモデル(GPT-OSSなど)を選択し、メールコンテンツを生成する。
- 品質管理::
- 電子メールフォーマットのコンプライアンスチェック
- 列の下部をドラッグして、より多くのサンプルを生成する(最大1000行まで)
- 一括エクスポート::
- データセットとconfig.ymlファイルのエクスポート
- HFジョブ実行スクリプトで数万データまで拡張可能
この方法は特に適している:
- プライバシーに配慮したシナリオ(実際の顧客データの使用は避ける)
- モデル・トレーニング・データの拡張
- ビジネス・プロセス・シミュレーション・テスト
この答えは記事から得たものである。AIシート:コードなしでテーブルのAIモデルを使用してデータセットを構築し、処理する。について