解決策:Optexityを使って人間の実演を記録し、トレーニングデータを作成する。
背景:ウェブページの操作をAIに学習させる際の中心的な課題は、十分な量の正確な操作実証データを取得することにある。従来のアプローチでは、大規模な手動アノテーションや複雑なプログラミングロジックが必要でした。
具体的な運用ステップ
- 録画環境の設定ドキュメントに従ってdemonstration_config.yamlファイルを作成し、タスクの目的(例:「ウェブサイトにログインする」)を指定する。
- 運転記録の実行demonstrate.shスクリプトを実行すると、マウストラック、クリックイベント、キーボード入力を自動的に記録します。
- データ変換処理: process_demonstration.pyを使用して、生の操作を構造化されたトレーニングデータに変換する。
- バッチ生産データシードパラメータを変更することで、異なる操作シナリオを繰り返し記録し、多様なサンプルを生成します。
上級者向けヒント:標準化されたウェブページのアクションデータは、クリックやフォーム入力などの基本的なアクションを含め、MiniWoB++環境でバッチ生成することができます。
この答えは記事から得たものである。Optexity:人間の実演を見ながらウェブ操作を行うAIを訓練するオープンソースプロジェクトについて




























