Magentic-UIはモジュール設計で、3種類のコア機能エージェントが含まれている:
- ウェブサーファーエージェントボタンをクリックしたり、フォームに入力したり、ファイルをアップロードしたりといったインタラクティブな動作をサポートします。Webサイトの構造を深くナビゲートし、複数ステップの操作を必要とするWebタスクを処理することができます。
- コーダー・エージェントプログラミングタスクに特化し、Dockerコンテナ内でPythonやShellのコードを安全に実行できます。ウェブページからデータを抽出してビジュアルチャートを生成するなど、データのクローリング、変換、分析シナリオに最適。
- ファイルサーファーエージェントローカルのファイルシステムを管理し、プロジェクト・ファイルの検索、読み込み、Markdownフォーマットへの変換を行います。また、ファイルの内容を分析し、ファイルに関するユーザー固有の質問に答えることもできます。
WebSurferはWebページのデータを取得し、そのデータをCoderに渡して処理と分析を行い、最終結果はFileSurferによって保存またはさらに処理されます。ユーザはいつでも各エージェントの操作ログを見ることができ、タスクが期待通りに実行されていることを確認することができます。
この答えは記事から得たものである。Magentic-UI:ウェブタスクにおけるユーザーコラボレーションを支援する知的エージェントツールについて






























