MiroFlowは、複雑なマルチインテリジェント身体システムの開発を簡素化するために設計されたインテリジェント身体フレームワークです。 MiroFlowはGAIAの検証セットで72.2%のpass@1(3回の実行平均)を達成し、オープンソースのインテリジェントボディフレームワークの最先端を行く性能を示した。 このフレームワークは高度な同時実行性と耐障害性を備えており、効率的な大規模データ収集とAPIアクセス速度の制限やネットワークの不安定性への対処が可能です。 同時に、MiroFlowには観測可能性と評価機能が組み込まれており、ベンチマーク用のスクリプトと、スマートボディーのトレースデータを視覚化してデバッグするためのWebユーザーインターフェースが付属しています。 MiroFlowはオープンソースのインテリジェントボディモデルであるMiroThinkerファミリーと緊密に統合されており、複雑な複数の計測器のタスクを処理することを目的として構築され、開発から配備までの完全なソリューションを提供するように設計されています。
機能一覧
- 再現可能なパフォーマンス:: 主要な大規模言語モデルとしてClaude Sonnet 3.7を使用した場合、GAIA検証セットにおいて最先端の性能レベルを実証MiroFlow在三次运行中的平均pass@1得分率为72.2%。
- 高い並行性と耐障害性フレームワークは、効率的なデータ収集のスケーリングをサポートし、ネットワークの不安定性やAPIの制限などの問題に対処できるように設計されています。
- 内蔵された観察力と評価開発者がスマートボディの動作データを視覚化、分析、デバッグするためのベンチマーク・スクリプトとウェブ・ユーザー・インターフェイスが付属しています。
- モジュラー・アーキテクチャー:: 複数ラウンドの対話、完全なツール統合、階層的なサブインテリジェンス構造をサポートする洗練されたモジュール設計。
- ワークフローの概要:
- 意図の認識とクエリの強化大規模言語モデルを用いたユーザー入力の分析により、クエリの意図を決定し、クエリを充実させる。
- プランニングとタスクマスター・インテリジェンスは、強化されたクエリに基づいて実行計画を策定し、ワークフロー全体を調整する。
- サブインテリジェンスへの配属複雑なドメイン固有のタスクについては、マスターインテリジェンスはタスクを専門化したサブインテリジェンスに委任することができる。
- MCPサーバー経由でのツールへのアクセス外部機能が必要な場合、インテリジェンスはモデル・コンテキスト・プロトコル(MCP)サーバーに接続することで、特別なツールを利用する。
- 結果の統合とアウトプットの調整タスクが完了すると、専用のサマリー・プロセスが結果を合成し、出力が高品質でユーザーの指示に適合していることを確認する。
- MiroThinkerとの統合:: MiroThinkerのオープンソースのインテリジェントなボディモデルとシームレスに連携し、複雑な複数のツールによるエンゲージメントタスクを実行できるように設計されています。
ヘルプの使用
インストールと環境設定
の使用を推奨する。uv
歌で応えるpython>=3.12
バージョン
ステップ1:リポジトリのクローンとPython環境の準備
まず、MiroFlowのGitHubリポジトリをローカルにクローンし、適切なアプリケーションディレクトリに移動します。uv
環境を同期させる。
## 克隆仓库
git clone https://github.com/MiroMindAI/MiroFlow
cd MiroFlow/apps/run-agent
## 准备python环境
uv sync
ステップ2:環境変数の設定
MiroFlowが必要なデータセットとAPIサービスにアクセスできるように、一連の環境変数を設定する必要があります。
必要な環境変数は以下の通り:
HF_TOKEN
Hugging Faceからデータセットをダウンロードするのに使う。OPENROUTER_API_KEY
OpenRouterを使って、主要なインテリジェント・モデルを提供する。ANTHROPIC_API_KEY
:: ビジュアルツールの場合。OPENAI_API_KEY
音声ツール、意図認識、回答抽出用。GEMINI_API_KEY
YouTube関連のタスクを処理する。SERPER_API_KEY
グーグル検索とウェブサイトコンテンツのクロールのため。JINA_API_KEY
ウェブサイトコンテンツのクロールに使用される。E2B_API_KEY
Linuxのサンドボックス環境の場合。
オプションの環境変数:
HTTPS_PROXY
デフォルトでは空です。DATA_DIR
デフォルトでは../../data
.
これらの変数を.env
ファイルからコピーすることができます。テンプレートファイルからコピーを作成することから始めることができます:
cd MiroFlow/apps/prepare-benchmark
cp .env.template .env
vim .env
cd ../run-agent
cp .env.template .env
vim .env
```如果你希望使用其他大型语言模型作为主要智能体模型,则需要提供相应的API密钥。
**第三步:准备E2B沙盒(可选)**
为了实现可复现的结果,官方推荐配置一个E2B沙盒。这需要你的本地环境装有`npm`和`Docker`。
1. **安装并登录E2B命令行工具:**
```bash
## 安装e2b
npm install -g @e2b/cli
## 检查是否可用
which e2b
```
2. **下载预设的Dockerfile:**
```bash
wget https://github.com/MiroMindAI/MiroFlow/blob/main/docs/e2b.Dockerfile
```
3. **构建模板:**
使用`e2b template build`命令来构建本地的Docker镜像。请将模板命名为`all_pip_apt_pkg`。
```bash
## 在本地使用`docker build`构建模板
E2B_ACCESS_TOKEN=${your-token} e2b template build -c "/root/.jupyter/start-up.sh" -n "all_pip_apt_pkg" -d ./e2b.Dockerfile
## 检查模板是否构建成功
E2B_ACCESS_TOKEN=${your-token} e2b template list
```
更多信息可以参考E2B Docker的官方文档。
### 运行与评估
**运行单个任务**
你可以通过命令行运行一个指定的任务。
```bash
## 使用指令运行一个任务
cd MiroFlow/apps/run-agent
uv run main.py trace --task="你的任务描述" --task_file_name="相关任务文件的路径"
ベースラインでの評価
あらかじめ設定されたインテリジェンスを使用して、ベンチマークデータで評価を実行できます。
- データのダウンロード
## 下载数据 cd MiroFlow/apps/prepare-benchmark uv run main.py get gaia-val
- コードを実行する:
## 运行代码 cd MiroFlow/apps/run-agent uv run main.py common-benchmark benchmark=gaia-validation
複数の評価を並行して行う必要がある場合は、提供されているスクリプトを使用することができる:
cd MiroFlow/apps/run-agent
bash scripts/claude-sonnet-3.7/run_evaluate_multiple_runs_gaia-validation.sh
アプリケーションシナリオ
- 複雑なタスクの自動化
MiroFlowは、綿密な被験者調査のような、複数のステップ、複数のツールの協調を必要とする複雑な作業を自動化するために使用することができる。 Intelligentsiaは自律的に計画を立て、検索を実行し、データを分析し、レポートを作成します。 - ソフトウェア開発支援
開発者はMiroFlowを使って、コードの自動記述、テストの実行、デバッグ、バグの修正など、プログラミングを支援するインテリジェンスを構築できる。 - データ収集と分析
MiroFlowの高度な並行性は、複数のウェブサイトから情報をクロールし、それを処理し、構造化された分析を実行するといった大規模なデータ収集プロジェクトに理想的です。 - 学術研究
研究者はMiroFlowを使用して、AIインテリジェンスの性能を再現して検証したり、AI分野を発展させるためにフレームワークに基づいて新しいインテリジェント体モデルやアルゴリズムを開発したりすることができる。
品質保証
- なぜ他のインテリジェントなボディフレームワークではなくMiroFlowを選ぶのか?
MiroFlowの核となる強みは、安定した再現可能なパフォーマンスです。 多くのオープンソースプロジェクトは、そのドキュメントに高いベンチマークスコアを記載していますが、しばしば明確なテスト条件がなく、再現が困難です。 MiroFlowは完全にオープンな評価スクリプトとプロファイルを提供し、HuggingFace上で複数の独立したGAIAトレース実行を公開しており、結果の透明性と信頼性を保証しています。 - MiroFlowはどのような大規模言語モデルをサポートしていますか?
ミロフローのLLM Client
Anthropic、OpenAI、Google、Qwen、DeepSeekなどの大規模な言語モデルプロバイダーや、ローカルに展開されたモデルを幅広くサポートする統一インターフェースが提供されている。 - MiroThinkerとは何ですか?MiroFlowとの関係は?
MiroThinkerはMiroMindAIが提供するオープンソースのインテリジェントボディモデルファミリーで、複雑なマルチツールタスクを処理するために特別に設計されています。 インテリジェントボディフレームワークであるMiroFlowはMiroThinkerモデルとシームレスに統合され、高性能で再現可能なAIインテリジェントボディを構築するためのモデルからフレームワークまでのエンドツーエンドのソリューションを提供します。