MAESTROは、複雑な研究作業を支援するために設計されたオープンソースのAI研究ツールです。文書管理、検索機能拡張生成(RAG)、マルチエージェントコラボレーションを通じて、研究計画から報告書作成までの完全なプロセスを提供する。ユーザーはPDFドキュメントをアップロードし、AIエージェントを使って検索、分析、レポート作成を行うことができる。 MAESTROはセルフホスト型で、学者、アナリスト、開発者など、大量の情報を効率的に整理・分析する必要のあるユーザーに適している。PythonとDockerをベースに構築されたMAESTROは、ユーザーフレンドリーなインターフェイスを持ち、個人またはチームでのコラボレーションに十分な柔軟性を備えています。
機能一覧
- ドキュメント管理:PDFファイルをアップロードして管理し、検索可能なナレッジベースを構築します。
- Retrieval Augmented Generation (RAG): 文書検索と生成技術を組み合わせて、正確な応答を提供する。
- マルチエージェントコラボレーション:プランニング、リサーチ、リフレクション、ライティングの各エージェントがタスクを自動的に分解し、レポートを作成します。
- セルフホストデプロイメント:Docker経由でコンテナ化して実行し、データのプライバシーを保護します。
- ウェブインターフェース:Streamlitベースの直感的なインターフェースで、簡単な操作と結果の表示が可能。
- レポート作成:繰り返し最適化をサポートし、構造化された調査レポートを自動的に作成します。
- カスタムコンフィギュレーション:ユーザーがAPIキーやネットワークパラメータを設定し、ニーズに柔軟に対応できるようサポートします。
ヘルプの使用
設置プロセス
MAESTROはセルフホストツールであり、Dockerを使用してデプロイすることが推奨されています。以下は、ユーザーがすぐに始められるようにするための詳細なインストール手順です。
- 環境を整える
- 以下のソフトウェアがシステムにインストールされていることを確認してください:
Docker
歌で応えるDocker Compose
コンテナ運転用Git
コード・リポジトリをクローンする。- NVIDIA GPU(オプション):モデルの埋め込みと並べ替えのパフォーマンスを向上させます。
- ディスク容量:AIモデル保存用に約5GB(初回実行時に自動ダウンロードされます。)
- お使いのシステムがPython 3.xをサポートしているか確認してください。
- 以下のソフトウェアがシステムにインストールされていることを確認してください:
- クローン・コード・リポジトリ
ターミナルで以下のコマンドを実行し、MAESTROのソースコードをダウンロードします:git clone https://github.com/murtaza-nasir/maestro.git cd maestro
- 環境変数の設定
- 提供されたコンフィギュレーション・スクリプトを実行して
.env
ドキュメンテーション./setup-env.sh
- スクリプトは、ネットワーク・パラメータとAPIキーの設定を通してユーザーをガイドする。ユーザーは、必要なAPIキー(言語モデルや外部サービス用など)を提供する必要がある。
- 手動でコピーすることもできる
.env.example
ファイルを編集する:cp .env.example .env
コンパイラ
.env
ファイルに、APIキーやその他の設定を記入する:API_KEY=your_api_key_here PORT=3030
- 提供されたコンフィギュレーション・スクリプトを実行して
- ビルドと実行
- Docker Composeを使用して、サービスをビルドして起動します:
docker compose up --build -d
- このコマンドはバックグラウンドでMAESTROコンテナを起動します。最初の実行では、必要なAIモデルが自動的にダウンロードされます。
- 通常数分かかる。
- Docker Composeを使用して、サービスをビルドして起動します:
- MAESTROを訪問
- ブラウザーを開き、設定されたアドレスにアクセスする(デフォルトは
http://localhost:3030
). - デフォルトのログイン認証情報を使用する:ユーザー名
admin
パスワードadminpass123
. - セキュリティを確保するため、ログイン後すぐにデフォルトのパスワードを変更してください。
- ブラウザーを開き、設定されたアドレスにアクセスする(デフォルトは
主要機能の使用
MAESTROの主な機能は、文書管理、調査作業、レポート作成です。詳細な説明は以下の通りです。
文書管理
- 文書のアップロードログインすると、「ドキュメント・ライブラリ」ページが表示されます。アップロード」ボタンをクリックし、PDFファイルを選択するか、指定された領域にファイルをドラッグ・アンド・ドロップしてください。システムが自動的にPDFを検索可能なナレッジベースに変換します。
- ドキュメントの管理ドキュメントライブラリでは、アップロードされたファイルのリストを表示し、ファイルの削除や並べ替えをサポートします。各ファイルにはアップロード時間とサイズが表示され、簡単に管理できます。
- ドキュメント検索検索バーからキーワードを入力すると、そのキーワードに基づいた ラグ キーワードに関連する文書の内容を返す技術。
研究課題
- タスクの作成タスク」画面で、「新規タスク」をクリックします。気候変動が農業に与える影響を分析する」など、研究目的を入力する。システムが自動的に計画エージェントを起動して、タスクを分解します。
- 操作するプランニングエージェントは、リサーチエージェントとリフレクションエージェントに割り当てられるサブタスクを生成します。ユーザはタスクページで進捗状況をリアルタイムに見ることができ、エージェントはドキュメントやウェブから情報を収集する。
- 反射と最適化リフレクティブ・エージェントは、調査結果の完全性と正確性をチェックする。不備が見つかった場合、システムは自動的にタスクプランを調整し、データを再収集する。
レポート作成
- レポートの作成リサーチが完了すると、ライティングエージェントは収集したデータを基にドラフトレポートを作成します。ユーザーはレポートページで内容をプレビューすることができます。
- 編集と最適化編集」ボタンをクリックすると、書き込みインターフェイスに入ります。ユーザーは、レポートの内容を手動で修正したり、レポートが論理的で正確であるように反映エージェントにさらに最適化させたりすることができます。
- 輸出レポート共有やアーカイブを容易にするために、レポートをPDFやMarkdown形式でエクスポートできます。
カスタマイズされた設定
- 設定画面では、別の世代モデルを選択したり、生成されるコンテンツのトーンを調整したりするなど、言語モデルのパラメータを調整できます。
- マルチユーザー管理をサポートし、管理者は「ユーザー管理」ページでユーザーを追加または削除し、権限を割り当てることができます。
ほら
- ポートの競合を避けるため、Dockerサービスが適切に実行されていることを確認する。
- モデルのダウンロードのため、初回の動作が遅くなることがあります。
- より高いパフォーマンスを得るためには、NVIDIA GPUアクセラレーションを推奨します。
アプリケーションシナリオ
- 学術研究
学者は学術論文をアップロードし、重要な情報を素早く抽出して概要レポートを作成することができます。例えば、複数の論文から核となるアイデアを分析し、構造化された研究レポートにまとめることができます。 - データ分析
アナリストはMAESTROを使って業界レポートを処理し、データを抽出し、市場動向レポートの迅速な作成に適した分析サマリーを作成することができます。 - コンテンツ制作
ライターやジャーナリストは、背景情報をアップロードし、MAESTROを使用して情報を照合し、記事の初稿を作成することができます。 - チームワーク
研究チームは、MAESTROのマルチユーザー機能を通じて、文書やタスクを共有し、複雑なプロジェクトで共同作業を行うことができます。
品質保証
- MAESTROの実行にはインターネット接続が必要ですか?
MAESTROはオフライン操作をサポートしていますが、最初の実行にはモデルをダウンロードするためのインターネット接続が必要です。タスクにウェブ検索が含まれる場合は、接続を維持する必要があります。 - データ・プライバシーをどのように確保するのか?
MAESTROは、データがローカルサーバーに保存され、ユーザーがデータを完全にコントロールできる、セルフホストツールです。定期的なバックアップを推奨します。.env
ファイルとドキュメントのライブラリ。 - PDF以外のファイルはサポートされていますか?
現在のバージョンは、主にPDFファイルをサポートしており、将来的には他の形式に拡張される可能性があります。ユーザーは他のフォーマットをPDFに変換してアップロードすることができます。 - どうすれば報告の質を最適化できるのか?
ユーザーは、タスク設定でモデルパラメータを調整したり、レポート内容を手動で編集したりすることができます。リフレクション・エージェントを複数回実行することで、レポートの精度を向上させることもできます。