JoyAgent-JDGenieは、Jingdongによってオープンソース化されたマルチインテリジェンス体フレームワークで、複雑なタスクの自動化に焦点を当てています。GAIAベンチマークでは75.15%の精度を誇り、複数の類似製品を凌駕しています。このフレームワークはすぐに利用でき、クラウドプラットフォームに依存せず、ローカルでの展開に適している。ユーザーはクエリーやタスクを入力することで、コード生成、文書処理、レポート生成などのオペレーションをシステムに自動化させることができる。様々なニーズに柔軟に対応できるよう、サブ・インテリジェンスやツールの取り付けをサポートしている。プロジェクトのコードはGitHubでホストされており、Apache-2.0ライセンスに基づいているため、開発者は自由に使用・変更することができる。
機能一覧
- コード、ドキュメンテーション、レポート作成などの複雑なタスクを処理するためのマルチインテリジェンス・コラボレーションをサポートします。
- 複雑な設定なしで動作する、すぐに使えるフレームワーク。
- ローカルでの展開をサポートし、クラウドプラットフォームに依存せず、エンタープライズレベルのアプリケーションに適している。
- 特定のニーズに合わせてサブインテリジェンスをカスタマイズできるモジュール式ツールマウントを提供。
- コードデバッグ、データ分析、自動レポート作成などのマルチタスク機能を統合。
- マルチモーダル入力をサポートし、テキストや画像など複数のデータタイプを扱う。
- 開発者がすぐに始められるように、サンプルデータとテストケースを提供する。
ヘルプの使用
JoyAgent-JDGenieは、開発者がプロジェクトに迅速に統合できるよう、明確な使用フローを備えています。以下は、ユーザーがゼロから始めるための詳細なインストールおよび使用ガイドです。
設置プロセス
- 環境準備
システムにPython 3.8以上とGitがインストールされていることを確認してください。LinuxまたはmacOSを推奨しますが、WindowsユーザーはWSLをインストールするか、互換性のある環境を使用する必要があります。sudo apt update sudo apt install python3 python3-pip git
- プロジェクトコードの複製
GitHubリポジトリからJoyAgent-JDGenieのソースコードをダウンロードします。ターミナルを開き、以下のコマンドを入力します:git clone https://github.com/jd-opensource/joyagent-jdgenie.git cd joyagent-jdgenie
- 依存関係のインストール
このプロジェクトは多くのPythonライブラリに依存しているので、事前にインストールしておくこと。pip
更新しました。以下のコマンドを実行して、必要な依存関係をインストールしてください:pip3 install --upgrade pip pip3 install -r requirements.txt
- 環境変数の設定
JoyAgent-JDGenieサポートAWS クロード とOpenAIのAPIを言語モデルドライバとして使用します。少なくとも1つのAPIキーを設定する必要があります。編集.env
ファイル(または新規作成)に以下を追加する:export OPENAI_API_KEY="你的OpenAI密钥" # 或者 export AWS_CLAUDE_API_KEY="你的Claude密钥"
保存後
source .env
環境変数を有効にする。 - ChromeDriverをインストールする(オプション)
ウェブタスクを処理する必要がある場合、ChromeDriverをインストールする必要がある。以下はLinux用のインストールコマンドである:wget https://storage.googleapis.com/chrome-for-testing-public/131.0.6778.85/linux64/chromedriver-linux64.zip unzip chromedriver-linux64.zip sudo mv chromedriver /usr/bin/chromedriver sudo chmod +x /usr/bin/chromedriver
デフォルトでは、Chromeはヘッドレスモード(GUIなし)で動作します。ブラウザを視覚化するには、設定ファイルを編集して
headful=True
. - インストールの確認
以下のコマンドを実行して、フレームワークが正しく動作しているかテストする:python3 -m simulated_web_agent.main --help
ヘルプメッセージが出力されれば、インストールは成功です。
機能 操作の流れ
JoyAgent-JDGenieの中核機能は、マルチインテリジェンス・コラボレーションによって複雑なタスクを達成することです。以下に、主な機能の詳細な操作手順を示します。
1.ミッションの実行
このプロジェクトでは、1,000のサンプル・キャラクター・データを提供している。 example_data/personas/json/
)のテストに使用できる。タスクを実行するコマンドは以下の通り:
python3 -m simulated_web_agent.main --persona "example_data/personas/json/virtual customer 0.json" --output "output" --llm-provider openai
--persona
商品の購入やレポートの作成など、タスクの説明を含むペルソナデータファイルを指定します。--output
タスク結果を保存する出力ディレクトリを指定する。--llm-provider
言語モデルの選択openai
もしかしたらclaude
).
文字データのフォーマット例は以下の通り:
{
"persona": "Persona: Michael ...",
"intent": "buy a large, inflatable spider decoration for halloween",
"age": 42,
"gender": "male",
"income": [30001, 94000]
}
実行後、システムはタスクの目的に応じて、ウェブ閲覧、データ抽出、レポート作成などの操作を完了するためにインテリジェンスを呼び出す。
2.サブインテリジェンスのカスタマイズ
JoyAgent-JDGenieは、特定のニーズを満たすために、サブインテリジェンスやツールの実装をサポートしています。例えば、データ分析用のサブインテリジェンスを追加することができます:
- ある
tools/
ディレクトリに、プロジェクト・ドキュメントのインターフェイス仕様に従った新しいツール・スクリプトを作成する。 - 修正
config.yaml
ツールパスを追加する:tools: - path: "tools/custom_analyzer.py" name: "DataAnalyzer"
- タスクを再実行すると、システムは自動的に新しいツールをロードする。
3.マルチモーダルなタスクへの対応
このフレームワークは、テキストや画像などの複数の入力を処理することをサポートしている。例えば、画像をアップロードして、説明文を生成してもらう:
- 画像ファイルを
input/
カタログ - ミッション・プロファイルを修正し、イメージ・パスとミッション・ターゲットを指定する:
{ "input": "input/image.jpg", "task": "generate image description" }
- タスクを実行すると、システムはマルチモーダルインテリジェンスを呼び出して結果を生成する。
4.出力を見る
タスク完了後、結果は --output
指定されたディレクトリ。出力ファイルには、タスクログ、生成されたコンテンツ、およびデバッグ情報が含まれます。チェック output/
ディレクトリに移動し、タスクが正しく実行されることを確認する。
ほら
- ネットワーク接続が安定しており、APIキーが有効であることを確認する。
- タスクの実行に時間がかかりすぎる場合は、設定ファイルの
timeout
パラメーター - プロジェクトのコードを定期的に更新し、最新の機能を追加する:
git pull origin main
アプリケーションシナリオ
- コードの自動デバッグ
開発者は、JoyAgent-JDGenie を使用して、コード エラーを自動的に解析し、修復案を生成できます。コードファイルをアップロードし、タスクを「デバッグコード」に指定すると、システムがインテリジェントボディを呼び出して解析し、解決策を出力します。 - ビジネスレポートの作成
ビジネスユーザーが販売データや市場調査タスクを入力すると、フレームワークが自動的に構造化されたレポートを生成します。財務分析や市場動向レポートの迅速な作成に最適です。 - ウェブ・データ・キャプチャ
このシステムは、自動化されたウェブ閲覧とデータ抽出をサポートしている。例えば、「eコマース・プラットフォームから商品価格をキャプチャする」と入力すると、インテリジェントなボディがターゲットのウェブサイトを訪問し、構造化されたデータを返します。 - パーソナライズされたタスク処理
サブインテリジェンスをカスタマイズすることで、ユーザーはEメールへの自動返信やドキュメントのバッチ処理など、オフィスオートメーションのシナリオに適した特定の機能を実装することができる。
品質保証
- JoyAgent-JDGenieはクラウドサービスのサポートが必要ですか?
必須ではありません。このフレームワークはローカル展開をサポートし、エンタープライズ・アプリケーションやデータ・プライバシーが要求される環境に適している。 - 正しい言語モデルを選ぶには?
OpenAIとAWS Claudeをサポート。openAIは高速応答、Claudeは複雑なタスクに対応。ニーズに応じて、Claudeの新しいバージョンを.env
ファイルで対応するAPIキーを設定する。 - どのような仕事に対応できますか?
コード生成、文書処理、レポート生成、ウェブ・クロール、マルチモーダルなタスクがサポートされている。特定のタスクは、文字データや設定ファイルによって定義されます。 - 機能を拡張するには?
あるtools/
ディレクトリにカスタムツールスクリプトを追加し、更新する。config.yaml
ドキュメントインターフェイスの互換性を確保するために、公式ドキュメントを参照してください。