カーネルイメージのための人類エージェント統合
Kernel Imagesは、AnthropicのComputer Useエージェントと統合し、テキストまたは音声コマンドによるブラウザ操作をサポートします。以下はその統合と使用方法です:
統合ノート
- このエージェント機能により、ユーザーはウェブページを開いたり、フォームに入力したりといったブラウザの動作を自然言語コマンドで制御できる。
- エージェントはAnthropicのAPIを使用し、使用するには有効なAPIキーが必要です。
使用手順
- アカウント登録とAPIキーの取得まず、Anthropicのウェブサイトでアカウントを登録し、APIキーを取得してください。
- 環境変数の設定取得したAPIキーを環境変数に設定する:
export ANTHROPIC_API_KEY=your-api-key - プロキシスクリプトの実行プロジェクトの
agent-loop.py脚本だ:python agent-loop.py - 入力"example.comを開いてスクリーンショットを撮る"、"フォームに記入する "などのコマンドをチャット画面に入力します。
この機能を使用するには、基本的なコマンドライン操作とPython環境の設定に精通している必要があります。Anthropicアカウントは基本的なブラウザ機能には必要なく、プロキシ機能はオプションの高度な機能であることに注意してください。
この答えは記事から得たものである。Kernel Images: 軽量サンドボックスブラウザのためのオープンソースソリューションについて































