
OpenAdaptは、強力な大規模マルチモーダルモデル(Large Multimodal Models: LMM)をコンピュータのグラフィカルユーザーインターフェース(Graphical User Interface: GUI)に接続し、プロセスの自動化を目的としたオープンソースのソフトウェアツールです。OpenAdaptはこの問題を解決することを目的としている。OpenAdaptは元々 ...

Step AI Desktop Partnerは、PCオペレーティングシステム上で動作し、ユーザーの自然言語コマンドを理解して実行する人工知能アシスタントで、様々なコンピュータ操作を行うことができる。このツールはブラウザに限らず、オペレーティング・システムと直接深く対話し、ローカル・ファイルの管理、インターネットへのアクセス、クロスアプリケーション・タスクを実行することができる。ユーザーは、デスクトップの右クリックでツールにアクセスできる。.

Youtu-agentは、Tencent Youtu Labによって開発された強力でクリーンな設計のAIインテリジェンスフレームワークです。 自律的なAI知能を構築、実行、評価するために特別に設計されており、オープンソースモデルを完全に受け入れ、クローズドソースのビッグモデルに依存することなく優れたパフォーマンスを達成することを中核的な特徴としています。 このフレームワークは、厳密なベンチマークによって検証され...

Ninja AIは、ユーザーのブラウザ上で動作する人工知能(AI)であり、様々なオンラインタスクを自動化するために使用される。このツールは忍者のように動作するように設計されており、ブラウザで行う必要がある反復的なタスクや時間のかかるタスクを黙々とこなす。ユーザーはNinja A...にコマンドを与えることができる。.

AI Thingは、AIインテリジェンスを通じて、複雑で反復的なコンピュータ・タスクでユーザーを支援するデスクトップ・アプリケーションである。他のAIツールとは異なり、AI Thingは、ユーザーが異なるプログラム間でコンテンツをコピー&ペーストすることなく、実行中のアプリケーションの環境内で直接操作を実行することができる。その中心は、特別な@t...

Asteroid AIは、人間の代わりにウェブページの繰り返し操作を自動化する「ブラウザ・インテリジェンス」を素早く構築できる人工知能ブラウザ自動化プラットフォームです。このツールは、技術的な開発者と非技術的なビジネスパーソンの両方が使用することができます。ユーザーは、ビジュアル・インターフェースを通じて自然言語でコマンドを与えることができ、...

AutoGLMはZhipuAI(ZhipuAI)が開発したAIインテリジェントボディアプリケーションである。単なるチャットボットではなく、実際に操作できるエグゼクティブアシスタントである。ユーザーはAutoGLMに、簡単な自然言語コマンドを通じて、クラウド上の仮想コンピュータや携帯電話で様々なタスクを自律的に実行させることができる。例えば、自動的に...

Bytebotは、コンテナ化されたLinux環境で動作し、自然言語コマンドによってコンピュータタスクを自動化する、オープンソースのセルフホスト型AIデスクトップエージェントである。人間がコンピュータを操作する方法を模倣し、キーボード、マウス、スクリーンを使って、ウェブブラウジング、データ処理、ファイル管理などのタスクを実行する。.

Browserflyは、ユーザーの既存ブラウザで直接動作するAI搭載ブラウザ・プラグインである。検索、情報の整理、タブの管理などのタスクに対して、AIが自然言語コマンドを使って人間のようにウェブページを操作することができる。仮想マシンや追加のブラウザは不要で、インストール後はChromeやEdgeで使用できます。.

Eigentは、CAMEL-AIオープンソースプロジェクトに基づく世界初のマルチインテリジェンス協調デスクトップアプリケーションで、AIインテリジェンスのチームを構築・管理し、複雑なタスクを自動化するために設計されています。ローカル展開とクラウド運用をサポートし、高度にカスタマイズ可能なツール統合とデータプライバシー保護を提供します。.

NeuralAgentは、ユーザーのローカルコンピュータ上で動作するオープンソースのAI知的身体ツールです。クリック、タイピング、スクロール、アプリケーションのナビゲートといった人間の動作をシミュレートすることで、さまざまなタスクを実行する。ユーザーは自然言語でコマンドを与えるだけで、NeuralAgentがフォームへの入力、電子メールの送信、情報の検索などを自動的に実行する。.

Gabriel Operatorは、ブラウザをインテリジェントなワークスペースに変えるツールです。AIブラウザエージェントを通じて、ユーザーがタスクを自動化し、支援を提供し、さまざまな作業シナリオに適応できるようにします。ユーザーはブラウザーで直接AI機能を使用し、日常業務を簡素化し、生産性を向上させることができます。ウェブサイトはシンプルなデザインで、機能...

Magentic-UIは、Microsoft Researchによって開発されたオープンソースのインテリジェントエージェントツールで、コラボレーションを通じて複雑なウェブタスクを完了するユーザーを支援するように設計されています。AutoGenフレームワークをベースとし、マルチエージェントシステムを組み合わせることで、透過的で制御されたユーザーエクスペリエンスを提供する。Magentic-UIは、ウェブブラウジングとコード実行を自動化するだけでなく、...

OpenDiaは、モデルコンテキストプロトコル(MCP)プロトコルを介して、AIモデルとブラウザをシームレスに接続することを目的としたオープンソースプロジェクトである。ユーザーは、ChromeやFirefoxなどのブラウザにOpenDia拡張機能をインストールし、ローカルで動作するMCPと組み合わせることができます...

Omni-Bot-SDK-OSSは、WeChatバージョン4.0のRPA(Robot Process Automation)操作をサポートする視覚認識技術に基づいたオープンソースのWeChat自動化フレームワークです。カスタムYOLOモデルとOCR技術により、ランタイム侵入ゼロを実現し、開発者が自動化タスクを構築するのに適しています。ユーザーは、プラグインに動的にアクセスして、自動化タスクを適応させることができます。.

Simular Browserは人工知能ベースのブラウザで、ウェブ操作を自動化し、ユーザーが反復作業を効率的にこなせるように設計されている。Simular Browserはクロスプラットフォームで、インテリジェントな生成機能を統合しています。.

Simular Proは、macOS(Apple Silicon)用に設計されたニューラル・シンボリック・フレームワークに基づくAIインテリジェンスである。クリック、タイピング、スクロールなど、コンピュータを操作する人間の行動を模倣した自然言語コマンドによって、複雑なデスクトップ作業を自動化する。この製品は透過的な実行を重視しており、ユーザーは各ステップをいつでも確認・変更できる。.

legacy-useは、APIインタフェースを持たない古いデスクトップ・ソフトウェア(しばしば「レガシー・ソフトウェア」と呼ばれる)に最新のREST APIインタフェースを提供することを中核的な役割とするオープンソース・ツールである。ソフトウェアのグラフィカル・ユーザー・インターフェース(GUI)を「観察」し、人間ユーザーのキーボードやマウス操作をシミュレートするAIインテリジェンスを使用している。このような ...

BrowserOSはオープンソースのAIスマートブラウザで、Chromium上で開発され、すべてのChrome拡張機能と互換性がある。プライバシー保護を重視し、すべてのデータとAIモデルはローカルで実行され、ユーザーは独自のAPIキーやOllama.BrowserO...のようなローカルモデルを使用するオプションがあります。
トップに戻る

