Youtu-agent:コンピュータを操作してタスクを自動化するAI知能のフレームワーク
Youtu-agentは、Tencent Youtu Labによって開発された強力でクリーンな設計のAIインテリジェンスフレームワークです。 自律的なAIインテリジェンスを構築、実行、評価するために特別に設計されており、オープンソースモデルを全面的に採用し、クローズドソースのビッグモデルに依存することなく優れたパフォーマンスを達成することを中核的な特徴としています。 このフレームワークは...
忍者AI:AIインテリジェンスでブラウザタスクを自動化する
Ninja AIは、ユーザーのブラウザ上で動作する人工知能(AI)であり、様々なオンラインタスクを自動化するために使用される。このツールは、忍者のように振る舞うことを目標に設計されており、ブラウザで行う必要がある反復的なタスクや時間のかかるタスクを黙々と処理する。ユーザーは...
アステロイドAI:ビジネスプロセス自動化のための人工知能ブラウザインテリジェンス
Asteroid AIは、人間の代わりにウェブページの繰り返し操作を自動化する「ブラウザ・インテリジェンス」を素早く構築できる人工知能ブラウザ自動化プラットフォームです。このツールは、技術的な開発者と非技術的なビジネスパーソンの両方が使用することができます。ユーザーはインターフェイスを視覚化...
AutoGLM:音声とテキストで操作する知能を利用したコンピュータと携帯電話の自動操作
AutoGLMはZhipuAI(ZhipuAI)が開発したAIインテリジェントボディアプリケーションである。単なるチャットボットではなく、実際に操作できるエグゼクティブアシスタントである。ユーザーはAutoGLMに、簡単な自然言語コマンドを通じて、クラウド上の仮想コンピュータや携帯電話で自律的に様々なタスクを実行させることができる...
Bytebot: Linuxコンテナにおけるデスクトップタスクの自然言語による自動化
Bytebotは、コンテナ化されたLinux環境で動作し、自然言語コマンドによってコンピュータタスクを自動化する、オープンソースのセルフホスト型AIデスクトップエージェントである。人間がコンピュータを操作する方法を模倣し、キーボード、マウス、スクリーンを使って、ウェブブラウジング、データ処理、ファイル管理などのタスクを実行する。
Browserfly:AIがブラウザを自動化するスマートなプラグイン
Browserflyは、ユーザーの既存ブラウザで直接動作するAI搭載ブラウザ・プラグインである。検索、情報の整理、タブの管理などのタスクに対して、AIが自然言語コマンドを使って人間のようにウェブページを操作することができる。仮想マシンや追加のブラウザは不要で、インストールすればChromeやEdge上ですぐに利用できる。
Eigent: 自動マルチインテリジェンス・コラボレーションのためのオープンソース・デスクトップ・アプリケーション
Eigentは、CAMEL-AIオープンソースプロジェクトに基づく世界初のマルチインテリジェンス協調デスクトップアプリケーションで、AIインテリジェンスのチーム構築と管理、複雑なタスクの自動化を支援するように設計されています。ローカル展開とクラウド運用をサポートし、高度にカスタマイズ可能なツール統合とデータプライバシー保護を提供します。
CopyCat: ブラウザのタスクを自動化するAIツール
CopyCatはAIを搭載したブラウザ自動化ツールで、企業や個人が繰り返し行うウェブ作業を簡素化するために設計されています。インテリジェントなブラウザエージェントと決定論的な操作を組み合わせることで、コードを書くことなく自動化されたワークフローを作成することができます。
NeuralAgent:音声とテキストを使ってコンピュータを操作し、タスクを完了させるAIインテリジェンス
NeuralAgentは、ユーザーのローカルコンピュータ上で動作するオープンソースのAI知的身体ツールです。クリック、タイピング、スクロール、アプリケーションのナビゲートといった人間の動作をシミュレートすることで、様々なタスクを実行する。ユーザーは自然言語でコマンドを与えるだけで、NeuralAgentはフォームへの入力や送信など、自動的にコマンドを実行する。
ガブリエル・オペレーター:ブラウザをスマートなワークスペースに変えるAIアシスタント
Gabriel Operatorは、ブラウザをインテリジェントなワークスペースに変えるツールです。AIブラウザエージェントを通じて、ユーザーがタスクを自動化し、サポートを提供し、さまざまな作業シナリオに適応できるよう支援します。ユーザーは、日々の業務を簡素化し、生産性を向上させるために、ブラウザで直接AI機能を使用することができます。
Magentic-UI:ウェブタスクにおけるユーザーコラボレーションを支援する知的エージェントツール
Magentic-UIは、Microsoft Researchによって開発されたオープンソースのインテリジェントエージェントツールであり、コラボレーションによって複雑なウェブタスクを完了するユーザーを支援するように設計されている。AutoGenフレームワークをベースとし、マルチエージェントシステムを組み合わせることで、透過的で制御されたユーザーエクスペリエンスを提供する。
OpenDia:ブラウザとAIモデルを接続するオープンソースツール
OpenDiaは、モデルコンテキストプロトコル(MCP)プロトコルを介して、AIモデルとブラウザをシームレスに接続することを目的としたオープンソースプロジェクトである。ユーザーは、ChromeやFirefoxなどのブラウザにOpenDia拡張機能をインストールし、ローカルで動作するMCPと組み合わせることができます...
Omni-Bot-SDK-OSS: WeChat RPAのための視覚認識ベースの自動化フレームワーク
Omni-Bot-SDK-OSSは、WeChatバージョン4.0のRPA(Robot Process Automation)操作をサポートする視覚認識技術に基づいたオープンソースのWeChat自動化フレームワークです。カスタムYOLOモデルとOCR技術により、ランタイム侵入ゼロを実現し、開発者が自動化タスクを構築するのに適しています。ユーザーが動的にピックアップすることができます...
Simular Browser:ウェブ操作をインテリジェントに自動化するAIブラウザ
Simular Browserは人工知能ベースのブラウザで、ウェブ操作を自動化し、ユーザーが反復作業を効率的に完了できるように設計されている。複雑なコードを書くことなく、自然言語コマンドを使ってウェブブラウジング、フォーム入力、データキャプチャを行います。
シミュラープロ:音声とテキストを使ってコンピュータを操作し、自動タスクを完了させるAIインテリジェンス
Simular Proは、macOS(Apple Silicon)用に設計されたニューラル・シンボリック・フレームワークに基づくAIインテリジェンスである。クリック、タイピング、スクロールなど、コンピュータを操作する人間の行動を模倣した自然言語コマンドによって、複雑なデスクトップ作業を自動化する。この製品は透過的な実行を重視しており、ユーザーは常に...
WebAgent:インテリジェントなWeb情報検索・処理ツール
WebAgentはAlibaba Tongyi Labによって開発されたオープンソースプロジェクトで、インテリジェントなウェブ情報の検索と処理に焦点を当てています。WebAgentは、WebWalker、WebDancer、WebSailorの3つの主要コンポーネントで構成されています。これらのツールは、高度な言語モデルと強化学習技術を使用して、ユーザーの高...
レガシーユース:APIを使わずにレガシーソフトウェアにAI自動化インターフェースを追加する。
legacy-useは、APIのない古いデスクトップソフトウェア(しばしば「レガシーソフトウェア」と呼ばれる)にモダンなREST APIインターフェースを提供することを中核的な役割とするオープンソースツールである。ソフトウェアのグラフィカル・ユーザー・インターフェース(GUI)を "観察 "し、人間のキー操作を模倣するAIインテリジェンスを使用している。
BrowserOS:オープンソースのAIスマートブラウザ
BrowserOSはオープンソースのAIスマートブラウザで、Chromium上で開発され、すべてのChrome拡張機能と互換性がある。プライバシー保護を重視し、すべてのデータとAIモデルはローカルで実行され、ユーザーは独自のAPIキーやOllama.BrowserO...のようなローカルモデルを使用するオプションがあります。
Windows-MCP: Windowsシステムの軽量AI制御のためのオープンソースツール
Windows-MCPは、AIエージェントがラージ・ランゲージ・モデル(LLM)を通じてWindowsオペレーティング・システムを直接制御できるように設計された、軽量のオープンソース・プロジェクトである。従来のコンピュータビジョン技術や特定のモデルに依存する必要性を排除することで、セットアッププロセスを簡素化します。ユーザーは簡単なツールを使って、キーボードやマウスの操作を実装し、また...
トップに戻る