オープンディアは、次のようなオープンソースプロジェクトである。 モデル・コンテキスト・プロトコル (エムシーピーOpenDiaは、ページ解析、コンテンツ抽出、ダイナミックブックマーク、ローカルで動作するMCPサーバーと連携したブラウザの自動化など、様々な機能をサポートしています。ユーザーは、ChromeやFirefoxなどのブラウザにOpenDiaの拡張機能をインストールすることで、ローカルで動作するMCPサーバーと連携してブラウザ操作を自動化することができます。OpenDiaは、ページ分析、コンテンツ抽出、ダイナミックブックマーク管理、ページスタイルのカスタマイズなど、様々な機能をサポートしています。プライバシーを重視し、クラウドサービスに依存することなく、完全にローカルで動作する。プロジェクトのライセンスはMITライセンスで、コードはGitHubで公開されている。最新バージョンv1.1では、Firefoxとリモート操作がサポートされ、より安定している。
機能一覧
- インテリジェント・ページ分析:AIモデルによる処理のためにウェブページのコンテンツを抽出します。
- 自動化された操作:ボタンのクリック、フォームへの入力、ウェブページのナビゲーションをサポート。
- ダイナミックなブックマーク管理:キーワードやトピックに基づいて閲覧履歴を素早く検索。
- ページスタイルのカスタマイズ:ウェブページの外観を調整し、ユーザーエクスペリエンスを最適化します。
- バックグラウンド操作:効率的なワークフローを維持するために、マルチタブページ操作をサポートします。
- プライバシー:すべての操作はローカルで実行され、データはクラウドにアップロードされない。
- クロスブラウザ対応:Chrome、Firefox、Edge、Braveなどに対応。
- リモート・コントロール:さまざまなデバイスやカメラからのリモート・コントロールをサポート。 クロード ブラウザの操作。
ヘルプの使用
設置プロセス
OpenDiaを使用するには、サーバー側とブラウザの拡張機能の両方をインストールする必要があります。以下はその詳細な手順である:
- Node.jsのインストール
OpenDiaはNode.js(v14以降)に依存しています。Node.jsの公式サイトにアクセスし、お使いのOSに適したバージョンをダウンロードしてインストールしてください。インストールが完了したら、以下のコマンドを実行し、インストールが成功したことを確認してください:node --version
- OpenDiaプロジェクトのクローン化
ターミナルまたはコマンドラインで以下のコマンドを実行し、OpenDiaのソースコードをダウンロードする:git clone https://github.com/aaronjmars/opendia.git cd opendia
- MCPサーバーの起動
サーバーのディレクトリに移動し、依存関係をインストールする:cd opendia-mcp npm install npm start
デフォルトでは、サーバーは
localhost:5555
(WebSocketポート)。カスタムポートにはnpx opendia --ws-port=5555 --http-port=5556
ポートが競合した場合、OpenDiaは自動的に既存のプロセスを終了し、再バインドします。
- ブラウザ拡張機能のインストール
- クローム
クロームを開きchrome://extensions/
Developer Mode "ボタンをクリックし、"Developer Mode "を有効にする。Load unzipped extensions "をクリックし、以下の項目を選択します。./opendia-extension/dist/chrome
フォルダーに接続します。エクステンションは自動的にローカルサーバーに接続します。 - Firefoxブラウザ
Firefoxを開きabout:debugging#/runtime/this-firefox
一時アドオンの読み込み」をクリックし、以下を選択します。./opendia-extension/dist/firefox/manifest.json
ファイル。拡張機能がロードされ、使用できるようになります。 - その他のChromiumブラウザ(Edge、Braveなど)については、Chromeのインストール手順を参照してください。
- クローム
- 接続の確認
エクステンションがロードされたら、サーバーが正しく動作していることを確認します。エクステンションは自動的にlocalhost:5555
リモートサーバーを使用している場合は、ngrokなどのツールを設定する(下記参照)。リモートサーバーを使用している場合は、ngrokなどのツールを設定します(下記参照)。 - オプション:遠隔操作
別のデバイスまたはクロードブラウザで実行するには、ポート転送用にngrokを設定します:- ngrokをインストールする(Ubuntu/Debianの例):
curl -s https://ngrok-agent.s3.amazonaws.com/ngrok.asc | sudo tee /etc/apt/trusted.gpg.d/ngrok.asc >/dev/null echo "deb https://ngrok-agent.s3.amazonaws.com buster main" | sudo tee /etc/apt/sources.list.d/ngrok.list sudo apt update && sudo apt install ngrok
- ngrokのオートトークンを無料で取得する(登録はngrokのウェブサイトで)。
- ngrokを走らせる:
ngrok http 5556
- ngrok が提供する URL を使用して、拡張リモート接続を設定します。
- ngrokをインストールする(Ubuntu/Debianの例):
主な機能
- インテリジェントなページ分析
拡張機能をインストールした後、任意のウェブページを開き、拡張機能のアイコンをクリックして「ページ分析」機能を有効にすると、OpenDiaはAIモデル(ClaudeやChatGPTなど)による処理のために、ウェブページのテキスト、画像、その他のコンテンツを抽出します。ユーザーはMCPプロトコルでコマンドを送信し、AIにコンテンツを分析させ、結果を返すことができる。例えば、「このページの核となるアイデアを要約せよ」と入力すると、AIは抽出されたコンテンツに基づいて要約を生成する。 - オートメーション
OpenDiaはAIコマンドによる自動化をサポートしている。例えば、「Twitterで最新のAIトレンドを検索」と入力すると、拡張機能が自動的にTwitterを開き、検索語を入力し、結果を表示する。ユーザーは拡張機能のインターフェイスにコマンドを入力したり、APIを介してローカルのAIモデルと統合することができる。 - ダイナミックなブックマーク管理
拡張機能のインターフェイスで「ブックマーク」を選択し、キーワード(例:「機械学習」)やトピックを入力すると、OpenDiaがブラウザの履歴をスキャンし、関連するウェブページをリストアップする。ブックマークのエクスポートやレポートの作成にも対応しており、研究データの整理に便利です。 - ページスタイルのカスタマイズ
拡張機能のスタイリングツールを開き、プリセットスキンまたはカスタムCSSを選択して、ウェブページのフォント、色、レイアウトを調整します。この機能は、ウェブページをナイトモードに切り替えるなど、読書体験を最適化するのに理想的です。 - 複数のタブをバックグラウンドで実行
OpenDiaはバックグラウンドでのタスク処理をサポートします。ユーザーは同時に複数のタブを開き、異なるコマンドを実行することができます(例えば、あるタブで検索し、別のタブでフォームに入力する)。バックグラウンドでの実行により、タスクが中断されることはありません。
ほら
- Node.jsとサーバーが正しく動作していることを確認してください。そうでない場合、エクステンションは接続できません。
- リモート操作には、ngrok接続の中断を避けるために安定したネットワークが必要です。
- 拡張機能は高い権限を必要とし、ブラウザのセキュリティ警告を引き起こす可能性があるため、手動で信頼性を確認してください。
- このプロジェクトはオープンソースソフトウェアであり、公式な技術サポートはない。
アプリケーションシナリオ
- 学術研究
研究者はOpenDiaを使って、ブラウザの履歴から学術論文を素早く検索し、重要な情報を抽出して要約を作成することができる。例えば、"Find machine learning articles read this week "と入力すると、関連するウェブページのリストとその内容の要約が表示される。 - 自動化されたワークフロー
OpenDiaを使えば、マーケティング担当者は、コンテンツの一括投稿やデータ収集といったソーシャルメディア上のアクションを自動化できる。LinkedInでAI関連の仕事を検索」とコマンドを入力すると、検索と結果の照合が自動化される。 - パーソナライズされたブラウジング体験
ユーザーは、ページスタイルのカスタマイズ機能を通じて、ウェブページの読書体験を最適化することができ、長時間の読書や高コントラストのインターフェイスを必要とするユーザーに適している。 - 開発とテスト
開発者はOpenDiaのMCPプロトコルを活用して、カスタムAIツールを開発し、ブラウザ自動化機能をテストし、より多くの統合の可能性を探ることができる。
品質保証
- オープンダイヤはインターネット接続が必要ですか?
オープンダイヤのコア機能はローカルで動作するため、インターネット接続は必要ありません。リモートコントロールやオンラインコンテンツへのアクセスにはネットワークサポートが必要です。 - 対応するAIモデルは?
オープンダイヤは、MCPプロトコルを介してClaude、ChatGPT、ローカルLLMをサポートしており、ユーザーはモデルを設定する必要がある。 - 完全無料ですか?
はい、OpenDiaはMITライセンスの下で利用可能であり、完全に無料です。ユーザーが負担するのは、実行環境のハードウェア費用のみです。 - エクステンションがサーバーに接続できない問題を解決するには?
サーバーがlocalhost:5555
ポートが占有されていない場合は、ポートが占有されていないことを確認してください。サーバーを再起動するか、ポートを変更して問題を解決してください。