legacy-useは、APIインタフェースを持たない古いデスクトップ・ソフトウェア(しばしば「レガシー・ソフトウェア」と呼ばれる)に最新のREST APIインタフェースを提供することを中核的な役割とするオープンソース・ツールである。ソフトウェアのグラフィカル・ユーザー・インターフェース(GUI)を「観察」し、人間のキー入力を模倣するAIインテリジェンスを使用している。これにより開発者は、通常のAPIと同じように、古い閉鎖的なソフトウェアを自動化するための簡単なコマンドを送ることができる。このツールは、コア・ビジネスにおいて重要だが時代遅れのソフトウェアに依存しているにもかかわらず、それを自動化できない多くの組織の悩みを解決する。このツールは、レガシーシステムを最新の自動ワークフローとAIテクノロジーに接続するための橋渡しをする。
機能一覧
- インテリジェント・ボディAPIレイヤーあらゆるデスクトップアプリケーション(Windows、Linuxなど)をプログラムで呼び出すための、AI主導のAPIレイヤーを提供する。
- 人間の操作シミュレーションAIビジュアルモデルでインターフェイス要素を識別し、マウスクリックやキーボード入力をシミュレートし、さまざまな複雑な操作を完了します。
- 接続性と実装RDP、VNCなどのリモートデスクトッププロトコルへの接続を処理し、ターゲットシステムに送信されたコマンドを実行するためのタスクキューを管理する機能を内蔵。
- データ抽出例えば、レポートから数値を抽出したり、顧客情報をコピーしたりすることができます。
- REST APIのカプセル化自動化された操作とデータ抽出機能はすべて統一され、標準的なREST APIインターフェースにカプセル化されているため、他のシステムとの統合が容易です。
- 監視と手動介入自動化されたプロセスを一時停止し、エラーや不測の事態が発生した場合に人間のオペレーターが介入できるように通知する「ガードレール」を備えた、完全なロギングとモニタリング機能を提供します。
ヘルプの使用
legacy-useは、API(Application Programming Interface)を提供しないレガシーデスクトップソフトウェアの自動化ソリューションを提供するように設計されている。人間のようにソフトウェアのグラフィカル・インターフェースを「見て」「操作」できるAIインテリジェンスを配置することで機能する。ここでは、その仕組みと使い方の詳細を紹介する:
建築コア
レガシーユースアーキテクチャは、Anthropicの "Computer Use "モデルをベースに、その機能をWindowsやLinux、その他のオペレーティングシステム上のレガシーソフトウェアに拡張したものです。レガシーソフトウェアのコードをハックしたり修正したりする代わりに、レガシーソフトウェアの外側にインタラクションレイヤーを作成し、以下のコンポーネントで構成される:
- 接続インフラ
- リモート接続legacy-useは、以下のような標準的なリモート接続プロトコルをサポートしています。
RDP
(リモート・デスクトップ・プロトコル)とVNC
(仮想ネットワークコンピューティング)を介してネットワークを使用するように設定することができます。VPN
(Virtual Private Network)でセキュアな接続を実現します。 - タスクキュー: ターゲット・ソフトウェアに送られるすべての操作コマンドは、キュー・システムに入る。このキューは、タスクの実行順序とステータスを管理し、秩序ある信頼性の高いオペレーションを保証する役割を担っている。
- リモート接続legacy-useは、以下のような標準的なリモート接続プロトコルをサポートしています。
- AIエージェントの実行
- 指示を受ける高度なコマンド(プロンプト)を送信することで、AIインテリジェンスに実行すべきタスクを指示することができます。例えば、"『顧客管理』プログラムを開き、『張三』を検索し、彼の電話番号をコピーしてください"。
- 視覚分析と操作インテリジェンスはコマンドを受信し、リアルタイムでターゲットコンピュータの画面イメージを分析します。ウィンドウ、ボタン、入力ボックス、テキストなどのインターフェース要素を認識するために、コンピュータ・ビジョンの技術を使用します。
- アナログキーボードとマウス認識結果とコマンド要求に基づいて、インテリジェントボディは一連のマウス操作、クリック、キーボード入力をシミュレートする。例えば、マウスカーソルを「検索」ボタンに移動させてクリックし、入力ボックスに「Zhangsan」と入力する。このプロセスは、UIPathのような従来のUI自動化ツールよりもフォールトトレラントである。なぜなら、固定されたインターフェイスのレイアウトに依存するのではなく、視覚的な理解によって要素を配置するからである。
- データ抽出とAPI公開
- データクロールインテリジェントボディは、ソフトウェアから情報を取得する必要がある場合、指示に従って画面上の指定領域やテキストフィールドからデータを抽出することができる。
- REST APIへの変換最も重要なステップは、legacy-useがデータの入出力を含む操作の流れ全体を、シンプルなREST APIインターフェースにカプセル化することです。つまり、他のアプリケーションは、旧ソフトウェアからの複雑な一連の操作を単一のHTTPリクエストでトリガーし、返されたデータを受け取ることができる。例えば、次のようなAPIエンドポイントを作成できます。
POST /api/getCustomerPhone
このインターフェイスが呼び出されると、前述のログイン、検索、番号のコピーの全プロセスが自動的に完了し、電話番号が返される。
- 監視とガードレール
- ロギングインテリジェンスによって実行されるすべてのステップは、スクリーンショットや操作ログを含めて詳細に記録されます。これは、デバッグや監査の基礎となる。
- 人工的な介入メカニズム自動化されたプロセスは完璧ではない。インテリジェンスが認識できないインターフェース、プログラムのクラッシュ、予期せぬエラーに遭遇すると、システムは「ガードレール」メカニズムを作動させる。この時点でプロセスは一時停止され、指定された人間のオペレーターにアラートが送られる。オペレーターは、インテリジェンスに制御を戻す前に、現在のステップを引き継いで手動で完了させることができる。
運用フロー例
2009年の会計ソフトからコンプライアンス・レポートを自動生成する必要があるとする:
- コネクションの設定まず、レガシーユースを、会計ソフトが動作しているWindowsサーバーに接続するように設定します。
RDP
住所と資格 - タスク指示の定義システムにログインし、'Report Centre'をクリックし、'Compliance Report'を選択し、日付範囲を今月に設定し、'Generate'ボタンをクリックし、レポートが表示されるのを待ち、'Export to PDF'をクリックし、デスクトップの'Reports'フォルダにファイルを保存する。レポートが表示されるまで待ち、'Export to PDF'をクリックし、デスクトップの'Reports'フォルダにファイルを保存してください。"
- APIエンドポイントの作成このタスクをレガシーユースのAPIエンドポイントとして定義する。
/api/generateComplianceReport
. - APIの呼び出しlegacy-useのAIインテリジェンスが自動的にサーバーにログオンし、会計ソフトを開き、熟練した従業員のようにすべてのクリックと入力を行い、最終的にレポートを指定の場所に保存します。
このようにして、手作業で30分かかっていた作業が、APIを1回呼び出すだけで、数分で自動化できるようになった。
アプリケーションシナリオ
- 財務・会計の自動化
ある会計事務所では、2009年にリリースされたデスクトップ財務ソフトウェアから、顧客ごとのコンプライアンス・レポートを手作業で作成する必要があった。このプロセスは煩雑で、エラーが発生しやすいものだった。レガシーユースを使用することで、彼らはレポート生成プロセス全体をAPIにカプセル化し、新しいシステムが自動的にそのAPIを呼び出して、すべてのクライアントのレポートをバッチで生成するようになりました。 - 医療管理システムのプロセス最適化
ある医療機関は、日々の管理(患者情報の入力や請求処理など)を老朽化した電子カルテ(EHR)システムに大きく依存していた。このシステムにはAPIがなく、異なる部門間で情報を同期することが困難でした。そこで、30%の管理業務を自動化するためにlegacy-useを導入しました。 例えば、新システムが患者の予約を受け取ると、自動的にlegacy-useを呼び出し、EHRシステムに対応するレコードを作成し、フロントスタッフのデータ入力作業を軽減しました。 - 製造在庫管理
工場の在庫管理ソフトウェアはローカルのWindows XPマシン上で動作しており、従業員が毎日手作業で在庫レベルをチェックし、スプレッドシートに更新する必要がある。レガシーユースを使用することで、インテリジェントボディが一日中一定の間隔で在庫管理ソフトウェアを開き、主要材料の数量を照会し、その結果をオンラインデータベースまたは共有テーブルに自動的に書き込み、在庫レベルのリアルタイム監視を可能にするAPIを作成することができる。 - 従来のソフトウェアと最新のクラウドサービスの橋渡し
ある企業は、古い顧客関係管理(CRM)デスクトップ・ソフトウェアからデータを取り出し、クラウド上のSalesforceプラットフォームに同期させたいと考えていた。レガシーユースでは、古いCRMに定期的に新しい顧客データを照会し、そのデータをSalesforceのAPI経由でクラウドに書き込むようにインテリジェンスを設定できるため、新旧システム間のデータサイロを埋めることができる。
品質保証
- レガシーユースとUIPathのようなRPAツールの違いは?
レガシーユースと従来のRPAツール(UIPathなど)の主な違いは、そのコアによる駆動方法にある。従来のRPAは通常、あらかじめ定義されたルールとインターフェイス要素の固定位置(XPathなど)に依存しており、インターフェイスに小さな変更があった場合に自動化プロセスが失敗する可能性がある。一方、Legacy-useはAIビジュアルモデルに基づいており、人間のように画面上のコンテンツを「理解」し、インターフェイスレイアウトの変更にも適応できるため、より耐障害性に優れている。 - このツールはオープンソースですか?どこで手に入りますか?
はい、legacy-useはオープンソースプロジェクトです。ソースコードリポジトリはGitHubにあります。https://github.com/legacy-use/legacy-use
. - このツールを使うには、どのような技術的背景が必要ですか?
レガシーユースを使うには、ある程度の技術的なバックグラウンドが必要だ。サービスをデプロイして設定する方法を理解し、REST APIの基本概念を理解し、AIインテリジェンスに指示する明確な命令(プロンプト)を書くことができる必要があります。主に、レガシーシステムを最新のワークフローに統合しようとしている開発者や技術チームを対象としています。 - レガシーユースはどのOSのどのソフトウェアをサポートしていますか?
プロジェクトの説明によると、Windows、Linux、その他のオペレーティング・システム上のソフトウェアを含む、あらゆるデスクトップ・アプリケーションにAPIレイヤーを追加できる汎用ソリューションとして設計されている。リモート・デスクトップ・プロトコル(RDP/VNC)経由で接続するため、理論的にはリモート・アクセスが可能なあらゆるデスクトップ環境をサポートできる。