legacy-use é uma ferramenta de código aberto cuja função principal é fornecer uma interface de API REST moderna para software de desktop antigo que não tem interface de API (geralmente chamado de "software legado"). Ela usa uma inteligência de IA para "observar" a interface gráfica do usuário (GUI) do software e imitar as teclas digitadas por um usuário humano. Isso permite que os desenvolvedores enviem comandos simples para automatizar softwares antigos e fechados da mesma forma que fariam com uma API normal. Essa ferramenta resolve o problema de um grande número de organizações que ainda dependem de softwares essenciais, mas desatualizados, para seus negócios principais, mas não conseguem automatizá-los. Ela fornece uma ponte para que esses sistemas legados acessem o fluxo de trabalho automatizado moderno e as tecnologias de IA.
Lista de funções
- Camada de API de corpo inteligenteAPI: fornece uma camada de API orientada por IA para qualquer aplicativo de desktop (Windows, Linux, etc.) a ser chamado programaticamente.
- Simulação de operação humanaIdentificação de elementos de interface por meio de modelos visuais de IA, simulação de cliques de mouse e entradas de teclado e realização de diversas operações complexas.
- Conectividade e implementaçãoCapacidade integrada de lidar com conexões a protocolos de área de trabalho remota, como RDP, VNC, etc., e gerenciar filas de tarefas para executar comandos enviados ao sistema de destino.
- extração de dadosIntelligentsia é capaz de reconhecer e obter os dados necessários de uma interface de software, por exemplo, para extrair números de um relatório ou copiar informações de clientes.
- Encapsulamento da API RESTTodas as operações automatizadas e funções de extração de dados são unificadas e encapsuladas em uma interface de API REST padrão para facilitar a integração com outros sistemas.
- Monitoramento e intervenção manualOferece funcionalidade completa de registro e monitoramento com "grades de proteção" que permitem que os processos automatizados pausem e notifiquem um operador humano para intervir em caso de erro ou circunstância imprevista.
Usando a Ajuda
O legacy-use foi projetado para fornecer uma solução automatizada para software de desktop legado que não fornece uma API (Interface de Programação de Aplicativos). Ele funciona com a implantação de uma inteligência de IA que pode "ver" e "operar" a interface gráfica do software como um ser humano. Veja a seguir os detalhes de como ele funciona e como usá-lo:
Núcleo de Arquitetura
A arquitetura de uso de legado baseia-se no modelo "Computer Use" da Anthropic e estende seus recursos para software legado no Windows, Linux e outros sistemas operacionais. Em vez de invadir ou modificar o código do software legado, ela cria uma camada de interação fora dele, que consiste nos seguintes componentes:
- Infraestrutura de conexão
- conexão remotaO sistema precisa primeiro se conectar ao computador que executa o software de destino. O legacy-use oferece suporte a protocolos de conexão remota padrão, como
RDP
(Remote Desktop Protocol) eVNC
(Virtual Network Computing), e pode ser configurado para usar uma rede por meio doVPN
(Virtual Private Network) para uma conexão segura. - fila de tarefasFila de espera: Todos os comandos de operação enviados ao software de destino entram em um sistema de fila. Essa fila é responsável por gerenciar a ordem de execução e o status das tarefas para garantir operações ordenadas e confiáveis.
- conexão remotaO sistema precisa primeiro se conectar ao computador que executa o software de destino. O legacy-use oferece suporte a protocolos de conexão remota padrão, como
- Execução do agente de IA
- receber instruçõesComando: Você pode informar à inteligência de IA quais tarefas precisam ser realizadas enviando comandos avançados (Prompt). Por exemplo, "Abra o programa 'Customer Management', procure por 'Zhang San' e copie o número de telefone dele".
- Análise e manipulação visualInteligência: A inteligência recebe comandos e analisa a imagem da tela do computador de destino em tempo real. Ela usa técnicas de visão computacional para reconhecer elementos da interface, como janelas, botões, caixas de entrada, texto etc.
- Teclado e mouse analógicosCom base nos resultados de reconhecimento e nos requisitos de comando, o corpo inteligente simulará uma série de movimentos do mouse, cliques e entradas de teclado. Por exemplo, ele moverá o cursor do mouse até o botão "Search" (Pesquisar), clicará nele e, em seguida, digitará "Zhangsan" na caixa de entrada. Esse processo é mais tolerante a falhas do que as ferramentas tradicionais de automação da interface do usuário, como o UIPath, porque não depende de um layout de interface fixo, mas sim da compreensão visual para posicionar os elementos.
- Extração de dados e exposição à API
- rastreamento de dadosQuando é necessário obter informações do software, o corpo inteligente pode extrair dados de uma área especificada na tela ou de um campo de texto de acordo com uma instrução.
- Conversão para API RESTO passo mais importante é que o legacy-use encapsula todo o fluxo de operações, inclusive a entrada e a saída de dados, em uma interface simples de API REST. Isso significa que seus outros aplicativos agora podem acionar um conjunto complexo de operações do software antigo com uma única solicitação HTTP e receber os dados retornados. Por exemplo, você pode criar um endpoint de API
POST /api/getCustomerPhone
Quando essa interface é chamada, ela conclui automaticamente todo o processo de login, pesquisa e cópia de números, conforme descrito acima, e retorna o número de telefone.
- Monitoramento e barreiras de proteção
- Registro em logCada etapa executada pelas inteligências é registrada em detalhes, incluindo capturas de tela e registros de operação. Isso fornece uma base para depuração e auditoria.
- Mecanismos de intervenção artificialOs processos automatizados não são 100% perfeitos. O sistema aciona um mecanismo de "proteção" quando a inteligência encontra uma interface irreconhecível, uma falha no programa ou um erro inesperado. Nesse momento, o processo é pausado e um alerta é enviado a um operador humano designado, que pode assumir o controle e concluir manualmente a etapa atual antes de devolver o controle à inteligência.
Exemplo de fluxo de operação
Suponha que você precise gerar automaticamente relatórios de conformidade a partir de um software de contabilidade de 2009:
- Configuração de conexõesPrimeiro, configure o legacy-use para se conectar ao servidor Windows que está executando o software de contabilidade
RDP
Endereço e credenciais. - Definição de instruções de tarefasEscreva uma instrução clara (prompt) descrevendo as etapas completas para gerar o relatório: "Faça login no sistema, clique em 'Report Center', selecione 'Compliance Report', defina o intervalo de datas para este mês, clique no botão Gerar", aguarde a exibição do relatório, clique em "Exportar para PDF" e salve o arquivo na pasta "Relatórios" em sua área de trabalho. "
- Criação de pontos de extremidade de APIDefinir essa tarefa como um ponto de extremidade de API em uso herdado, por exemplo
/api/generateComplianceReport
. - Chamando a APIAs inteligências de IA da legacy-use se conectarão automaticamente ao servidor, abrirão o software de contabilidade e passarão por todos os cliques e entradas como um funcionário qualificado, salvando o relatório em um local designado.
Dessa forma, tarefas que exigiriam meia hora de trabalho manual agora podem ser automatizadas em minutos com uma única chamada à API.
cenário do aplicativo
- Automação de finanças e contabilidade
Uma empresa de contabilidade precisava gerar manualmente relatórios de conformidade para cada cliente a partir de um software financeiro de desktop lançado em 2009. Esse processo era complicado e propenso a erros. Usando o legacy-use, eles encapsularam todo o processo de geração de relatórios em uma API, que o novo sistema agora chama automaticamente para gerar relatórios para todos os clientes em lote, sem necessidade de intervenção manual. - Otimização do processo do sistema de gerenciamento de assistência médica
Um prestador de serviços de saúde depende muito de um sistema de prontuário eletrônico de saúde (EHR) antigo para o gerenciamento diário (por exemplo, entrada de informações do paciente, processamento de faturamento). O sistema não tinha API, o que dificultava a sincronização de informações entre diferentes departamentos. Eles implantaram o legacy-use para automatizar as tarefas administrativas do 30%. Por exemplo, quando o novo sistema recebe a consulta de um paciente, ele chama automaticamente o legacy-use para criar o registro correspondente no sistema EHR, reduzindo a carga de trabalho de entrada de dados da equipe da recepção. - Gerenciamento de inventário de fabricação
O software de gerenciamento de inventário da fábrica é executado em um computador local com Windows XP e exige que os funcionários verifiquem manualmente os níveis de inventário e os atualizem diariamente em uma planilha. Usando o legacy-use, é possível criar uma API que permita que um órgão inteligente abra o software de inventário em intervalos regulares ao longo do dia, consulte as quantidades dos principais materiais e grave automaticamente os resultados em um banco de dados on-line ou em uma tabela compartilhada, permitindo o monitoramento em tempo real dos níveis de estoque. - Unindo software tradicional e serviços modernos de nuvem
Uma empresa queria pegar os dados de seu antigo software de desktop de gerenciamento de relacionamento com clientes (CRM) e sincronizá-los com a plataforma Salesforce na nuvem. Com o legacy-use, uma inteligência pode ser configurada para consultar periodicamente o CRM antigo em busca de novos dados de clientes e gravar esses dados na nuvem por meio da API do Salesforce, fazendo assim a ponte entre os silos de dados dos sistemas antigo e novo.
QA
- Qual é a diferença entre o uso legado e as ferramentas de RPA, como o UIPath?
A principal diferença entre o uso do legado e as ferramentas tradicionais de RPA (por exemplo, UIPath) é a forma como ele é conduzido por seu núcleo. A RPA tradicional geralmente se baseia em regras predefinidas e posições fixas dos elementos da interface (por exemplo, XPath), o que pode levar à falha do processo de automação em caso de pequenas alterações na interface. O Legacy-use, por outro lado, baseia-se em um modelo visual de IA que "entende" o conteúdo da tela como um ser humano e é mais adaptável a mudanças no layout da interface, o que o torna mais tolerante a falhas. - Essa ferramenta é de código aberto? Onde posso encontrá-la?
Sim, o legacy-use é um projeto de código aberto. Você pode encontrar seu repositório de código-fonte no GitHub emhttps://github.com/legacy-use/legacy-use
. - Que tipo de conhecimento técnico é necessário para usar essa ferramenta?
O uso do legacy-use requer algum conhecimento técnico. Você precisa entender como implantar e configurar um serviço, entender os conceitos básicos das APIs REST e ser capaz de escrever instruções claras (Prompts) para direcionar as inteligências de IA. Destina-se principalmente a desenvolvedores ou equipes técnicas que buscam integrar sistemas legados a fluxos de trabalho modernos. - Qual software e quais sistemas operacionais são compatíveis com o legacy-use?
De acordo com a descrição do projeto, ele foi projetado como uma solução de uso geral que pode adicionar uma camada de API a qualquer aplicativo de desktop, incluindo software no Windows, Linux e outros sistemas operacionais. Ele se conecta por meio do protocolo de área de trabalho remota (RDP/VNC), de modo que, teoricamente, qualquer ambiente de área de trabalho que possa ser acessado remotamente pode ser suportado.