O Omni-Bot-SDK-OSS é uma estrutura de automação do WeChat de código aberto baseada na tecnologia de reconhecimento visual que oferece suporte às operações de RPA (Robot Process Automation) do WeChat versão 4.0. Ele atinge intrusão zero no tempo de execução por meio de modelos YOLO personalizados e tecnologia OCR, adequados para que os desenvolvedores criem tarefas de automação. Os usuários podem pegar dinamicamente...
O Simular Browser é um navegador baseado em inteligência artificial projetado para automatizar operações na Web e ajudar os usuários a concluir tarefas repetitivas com eficiência. Ele usa comandos de linguagem natural para navegação na Web, preenchimento de formulários e captura de dados sem a necessidade de escrever códigos complexos.
O Simular Pro é uma inteligência de IA baseada em uma estrutura neural-simbólica projetada para o macOS (Apple Silicon). Ele automatiza tarefas complexas de desktop por meio de comandos de linguagem natural que imitam o comportamento humano na operação de um computador, como clicar, digitar e rolar a tela. O produto enfatiza a execução transparente, e os usuários sempre podem verificar...
legacy-use é uma ferramenta de código aberto cuja função principal é fornecer uma interface de API REST moderna para software de desktop antigo e sem API (geralmente chamado de "software legado"). Ela usa uma inteligência de IA para "observar" a interface gráfica do usuário (GUI) do software e imitar as teclas de um usuário humano...
O BrowserOS é um navegador inteligente de IA de código aberto, desenvolvido no Chromium e compatível com todas as extensões do Chrome. Ele enfatiza a proteção da privacidade, e todos os dados e modelos de IA são executados localmente, com os usuários tendo a opção de usar suas próprias chaves de API ou modelos locais, como o Ollama.BrowserO...
O Nxtscape é um navegador inteligente de código aberto com ênfase na proteção da privacidade e em recursos de IA localizados. Seu design principal é baseado na segurança dos dados do usuário, permitindo que os usuários executem modelos locais de IA com suas próprias chaves de API ou por meio do Ollama, garantindo que os dados de navegação não sejam carregados na nuvem.
O Suna é um agente de IA de uso geral de código aberto desenvolvido pela Kortix AI, hospedado no GitHub, com base na licença Apache 2.0, permitindo que os usuários façam download, modifiquem e hospedem o agente gratuitamente. Ele ajuda os usuários em tarefas complexas, como navegação na Web, gerenciamento de arquivos, rastreamento de dados e site ..... por meio de diálogo em linguagem natural
O Strawberry é um navegador inteligente com um assistente de IA integrado, projetado para ajudar os usuários a automatizar suas tarefas diárias e aumentar a eficiência. Diferentemente dos navegadores tradicionais, ele integra a tecnologia de IA para entender o conteúdo da Web em tempo real e executar tarefas complexas, como pesquisa rápida, redação de conteúdo e agrupamento de dados. Os usuários podem simplesmente...
O Fellou é o primeiro navegador orientado à ação habilitado para IA do mundo, da Fellou AI. O Fellou é o primeiro navegador de ação habilitado para IA do mundo, que não apenas fornece a funcionalidade de navegação na Web de um navegador tradicional, mas também automatiza tarefas e busca informações detalhadas por meio de IA...
O AiPy é uma ferramenta de linha de comando Python de código aberto desenvolvida pela equipe Knownsec. Ela combina o Large Language Model (LLM) e o ambiente de tempo de execução do Python para permitir que os usuários gerem e executem automaticamente o código Python, descrevendo tarefas em linguagem natural.
O DroidRun é uma ferramenta de código aberto que permite que a IA opere um telefone Android como um ser humano. Ela ajuda a IA a automatizar tarefas, como abrir aplicativos, enviar mensagens ou navegar na Web, extraindo elementos interativos, como botões na tela, caixas de entrada etc. O DroidRun combina análise visual e análise da estrutura da interface do usuário para operar com precisão...
O Agent S é uma estrutura de código aberto desenvolvida pela Simular AI que permite que inteligências operem computadores como seres humanos por meio de uma interface gráfica do usuário (GUI). Ele usa um modelo de macrolinguagem multimodal e técnicas de aprendizado empírico para executar tarefas como navegar na Web, editar documentos e usar software. O projeto é de código aberto no GitHub e foi desenvolvido...
Libra é uma ferramenta inovadora da Greenbit.ai, cuja função principal é gerar inteligências de IA que podem ser executadas localmente por meio de diálogo em linguagem natural. Chamada de "Vibe Agent", ela permite que os usuários criem rapidamente suas próprias inteligências, descrevendo suas necessidades em termos simples, e realizem pesquisa na Web, análise de dados, visualização...
O Optexity é um projeto de código aberto no GitHub, desenvolvido pela equipe do Optexity. Sua essência é usar dados de demonstração humana para treinar a IA para concluir tarefas de computador, especialmente operações de páginas da Web. O projeto consiste em três bibliotecas de código: ComputerGYM, AgentAI e Playwright...
O RunRabbit é uma ferramenta baseada em IA que permite aos usuários controlar seus navegadores para executar várias tarefas por meio de comandos simples de voz ou texto. Sua melhor característica é que ele entende as necessidades do usuário e, em seguida, manipula automaticamente as páginas da Web, como a busca de informações, o preenchimento de formulários ou a execução de tarefas repetitivas. O site foi desenvolvido por uma empresa de...
O LangGraph CUA é um projeto de código aberto desenvolvido pela equipe do LangChain. Ele se baseia na estrutura LangGraph, permitindo que os desenvolvedores usem Python para criar inteligências de IA que possam operar computadores diretamente. O núcleo dessa ferramenta é o "Computer Use Agent" (CU...
O Agent TARS é uma inteligência de IA multimodal de código aberto da ByteDance, com recursos principais que ajudam os usuários a realizar tarefas complexas no computador, compreendendo visualmente o conteúdo da Web e combinando operações de linha de comando e sistema de arquivos. Em vez de exigir operações manuais como as ferramentas tradicionais, ele automatiza as tarefas do navegador, a edição...
O Playwright MCP é uma ferramenta de código aberto desenvolvida pela Microsoft e hospedada no GitHub. Ela permite que modelos de inteligência artificial controlem diretamente os navegadores por meio do protocolo MCP (Model Context Protocol), executando ações como abrir páginas da Web, clicar em elementos e inserir texto. A ferramenta é baseada no Pl...
O Airtop é uma ferramenta de automação de navegador baseada em IA. Ela permite que os usuários controlem os navegadores em nuvem para realizar operações complexas na Web, como fazer login em um site, rastrear dados ou executar tarefas de automação por meio de comandos simples de linguagem natural. Ele resolve o problema de scripts tradicionais complexos e propensos a erros...