O Voxtral é seu primeiro modelo de áudio aberto lançado em 15 de julho de 2025 pela startup francesa de IA Mistral AI. O objetivo do Voxtral é fornecer aos aplicativos comerciais recursos de compreensão de fala prontos para uso em ambientes de produção, a um preço altamente competitivo no mercado. O modelo Voxtral está disponível em duas versões para ....
legacy-use é uma ferramenta de código aberto cuja função principal é fornecer uma interface de API REST moderna para software de desktop antigo e sem API (geralmente chamado de "software legado"). Ela usa uma inteligência de IA para "observar" a interface gráfica do usuário (GUI) do software e imitar as teclas de um usuário humano...
O Portia AI é um kit de desenvolvimento de software (SDK) Python de código aberto voltado para ajudar os desenvolvedores a criar fluxos de trabalho inteligentes e automatizados. Ele facilita aos usuários projetar e executar processos de tarefas complexas por meio de um sistema de inteligência múltipla. O Portia AI ajuda os desenvolvedores a personalizar fluxos de trabalho, fornecendo...
O CanonSwap é um projeto de pesquisa e uma estrutura que se concentra na tecnologia de troca de faces de vídeo. Ele se concentra na solução de um desafio central das tecnologias existentes: ao substituir o rosto de um personagem em um vídeo, muitas vezes são destruídos os atributos dinâmicos do vídeo original, como a expressão do personagem, o movimento da cabeça e a sincronização da boca, resultando em uma troca de rosto não natural e instável...
O BrowserOS é um navegador inteligente de IA de código aberto, desenvolvido no Chromium e compatível com todas as extensões do Chrome. Ele enfatiza a proteção da privacidade, e todos os dados e modelos de IA são executados localmente, com os usuários tendo a opção de usar suas próprias chaves de API ou modelos locais, como o Ollama.BrowserO...
O Scira MCP Chat é uma ferramenta de bate-papo de IA de código aberto criada com base no protocolo MCP (Model Context Protocol). Ele oferece suporte a vários modelos de IA por meio do Vercel AI SDK, permitindo que os usuários se conectem a diferentes servidores MCP e ampliem a funcionalidade de IA. O projeto foi desenvolvido por Zai...
O geminicli2api é um servidor proxy de código aberto baseado em FastAPI hospedado no GitHub. Ele converte a funcionalidade da CLI do Google Gemini em uma interface de API compatível com a OpenAI e oferece suporte a pontos de extremidade nativos da API do Gemini. Os desenvolvedores ...
O Xiaozhi Client é um aplicativo de assistente de IA multiplataforma desenvolvido com base na estrutura Flutter, compatível com várias plataformas, como Android, iOS, Web, Windows, macOS e Linux. Ele consegue interação de voz em tempo real e diálogo de texto por meio da tecnologia WebSocket, para que os usuários possam se comunicar com o assistente de IA a qualquer hora e em qualquer lugar. Item...
O Refact.ai é um assistente de programação de IA de código aberto projetado para desenvolvedores, compatível com os principais IDEs, como o Visual Studio Code e o JetBrains. O Refact.ai melhora drasticamente a produtividade da programação por meio do recurso inteligente de autocompletar código, refatoração de código e interação de linguagem natural.
O Chrome MCP Server é uma extensão baseada no Chrome. Ela permite que assistentes de IA (como o Claude) controlem diretamente o navegador Chrome de um usuário por meio do protocolo MCP (Model Context Protocol), possibilitando operações automatizadas complexas, análise de conteúdo e análise semântica...
O MemOS é um sistema de código aberto voltado para o aprimoramento da memória de modelos de linguagem grandes (LLMs). Ele ajuda os modelos a armazenar, recuperar e utilizar melhor as informações contextuais por meio de mecanismos inovadores de gerenciamento e agendamento de memória. O MemOS se destaca em tarefas como inferência de vários saltos, questionamento de domínio aberto e inferência temporal, em comparação...
O CosyVoice é um modelo de geração de fala multilíngue de código aberto que se concentra na tecnologia de conversão de texto em fala (TTS) de alta qualidade. Ele suporta a síntese de fala em vários idiomas, fornecendo recursos como geração de fala com amostra zero, clonagem de fala em vários idiomas e controle de sentimento refinado. O CosyVoice 2.0 é comparado à versão anterior, significativamente...
O Qwen3-8B-BitNet é um modelo de linguagem grande de código aberto desenvolvido e hospedado pelo usuário codys12 do Hugging Face. O modelo é baseado no Qwen3-8B ajustado com a tecnologia BitNet, usando um conjunto de dados de cerca de 1 bilhão de tokens (Prime I...
O xmcp é uma estrutura de desenvolvimento baseada em TypeScript projetada para criar e distribuir aplicativos MCP (Model Context Protocol). Ele simplifica o processo de desenvolvimento, permitindo que os desenvolvedores criem rapidamente ferramentas eficientes e as implementem no ecossistema MCP. O xmcp se concentra na experiência do desenvolvedor, fornecendo roteamento do sistema de arquivos...
21st.dev é uma plataforma de código aberto voltada para a criação, o compartilhamento e a instalação de componentes de IU React. Inspirada no shadcn/ui, ela fornece componentes leves e modernos com base no Tailwind CSS e no Radix UI. Os desenvolvedores podem instalar rapidamente os componentes, publicar seu trabalho ou gerar diversas variações de IU por meio de IA...
O Trae Agent é uma ferramenta de automação de tarefas de engenharia de software baseada no modelo de linguagem grande (LLM) de código aberto da ByteDance. Ele recebe instruções de linguagem natural por meio de uma interface de linha de comando (CLI) para automatizar tarefas de programação complexas, como escrever código, corrigir bugs ou otimizar programas. O projeto está atualmente em fase alfa...
A Gen CLI é uma ferramenta de linha de comando de código aberto baseada em uma bifurcação da Gemini CLI do Google, hospedada no GitHub e projetada para desenvolvedores. Ela fornece recursos de IA por meio do terminal, oferece suporte a modelos de IA, como o DeepSeek, e permite que os usuários gerem código usando linguagem natural, automatizem tarefas de desenvolvimento...
O DeepResearch é um assistente de pesquisa de IA de código aberto, hospedado no GitHub, projetado para ajudar os usuários a automatizar a pesquisa profunda por meio de uma combinação de mecanismos de pesquisa, rastreamento da Web e Modelagem de Linguagem Grande (LLM). Ele foi criado pelo desenvolvedor cat3399 com o objetivo de fornecer uma ferramenta de pesquisa fácil de usar que pode...
O THESIS Agent é uma ferramenta de inteligência artificial de código aberto hospedada no GitHub, criada para ajudar os usuários a concluir trabalhos acadêmicos com mais eficiência. Ele alivia o trabalho tedioso envolvido na pesquisa acadêmica automatizando o processamento de documentos, analisando dados e gerando conteúdo. O projeto baseia-se em um modelo de linguagem avançado que combina inteligência múltipla...