O llmware é uma estrutura de código aberto de nível empresarial focada na tecnologia Retrieval Augmented Generation (RAG), desenvolvida pela AI Bloks e que segue a licença Apache 2.0. Ele fornece uma cadeia completa de ferramentas de pipeline RAG que abrange o gerenciamento de todo o ciclo de vida, desde o acesso à fonte de conhecimento até a inferência do modelo de IA generativo. A estrutura contém mais de 50 modelos de linguagem grandes e dedicados (por exemplo, as famílias SLIM, DRAGON e BLING) otimizados para tarefas como perguntas e respostas, classificação e extração. Sua característica distintiva é que ele suporta a execução em ambientes de nuvem local ou privada, o que é particularmente adequado para setores com requisitos rigorosos de segurança de dados, como finanças e direito, e é compatível com uma ampla variedade de bancos de dados comuns e soluções de armazenamento vetorial.
Essa resposta foi extraída do artigollmware: uma estrutura de código aberto para criar rapidamente aplicativos RAG de nível empresarialO