Chutes: uma plataforma de computação sem servidor para implementar e dimensionar modelos de IA de código aberto
Chutes是一个为开发者设计的AI模型计算平台。 它基于去中心化的开源架构,用户不需要自己管理复杂的服务器。 使用这个平台,开发者可以快速部署和运行各种开源的人工智能模型,例如大语言模型或图像生成模型。 Ch...
vLLM CLI: ferramenta de linha de comando para implantação de modelos de idiomas grandes com o vLLM
O vllm-cli é uma ferramenta de interface de linha de comando para o vLLM que facilita muito a implantação e o gerenciamento de grandes modelos de linguagem. A ferramenta oferece uma interface de menu interativa e um modo de linha de comando tradicional. Ela permite que os usuários gerenciem modelos locais e remotos, usem esquemas de configuração predefinidos ou personalizados,...
LMCache: uma ferramenta de otimização de cache de valores-chave para acelerar o raciocínio em grandes modelos de linguagem
O LMCache é uma ferramenta de otimização de cache de valor-chave (KV) de código aberto projetada para melhorar a eficiência do raciocínio em modelos de linguagem grande (LLMs). Ela reduz significativamente o tempo de inferência e o consumo de recursos da GPU armazenando em cache e reutilizando os resultados de computação intermediários (cache de valor-chave) do modelo, o que é especialmente adequado para cenários de contexto longo.
FastDeploy: uma ferramenta de código aberto para implantação rápida de modelos de IA
O FastDeploy é uma ferramenta de código aberto desenvolvida pela equipe do PaddlePaddle que se concentra na implantação rápida de modelos de aprendizagem profunda. Ela oferece suporte a uma ampla variedade de hardware e estruturas, abrangendo mais de 20 cenários, como imagem, vídeo, texto e fala, e contém mais de 150 modelos convencionais. O FastDeploy oferece um ambiente de produção pronto para uso ....
Web - Navegador de IA do macOS: um navegador nativo com tecnologia de IA para macOS
O Web é um projeto de navegador de código aberto para macOS desenvolvido pela nuance-dev e hospedado no GitHub. Ele se baseia no mecanismo WebKit da Apple, usando as estruturas SwiftUI e Combine, e segue a arquitetura MVVM. O principal recurso do Web é o conjunto de ...
Transformers: estrutura de modelagem de aprendizado de máquina de código aberto com suporte para tarefas de texto, imagem e multimodais
O Transformers é uma estrutura de aprendizado de máquina de código aberto desenvolvida pela Hugging Face que se concentra em fornecer definições avançadas de modelos para dar suporte à inferência e ao treinamento para tarefas de texto, imagem, áudio e multimodais. Ele simplifica o processo de uso de modelos e é compatível com muitas estruturas de aprendizagem profunda convencionais, como PyTorch, Tens .....
Hyperspace (aiOS): rede de compartilhamento de aritmética de IA distribuída, navegador generativo do aiOS, inteligências de conhecimento profundo
O Hyperspace é um navegador generativo inovador (aiOS), baseado na maior rede de IA ponto a ponto do mundo, projetado para oferecer aos usuários ferramentas poderosas para pesquisa e análise profundas. Ao integrar uma ampla variedade de modelos de IA e fontes de dados, o Hyperspace permite que os usuários gerem rapidamente redes de informações, utilizando fontes de alta qualidade, como o Wikiped...
RunPod: serviço de nuvem de GPU projetado para IA com SD de inicialização rápida e pagamento por segundo
O RunPod é uma plataforma de computação em nuvem projetada especificamente para IA, com o objetivo de fornecer aos desenvolvedores, pesquisadores e empresas uma solução completa para o desenvolvimento, treinamento e dimensionamento de modelos de IA. A plataforma integra recursos de GPU sob demanda, raciocínio sem servidor e dimensionamento automático para oferecer suporte avançado a todos os estágios dos projetos de IA....
OpenBayes: implementação rápida de instâncias de modelos grandes e avançados usando recursos de computação em nuvem
O OpenBayes é uma plataforma de serviços de inteligência artificial e computação de alto desempenho (AI+HPC) pronta para uso para engenheiros de aprendizado de máquina, que oferece suporte a estruturas de várias versões e conjuntos de dados avançados. Com base no JupyterLab, ele oferece suporte à conteinerização e ao agendamento de recursos do Kubernetes. Ao mesmo tempo, abre uma variedade de APIs e opções de implementação privada...
Range Rover Starship: fornecendo uma plataforma integrada para aritmética de GPU e treinamento e raciocínio de IA na nuvem
A Lanrui Starship (Lanrui-ai) é uma plataforma que fornece AIGC (Conteúdo Gerado por Inteligência Artificial) baseado em nuvem e treinamento de IA e aritmética de integração push. A plataforma é desenvolvida de forma independente pela Wingsquare e tem como objetivo fornecer aos usuários soluções aritméticas de IA econômicas. O Rangefinder Starship integra uma variedade de cadeias de ferramentas de IA e oferece suporte a várias máquinas e cartões distribuídos...
Ollama: Implementação nativa de modelos de linguagem grande de código aberto com um clique
Ollama Descrição geral O ollama é uma estrutura leve para executar modelos de linguagem nativa, permitindo que os usuários criem e executem facilmente modelos de linguagem grandes. Ele oferece várias opções de início rápido e instalação, é compatível com o Docker e inclui um rico conjunto de bibliotecas para os usuários escolherem. É fácil de usar, fornece aplicativos REST...
voltar ao topo