O OmniSVG é um projeto de código aberto desenvolvido em conjunto pela Universidade de Fudan e pela equipe da StepFun, com foco na geração de gráficos vetoriais editáveis (formato SVG) por meio de técnicas de IA multimodal. O projeto combina de forma inovadora modelos visuais-linguísticos pré-treinados para obter a capacidade de conversão bimodal de texto para SVG e de imagem para SVG. Em comparação com as ferramentas tradicionais de geração de gráficos vetoriais, o maior avanço do OmniSVG é seu suporte à geração de vetores em cenários complexos, incluindo diversos resultados, desde ícones simples até personagens de anime.
Em termos de implementação técnica, o projeto emprega estruturas avançadas de aprendizagem profunda (por exemplo, PyTorch e Transformers) e é acompanhado pelo lançamento de um conjunto de dados em grande escala, o MMSVG, otimizado para a geração de SVG. preservação da consistência do estilo dos caracteres.
A natureza de código-fonte aberto do projeto faz dele uma importante plataforma básica para pesquisa acadêmica e aplicativos comerciais e, com o lançamento completo do código principal no futuro, espera-se que ele tenha um impacto de longo alcance nas áreas de design de interface do usuário, criação de arte digital e educação.
Essa resposta foi extraída do artigoOmniSVG: a partir de texto e imagens para gerar gráficos vetoriais SVG projeto de código abertoO




























