O OmniSVG é um projeto de código aberto baseado em um modelo multimodal voltado para a geração de gráficos vetoriais editáveis de alta qualidade (formato SVG). Desenvolvido em conjunto pela Universidade de Fudan e pela equipe StepFun, o principal recurso do projeto é o uso de modelos linguísticos visuais pré-treinados para implementar as duas principais modalidades de geração:
- Geração de texto SVGSaída direta de gráficos vetoriais por meio de descrições em linguagem natural (por exemplo, "pentagrama vermelho")
- Imagem para SVGConverta imagens rasterizadas (por exemplo, PNG/JPG) em caminhos vetoriais dimensionáveis
Os principais recursos da versão atual também incluem:
- Geração de consistência de funçãoManutenção de estilos uniformes de personagens de anime com base em desenhos de referência
- Suporte a gráficos complexosIlustrações altamente detalhadas e desenhos de personagens podem ser exportados
- Conjuntos de dados e protocolos de avaliaçãoFornecimento do conjunto de dados do MMSVG (com subconjunto de ícones/ilustrações) e padrões de qualidade do MMSVG-Bench
O projeto se concentra no uso para pesquisa nesta fase e, no futuro, abrirá o código-fonte do modelo completo para dar suporte ao treinamento e à otimização definidos pelo usuário.
Essa resposta foi extraída do artigoOmniSVG: a partir de texto e imagens para gerar gráficos vetoriais SVG projeto de código abertoO































