O Seed Diffusion é um modelo de linguagem experimental lançado em conjunto pela equipe do ByteDance Seed e pela Academy of Intelligent Industry Research (AIR) da Universidade de Tsinghua. O modelo adota a técnica de difusão discreta como sua arquitetura principal e tem como objetivo explorar as possibilidades dos modelos de linguagem da próxima geração. Sua plataforma de demonstração de tecnologia oferece uma experiência interativa intuitiva, e o modelo se concentra em verificar a eficácia de sua aplicação no domínio da geração de código.
Diferentemente dos modelos autorregressivos tradicionais, o Seed Diffusion utiliza um mecanismo de geração paralela para refinar progressivamente de um rascunho difuso a um resultado completo, uma inovação que permite alcançar um grande avanço na velocidade de inferência. A introdução desse modelo fornece novas ideias técnicas para lidar com problemas complexos de inferência estruturada.
Essa resposta foi extraída do artigoDifusão de sementes: validação de modelos de linguagem de alta velocidade para arquiteturas de última geraçãoO