シード・ディフュージョンは、並列デコードによる画期的な推論スピードアップを実現し、処理能力は毎秒2,146文字(トークン)と、従来の同サイズの自己回帰モデルの5.4倍である。この画期的な進歩は、拡散モデルのユニークな生成方法によるもので、単語ごとに逐次出力するのではなく、全体として並列処理される。
高速生成を維持しながら、モデルのパフォーマンスは、LiveCodeBenchやBigcode Benchなどの複数のコード・レビュー・ベンチマークにおいて、同じサイズの自己回帰モデルに匹敵します。この高速性能は、迅速な反復を必要とする開発シナリオに特に適しており、開発者にリアルタイムに近いコード生成体験を提供します。
この答えは記事から得たものである。シードの拡散:次世代アーキテクチャのための高速言語モデルの検証について