OmniSVGは、高品質で編集可能なベクターグラフィックス(SVGフォーマット)の生成に焦点を当てたマルチモーダルモデルに基づくオープンソースプロジェクトである。復旦大学とStepFunチームによって共同開発されたこのプロジェクトの中核的な特徴は、2つの主要な生成モダリティを実装するために、事前に訓練された視覚言語モデルを使用することです:
- テキスト生成 SVG自然言語記述によるベクターグラフィックスの直接出力(例:「赤い五芒星)
- 画像からSVGへラスター画像(PNG/JPGなど)をスケーラブルなベクターパスに変換します。
現バージョンのコア機能には以下も含まれる:
- 役割の一貫性生成参考図面をもとにアニメキャラクターのスタイルを統一する
- 複雑なグラフィックスのサポート高精細なイラストやキャラクターデザインの書き出しが可能
- データセットと評価プロトコルMMSVGデータセット(アイコン/イラストのサブセット)とMMSVG-Bench品質基準の提供
このプロジェクトは、現段階では研究利用に重点を置いているが、将来的には、ユーザー定義のトレーニングや最適化をサポートするために、モデルコード全体をオープンソース化する予定である。
この答えは記事から得たものである。OmniSVG: テキストと画像からSVGベクターグラフィックスを生成するオープンソースプロジェクトについて































