開発計画の公表
プロジェクトの文書や開発者へのインタビューによると、焦点は今後6ヶ月間である:
- 言語拡張フランス語と日本語のサポートは2024年第3四半期までに完了。
- エモーションエンジン喜怒哀楽など8つの感情パラメータを追加(ベータ版は社内テスト済み)
- ハードウェアアクセラレーションNVIDIA Tensor CoreとIntel OpenVINOのための独自の最適化。
コミュニティ主導の機能
オープンソースコミュニティで議論されている機能案には、以下のようなものがある:
- 方言サポート広東語、関西日本語、その他の地域バリエーション
- 声紋クローニング特徴抽出のためのサンプル音声のアップロードを許可します。
- クラウドコラボレーションクラウドにおけるローカルモデルと大規模モデルのハイブリッド推論スキーム
エコロジカル・コンストラクション
ボイススタイルマーケットプレイス(ボイスマーケットプレイス)を創設し、開発者が利用できるようにする計画もある:
- カスタム・トレーニング・サウンドモデルを共有する
- プロフェッショナル・ナレーション・パッケージ販売の商業化
- プラグインシステムでサウンド処理機能を拡張
この答えは記事から得たものである。ココロ-ONNX:多言語・多音声をサポートする効率的な音声合成ツールについて





























