Fogsightは、大規模言語モデル(LLM)によって駆動されるオープンソースのAIアニメーション生成ツールです。ユーザーが入力した抽象的な概念や単語を、中国語と英語のナレーション付きの完全な構造化された教育用アニメーションに変換する。ユーザーは「バブルソート」や「エントロピー増大の法則」などのトピックを入力するだけで、フォグサイトはナレーション、ビジュアル要素、モーションエフェクトを含むアニメーションを自動生成し、コンテンツを分かりやすく提示する。教育、ポピュラーサイエンス、クリエイティブな表現に適したこのツールは使いやすく、アニメーション効果を最適化するためのローカル展開や複数回の対話をサポートしている。FogsightのライセンスはMITライセンスであり、コードはGitHubで公開されているため、ユーザーは自由に使用したり変更したりすることができる。
機能一覧
- コンセプト回転ドローイング単語や概念を入力すると、自動的に中国語と英語の吹き替えによる教育用アニメーションが生成されます。
- インテリジェントなスケジューリングAIはボイスオーバー、ビジュアルエレメント、モーションエフェクトの作成を自動化し、物語的に完成度の高いアニメーションを生成します。
- 言語ユーザーインターフェース(LUI)アニメーションの内容を調整し、ビジュアルと吹き替えの効果を最適化する。
- 複数の大規模言語モデルをサポートグーグル対応 ジェミニ 2.5や他のモデルAPIは、異なるLLMに柔軟に適応する。
- ローカル展開ローカルでの実行をサポートし、ユーザーのプライバシーを保護し、オフラインでの使用に適しています。
- オープンソースで無料MITライセンスに基づき、コードは一般に公開されており、ユーザーが自由に改変して配布することができます。
ヘルプの使用
設置プロセス
Fogsightはローカルにデプロイする必要がある。以下は詳細なインストール手順である。Python 3.9以上、モダンブラウザ(Chrome、Firefox、Edgeなど)、大規模言語モデルのAPIキー(Google Gemini 2.5を推奨)が必要です。
- クローン・コード・リポジトリ
ターミナルを開き、以下のコマンドを入力してFogsightリポジトリをクローンする:git clone https://github.com/fogsightai/fogsight.git cd fogsight
- 依存関係のインストール
プロジェクト・ディレクトリで以下のコマンドを実行し、必要なPythonライブラリをインストールする:pip install -r requirements.txt
- APIキーの設定
FogsightはOpenAI互換のSDKを使用しているが、Google Gemini 2.5のAPIキーを推奨している。手順は以下の通り:- サンプル設定ファイルをコピーする:
cp demo-credentials.json credentials.json
- コンパイラ
credentials.json
ファイルに、APIキーとAPIのBASE_URLを入力する。
典型例credentials.json
フォーマット{ "API_KEY": "your_api_key_here", "BASE_URL": "https://api.gemini.google.com/v2.5" }
- ファイルを保存してキーを確保する。
- サンプル設定ファイルをコピーする:
- サービス開始
以下のコマンドを実行し、Fogsightのバックエンド・サービスを開始する:python start_fogsight.py
開始後、サービスは自動的にブラウザで開きます。
http://127.0.0.1:8000
.
使用方法
サービス開始後、Fogsightはシンプルで直感的なウェブインターフェースを提供します。以下は主な機能の流れです:
- アニメーションを生成する
- ウェブ・インターフェースで、入力ボックスを見つけてください。
- オイラーの定理」や「バブルソート」など、トピックやコンセプトを入力します。
- 生成」ボタンをクリックすると、AIが自動的に中国語と英語のナレーションとダイナミックな視覚効果を持つアニメーションを生成します。
- 生成プロセスは、トピックの複雑さやネットワークの速度にもよるが、数秒から数分かかる。
- 最適化されたアニメーション
- Fogsightは、ユーザーが対話を通じてアニメーションを調整できる言語ユーザーインターフェース(LUI)をサポートしています。
- インターフェイスで、"調整 "または "対話 "ボタンをクリックして対話モードに入ります。
- 色を増やす」「ナレーションをシンプルにする」など、具体的な要望を入力する。
- AIはフィードバックに基づいてアニメーションを再生し、満足するまで繰り返す。
- プレビューとエクスポート
- 生成されたアニメーションは、ウェブ・インターフェイスで直接プレビューすることができます。
- ビデオファイルへのエクスポートをサポート(特定のフォーマットはバージョンによって異なりますが、一般的にはMP4です)。
- エクスポートされたアニメーションは、教育、共有、さらに編集するために使用することができます。
ほら
- APIキー有効なAPIキーを入力しないと、ビッグ・ランゲージ・モデルに接続できません。
- 現地でのパフォーマンス複雑なアニメーションを生成するには、高い計算リソースが必要になる場合があります。
- ネットワーク環境ローカルでの展開にはインターネット接続は必要ありませんが、オンラインAPIを使用する場合は、安定したネットワークを維持する必要があります。
- ブラウザの互換性最新のChromeまたはFirefoxをご利用ください。
注目の機能
- コンセプト回転ドローイングFogsightの中核機能は、抽象的な概念を視覚化することである。例えば、「エントロピー増大の法則」と入力すると、AIがわかりやすいナレーションとともに、エントロピーが時間とともにどのように増大するかを示すアニメーションを生成します。これは、複雑な学術的概念を視覚的なコンテンツに変えるのに特に役立ちます。
- インテリジェントなスケジューリングAIは、スクリプト、ビジュアル・デザイン、モーション・エフェクトなど、アニメーションのあらゆる部分を自動化します。ユーザーはアニメーションの経験がなくても、テーマを提供するだけでよい。
- 言語ユーザーインターフェース(LUI)対話によるアニメーションの最適化は、『フォグサイト』独自の機能です。ユーザーはAIにアニメーションのテンポ、配色、ナレーションのスタイルを調整するよう依頼することができます。例えば、「もっと子供向けのアニメーションにして」と言うと、AIはよりきれいでカラフルなアニメーションを生成します。
- オープンソースとローカル展開Fogsightのコードは完全にオープンソースで、ユーザーはローカルで実行することができます。これにより、プライバシーが保護されるだけでなく、新しい視覚効果の追加や他の言語モデルのサポートなど、開発者のニーズに応じて機能をカスタマイズすることが容易になります。
アプリケーションシナリオ
- ティーチング・デモンストレーション
フォグサイトは数学、物理、コンピュータサイエンスなどのアニメーションを作成することができます。例えば、"バブルソート "と入力すると、ソートのプロセスを視覚化し、アルゴリズムのロジックを理解するためのアニメーションが生成されます。 - 人気科学コンテンツの制作
人気者は、「ブラックホール」や「量子もつれ」といった科学的概念を入力し、ソーシャルメディアや視聴者の興味を引く説明ビデオで使用するためのナレーション付きアニメーションを素早く生成することができる。 - 技術トレーニング
企業の研修担当者は、従業員向けに「ブロックチェーンの原理」のような技術関連のアニメーションを作成し、複雑な技術を視覚的に説明することで、研修の効果を高めることができる。 - 個人の創造的表現
クリエイターは、「自由」や「時間」といった抽象的な概念を入力することで、短いビデオ・プラットフォームやアート・プロジェクトのプレゼンテーションで使用する芸術的なアニメーションを生成することができる。
品質保証
- Fogsightのナレーションは何語に対応していますか?
現在のバージョンでは、英語と中国語のバイリンガルナレーションをサポートしています。将来的には、コミュニティからの貢献により、さらに多くの言語に対応する可能性があります。 - アニメーションの経験は必要ですか?
フォグサイトはシンプルに設計されており、ユーザーはテーマを入力するだけで、AIが自動的にすべてのアニメーションを行います。 - オフラインで使用できますか?
ローカルにデプロイした場合、Fogsightは完全にオフラインで実行できますが、アニメーションを生成するには、大規模な言語モデルに接続するための有効なAPIキーが必要です。 - アニメーションの生成速度を上げるには?
より性能の良いコンピューターを使用するか、APIキーの応答速度を最適化する。安定したネットワークを確保することで、生成時間を短縮することもできます。 - フォグサイトは有料ですか?
Fogsight自体はMITライセンスのもとフリーでオープンソースである。ただし、大規模言語モデルのAPIを使用する際には費用が発生する場合があります。