
Code2Videoは、NUS Show Labが開発した画期的な動画生成フレームワークであり、高品質の教育用動画を「コード中心」で生成することを基本理念としている。ピクセルを直接生成する従来のAI動画モデル(例:Sora)とは異なり、Code2Videoは動画を直接「描画」しない...

ChatTutorはオープンソースのビジュアル対話型AI教材です。従来のチャットボットは、主にテキストを介して対話し、それはほとんどのシナリオで十分ですが、科学や工学の学習では、プレーンテキストで伝えることができる情報は非常に限られています。ChatTutorは、AIのようなツールを装備することによって、この問題を解決することを目指しています...

ALLWEONE presentation-aiは、有名なアプリGamma.appに代わるオープンソースの人工知能プレゼンテーション生成ツールです。 ユーザーはトピックを入力するだけで、数分で完成度の高いプロフェッショナルなスライドを自動的に作成します。このツールには高度な...

Drawnixは強力なオープンソースのオンラインホワイトボードツールで、無限のキャンバス上にマインドマップ、フローチャート、手描き機能を統合し、ユーザーに自由な創造を提供します。このツールは無料で、複雑なインストールやデプロイをすることなく、ブラウザ上で直接使用することができます。

DeepAnalyzeは、自律的なデータサイエンスのために設計されたインテリジェントなエージェント大規模言語モデルである。 人間の介入なしに、データの準備、分析、モデリング、可視化、レポート生成など、データサイエンス・プロセス全体のタスクを独立して実行することができます。

GEPA(Genetic-Pareto)は、AIシステムにおける様々なタイプのテキスト・コンポーネントを最適化するためのフレームワークである。これらのテキスト・コンポーネントは、AIモデルのプロンプト、コード・スニペット、あるいは設定ファイルである。大規模言語モデル(LLM)を通じてAIシステムを分析・考察するために、リフレクティブ・テキスト・エボリューションと呼ばれるアプローチを用いている。

DeepSeek-OCRは、DeepSeek-AIによって開発され、オープンソース化された光学式文字認識(OCR)ツールです。 大規模言語モデル(LLM)の観点から視覚コーダーの役割を再考する「文脈的光学圧縮」と呼ばれる新しいアプローチを提案しています。 このツールは単に...

grok2apiはFastAPIフレームワークのリファクタリングに基づくオープンソースプロジェクトで、X (旧Twitter) Grokの大規模なWebページ呼び出し形式のモデルをOpenAI APIインターフェースと完全に互換性を持つように設計されています。 これにより、開発者は Grok のパワーを簡単に ... に統合することができます。

ArborisはAIツールである。小説家がアイデアから完全なストーリーを構築するのを助ける。ユーザーが簡単なコンセプトを入力すると、AIが世界観、登場人物、人間関係の網を生成する。このツールはまた、アイデアをストーリーのアウトラインに拡張し、下書きの章を書く。各小説は、すべての内容が明確に整理されたプロジェクトとして管理される。ユーザーは...

Paper2Videoはオープンソースプロジェクトであり、研究者が学術発表のビデオを準備する労苦から解放されることを目的としている。 プロジェクトの中心は、PaperTalkerと呼ばれるマルチ・インテリジェンス・フレームワークで、LaTeXで書かれた論文、講演者の参考画像、参考音声を受け取る。

バナナ・スーパーマーケット」としても知られるナノ・バナナは、オープンソースのアプリケーションである。写真や動画を簡単に生成・編集することができる。このツールの最大の特徴は「ワンクリック生成」で、ユーザーは自分で複雑なプロンプトを書く必要がありません。必要なのは、画像をアップロードし、プロンプトを選択するだけです。

Scribbler は、ブラウザで直接動作する JavaScript ノートブックツールです。 開発者、エンジニア、研究者に、JavaScript コードの実験と実行のためのシンプルなオンラインインターフェースを提供する。 このツールはオープンソースで無料で使用でき、登録ログインは不要です。 ...

AIClient-2-APIは、開発者向けの軽量APIプロキシツールで、複数のAIクライアントの認証とリクエストプロセスのシミュレーションに重点を置いている。このプロジェクトは、GoogleのGemini CLI、AliのQwen Code Plus、Kir...など、クライアントサイドでの使用に限定されるビッグモデル・サービスを取り込んでいる。

OpenAdaptは、強力な大規模マルチモーダルモデル(Large Multimodal Models: LMM)をコンピュータのグラフィカルユーザーインターフェース(Graphical User Interface: GUI)に接続し、プロセスの自動化を目的としたオープンソースのソフトウェアツールである。OpenAdaptはこのような問題を解決することを目的としています。

OmniInsertは、ByteDance Intelligent Creation Labによって開発された研究プロジェクトです。マスク(Mask)を使用することなく、任意の参照オブジェクトを動画にシームレスに挿入するツールです。従来のビデオ編集プロセスでは、ビデオに新しいオブジェクトを追加したい場合、通常は手動で...

AI-model-comparisonは、ブラウザ上で動作し、ユーザーが2つの異なる人工知能(AI)ビッグ言語モデルからの応答を並べて比較するのに役立つウェブツールです。ユーザーが質問を入力すると、ツールは設定された両方のモデルAPIに同時にリクエストを送信し、結果を並べて返します...

ReceiptHeroはオープンソースの領収書管理アプリケーションで、人工知能(AI)技術を使用して、ユーザーが様々な領収書を整理するのを支援する。 ユーザーは領収書の画像をアップロードすることができ、システムは光学式文字認識(OCR)技術を使って画像内のテキスト情報を自動的に読み取ることができる。この技術は、Together AIによって提案された。

Reddit AI Trend ReportsはオープンソースのPythonプロジェクトです。Redditコミュニティにおける人工知能(AI)に関する議論の傾向を、ユーザーが自動的に追跡・分析できるように設計されている。このツールは、ユーザーが指定したRedditのサブボードを取得することができます。

Fake News Detectorは、ファクトチェックに基づく自動フェイクニュース検出システムである。 人工知能技術、特に大規模言語モデル(LLM)と高度な埋め込みモデルを使用して、ニューステキストの信憑性を分析する。その中核となるワークフローは、まずユーザー入力からニュース・コンテンツを取り込み...
トップに戻る

