Smart Dictation:書き起こし、翻訳、要約機能を組み合わせたAI音声処理ツール
Smart Dictationは、高度なAI技術を活用し、ユーザーが録音した音声を簡単にテキストに変換できる強力なmacOSアプリです。このアプリは、OpenAIの最新のGPT-4oとWhisperモデルを統合し、正確な書き起こし、翻訳、要約サービスを提供します。あなたが記憶しているかどうか......。
Voquill:音声をテキストに変換するブラウザ・プラグイン
VoquillはChromeにインストールされているAIツールです。どんなウェブサイトでも、キーボード入力の代わりに音声入力を使うことができる。メールを書くとき、チャットメッセージに返信するとき、ドキュメントを編集するとき、話すだけでVoquillがあなたの声をリアルタイムでテキストに変換します。基本的な音声リスニングに加え...
Grabcube:AI文字起こし・翻訳ツール付き無料ダウンロード動画
Grabcubeは、ビデオやオーディオのダウンロード、AI音声テキスト、字幕翻訳や編集に焦点を当てた無料のオーディオおよびビデオ処理ツールです。YouTube、Bilibili、Vimeoなど1,000以上の主要プラットフォームをサポートしており、ユーザーは制限なく複数の形式の動画や音声ファイルをダウンロードすることができます。
Kitten-TTS-Server: セルフデプロイ可能な軽量音声合成サービス
Kitten-TTS-Serverは、軽量なKittenTTSモデルの機能拡張サーバーを提供するオープンソースプロジェクトです。ユーザーはこのプロジェクトを使って独自の音声合成(TTS)サービスを構築することができます。このプロジェクトの核となる利点は、オリジナルのモデルをベースにしていることです。
AI-Chatbox:ESP32S3ベースの音声テキストインテリジェント対話プロジェクト
AI-ChatboxはESP32S3開発ボードをベースにした音声対話プロジェクトです。ユーザーが音声でビッグモデル(LLM)に話しかけると、デバイスが音声をテキストに変換してビッグモデルに送信し、回答を得た後、さらに音声放送に変換することができます。このプロジェクトはRust言語を使って開発され、Vosk音声認識ワーカーと統合されています。
ウィスパー・オン・クラウドフレアAI:音声をテキストに変換し、字幕を生成する無料ツール
Whisper_Cloudflareは、開発者thun888によって作成され、GitHubでホストされているオープンソースプロジェクトです。OpenAIのWhisperモデルに基づいており、Cloudflare Workersのサーバーレスアーキテクチャを組み合わせて、非常に効率的な音声テキスト変換を提供します。
Spokenly:macOS用音声テキスト変換ツール
SpokenlyはmacOS用に設計された音声テキスト変換ツールで、ユーザーが音声でテキストを素早く入力し、作業効率を向上させるために設計されています。高度なAI技術(WhisperやGPT-4oなど)を利用して音声をリアルタイムでテキストに変換し、100以上の言語をサポートし、幅広いシーンに対応します。
Vibe Musicing:AI音楽ジェネレーター(無料、オンライン)
Vibe Musicingは無料のオンラインAI音楽ジェネレーターで、音楽の基礎がなくても、誰でもすぐにオリジナルの曲を作ることができます。ユーザーは、音楽のスタイルを選択し、歌詞を記入するか、またはAIに歌詞を自動生成させ、ニーズに応じてメロディ、リズム、雰囲気を簡単にカスタマイズすることができます。
AI Song Creator:テキストを高品質なオリジナル音楽に素早く変換するAIツール
AI Song Creatorは、ユーザーがテキストの説明や歌詞を入力することで、30~90秒でプロ品質のオリジナル音楽と歌詞を生成できるオンラインAI音楽生成プラットフォームです。エレクトロニック・ダンス・ミュージック、ローファイ、クラシック、K-POPなど40以上の音楽スタイルに対応しており、コンテンツ・クリエイターや観光客に最適です。
OpenWispr: プライバシー第一の音声テキストデスクトップアプリケーション
OpenWisprは、OpenAI Whisperテクノロジーに基づいたオープンソースのデスクトップ音声テキスト変換アプリケーションで、ユーザーの音声を素早くテキストに変換します。プライバシー保護に重点を置き、ローカルとクラウドの両方の処理オプションを提供し、データは完全にローカルに残すことができます。ユーザーはグローバルホットキーで素早くディクテーションを開始することができ、テキストは自動的に...
TEN: リアルタイムのマルチモーダル音声AIインテリジェンスを構築するオープンソースツール
TEN Frameworkは、開発者がリアルタイム、マルチモーダル、低遅延の音声AIインテリジェンスを構築することを支援することに重点を置いたオープンソースソフトウェアプラットフォームです。C, C++, Go, Python, JavaScript, TypeScriptを含む複数のプログラミング言語をサポートしています。開発者はTEN Frameworkを使用することで、スピーチ、ビジョン、AIインテリジェンスを素早く作成することができます。
Zaia Health:健康習慣をモニターし改善するAI音声アシスタント
Zaia Healthは、Zaiaと呼ばれる音声アシスタントを中心とした人工知能健康アプリである。 このアプリは、ユーザーが健康習慣に集中し、改善するのを助けるように設計されている。 このアプリは、音声対話を通じて、睡眠、運動、栄養、精神面など、個人的な健康コンパニオンとしてユーザーを導きます。
FineShare:AIの音声と音楽を生成するオーサリングツール
FineShareはAI音声・映像技術に特化したプラットフォームで、ユーザーが高品質な音声・音楽・映像コンテンツを作成するための様々なツールを提供している。同サイトの主力製品には、音声生成・変換、AI音楽作成、バーチャルカメラ用のFineVoice、Singify、FineCamがある。
SpleeterGui:簡単音楽トラック分離ツール
SpleeterGuiは、Deezerによって開発されたオープンソースの音楽分離ライブラリであるSpleeterをベースにした、Windowsユーザー向けのデスクトップアプリケーションです。シンプルなグラフィカルインターフェースにより、ユーザーはコマンドラインを使用することなく、音楽ファイルをボーカル、ドラム、ベースなどの複数のトラックに分離することができます。ユーザーは...
サイバースマート:テキストを音声に変換し、デジタルヒューマンビデオに変換する
Xunfei Zhizuoは、人工知能コンテンツ作成サービスを提供するためにXunfeiによって開発されたプラットフォームです。その中核機能は、ユーザーが入力したテキストを音声に変換することであり、このプロセスはしばしば「AIダビング」または「音声合成」と呼ばれる。ユーザーはプリセットされた様々なバーチャルボイス(すなわち「アンカー」)から選択することができる...
Any2Text: 音声とビデオをテキストに変換する無料AIツール
Any2Textは、音声や動画ファイルを素早くテキストに変換することに特化した無料のオンラインツールです。高度なAI音声認識技術を利用し、100以上の言語をサポートし、会議の録音、ポッドキャストの書き起こし、字幕の生成など幅広いシーンに適しています。ユーザー登録は不要で、操作も簡単です。
パロットTTS:ウェブテキストを自然な音声に変換する読み上げツール
Parrot TTSは、ウェブテキストを自然な音声に変換するために設計されたChrome拡張機能です。高度なAI技術を駆使して人間に近い音声体験を提供し、従来の音声合成ツールの機械的な音声の問題を解決します。ユーザーは、記事やニュース、研究資料をワンクリックで変換することができます...
Wavel AI:多言語映像の吹替・字幕を高速生成するツール
Wavel AIはAIベースのプラットフォームで、ビデオコンテンツの迅速な作成とローカライズを支援することに重点を置いている。音声クローニング、テキスト読み上げ、自動字幕生成などの機能により、ユーザーは多言語のビデオおよびオーディオコンテンツを簡単に作成することができます。このプラットフォームは70以上の言語をサポートし、1000以上の...
wukong-robot:パーソナライズされた中国語の音声対話を実現するスマート・スピーカー・プロジェクト
wukong-robotはオープンソースの中国語音声対話ロボットおよびスマートスピーカープロジェクトで、開発者がパーソナライズされたスマートスピーカーを迅速に構築できるように設計されています。中国語の音声認識、音声合成、多ラウンド対話機能をサポートし、ChatGPT、Baidu、KDDIなどの技術と統合されています。このプロジェクトはモジュール式に設計されており、...
トップに戻る