AIオーディオ

 ウェブサイトを投稿する

Smart Dictation：書き起こし、翻訳、要約機能を組み合わせたAI音声処理ツール
Smart Dictationは、高度なAI技術を活用し、ユーザーが録音した音声を簡単にテキストに変換できる強力なmacOSアプリです。このアプリは、OpenAIの最新のGPT-4oとWhisperモデルを統合し、正確な書き起こし、翻訳、要約を提供します。会議を録音しているかどうかに関わらず...
1.9 Kをとおして0表彰される
0ブックマークに登録
Voquill：音声をテキストに変換するブラウザ・プラグイン
VoquillはChromeにインストールされているAIツールです。どんなウェブサイトでも、キーボード入力の代わりに音声入力を使うことができる。メールを書くとき、チャットメッセージに返信するとき、ドキュメントを編集するとき、話すだけでVoquillがあなたの声をリアルタイムでテキストに変換します。基本的な音声入力に加え、このツールは...
1.7 Kをとおして0表彰される
0ブックマークに登録
Grabcube：AI文字起こし・翻訳ツール付き無料ダウンロード動画
Grabcubeは、ビデオやオーディオのダウンロード、AI音声テキスト変換、字幕翻訳、編集に特化した無料のオーディオ・ビデオ加工ツールです。YouTube、Bilibili、Vimeoなど1,000以上の主要なプラットフォームをサポートし、ユーザーは制限なく複数の形式の動画や音声ファイルをダウンロードすることができます。.
2.8 Kをとおして0表彰される
0ブックマークに登録
Kitten-TTS-Server: セルフデプロイ可能な軽量音声合成サービス
Kitten-TTS-Serverは、軽量なKittenTTSモデルの機能拡張サーバーを提供するオープンソースプロジェクトです。ユーザーはこのプロジェクトを使って、独自の音声合成（TTS）サービスを構築することができます。このプロジェクトの核となる利点は、オリジナルのモデルに基づき、直感的なウェブページを追加していることです。.
4.1 Kをとおして0表彰される
0ブックマークに登録
AI-Chatbox：ESP32S3ベースの音声テキストインテリジェント対話プロジェクト
AI-ChatboxはESP32S3開発ボードをベースにした音声対話プロジェクトです。ユーザーが音声でビッグモデル（LLM）に話しかけると、デバイスが音声をテキストに変換してビッグモデルに送信し、回答を得た後、さらに音声放送に変換することができます。このプロジェクトはRust言語を使って開発され、Vosk音声認識ツールと統合されています。.
2.1 Kをとおして0表彰される
0ブックマークに登録
ウィスパー・オン・クラウドフレアAI：音声をテキストに変換し、字幕を生成する無料ツール
Whisper_Cloudflareは、開発者thun888によって作成され、GitHubでホストされているオープンソースプロジェクトです。OpenAIのWhisperモデルに基づいており、Cloudflare Workersのサーバーレスアーキテクチャを組み合わせて、非常に効率的な音声テキスト変換を提供します。
2.9 Kをとおして0表彰される
0ブックマークに登録
Spokenly：macOS用音声テキスト変換ツール
SpokenlyはmacOS用に設計された音声テキスト変換ツールで、ユーザーが音声でテキストを素早く入力し、作業効率を向上させることを目的としています。高度なAI技術（WhisperやGPT-4oなど）を活用して音声をリアルタイムでテキストに変換し、100以上の言語をサポートしています。.
3.8 Kをとおして0表彰される
0ブックマークに登録
Vibe Musicing：AI音楽ジェネレーター（無料、オンライン）
Vibe Musicingは無料のオンラインAI音楽ジェネレーターで、音楽の基礎がなくても、誰でもすぐにオリジナルの曲を作ることができます。ユーザーは、音楽のスタイルを選択し、歌詞を記入するか、またはAIがニーズに応じて歌詞を自動的に生成し、簡単にメロディ、リズム、雰囲気をカスタマイズすることができます。Vibe Musicingは、幅広いサウンドをサポートしています...
2.3 Kをとおして0表彰される
0ブックマークに登録
AI Song Creator：テキストを高品質なオリジナル音楽に素早く変換するAIツール
AI Song Creatorは、ユーザーがテキストの説明や歌詞を入力することで、30～90秒でプロ品質のオリジナル楽曲と歌詞を生成できるオンラインAI音楽生成プラットフォームです。エレクトロニック・ダンス・ミュージック、ローファイ、クラシック、K-POPなど40以上の音楽スタイルに対応しており、コンテンツクリエイターやゲームクリエイターに適しています。.
2.5 Kをとおして1表彰される
0ブックマークに登録
OpenWispr: プライバシー第一の音声テキストデスクトップアプリケーション
OpenWisprは、OpenAI Whisperテクノロジーに基づいたオープンソースのデスクトップ音声テキスト変換アプリケーションで、ユーザーの音声を素早くテキストに変換します。プライバシー保護を重視し、ローカルとクラウドの両方の処理オプションを提供し、データは完全にローカルに残すことができる。ユーザーはグローバルホットキーで素早くディクテーションを開始でき、テキストは自動的にカーソル位置に貼り付けられます。.
3.2 Kをとおして0表彰される
0ブックマークに登録
TEN: リアルタイムのマルチモーダル音声AIインテリジェンスを構築するオープンソースツール
TEN Frameworkは、開発者がリアルタイム、マルチモーダル、低遅延の音声AIインテリジェンスを構築することを支援することに焦点を当てたオープンソースソフトウェアプラットフォームです。C, C++, Go, Python, JavaScript, TypeScriptなど、複数のプログラミング言語をサポートしています。開発者はTEN Frameworkを使って、音声、視覚、テキストを素早く作成することができます。.
2.6 Kをとおして0表彰される
0ブックマークに登録
Zaia Health：健康習慣をモニターし改善するAI音声アシスタント
Zaia Healthは、Zaiaと呼ばれる音声アシスタントを中心とした人工知能健康アプリである。このアプリは、ユーザーが健康習慣に集中し、改善するのを助けるように設計されている。音声対話を通じて、個人的な健康コンパニオンとして機能し、睡眠、運動、栄養、メンタルヘルスの分野でより規則正しい生活習慣へとユーザーを導く。.
1.6 Kをとおして0表彰される
0ブックマークに登録
FineShare：AIの音声と音楽を生成するオーサリングツール
FineShareはAI音声・映像技術に特化したプラットフォームで、ユーザーが高品質な音声・音楽・映像コンテンツを作成するための様々なツールを提供している。同サイトの主力製品には、音声生成・変換、AI音楽作成、バーチャルカメラ用のFineVoice、Singify、FineCamがある。
2.3 Kをとおして0表彰される
0ブックマークに登録
SpleeterGui：簡単音楽トラック分離ツール
SpleeterGuiは、Deezerによって開発されたオープンソースの音楽分離ライブラリであるSpleeterをベースにしたWindowsユーザー向けのデスクトップアプリケーションです。シンプルなグラフィカルインターフェースによって、ユーザーはコマンドラインを使用することなく、音楽ファイルをボーカル、ドラム、ベースなどの複数のトラックに分離することができます。ユーザーは簡単にオン...
2.9 Kをとおして0表彰される
0ブックマークに登録
サイバースマート：テキストを音声に変換し、デジタルヒューマンビデオに変換する
Xunfei Zhizuoは、人工知能コンテンツ作成サービスを提供するためにXunfeiによって開発されたプラットフォームです。その中核機能は、ユーザーが入力したテキストを音声に変換することであり、このプロセスはしばしば「AIダビング」または「音声合成」と呼ばれる。ユーザーは、あらかじめプログラムされたさまざまなスタイルのバーチャルボイス（すなわち「キャスター」）から、ニュースキャスターやニュース番組などの音声を選ぶことができる。.
2.4 Kをとおして0表彰される
0ブックマークに登録
Any2Text: 音声とビデオをテキストに変換する無料AIツール
Any2Textは、音声や動画ファイルを素早くテキストに変換することに特化した無料のオンラインツールです。高度なAI音声認識技術を利用し、100以上の言語をサポートし、会議録音、ポッドキャスト書き起こし、字幕生成など様々なシナリオに適しています。ユーザーは登録なしで使用でき、操作は簡単で、ファイルをアップロードして高精度のテキストエンドを得ることができます...
3.9 Kをとおして0表彰される
0ブックマークに登録
パロットTTS：ウェブテキストを自然な音声に変換する読み上げツール
Parrot TTSは、ウェブテキストを自然な音声に変換するために設計されたChrome拡張機能です。高度なAI技術を駆使し、人間に近い音声体験を提供することで、従来の音声合成ツールの機械的な音声の問題を解決しています。ユーザーは、記事、ニュース、研究資料をワンクリックで音声に変換でき、マルチタスクに適しています...
1.9 Kをとおして0表彰される
0ブックマークに登録
Wavel AI：多言語映像の吹替・字幕を高速生成するツール
Wavel AIはAIベースのプラットフォームで、ビデオコンテンツの迅速な作成とローカライズを支援することに重点を置いている。音声クローニング、テキスト読み上げ、自動字幕生成などの機能により、ユーザーは多言語の動画・音声コンテンツを簡単に作成できる。このプラットフォームは70以上の言語をサポートし、コンテンツ制作者のために1,000以上のリアルな音声を提供しています...
2.1 Kをとおして0表彰される
0ブックマークに登録
wukong-robot：パーソナライズされた中国語の音声対話を実現するスマート・スピーカー・プロジェクト
wukong-robotはオープンソースの中国語音声対話ロボットおよびスマートスピーカープロジェクトで、開発者がパーソナライズされたスマートスピーカーを迅速に構築できるように設計されています。中国語の音声認識、音声合成、多ラウンド対話機能をサポートし、ChatGPT、Baidu、KDDIなどの技術と統合されています。プロジェクトの設計はモジュール式で、プラグインや機能を自由に拡張することができます。.
2.7 Kをとおして0表彰される
0ブックマークに登録

AIオーディオ

クイック照会ステーションAIツール