海外からのアクセス：www.kdjingpai.com

Ctrl + D このサイトをブックマークする

AI音声合成

 ウェブサイトを投稿する

Smart Dictation：書き起こし、翻訳、要約機能を組み合わせたAI音声処理ツール
Smart Dictationは、高度なAI技術を活用し、ユーザーが録音した音声を簡単にテキストに変換できる強力なmacOSアプリです。このアプリは、OpenAIの最新のGPT-4oとWhisperモデルを統合し、正確な書き起こし、翻訳、要約を提供します。会議を録音しているかどうかに関わらず...
08-26 1.6 K0表彰される
Voquill：音声をテキストに変換するブラウザ・プラグイン
VoquillはChromeにインストールされているAIツールです。どんなウェブサイトでも、キーボード入力の代わりに音声入力を使うことができる。メールを書くとき、チャットメッセージに返信するとき、ドキュメントを編集するとき、話すだけでVoquillがあなたの声をリアルタイムでテキストに変換します。基本的な音声入力に加え、このツールは...
08-21 1.4 K0表彰される
Grabcube：AI文字起こし・翻訳ツール付き無料ダウンロード動画
Grabcubeは、ビデオやオーディオのダウンロード、AI音声テキスト変換、字幕翻訳、編集に特化した無料のオーディオ・ビデオ加工ツールです。YouTube、Bilibili、Vimeoなど1,000以上の主要なプラットフォームをサポートし、ユーザーは制限なく複数の形式の動画や音声ファイルをダウンロードすることができます。.
08-10 2.5 K0表彰される
まとめ：macOSローカル・ミーティングの音声書き起こし・要約ツール
RecapはmacOS用に設計されたオープンソースツールで、ユーザーが会議の音声を素早く録音、書き起こし、要約するのに役立ちます。すべてのデータをクラウドにアップロードすることなくローカルで処理し、ユーザーのプライバシーを保護する。開発者のRawand Ahmad氏は、議論と録音の両方に同時に集中することが難しい会議の問題を解決するためにRecapを構築した。.
08-04 2.2 K0表彰される
ウィスパー・オン・クラウドフレアAI：音声をテキストに変換し、字幕を生成する無料ツール
Whisper_Cloudflareは、開発者thun888によって作成され、GitHubでホストされているオープンソースプロジェクトです。OpenAIのWhisperモデルに基づいており、Cloudflare Workersのサーバーレスアーキテクチャを組み合わせて、非常に効率的な音声テキスト変換を提供します。
08-02 2.4 K0表彰される
Spokenly：macOS用音声テキスト変換ツール
SpokenlyはmacOS用に設計された音声テキスト変換ツールで、ユーザーが音声でテキストを素早く入力し、作業効率を向上させることを目的としています。高度なAI技術（WhisperやGPT-4oなど）を活用して音声をリアルタイムでテキストに変換し、100以上の言語をサポートしています。.
08-02 3.4 K0表彰される
OpusLM_7B_Anneal：音声認識と合成のための効率的な統一モデル
OpusLM_7B_Annealは、ESPnetチームによって開発され、Hugging Faceプラットフォーム上でホストされているオープンソースの音声処理モデルです。OpusLM_7B_Annealは、音声認識、テキスト読み上げ、音声翻訳、音声強調などの様々なタスクに焦点を当てており、研究者や開発者が音声処理分野で実験や応用を行うのに適しています。このモデルは...
08-01 1.5 K0表彰される
OpenWispr: プライバシー第一の音声テキストデスクトップアプリケーション
OpenWisprは、OpenAI Whisperテクノロジーに基づいたオープンソースのデスクトップ音声テキスト変換アプリケーションで、ユーザーの音声を素早くテキストに変換します。プライバシー保護を重視し、ローカルとクラウドの両方の処理オプションを提供し、データは完全にローカルに残すことができる。ユーザーはグローバルホットキーで素早くディクテーションを開始でき、テキストは自動的にカーソル位置に貼り付けられます。.
07-30 2.8 K0表彰される
Vosk-Browser：ブラウザ上で動作する音声認識ツール
vosk-browserはブラウザ上で動作する音声認識ツールで、WebAssembly技術に基づいて構築され、Vosk音声認識ライブラリを使用しています。マイク入力や音声ファイルをブラウザで直接処理することができ、クラウドサーバに依存しないオフライン音声テキスト化機能を提供します。.
07-28 7.7 K0表彰される
Any2Text: 音声とビデオをテキストに変換する無料AIツール
Any2Textは、音声や動画ファイルを素早くテキストに変換することに特化した無料のオンラインツールです。高度なAI音声認識技術を利用し、100以上の言語をサポートし、会議録音、ポッドキャスト書き起こし、字幕生成など様々なシナリオに適しています。ユーザーは登録なしで使用でき、操作は簡単で、ファイルをアップロードして高精度のテキストエンドを得ることができます...
07-25 3.5 K0表彰される
ウィスパーアプリ：無料のテキスト読み上げ＆AIノートオーガナイザー
Whisperアプリは、ユーザーが音声でメモを記録し、AI技術を使って音声をテキストに変換し、リスト、ブログ、タスクなどのコンテンツを生成できる無料のオープンソースツールである。Nutlopeによって開発され、GitHubでホストされているこのプロジェクトは、Together.aiのWhisperモデルに基づいている。
07-23 2.0 K0表彰される
Voxtral：ミストラルAIが開発した音声転写・理解用AIモデル
Voxtralは、フランスのAIスタートアップMistral AIが2025年7月15日にリリースした初のオープンオーディオモデルである。 Voxtralは、生産環境向けの音声理解機能をすぐに使える商用アプリケーションを、市場競争力の高い価格で提供することを目的としている。 Voxtralモデルには2つのバージョンがある。.
07-16 2.3 K0表彰される
シンプル・リスニング・ノート：バイドゥの音声・動画テキスト化とAI要約ツール
SimpleListenJournalはBaiduが提供する音声/動画テキスト変換ツールで、音声や動画コンテンツを素早くテキストに変換し、AIによるインテリジェントな分析を提供する。ユーザーは音声、ビデオ、入力テキストをアップロードすることで、高精度の書き起こし結果と自動要約を得ることができる。このプラットフォームは多言語に対応しており、会議の記録、受講メモ、ポッドキャストの構成など、さまざまなシナリオに適している。バウンダリ...
07-07 2.2 K0表彰される
テンセント会議AIアシスタント：会議の効率をインテリジェントに高める補助ツール
Tencent Meeting AI Little Assistant Proは、Tencentが発表したインテリジェントな会議支援ツールで、オンライン会議の効率と利便性の向上を目指している。人工知能技術によってリアルタイムで会議の内容を分析し、パーソナライズされたリマインダーを提供したり、重要な情報を要約したり、ToDoリストを生成したりすることで、ユーザーがポイントを見逃すことなく議論に集中できるようサポートします。AI Little Assistant Proは、マルチシナリオの使用をサポートし、以下のような用途に対応します。.
07-07 2.2 K0表彰される
ネイルフラッシュメモ：素早く記録・共有できるスマートなメモツール
フラッシュノートは、ネイル社が発表したスマートなメモツールで、ユーザーが情報を素早く記録、整理、共有できるように設計されている。音声、テキスト、画像など様々な記録方法に対応しており、個人でもチームでも、仕事、勉強、生活のメモを効率的に管理するのに適している。フラッシュノートは、インテリジェント技術により音声をテキストに変換し、内容を自動的に整理するため、手入力の手間を軽減します。ユーザーはピン...
07-07 3.0 K0表彰される
Kyutai：リアルタイム音声テキスト変換ツール
Kyutai Labsのdelayed-streams-modellingプロジェクトは、DSM（Delayed Stream Modelling）技術をコアとしたオープンソースの音声テキスト変換フレームワークです。リアルタイム音声テキスト変換(STT)と音声合成(TTS)機能をサポートしており、効率的な音声対話アプリケーションの構築に適しています。このプロジェクトでは、STTおよびTTSのためのP...
07-05 3.6 K1表彰される
超高速ディクテーション：MAC用高速音声テキスト化ツール
Very Fast Dictationは、Macユーザーのために設計されたオープンソースの音声テキスト変換ツールです。テキスト入力を必要とするあらゆる場面で、高速音声認識技術を使ってユーザーの発言をリアルタイムでテキストに変換する。このプロジェクトはGitHubでホストされており、開発者のAvi Aryanによって開発されました。
07-03 1.6 K0表彰される
Simple Subtitling: ビデオ字幕と話者識別を自動生成するオープンソースツール
Simple Subtitlingはオープンソースの音声字幕生成ツールで、動画や音声ファイルの字幕を自動生成し、話者をラベリングすることに重点を置いています。Jaesung Huhによって開発され、GitHubでホストされているこのプロジェクトは、シンプルで効率的な字幕生成ソリューションを提供することを目的としています。音声処理技術によるツール、...
05-16 3.1 K0表彰される
Abogen：複数のテキスト形式をオーディオブックに変換するツール
Abogenは、ePub、PDFまたはプレーンテキストファイルを高品質な音声に素早く変換するために設計されたオープンソースツールです。Kokoro-82Mモデルを使用して自然で滑らかな音声を生成し、同時字幕生成をサポートしているため、オーディオブックやビデオの吹き替え、学習教材に適しています。複数の言語と男女の音声を選択できます。.
05-05 3.2 K0表彰される