
Smart Dictationは、高度なAI技術を活用し、ユーザーが録音した音声を簡単にテキストに変換できる強力なmacOSアプリです。このアプリは、OpenAIの最新のGPT-4oとWhisperモデルを統合し、正確な書き起こし、翻訳、要約を提供します。会議を録音しているかどうかに関わらず...

VoquillはChromeにインストールされているAIツールです。どんなウェブサイトでも、キーボード入力の代わりに音声入力を使うことができる。メールを書くとき、チャットメッセージに返信するとき、ドキュメントを編集するとき、話すだけでVoquillがあなたの声をリアルタイムでテキストに変換します。基本的な音声入力に加え、このツールは...

Grabcubeは、ビデオやオーディオのダウンロード、AI音声テキスト変換、字幕翻訳、編集に特化した無料のオーディオ・ビデオ加工ツールです。YouTube、Bilibili、Vimeoなど1,000以上の主要なプラットフォームをサポートし、ユーザーは制限なく複数の形式の動画や音声ファイルをダウンロードすることができます。.

RecapはmacOS用に設計されたオープンソースツールで、ユーザーが会議の音声を素早く録音、書き起こし、要約するのに役立ちます。すべてのデータをクラウドにアップロードすることなくローカルで処理し、ユーザーのプライバシーを保護する。開発者のRawand Ahmad氏は、議論と録音の両方に同時に集中することが難しい会議の問題を解決するためにRecapを構築した。.

Whisper_Cloudflareは、開発者thun888によって作成され、GitHubでホストされているオープンソースプロジェクトです。OpenAIのWhisperモデルに基づいており、Cloudflare Workersのサーバーレスアーキテクチャを組み合わせて、非常に効率的な音声テキスト変換を提供します。

SpokenlyはmacOS用に設計された音声テキスト変換ツールで、ユーザーが音声でテキストを素早く入力し、作業効率を向上させることを目的としています。高度なAI技術(WhisperやGPT-4oなど)を活用して音声をリアルタイムでテキストに変換し、100以上の言語をサポートしています。.

OpusLM_7B_Annealは、ESPnetチームによって開発され、Hugging Faceプラットフォーム上でホストされているオープンソースの音声処理モデルです。OpusLM_7B_Annealは、音声認識、テキスト読み上げ、音声翻訳、音声強調などの様々なタスクに焦点を当てており、研究者や開発者が音声処理分野で実験や応用を行うのに適しています。このモデルは...

OpenWisprは、OpenAI Whisperテクノロジーに基づいたオープンソースのデスクトップ音声テキスト変換アプリケーションで、ユーザーの音声を素早くテキストに変換します。プライバシー保護を重視し、ローカルとクラウドの両方の処理オプションを提供し、データは完全にローカルに残すことができる。ユーザーはグローバルホットキーで素早くディクテーションを開始でき、テキストは自動的にカーソル位置に貼り付けられます。.

vosk-browserはブラウザ上で動作する音声認識ツールで、WebAssembly技術に基づいて構築され、Vosk音声認識ライブラリを使用しています。マイク入力や音声ファイルをブラウザで直接処理することができ、クラウドサーバに依存しないオフライン音声テキスト化機能を提供します。.

Any2Textは、音声や動画ファイルを素早くテキストに変換することに特化した無料のオンラインツールです。高度なAI音声認識技術を利用し、100以上の言語をサポートし、会議録音、ポッドキャスト書き起こし、字幕生成など様々なシナリオに適しています。ユーザーは登録なしで使用でき、操作は簡単で、ファイルをアップロードして高精度のテキストエンドを得ることができます...

Whisperアプリは、ユーザーが音声でメモを記録し、AI技術を使って音声をテキストに変換し、リスト、ブログ、タスクなどのコンテンツを生成できる無料のオープンソースツールである。Nutlopeによって開発され、GitHubでホストされているこのプロジェクトは、Together.aiのWhisperモデルに基づいている。

Voxtralは、フランスのAIスタートアップMistral AIが2025年7月15日にリリースした初のオープンオーディオモデルである。 Voxtralは、生産環境向けの音声理解機能をすぐに使える商用アプリケーションを、市場競争力の高い価格で提供することを目的としている。 Voxtralモデルには2つのバージョンがある。.

SimpleListenJournalはBaiduが提供する音声/動画テキスト変換ツールで、音声や動画コンテンツを素早くテキストに変換し、AIによるインテリジェントな分析を提供する。ユーザーは音声、ビデオ、入力テキストをアップロードすることで、高精度の書き起こし結果と自動要約を得ることができる。このプラットフォームは多言語に対応しており、会議の記録、受講メモ、ポッドキャストの構成など、さまざまなシナリオに適している。バウンダリ...

Tencent Meeting AI Little Assistant Proは、Tencentが発表したインテリジェントな会議支援ツールで、オンライン会議の効率と利便性の向上を目指している。人工知能技術によってリアルタイムで会議の内容を分析し、パーソナライズされたリマインダーを提供したり、重要な情報を要約したり、ToDoリストを生成したりすることで、ユーザーがポイントを見逃すことなく議論に集中できるようサポートします。AI Little Assistant Proは、マルチシナリオの使用をサポートし、以下のような用途に対応します。.

フラッシュノートは、ネイル社が発表したスマートなメモツールで、ユーザーが情報を素早く記録、整理、共有できるように設計されている。音声、テキスト、画像など様々な記録方法に対応しており、個人でもチームでも、仕事、勉強、生活のメモを効率的に管理するのに適している。フラッシュノートは、インテリジェント技術により音声をテキストに変換し、内容を自動的に整理するため、手入力の手間を軽減します。ユーザーはピン...

Kyutai Labsのdelayed-streams-modellingプロジェクトは、DSM(Delayed Stream Modelling)技術をコアとしたオープンソースの音声テキスト変換フレームワークです。リアルタイム音声テキスト変換(STT)と音声合成(TTS)機能をサポートしており、効率的な音声対話アプリケーションの構築に適しています。このプロジェクトでは、STTおよびTTSのためのP...
Very Fast Dictationは、Macユーザーのために設計されたオープンソースの音声テキスト変換ツールです。テキスト入力を必要とするあらゆる場面で、高速音声認識技術を使ってユーザーの発言をリアルタイムでテキストに変換する。このプロジェクトはGitHubでホストされており、開発者のAvi Aryanによって開発されました。

Simple Subtitlingはオープンソースの音声字幕生成ツールで、動画や音声ファイルの字幕を自動生成し、話者をラベリングすることに重点を置いています。Jaesung Huhによって開発され、GitHubでホストされているこのプロジェクトは、シンプルで効率的な字幕生成ソリューションを提供することを目的としています。音声処理技術によるツール、...

Abogenは、ePub、PDFまたはプレーンテキストファイルを高品質な音声に素早く変換するために設計されたオープンソースツールです。Kokoro-82Mモデルを使用して自然で滑らかな音声を生成し、同時字幕生成をサポートしているため、オーディオブックやビデオの吹き替え、学習教材に適しています。複数の言語と男女の音声を選択できます。.
トップに戻る

