音声対話

 ウェブサイトを投稿する

AI-Chatbox：ESP32S3ベースの音声テキストインテリジェント対話プロジェクト
AI-ChatboxはESP32S3開発ボードをベースにした音声対話プロジェクトです。ユーザーが音声でビッグモデル（LLM）に話しかけると、デバイスが音声をテキストに変換してビッグモデルに送信し、回答を得た後、さらに音声放送に変換することができます。このプロジェクトはRust言語を使って開発され、Vosk音声認識ツールと統合されています。.
2.0 Kをとおして0表彰される
0ブックマークに登録
TEN: リアルタイムのマルチモーダル音声AIインテリジェンスを構築するオープンソースツール
TEN Frameworkは、開発者がリアルタイム、マルチモーダル、低遅延の音声AIインテリジェンスを構築することを支援することに焦点を当てたオープンソースソフトウェアプラットフォームです。C, C++, Go, Python, JavaScript, TypeScriptなど、複数のプログラミング言語をサポートしています。開発者はTEN Frameworkを使って、音声、視覚、テキストを素早く作成することができます。.
2.4 Kをとおして0表彰される
0ブックマークに登録
Zaia Health：健康習慣をモニターし改善するAI音声アシスタント
Zaia Healthは、Zaiaと呼ばれる音声アシスタントを中心とした人工知能健康アプリである。このアプリは、ユーザーが健康習慣に集中し、改善するのを助けるように設計されている。音声対話を通じて、個人的な健康コンパニオンとして機能し、睡眠、運動、栄養、メンタルヘルスの分野でより規則正しい生活習慣へとユーザーを導く。.
1.5 Kをとおして0表彰される
0ブックマークに登録
wukong-robot：パーソナライズされた中国語の音声対話を実現するスマート・スピーカー・プロジェクト
wukong-robotはオープンソースの中国語音声対話ロボットおよびスマートスピーカープロジェクトで、開発者がパーソナライズされたスマートスピーカーを迅速に構築できるように設計されています。中国語の音声認識、音声合成、多ラウンド対話機能をサポートし、ChatGPT、Baidu、KDDIなどの技術と統合されています。プロジェクトの設計はモジュール式で、プラグインや機能を自由に拡張することができます。.
2.5 Kをとおして0表彰される
0ブックマークに登録
RealtimeVoiceChat
RealtimeVoiceChatは、音声を介した人工知能とのリアルタイムで自然な会話に特化したオープンソースプロジェクトである。ユーザーはマイクを使って音声を入力し、システムはブラウザを通して音声をキャプチャし、素早くテキストに変換し、大規模言語モデル（LLM）から返答を生成し、テキストを音声出力に変換し、全てのプロセスはリアルタイムに近い。このプロジェクトは...
4.3 Kをとおして0表彰される
0ブックマークに登録
gibberlink：2つのAI知能間の効率的な音声通信のための実証プロジェクト
gibberlinkは、開発者PennyroyalTeaによるGitHub上のオープンソースプロジェクトで、2つの会話型AI知能間の最適化されたコミュニケーションを可能にすることに焦点を当てている。2つのAIが電話で会話し、お互いをAIとして認識すると、人間の言葉（英語）から...
7.4 Kをとおして0表彰される
0ブックマークに登録
OpenAI Realtime Agents
OpenAI Realtime Agentsは、OpenAIのリアルタイムAPIを使用して、マルチインテリジェントボディスピーチアプリケーションを構築する方法を示すことを目的としたオープンソースプロジェクトです。OpenAI Swarmから借用した）ハイレベルなインテリジェントボディモデルを提供することで、開発者は複雑なマルチインテリジェントボディスピーチシステムを短時間で構築することができます。このプロジェクトは ...
3.7 Kをとおして0表彰される
0ブックマークに登録
保釈
Bailingは、音声を通じてユーザーと自然な対話を行うように設計されたオープンソースの音声対話アシスタントです。このプロジェクトでは、音声認識（ASR）、音声活動検出（VAD）、大規模言語モデル（LLM）、音声合成（TTS）技術を組み合わせて、GPT-4oのような音声対話ロボットを実装している。BaiLingのエンド・ツー・エンドの待ち時間は...
3.5 Kをとおして0表彰される
0ブックマークに登録
「常時稼働のDeepseek AIアシスタント：Deepseek-V3に基づくインテリジェントな音声対話システムの構築
Always-On AI Assistantは、Deepseek-V3、RealtimeSTT、Typerなどの先進技術を統合し、強力で永続的なオンラインAIアシスタントシステムを構築する革新的なAIアシスタントプロジェクトです。このプロジェクトは、特にエンジニアリング開発シナリオに最適化されており、完全な...
4.5 Kをとおして0表彰される
0ブックマークに登録
シャオジーAIチャットボット
Xiaozhi AI Chatbotは、ESP32開発ボードをベースにしたオープンソースプロジェクトで、ユーザーが独自のAIチャットコンパニオンを構築できるように設計されています。このプロジェクトはShrimpによって開発され、より多くの人々がAIハードウェア開発を始め、大きな言語モデルを実際のハードウェアデバイスに適用する方法を理解するための教育目的で主に使用されています。このプロジェクトは、多言語による音声認識と対話機能をサポートしている。.
6.2 Kをとおして0表彰される
0ブックマークに登録
Fish Agent
フィッシュ・スピーチ派生プロジェクトフィッシュ・エージェントは、V0.1 3Bモデル・アーキテクチャに基づいて開発された、革命的なエンド・ツー・エンドのAI音声クローニング・システムです。完全なエンドツーエンドの音声クローニング処理システムとして、その最大の特徴は、革新的なセマンティックタグレスアーキテクチャ設計を採用しており、Whisperのような従来のセマンティックコンパイラに依存する必要がないことです。.
3.6 Kをとおして0表彰される
0ブックマークに登録
いちご（llama3-s）
Ichigoはオープンソースのリアルタイム音声AIプロジェクトで、テキストベースの言語モデルをネイティブの「聞き取り」機能で拡張することを目的としている。このプロジェクトは、MetaのChameleon論文にインスパイアされた初期のフュージョン技術を使用している。Ichigoの目標は、ネイティブ・デバイス向けのオープンソース・データ、オープンソースの重み付け音声アシスタントになることで、S...
3.4 Kをとおして0表彰される
0ブックマークに登録
Hume AI: 感情認識でAIを強化する｜音と表情から感情を認識する｜感情のある音声を生成する
ヒュームAIは感情知能に特化したAI企業で、人間の感情を理解し、それに反応するマルチモーダルAI技術を開発している。ヒュームAIの主力製品であるエンパス・ボイス・インターフェース（EVI）は、音声、表情、言語など様々な形でユーザーの感情を認識し、それに反応することができる。.
3.4 Kをとおして0表彰される
0ブックマークに登録

音声対話

クイック照会ステーションAIツール