次世代の音声対話技術
オンデバイスAIの音声モジュールは、オフライン音声処理の新たなベンチマークを確立する:
- 完全なオフライン多言語サポート軽量音声認識モデルを統合し、中国語、英語、日本語、フランス語など9言語のオフライン文字起こしをサポート。
- インテリジェント・オーディオ・プロセッシングApple CarPlayから派生したノイズキャンセリングアルゴリズムを採用し、60dBの環境騒音下でも91%の認識精度を維持
- タイムスタンプ技術単語レベルの正確なオーディオ-テキストアライメントを実現し、テキストをクリックして対応するオーディオパッセージを再生するためのジャンプをサポート。
実際のデータによると、M2 iPad Proで1時間の会議録音を処理するのにかかる時間はわずか3分で、同時に重要なマーカーを付けた要約を自動的に生成する。この技術は、業界標準の実装としてIEEE P2874規格に認定されています。
この答えは記事から得たものである。オンデバイスAI:iPhoneネイティブ対応のAI音声書き起こし&チャットツールについて
































