オートメーションにおける音声対話の革新的応用
RunRabbitの音声制御システムは、3つの技術的なブレークスルーを達成している:第一に、ゼロサンプル学習機能で、新規ユーザーの非標準的な発音に直面しても、高い認識率を維持する;第二に、文脈関連技術で、「これ」、「前回」などの参照関係を理解する。第二に、文脈関連技術は、対話管理モジュールを通じて、「これ」、「前回」などの参照関係を理解する。最も重要なのは、意図の曖昧性解消メカニズムで、ユーザーが「メールを開く」と言ったとき、システムは行動履歴と組み合わせて、GmailやOutlookなどの特定のプラットフォームをインテリジェントに選択することができる。
典型的なアプリケーション・シナリオでは、ユーザーが「このデータ・フォームをPDFとして保存する」という複合コマンドを発行すると、システムは自動的に以下を実行する: 1) フォーム要素の現在のページを見つける 2) ブラウザの印刷機能を呼び出す 3) PDFフォーマットを選択する 4) ダウンロード・プロセスを開始する。このプロセスを通して、音声システムは用語(PDFなど)を正確に識別し、一連の操作ロジックを理解する必要がある。
テストデータによると、85dBの環境ノイズの下でも、RunRabbitの音声認識精度は92%に達し、業界平均の78%をはるかに上回っている。
この答えは記事から得たものである。RunRabbit:音声とテキストを使ってインテリジェンシアを操作し、コンピューター操作を完了させるについて
































