クロスモーダル知識検索技術
Universal XiaoinのQ&Aエンジンは、従来のテキスト検索の限界を打ち破り、三位一体のインテリジェントな対話システムを構築します。テキスト質問は5,000語以上の複雑な問題記述をサポートし、画像認識モジュールは学術図表、手書きノートなど15種類のファイルを解析することができます。 音声対話はエンドツーエンドのASRモデルを採用し、方言認識精度は92%です。このシステムは、まずユーザーの知識ベースのベクトルインデックスを構築し、次にハイブリッド検索技術(BM25+密検索)によって最も関連性の高い文章を探し出し、最後にT5モデルを用いて構造化された回答を生成することによって動作する。
実際のテストでは、300ページの医学教科書をアップロードした後、CT画像の読影ポイントに関する質問に対して、8秒で診断基準や識別ポイントを含む専門的な回答を返すことができる。また、法律家が労働契約の解除条件について音声クエリを入力すると、システムは自動的にアップロードされた法律文書と関連付け、関連する法律条文をマークする。この機能は、特に医師や弁護士など、専門知識を素早く抽出する必要のある専門家グループに適している。
この答えは記事から得たものである。ユニバーサル・リトル・イン:知識ベースに基づくAI執筆・学習アシスタントについて































