チャレンジの内容
航空宇宙などの専門分野では、文書に英語・日本語・ドイツ語など多言語の専門用語が混在していることが多く、知識検索システムによる重要概念の誤認識につながる。
テクニカル・プログラム
- 多言語埋め込みモデルvectors.yamlの設定をparaphrase-multilingual-mpnet-base-v2に置き換える。
- 用語辞書マッピング: Neo4jに用語集を作る。例えば "Turbine=タービン"。
- ハイブリッド検索戦略ベクトルの類似度を計算する前に、項の正規化置換を行う。
ワークフロー
- Neo4jノードへの多言語用語集を準備する:
CREATE (:Term {ja: "アクチュエータ", ja: "アクチュエータ", zh: "アクチュエータ" }) - src/processing.pyのテキスト前処理ロジックを修正し、用語統一ステップを追加する。
- テスト中、"アクチュエータフォルトコード "を入力し、英語マニュアルがコンテンツと関連付けられるか確認する。
多国籍工場における知識の再利用、自動車部品会社での利用後92%に達する
この答えは記事から得たものである。Yuxi-Know:知識グラフベースのインテリジェントQ&Aプラットフォームについて































