Qwen3-Coderには、多言語処理における3つの大きなブレークスルーがある:
- 言語の幅コード生成のための92のプログラミング言語と、RustやKotlinのような新しい言語やSolidityのようなブロックチェーンに特化した言語を含む100以上の自然言語理解をサポートしており、GitHub Copilot(主に12言語をサポート)をはるかに上回るカバレッジを誇っています。
- 相互変換能力PythonからC++への言語横断的なコード変換を実現し、システムプログラミング言語変換時のメモリ管理などの特性の違いを自動的に処理することができ、変換精度は78.5%(HumanEval-Xベンチマークによる)です。
- 方言の適応中国語のピンイン変数名、日本語のコメントなど、英語以外の開発環境に特に最適化されています。言語が混在するコードスニペットを処理する場合、エラー率はCodeLlamaより42%低くなります。
技術的に実装されたその多言語能力は、1) コード自然言語並列コーパスによる学習 2) 動的語彙拡張技術の採用 3) 損失関数への言語バランス重みの追加、に起因する。これにより、中国語と英語が混在するJavaScriptプロジェクトや、ドイツ語のアノテーションを含むJavaコードなど、多言語が混在するプロジェクトの処理に優れている。
この答えは記事から得たものである。Qwen3-Coder: オープンソースコード生成とインテリジェントプログラミングアシスタントについて