Grok-2の具体的なコード生成能力は？他のトップモデルとの比較は？

2025-08-25

390

コード能力の詳細なレビュー

xAIが発表したテクニカル・ホワイトペーパーによると、Grok-2は以下のプログラミング・シナリオにおいて卓越した能力を示している：

典型的なワークフロー例高速なソートを実装し、マルチスレッド最適化を追加する」と入力すると、Grok-2は、1)標準的な実装を最初に出力し、2)性能のボトルネックとなる主要なポイントをマークし、3)OpenMP/TBBの2つの並列化オプションを与え、4)テストケース生成の提案を行う。

HuggingFace Open LLM Leaderboardのプログラミングの内訳では、Grok-2は68.7ポイントで3位で、GPT-4-Turboと約2.3ポイント差だが、推論は2.1倍速い。