海外からのアクセス:www.kdjingpai.com
Ctrl + D このサイトをブックマークする
現在の場所図頭 " AIアンサー

DeepCoder-14B-Preview、LiveCodeBench v5テストで60.6%のPass@1精度を実証

2025-08-25 1.5 K

2024年8月から2025年2月までのLiveCodeBench v5 Authority Testにおいて、DeepCoder-14B-Previewは画期的な60.61 TP3T Pass@1精度を達成しました。このスコアは以下を表しています:

  • 8%のベース車からの改良点
  • OpenAI o3-miniのような商用モデルに近い。
  • オープンソースのモデリングにおけるトップ3

このテストは、以下のような評価項目をカバーしている:

  • アルゴリズム問題(動的計画法、グラフ理論など)の解の正しさ
  • コード仕様準拠(PEP8などの規格)
  • 境界条件処理機能
  • 例外シナリオの適用範囲

この成果は、このモデルが実用的な工学的応用が可能であり、プログラミング競技や教育シナリオのニーズに特に適していることを示している。

おすすめ

AIツールが見つからない?こちらをお試しください!

キーワードを入力する アクセシビリティこのサイトのAIツールセクションは、このサイトにあるすべてのAIツールを素早く簡単に見つける方法です。

トップに戻る