海外からのアクセス:www.kdjingpai.com
Ctrl + D このサイトをブックマークする
現在の場所図頭 " AIニュース

Anthropic、クロード・ソネット4.5をリリース:コーディングとAI知能開発の「ルール」を再発明する

2025-09-30 2.0 K

アンソロピック 同社は最新のフラッグシップモデルを発表した。 Claude Sonnet 4.5世界で最も強力なコーディングモデルだ。これは単なるモデルの定期的な反復ではなく、AIの知能(エージェント)、コンピューター操作、複雑な推論能力の構築における本格的な飛躍である。

コードはデジタル世界の礎であり、私たちが日常的に使用するあらゆるアプリ、スプレッドシート、ソフトウェアツールを動かしています。これらのツールを理解し、ナビゲートし、複雑な問題を推論することは、現代の生産性の核心です。Claude Sonnet 4.5 は、この能力を新たな高みへと引き上げるためにリリースされた。

新モデルの発表に伴い、以下のようなレビューが相次いでいる。 Claude 製品エコロジーの大幅なアップグレード:

  • クロード・コードの強化新しい「チェックポイント」機能により、ユーザーは進捗状況を保存し、いつでも以前の状態にロールバックすることができる。端末のインターフェースも一新され、ネイティブの VS Code 延長。
  • API機能拡張で Claude API 新しいコンテクスト編集機能とメモリーツールが導入され、AIインテリジェンスがより長い実行時間とより複雑なタスクを処理できるようになった。
  • アプリケーション内機能の統合で Claude アプリケーションでは、ユーザーがダイアログ内で直接コードを実行したり、ファイル(スプレッドシート、スライドショー、ドキュメントなど)を作成したりできるようになりました。
  • 開発ツールを開くリリース Claude Agent SDK意志 Anthropic を構築するために社内で使用される。 Claude Code すべての開発者に開かれたインフラ

Claude Sonnet 4.5 が本日より本格的に始動した。開発者は Claude API 各論 claude-sonnet-4-5 を使用する。特筆すべきは、価格設定が前世代の Claude Sonnet 4 100万の入出力に対して一貫性がある トークン 3/15米ドル

一流のインテリジェンスとパフォーマンス

Claude Sonnet 4.5 ある SWE-bench Verified レビューにおける現在のベストスコア。このベンチマークは、以下を把握し検証することで達成された。 GitHub を実際のソフトウェア工学の問題に適用し、AIモデルの実世界でのコーディング能力とソフトウェア修復能力を測定する。実際のテストではClaude Sonnet 4.5 複雑な複数ステップのタスクに30時間以上集中し続ける能力。

Anthropic 发布 Claude Sonnet 4.5:重塑编码与 AI 智能体开发的“规则”-1

コンピューターの能力という点では。Claude Sonnet 4.5 同じように大きな飛躍があった。それは OSWorld ベンチマークテストでは、61.4%という驚異的なスコアを記録した。OSWorld ファイル管理、ソフトウェア・インストール、システム設定など、実際のコンピュータ・タスクを実行するAIモデルの能力を評価するために設計された。ちょうど4ヶ月前Sonnet 4 このテストでは42.21 TP3Tというトップスコアを記録しており、新モデルの改善は明らかだ。

この能力は採用されている Claude for Chrome エクステンションを適用することができた。下のデモビデオでは Claude ウェブサイトのナビゲート、スプレッドシートの入力、割り当てられたタスクの完了など、ブラウザで直接作業する方法。

コーディングやコンピューターの使用だけでなく、このモデルは推論や数学など、より広範な評価においても著しい向上を示している:

Anthropic 发布 Claude Sonnet 4.5:重塑编码与 AI 智能体开发的“规则”-2

金融、法律、医学、STEMなどの専門分野において、専門家は次のようなことを発見している。 Claude Sonnet 4.5 これと比較してみよう。 Opus 4.1 旧モデルでは、ドメイン知識と推論能力の質的飛躍である。

財政的 立法 医学 STEM
Anthropic 发布 Claude Sonnet 4.5:重塑编码与 AI 智能体开发的“规则”-3 Anthropic 发布 Claude Sonnet 4.5:重塑编码与 AI 智能体开发的“规则”-4 Anthropic 发布 Claude Sonnet 4.5:重塑编码与 AI 智能体开发的“规则”-5 Anthropic 发布 Claude Sonnet 4.5:重塑编码与 AI 智能体开发的“规则”-6

これまでで最も「整列した」フロンティアモデル

パワフルなパフォーマンスに加えてClaude Sonnet 4.5 また Anthropic これまでで最も「整列」されたフロンティア・モデル。モデル・アラインメントは、AIの行動が人間の意図や価値観と一致することを保証することを目的としている。能力の向上と広範な安全訓練を通じてAnthropic モデルの行動を大幅に改善し、お世辞、ごまかし、権力追求、妄想の助長といった好ましくない傾向を減らした。

モデル化された知能とコンピューター使用能力のために。Anthropic また、「キューワード・インジェクション攻撃」に対する防御においても大きな進展があった。キューワード・インジェクションは、現在AIインテリジェンスが直面している最も深刻なリスクのひとつであり、悪意のあるユーザーが巧妙に構築された入力によってAIの本来の指示を乗っ取り、意図しない、あるいは有害な行動を実行させることができる。

Anthropic 发布 Claude Sonnet 4.5:重塑编码与 AI 智能体开发的“规则”-7

Claude Sonnet 4.5 ある Anthropic このリリースはAI安全レベル3(ASL-3)フレームワークの下で行われ、モデルのロバスト性が適切な安全保護措置と適合していることを保証する。これには、特に化学・生物・放射性・核兵器(CBRN)に関連する、潜在的に危険な入出力を検出するように設計された分類器が含まれる。

これらの分類器は、時として正常な内容を誤って報告することがあるが Anthropic にシームレスに切り替えることができます。 Sonnet 4 モデルのオプション。

クロード・エージェントSDK:インテリジェント・ボディをオープンに構築するコア・ツール

Anthropic を繰り返すのに6ヶ月以上かかった。 Claude Codeチームは、AIインテリジェンスの構築と設計方法について多くの経験を蓄積してきた。長時間のタスクの間、いかに効率的にメモリを管理させるか、自律性とユーザー制御のバランスをとる許可システムをいかに設計するか、共通の目標を達成するために複数のサブインテリジェンスをいかに協調させるか、などである。

今すぐだ。Anthropic これらの経験やツールをパッケージ化して Claude Agent SDK すべての開発者に開かれています。SDKはコーディング作業のためだけのものではなく、あらゆる種類の複雑なインテリジェンスを構築するための強固な基盤を提供する。この動きは明確なシグナルだ:Anthropic 強力なモデルを提供するだけでなく、開発者に次世代のAIアプリケーションを構築する力を与え、繁栄するエコシステムを構築する。

研究プレビュー:クロードと想像する

期間限定のスタディ・プレビューとしてAnthropic イマジン・ウィズ・クロード」と呼ばれる実験的な機能が開始された。この機能ではClaude ソフトウエアをオンザフライで生成する機能で、どの機能も事前にプログラムされておらず、事前に書かれたコードもない。ユーザーは Claude リアルタイムのインタラクションやリクエストに基づいて、動的にソフトウェアを作成し、適応させるプロセス。

このデモは、トップモデルと適切なインフラが組み合わされたときに、どのような創造性が発揮されるかを鮮明に示している。"Imagine with Claude "は今後5日間、Max加入者に公開される。

始め方

にアップグレードすることが公式に推奨されています。 Claude Sonnet 4.5.アプリでもAPIでも、あるいは Claude Code 利用する Claude新しいモデルは、同じ価格で性能が大幅に向上した「直接交換」オプションである。

評価方法

  • SWEベンチ検証済みすべて Claude 結果はすべて bash ファイルエディターとドキュメントエディターの2つのツールのシンプルなフレームワークのレポート。報告された77.2%というスコアは、200Kトークンの思考バジェットで、テストなしで計算された500の完全な問題データセットの10回の試行の平均である。
  • ターミナル・ベンチ::報告されたスコアはすべて、XMLパーサーを備えたデフォルトのsmartbodyフレームワーク(Terminus 2)を使用している。
  • AIMESonnet 4.5 スコアはサンプリング温度1.0で報告される。モデルはPythonの設定で64K推論トークンを使用する。
  • オーエスワールド:: 報告されているスコアはすべて公式スコアを使用している。 OSWorld-Verified フレーム、最大ステップ数100、4回の平均。
  • MMMLU報告されているスコアはすべて、拡張思考(最大128K)を使用して14の非英語言語で5回実行した平均値です。
  • ファイナンス・エージェント:: スコアはすべて バルスAI 公開リーダーボードを運営し、公開する。
  • 他のモデルのスコアは、以下から参照した。 OpenAI 歌で応える Google 公式発表や公開ランキングの

おすすめ

AIツールが見つからない?こちらをお試しください!

キーワードを入力する アクセシビリティこのサイトのAIツールセクションは、このサイトにあるすべてのAIツールを素早く簡単に見つける方法です。

トップに戻る

ja日本語