グーグルは最近、最新のAI機能を発表した。 Deep Think
が女性差別撤廃委員会に正式に提出された。 Google AI Ultra
加入者は募集中この動きは、グーグルが現在主流となっているスピードを追求するAIモデルとは異なる開発路線、「ディープ・シンキング」を模索していることを示唆している。一方、より強力な Gemini 2.5 Deep Think
フルバージョンは、学術研究のために選ばれた数学者にも提供されている。
今回の一般公開 Deep Think
初期のテスターからのフィードバックと研究のブレークスルーに基づく改良版である。今年の国際数学オリンピック(IMO)大会で金賞を獲得したあのモデルとは異なる。コンペティションモデルでは複雑な数学的問題を解くのに数時間を要したのに対し、公開バージョンでは日常的な使いやすさを維持しながら推論を飛躍的に向上させ、内部で評価された2025年IMOベンチマークでも銅メダルレベルの成績を残している。
スローシンキング」とは何か?
現在のAIの分野では、一般的に応答時間の短縮が求められている。 Deep Think
プログラムの核となる仕組みはその逆で、「思考時間の延長」という概念を導入している。
Deep Think
パラレル・シンキング(並列思考)の技法が使われている。複雑な問題に直面すると、モデルは複数のアイデアと解決経路を同時に生成し、最終的に最適な答えを選択するために、これらの経路を評価、修正、さらには組み合わせます。このプロセスは、問題を解決する際の人間の思考方法を模倣している。つまり、時間をかけてさまざまな視点を探り、さまざまな可能性のある選択肢を吟味し、最終的に考え抜かれた結論を形成するのである。
拡大された推論時間を有効に活用するため、グーグルは、モデルがより複雑な推論経路を探索する動機付けとなる新しい強化学習技術も開発した。これにより Deep Think
時間をかけてより良い問題解決者になる能力。
グーグルは Deep Think
数学者へのオファー Michel van Garrel
などの専門家が数学的推測を検証する。
ディープ・シンキングの利点は?
思考時間の延長 Deep Think
創造性、戦略的プランニング、漸進的改善を必要とする業務を得意とする。
- 反復的な開発と設計: 複雑なものを段階的に構築する必要がある作業では
Deep Think
は強力な能力を発揮する。例えば、ウェブ開発作業では、コードの機能性とページの美的デザインの両方を最適化することが可能である。次の図は、コードの機能性とページの美観を最適化する方法をGemini 2.5 Flash
までPro
再入力Deep Think
ボクセル・アートワークの生成におけるディテール、複雑さ、創造性の差は、次第に大きくなっていく。 - 科学と数学の探検:
Deep Think
非常に複雑な問題を推論する能力は、研究者にとって強力なツールとなる可能性を秘めている。数学的予想の構築と探求、あるいは複雑な科学文献の詳細な分析に役立つ。 - アルゴリズムとプログラミング このモデルは、特に難しいプログラミング問題を解くのに優れている。このような問題では、問題を明確に定義し、さまざまな選択肢の長所と短所を比較検討し、時間の複雑さを考慮することが重要である。
そのパフォーマンスは、いくつかの厳しい業界ベンチマークにも反映されている。外部ツールを使用しない場合Gemini 2.5 Deep Think
ある LiveCodeBench V6
(競技プログラミング能力の指標)と Humanity’s Last Exam
(科学や数学などの専門知識を測定する)やその他のベンチマークは、利用可能な最も高度なパフォーマンスを達成している。
セキュリティとトレードオフ
モデルの能力が高まるにつれて、セキュリティはより重要になる。 Deep Think
のトレーニングおよび配備サイクル全体を通じて、セキュリティ対策が組み込まれている。テストでは Gemini 2.5 Pro
と比べるとDeep Think
コンテンツ・セキュリティとトーンの客観性には改善が見られるが、「無害なリクエストを拒否する」傾向も高くなっている。これは、現在のフロンティア・モデルがセキュリティ能力を向上させる上で直面しているトレードオフを反映している。
より詳細なセキュリティー評価の結果は、以下のサイトで発表されている。 Deep Think
をモデルカードに追加した。
ディープシンクの使い方
Google AI Ultra
を購読できるようになった。 Gemini
アプリケーションは Deep Think
1日の使用回数に制限があります。ユーザーはモデルのドロップダウンメニューから 2.5 Pro
そして、「ディープ・シンキング」スイッチをオンにして起動させる。この機能により、コード実行やGoogle検索などのツールが自動的に呼び出され、より長い回答が生成される。
また、グーグルは今後数週間で Gemini API
開発者および企業テスターを対象に、ツール付きとツールなしを選択可能 Deep Think
バージョンを使って、さまざまなシナリオでの使い勝手を評価した。