Googleは2025年のI/Oカンファレンスにおいて、「万能AIアシスタント」の実現に向けた最新進化を発表した。中心となるのは、大規模言語モデル「Gemini 2.5」のProおよびFlashの強化である。

とりわけ注目を集めたのが、「Deep Think」と呼ばれる実験的な推論モードである。これは複数の仮説を並行して検討することで、従来よりも高度な推論能力を実現するものだ。このモードは、米国数学オリンピック(USAMO)や競技用コードベンチマーク「LiveCodeBench」で高得点を記録しており、Gemini Proは現在最も知的なモデルとして位置づけられている。

一方、「Gemini 2.5 Flash」も高速・省リソース・低コストなモデルとして進化を遂げた。理由推論、マルチモーダル処理、コード対応、長文文脈理解のすべてにおいて前バージョンを上回り、Gemini Proに次ぐ性能を示している。

加えて、ネイティブの音声入力・出力機能、複数話者対応、感情認識ダイアログ、思考の要約やトークン使用量の管理など、会話体験を豊かにする新機能も多数搭載された。24言語以上に対応し、方言の切り替えも可能となっている。

Googleは、Geminiの思想を「構造化された思考」と「理解しやすい対話」に重きを置き、今後さらに高度なAPI統合とオープンソースツールとの互換性を推進する構えである。

※本記事は、以下の記事をもとに翻訳・要約しています。
VentureBeat「Inside Google’s AI leap: Gemini 2.5 thinks deeper, speaks smarter and codes faster」

コメント

GoogleのGemini 2.5シリーズは、まさに次世代AIの幕開けを告げる進化といえます。とくに「Deep Think」による並列的な思考処理や、話し方の感情表現まで制御できる音声機能などは、日常のアシスタント体験を大きく変える可能性があります。開発者にとっても制御性が高く、今後の活用シーンがますます広がることが期待されます。これからのAIとの関わり方を見直すよい機会になるかもしれません。