速くて安くてProより高性能、GoogleのGemini 3.5 Flashが国内でも即日使える

2026年5月22日

GoogleがGemini 3 Proより低価格・高速のGemini 3.5 Flashを国内で公開した

URLをコピーしました！

Googleが「廉価・高速版」として発表したAI「Gemini 3.5 Flash」が、5月21日の公開と同時に企業の本番業務に投入され始めた。異例のスピードには理由がある。Flashは上位モデルの「Pro」より安くて速いだけでなく、性能でも上回っていた。

FlashはProより速く安く高性能

「安いほうが性能も高い」——AIの世界では、これまでありえなかった話だ。

Googleのモデル体系では、Proが上位、Flashが廉価版という位置づけだった。それが今回、崩れた。Gemini 3.5 Flashは、一つ前の上位モデル「Gemini 3.1 Pro」を複数の性能指標で超えながら、価格は安く、動作も速い。この三拍子が、企業のAI担当者の目を一気に引いた。

エージェント性能で上位モデルを超える

AIの「エージェント」とは、指示を受けて自律的に作業をこなすAIのことだ。検索、計算、文書処理といった複数のタスクを連続してこなす能力が問われる。そのエージェント向けの性能試験で、Gemini 3.5 FlashはGemini 3.1 Proを明確に上回った。複雑なタスク処理を測る試験では76.2%対70.3%、AIツール間の連携能力を評価する試験では83.6%対78.2%——いずれもFlashが上だ。

その実力はGoogle自身が実証した。93個のAIを同時に稼働させて小さなOS（コンピュータを動かす基本ソフト）を構築するという試験で、かかった費用は1,000ドル以下だった。従来の上位モデルでは、これだけの並列稼働を現実的なコストで回すのは難しかった。

GitHubのコード補助ツール「Copilot」は、公開初日からFlashを選択肢に加えた。「Pro級のコーディング品質をFlashのスピードとコストで」という判断だ。

速度と価格の差

出力速度は競合する同クラスのAIモデルと比べて最大4倍速い。

処理コストは100万トークンあたり0.075ドル——同条件の上位モデルより約25%安い。繰り返し同じデータを処理する業務では最大90%引きになる仕組みも備わっている。

GoogleのサンダーピチャイCEOはGoogle I/O 2026基調講演でこう試算した。企業のAI業務の80%をFlashのようなモデルに切り替えれば、大規模な企業では年間10億ドル以上のコストが浮く、と。

Google自身の製品にも即搭載

外部の企業が動く前に、Googleはすでに自社の主力サービスに組み込んでいた。「廉価版」として発表したFlashを、月に何億人もが使う製品の中核に据えた。

検索のデフォルトモデルに

Googleの検索には、質問に対してAIが直接答える「AI Mode」という機能がある。この機能の利用者はすでに10億人を超えている。そのエンジンとして選ばれたのがFlashだ。

Geminiアプリの月間利用者数も9億人を突破した。これだけの規模で動くサービスに、GoogleはFlashをデフォルトとして採用した。性能に問題があれば、Googleのブランドが傷つく。それでもFlashを選んだことは、社内評価の高さを物語る。

24時間自律動作のSparkに採用

もう一つの採用先が「Gemini Spark」だ。人間が指示を出し続けなくても、AIが自律的に作業を進め続ける——そういう機能で、最長24時間にわたって動く。

長時間の連続稼働には、処理が速くコストが低いモデルが必要になる。処理が遅ければ24時間以内にタスクが終わらない。コストが高ければ連続稼働そのものが現実的でなくなる。GoogleがSparkの動力にFlashを選んだのは、この二つの条件を同時に満たすモデルが他になかったからだ。

「安いほうが強い」という逆転は、外部企業への売り文句ではなかった。Google自身が、その選択に先に踏み切っていた。

発表翌日、世界の企業が動き出した

かつては、AIの新バージョンが発表されてから企業が本番システムに組み込むまで、数週間から数ヶ月の検証期間が必要だった。今回は、その工程が事実上なくなっている。

Shopifyは世界170カ国以上で使われるネット販売プラットフォームだ。公式発表と同日に、複数のAIが並んで同時に走る機能を稼働させ、加盟店のデータ分析と成長予測の処理を始めた。従来なら数日かかっていた作業だ。企業の業務管理ツールを手がけるSalesforceも即日で動き、複数の工程を連続してこなすシステムにFlashを組み込んだと発表している。

オーストラリアのマッコーリー銀行は、100ページを超える複雑な文書を扱う口座開設業務にFlashを試験導入した。Flashは最大100万トークン分のテキストを一度に処理できるため、長大な金融書類を分割せずそのまま渡せる。この特性が複雑な書類処理に適している。

日本ではNTTドコモと提携関係にあるSUPERNOVAが、Googleの発表から24時間以内にAIサービス「Stella AI」へのFlash組み込みを完了した。ahamoやeximoを契約しているユーザーも対象に含まれるため、携帯キャリア経由でAIサービスを使っている層にも、この最新モデルが届く経路がすでに整っている。

発表から本番稼働まで「数日以内」——この速度が、今回の一連の動きで共通していた。ただし、Gemini 3.5 Flashの価格は前世代のFlashより上がっており、「安さ」の中身は変わっている。それでも「上位モデルを使わなければ本格運用できない」という前提は、Shopifyやマッコーリー銀行が発表翌日に動いた事実によって、すでに崩れ始めている。