
於 Google I/O 2026 5月19日、Google AI Studio は以下の公式開発者ガイドを公開しました: Gemini 3.5 Flash — ついに一般提供(GA)が開始され、安定版として本番環境での利用が可能になりました。おなじみの Flash ファミリーですが、コーディングのベンチマークでは 3.1 Pro の数値を塗り替え、他のフロンティアモデルよりも約4倍高速に動作し、さらに新しいデフォルトの thinking effort を備えています。Antigravity 内でエージェント機能を構築している場合、今すぐデフォルト設定の変更が必要になるでしょう。
Gemini 3.5 Flash 開発者ガイドが公開されました
Gemini 3.5 Flash GA の完全な開発者ガイドを公開する @GoogleAIStudio の公式アナウンス。I/O 2026 の基調講演から数時間で 2.8万ビュー、487いいねを記録しました。
Get the latest on AI, LLMs & developer tools
New MCP servers, model updates, and guides like this one — delivered weekly.
1. アナウンス
上記のツイートは、Google AI Studio が Gemini 3.5 Flash 開発者ガイドを公開するために使用した公式なポインターです。投稿日は以下の通りです: 2026年5月19日(火)Sundar PichaiがI/Oのステージを降りてから、およそ2分後のことでした。その日の終わりまでに、開発者によって223回ブックマークされました。いいねに対するブックマークの比率が異様に高く—ターゲット層が誰であるかを如実に物語っています。
同日の朝に投稿されたSundar'sのポストは、そのポジショニングを明確にしました:“Gemini 3.5 Flashは本日より、Antigravity内、および当社の製品やAPIを通じてすべての方にご利用いただけます。3.1 Proと比較して、3.5 Flashはほぼすべてのベンチマークで上回っており、コーディングにおいて大きな進歩を遂げています。” これは、Googleが安価で高速なFlashモデルが、ほとんどの評価において以前のフラッグシップであるProモデルを凌駕したと公言したことを意味します。これにより、Geminiラインナップ全体の立ち位置が再定義されました。
3.5 Flashは、他の追随を許さない独自の領域にあります。
Sundarの基調講演後のスレッド:3.5 Flashは、コーディングの大幅な進歩により、ほぼすべてのベンチマークで3.1 Proを上回り、他のフロンティアモデルよりも4倍速く動作し、知能対速度のチャートで右上に独走しています。
Google AI Studioを率いるLogan Kilpatrickは、その位置づけをさらに鮮明にしました:“Gemini 3.5 Flashは、これまでで最も強力なモデルです。知能、速度、コストの限界を押し広げ、3.5 Flashを独自のクラスへと押し上げました。” この言葉に注目してください。 most powerful。これは、GoogleがFlashモデルを現在のフラッグシップであると宣言しているに等しいのです。
3.5 Flash:これまでで最も強力なモデル
Loganは、3.5 FlashをGoogleの最も強力なモデルと明言しています。これは、知能、速度、コストの限界を同時に押し広げるものです。
2. 要約 (TL;DR)
- モデルID:
gemini-3.5-flash - ステータス: 一般提供開始 (GA)、本番環境で安定して利用可能
- コンテキストウィンドウ: 1,000,000 入力トークン
- 最大出力: 65,536 トークン
- Thinking: 3つのエフォートレベル(low / medium / high)をサポート
- 新しいデフォルトの effort:
medium(以前はhigh3 Flash の場合) - スピード: 他のフロンティアモデルと比較して、1秒あたりのトークン生成速度が約4倍高速
- コーディング: ほぼすべてのベンチマークで Gemini 3.1 Pro を凌駕
- 推奨 API: Interactions API (新しい標準プリミティブ)
- 未対応の機能: Computer Use
- Antigravity 内: 本日より全ティアで利用可能
この2ヶ月間、Antigravity 内で深い推論が必要なときは Gemini 3.1 Pro を、スピードやクォータ制限の緩和が必要なときは Flash を選択していたことでしょう。3.5 Flash は、コーディングのワークロードにおいてそのトレードオフを解消します。私たちの 3.1 Pro と Opus の比較 におけるヒューリスティクスの多くは、中央の列に Flash を置いて読み直す必要があります。
3. 3.5 Flash の新機能 (What's New)
開発者ガイドでは、変更点を平易な言葉で箇条書きにしています。Antigravity ユーザーにとっての意味を具体的に説明すると、以下の通りです。
- 持続的なフロンティア級のパフォーマンス。 Google's の位置付けでは、これはエージェントタスクや大規模なコーディングタスクに最適化された、最もインテリジェントな Flash モデルです。つまり、200k トークンを超えるような長いセッションでも、動作が破綻しなくなります。
- エージェントによる実行。 サブエージェントのデプロイ、問題解決、および大規模な高速エージェントループ。つまり、Antigravity's の オーケストレーションモード (プランニング、コーディング、レビューのために子エージェントを生成するモード)においても、パフォーマンスを維持できるということです(詳細は当社の マルチエージェント・オーケストレーションガイドを参照)。
- コーディングループ。 反復的なコーディングサイクル、迅速な探索、代替案のテストや動的なソリューション探索のためのプロトタイピング。つまり、“try, fail, fix, retry” ループにおける試行あたりのコンテキスト消費コストが抑えられます。
- 長期的なタスク遂行(ロングホライゾン)。 大規模なマルチステップ・ワークフローとツール利用。つまり、30回以上のツール呼び出しの連鎖でも精度が低下しなくなります。
- 思考の保持。 中間的な推論プロセスが、マルチターンの会話を通じて自動的に維持されるようになりました — API の変更は不要です。詳細は セクション 12をご覧ください。
- 新しいデフォルトの effort。
mediumが以下を置き換えます。highをデフォルトの思考レベルとして採用。詳細は セクション 5。 - low 思考の改善。 The
lowティアは、ステップ数の少ないコード生成やエージェントタスクにおいて「大幅に改善」されました。低レイテンシかつ低コストで高い品質を提供します。詳細は セクション 6。 - GA リリース。 安定版。プレビュー版特有の SLA の注意点はなくなりました。本番環境のトラフィックが正式にサポートされます。
4. モデルの仕様と機能
コンテキストウィンドウ: 1,000,000 入力トークン
最大出力: 65,536 トークン
Thinking: サポート対象 (low / medium / high)
デフォルトの effort: medium
ツール: Gemini 3 Flash と同様
マルチモーダル: テキスト + 画像 + 音声 + 動画入力
Computer Use: 未対応(現時点)
Pricing: 公式の料金ページを参照
Status: 一般提供(GA)、安定版
ツールインターフェースは 3 Flash から変更されていないため、既存の grounding-with-google-search、 code-execution、 url-context、および function-calling パイプラインは、修正なしでそのまま動作し続けます。もし、 1% の Claude Opus thinking-budget 制限 に Antigravity で直面していたのであれば、3.5 Flash の新しい effort ティアは、高度な推論ワークロードにおいて Gemini 側の有力な代替手段となります。
5. デフォルトの Effort:high → medium
これは、最も驚かれる可能性が高く、かつ変更履歴で見落としやすい唯一の変更点です。3 Flash では、effort レベルを設定せずに API を呼び出した場合、モデルのデフォルトは highでした。3.5 Flash では、未設定時のデフォルトは mediumになりました。
ほとんどのワークロードにおいて、これは大きなメリットです。3.5 Flash の medium effort は、3 Flash の high effort とほぼ同等でありながら、より低いレイテンシとコストで利用できます。しかし、もし暗黙的な high 困難で長期的なタスクにおいて信頼性の高いエージェント的な動作を得ようとすると、トラフィックが密かに劣化してしまいました。そのパターンは、以下のものに似ています。 サイレントなモデルのダウングレード クォータの圧迫下で Antigravity がすでに見せている挙動です。2つの選択肢があります:
- 監査と明示的な設定。 コードベースを grep して、以下を省略している呼び出しを探します:
thinking_configそして、呼び出し箇所ごとに以下のどちらにするか決定します:medium(より安価で高速、GA推奨)またはhigh(従来の暗黙的な挙動)。 - グローバルに一度だけ high を設定する。 共有のクライアントラッパーがある場合は、以下を設定します:
effort: "high"そこをグローバルなデフォルトとし、呼び出しごとのオーバーライドについては後で再検討します。
6. 'low' モードがスマートになった
あまり宣伝されていないもう一つの変更点は、 low ティアが刷新されたことです。Google の表現を借りれば:“low は、コードや、より少ないステップで完了するエージェント的なタスクにおいて大幅に改善され、低レイテンシかつ低コストで高い品質を提供します。」
つまり、以前は medium に送らなければ実用的な結果が得られなかったワークロードが、今後は lowで完了するようになります。Antigravity ユーザーにとっては、これまで medium のコストでクレジットを消費していたクリーンアップ、リネーム、小規模なリファクタリング作業の多くを low で実行できることを意味します。ぜひ以下で試してみてください:
- 少数のファイルにまたがる変数やファイルのリネーム
- JSDoc / docstring の生成
- 単一関数のユニットテストのスタブ作成
- コードのフォーマットおよび lint ルールの適用
- ワンステップのツール呼び出し(ファイルの読み取り、編集、テストの実行)
詳細は トークン節約ガイド をご覧ください。実用性を維持しつつ、最も安価なコスト設定にタスクを振り分けるための詳細なプレイブックを掲載しています。
7. Interactions API への移行
開発者ガイドでは、最新の Google Gen AI SDK をインストールするよう指示されており、すべてのサンプルコードで新しい Interactions APIが使用されています。これは「Gemini を使用した開発における新しい標準プリミティブであり、すべての新規プロジェクトで推奨される」と位置づけられています。従来の GenerateContent API も引き続きサポートされており、同様の構成オプションが適用されます。
実用的には、新しいエージェントを開始する場合は Interactions を使用してください。既存の GenerateContent パイプラインがある場合、今すぐ書き直す必要はありません — しかし、API サーフェスはエージェント指向のワークフロー、サーバーサイドの状態管理、および複雑なマルチモーダル・マルチターンの会話に合わせて最適化されています。これはまさに Antigravity サブエージェントの形態そのものです。移行しておくことは、将来的に大きなメリットとなるでしょう。
8. クイックスタートコード
Interactions API を介した 3.5 Flash に対する最小限の Python 呼び出し:
注目すべき点が3つあります。まず、モデル ID は gemini-3.5-flash — なし -preview または -latest サフィックスはありません。GA 版だからです。次に、effort は明示的に設定されています。たとえ medium がデフォルトであってもです。これにより、Google が将来デフォルトを再度変更した場合でも影響を受けません。第三に、手動でのスレッド管理は不要です — Interactions がサーバーサイドの状態を処理します。
9. 3.5 Flash vs 3.1 Pro
Sundar の投稿における Google 自身の位置付けでは、3.5 Flash は 3.1 Pro と比較して「コーディングにおいて大きな進歩を遂げ、ほぼすべてのベンチマークで優れている」とされており、知能対出力速度のプロットにおいて右上の象限に単独で位置しています。以下は、I/O 2026 基調講演のスライドからのそのチャートです:

| ディメンション | Gemini 3.1 Pro | Gemini 3.5 Flash |
|---|---|---|
| ポジショニング | Frontier Pro ティア | 最もインテリジェントな Flash モデル |
| コンテキストウィンドウ | 1M 入力 | 1M 入力 |
| 最大出力 | 65k トークン | 65k トークン |
| コーディングベンチマーク | 強力 | 向上 — Sundar 氏いわく「大きな進歩」 |
| 出力速度 | Pro ティアのレイテンシ | フロンティア級の他モデルより約4倍高速 |
| デフォルトの Effort | (コールごと) | medium (high から変更) |
| 思考の保持 | ターンをまたぐ制限あり | 自動適用、API の変更なし |
| Computer Use | サポート済み | 未対応 |
Computer Use の差こそが、3.1 Pro をツールボックスに残しておく唯一の理由です — ブラウザの操作や UI の制御が必要なあらゆるケースにおいて、現時点では Flash は最適解ではありません。それ以外のコーディングワークフローにおいては、より安価で高速な GA モデルが、今や高いベンチマークスコアを記録するモデルとなっています。これは異例のことです。
10. Antigravity 内の 3.5 Flash
Sundar はこれを名指しで言及しました:“Gemini 3.5 Flash は本日より、Antigravity および当社の製品と API 全体で、すべてのお客様にご利用いただけます。” Logan Kilpatrick が詳細な配信リストで追随しました:
すべての Google サービスで試す
3.5 Flash は初日から、Gemini API、Google AI Studio、Antigravity、AI Mode、Gemini アプリ、およびその他のすべての Gemini サービスに同時にリリースされました。ウェイティングリストはありません。
モデルピッカー(Settings → Models)の Pro および Ultra ティアにて、2026年5月19日の基調講演時点で利用可能です。いくつか実用的な注意点があります:
- ピッカーに 2 つの Flash エントリが表示される場合があります ロールアウト期間中 — 3 Flash と 3.5 Flash です。特別な理由がない限り 3.5 を選択してください。1 つしか表示されない場合は、クライアントの再起動が必要な可能性があります。
- Effort ティアのコントロールは引き続き同じ場所にあります — Settings → Models の下にある low/medium/high の 3 段階セレクターです。現在のデフォルトは medium です。
- ほとんどのワークロードでクレジット消費が減少するはずです medium は high よりも安価であり、以前は medium を必要としていた多くのタスクが low で実行できるようになったためです。使用状況の追跡には Cockpit モニタリングガイドをご利用ください.
- ブラウザのサブエージェント統合 読み取りや分析タスクについては 3.5 Flash で動作しますが、完全な Computer Use 制御には引き続き 3.1 Pro が必要です。
11. Spark、Antigravity 2.0、そしてなぜ Flash が重要なのか
3.5 Flash の GA 発表は、単独で行われたものではありません。同じ I/O の朝に行われた他の2つの発表が、なぜ Google が Flash に賢さと および 速さの両方を求めたのかを説明しています。
- Antigravity 2.0 — マルチエージェントチーム、スケジュールタスク、ネイティブ音声、他の Google 製品とのワンクリック統合を備え、再構築されたスタンドアロンのデスクトップアプリです。スケジュールタスクとマルチエージェントチームの存在は、Google がコストを抑えつつ、持続的なエージェントワークを実行できるモデルを求めていたことを意味します。リリース記事には、各インターフェースごとの詳細な内訳が記載されています。
- Antigravity CLI — サポート対象のターミナルインターフェースとして Gemini CLI に代わる、新しい Go ベースのターミナルエージェントです。デフォルトで 3.5 Flash が設定されています。ターミナルを多用するなら、これこそが 3.5 Flash が最適化されたインターフェースです。
- Gemini Spark — Gemini アプリ内の 24時間365日稼働するパーソナル AI エージェントで、「Antigravity 上に構築」され、Google Cloud の専用 VM で動作し、明示的に Gemini 3.5 を搭載しています。Spark は、3.5 Flash が今日 GA としてリリースされる必要があった消費者向けの理由です。すべての Spark ユーザーのバックグラウンドタスクは、3.5 Flash の呼び出しなのです。
Antigravity 2.0 が 3.5 Flash と同時にリリース
2.0 スタンドアロンデスクトップアプリに関する @antigravity の公式発表 — マルチエージェントチーム、スケジュールタスク、ネイティブ音声、ワンクリックの Google 統合。3.5 Flash が動かすために構築されたプラットフォームです。
Logan の締めくくりの言葉がその一貫性を捉えています。「モデルこそが製品である」。3.5 Flash は単なるリリースの1つではありません。Spark を安価に、Antigravity 2.0 をエージェント指向に、そして AI Mode を高速にするために、Google がこれらすべてを同時に実現するために必要としたエンジンなのです。
これら3つの発表を総合すると、3.5 Flash は、Antigravity のサブエージェント、Spark のバックグラウンドジョブ、スケジュールタスクなど、Google があらゆる長期実行型のエージェントループを動作させることを意図した主力モデルです。Pro や Ultra Pro は、特に追加の推論の深さや Computer Use が必要なケースのために予約されています。
12. ターンをまたいだ思考の保持
最も地味ながら重要な機能変更は、思考の保持です。ガイドによれば、「モデルはマルチターンの会話全体で中間的な推論を自動的に維持します。API の変更は不要です」とのことです。
3 Flash では、各ターンが新しい思考プロセスから始まっていました。もしターン1でデータモデルについて慎重に推論して回答を出したとしても、ターン2では必要なことをゼロから再導出していました。3.5 Flash では、これらの中間的な推論の痕跡がサーバー側で引き継がれます。モデルは中断したところから再開します。
Antigravityのワークフローへの影響:
- 長時間のプランニングセッションでも、8ターン目あたりで文脈を見失うことがなくなります。
- あるエージェントから別のエージェントへタスクを引き継ぐサブエージェントの“handoffs”において、元の思考の連鎖(chain of thought)がより正確に維持されます。
- “OK now do the same for the other module”とプロンプトを出すと、場当たり的な別の試行ではなく、実際に同じアプローチが適用されます。
- その デメリット:1ターン目での誤った前提が、2ターン目からNターン目までを台無しにする可能性があります。セッションが意図しない方向へ進んでしまった場合は、エージェントの維持された推論を修正しようと議論するよりも、新しいチャットを開始してください。
13. Flashにまだできないこと
開発者ガイドには明記されています: 現時点では、3.5 FlashでComputer Useはサポートされていません。それ以外の3 Flashのツール機能はすべて利用可能です。
エージェントがブラウザの操作、フォーム入力、UIのナビゲーション、あるいはスクリーンショットの撮影とクリックといった、3.1 ProのComputer Useモードが担うような作業を必要とする場合、それらの呼び出しにはルーティングロジックで3.1 Proを維持するか、3.5 Proまたは3.5ティアのComputer Useがリリースされるのを待つ必要があります。
Antigravityのサブエージェントにおけるスマートな対処法は、 coder と planner のロールを3.5 Flashにデフォルト設定し、 browser-driver ロールのみを3.1 Proにルーティングすることです。通常、browser-driverの呼び出しはセッション内のトークン消費のごく一部であるため、Computer Useの機能を完全に失うことなく、作業の大部分で3.5 Flashのコスト構造を享受できます。
14. 料金とクォータへの影響
Googleはこの発表に際して新しい料金体系を公開していません。ガイドは既存の料金ページにリンクしています。Antigravityにおける実質的な影響は、以下の3つの事実に基づいています。
- デフォルトの effort が1ティア下がりました (high → medium)。同じコール数であれば、1コールあたりの料金が安くなります。
- Low の性能が向上しました。 以前は medium が必要だったコールの多くが low で実行可能になります。さらなるコスト削減につながります。
- Thought preservation により、冗長な思考プロセスが削減されます。 ターンNにおいて、ターン1からN-1ですでに解決済みの内容に対してコストを支払う必要がなくなります。
総評:3.5 Flashを使用した一般的なAntigravityセッションは、3 Flashでの同セッションよりも週間クォータの消費が明らかに少なくなります。上限ギリギリで運用していた場合、この発表によって実質的に余裕が生まれます。クォータの仕組みの詳細は、以下をご覧ください: クレジットと料金の解説 および 週間クォータのクールダウン。
15. 移行チェックリスト
Antigravity のワークフローや直接的な Gemini API 統合を利用している場合は、今週中に以下の手順を順に実施してください。
- モデルピッカーを
gemini-3.5-flashに切り替え、Antigravity のデフォルトのコーディングモデルに設定してください。表示されない場合はクライアントを再起動してください。 - effort ポリシーを決定してください。 グローバルなデフォルト(medium または high)を選択し、記録しておきましょう。将来のデフォルト変更で混乱しないよう、クライアントのラッパーで明示的に設定してください。
- 可能であれば、ティアを1つ下げてください。 クリーンアップ、リネーム、フォーマット、およびシンプルな tool-call のタスクは、
低いティアでまず試してください。 - Computer Use には 3.1 Pro を使い続けてください。 ブラウザを操作するサブエージェントは明示的に 3.1 Pro にルーティングしてください。3.5 Flash では対応できません。
- より積極的に新しいチャットを開始してください。 思考が保持されることで、古い前提条件によるコストが高くなります — 偏った推論がターンをまたいで引き継がれてしまうためです。
- 新しいエージェントは Interactions API に移行してください。 既存の GenerateContent コードをまだ書き換える必要はありません。単に、古い API への新規コード追加を停止してください。
- Gemini CLI を使用している場合は、CLI の移行を計画してください。 Google は、個人向けの Pro / Ultra / 無料の Code Assist ユーザーに対し、Gemini CLI の提供を終了します。終了日は 2026年6月18日です。後継は Antigravity CLI で、デフォルトは 3.5 Flash になります。詳細は Gemini CLI → Antigravity CLI 移行ガイド でステップバイステップの手順を確認してください。
- ベンチマークの基準を再設定してください。 「Pro > Flash」を前提としていた内部評価スイートは、すべて再実行する必要があります。ランキングが入れ替わりました。
16. 結論
Gemini 3.5 Flash は、「Flash を使うこと」がコーディングのワークロードにおいて妥協ではなくなった最初の Flash リリースです。Google が I/O で発表したほぼすべてのベンチマークにおいて、より速く、より安く、よりスマートであり、GA(一般提供)として安定しており、すでに Antigravity に組み込まれています。デフォルトのルーティングに 3.1 Pro を残すべき唯一の正当な理由は Computer Use です。それ以外については、3.5 Flash の方が日常的な利用に適しています。
今日もし一つだけやるなら、Antigravityを開き、デフォルトモデルをGemini 3.5 Flashに切り替えて、昨日一番苦戦したコーディングセッションを再実行してみてください。その効果は一目瞭然です。
関連ガイド
その他の I/O 2026 ローンチ
- → Antigravity 2.0 ローンチ:Google がリリースしたすべての機能
- → Antigravity CLI ディープダイブ
- → Gemini CLI から Antigravity CLI への移行(6月18日締め切り)
スタックにおける 3.5 Flash の位置付け
- → Antigravity における Gemini 3.1 Pro vs Claude Opus 4.6
- → Antigravity におけるマルチエージェント・オーケストレーション
- → Opus が不足した場合:フォールバック・ワークフロー
- → 修正:Claude の Thinking Budget が 1% に制限される問題