
На Google I/O 2026 19 мая Google AI Studio выпустила официальное руководство разработчика для Gemini 3.5 Flash — теперь в общем доступе (GA), стабильна и готова к использованию в продакшене. Это то же семейство Flash, которое вы уже знаете, за исключением того, что она превзошла показатели 3.1 Pro в бенчмарках по кодингу, работает примерно в 4 раза быстрее других передовых моделей и поставляется с новым значением thinking effort по умолчанию. Если вы создаете агентные решения внутри Antigravity, ваши настройки по умолчанию, вероятно, стоит обновить уже сегодня.
Руководство разработчика по Gemini 3.5 Flash опубликовано
Официальный анонс @GoogleAIStudio, представляющий полное руководство разработчика для Gemini 3.5 Flash GA. 28 тыс. просмотров, 487 лайков в течение нескольких часов после выступления на I/O 2026.
Get the latest on AI, LLMs & developer tools
New MCP servers, model updates, and guides like this one — delivered weekly.
1. Анонс
Твит выше — это каноническая ссылка, которую Google AI Studio использовала для публикации руководства разработчика Gemini 3.5 Flash. Он был опубликован в вторник, 19 мая 2026 г.спустя примерно две минуты после того, как Сундар Пичаи ушел со сцены I/O. К концу дня разработчики добавили пост в закладки 223 раза — необычное соотношение закладок к лайкам, которое точно говорит о том, кем была аудитория.
Параллельный пост Сундара тем же утром сделал позиционирование явным: “Gemini 3.5 Flash доступна сегодня для всех в Antigravity, а также в наших продуктах и API. По сравнению с 3.1 Pro, 3.5 Flash лучше почти во всех бенчмарках с огромным прогрессом в написании кода.” Это публичное заявление Google о том, что их дешевая и быстрая модель Flash теперь превосходит предыдущую флагманскую модель Pro в большинстве тестов. Это меняет позиционирование всей линейки Gemini.
3.5 Flash — в собственной лиге
Тред Сундара после кейноута: 3.5 Flash превосходит 3.1 Pro почти во всех бенчмарках с огромным прогрессом в кодинге, работает в 4 раза быстрее других передовых моделей и занимает единоличное место в верхнем правом углу графика «интеллект против скорости».
Логан Килпатрик, возглавляющий Google AI Studio, выразился еще резче: “Gemini 3.5 Flash — наша самая мощная модель на сегодняшний день. Она расширяет границы интеллекта, скорости и стоимости, выделяя 3.5 Flash в отдельный класс.” Обратите внимание на слово самая мощная. Этим Google заявляет, что модель Flash теперь является их флагманом.
3.5 Flash: самая мощная модель на сегодняшний день
Логан прямо называет 3.5 Flash самой мощной моделью Google — одновременно расширяющей границы интеллекта, скорости и стоимости.
2. TL;DR
- ID модели:
gemini-3.5-flash - Статус: Generally Available (GA), стабильна для продакшена
- Окно контекста: 1 000 000 входных токенов
- Макс. вывод: 65 536 токенов
- Рассуждения (Thinking): поддерживается с тремя уровнями интенсивности (low / medium / high)
- Новый уровень усилий по умолчанию:
средний(былвысокийв 3 Flash) - Скорость: ~в 4 раза больше токенов в секунду по сравнению с другими передовыми моделями
- Программирование: превосходит Gemini 3.1 Pro почти во всех бенчмарках
- Рекомендуемый API: Interactions API (новый стандартный примитив)
- Все еще не поддерживается: Computer Use
- Внутри Antigravity: доступно сегодня на всех тарифных планах
В течение двух месяцев Gemini 3.1 Pro была моделью, которую вы выбирали в Antigravity, когда требовались глубокие рассуждения, а Flash — когда была нужна скорость или экономия квот. 3.5 Flash устраняет этот компромисс в задачах по написанию кода. Многие эвристики в нашем сравнении 3.1 Pro и Opus нужно пересмотреть, учитывая Flash в средней колонке.
3. Что нового в 3.5 Flash
В руководстве для разработчиков изменения перечислены простым языком. Вот они, с пояснением того, что это значит для пользователя Antigravity:
- Стабильная производительность на уровне передовых моделей. Google's позиционирует её как свою самую интеллектуальную модель Flash, оптимизированную для агентных задач и написания кода в больших масштабах. Читать как: длинные сессии перестают «разваливаться» на отметке 200k+ токенов.
- Агентное выполнение. Развертывание субагентов, решение задач и быстрые агентные циклы в масштабе. Читать как: она выдерживает работу в Antigravity's режиме оркестрации где вы создаете дочерних агентов для планирования, написания кода и ревью (см. наше руководство по мультиагентной оркестрации).
- Циклы написания кода. Итеративные циклы кодинга, быстрое исследование, прототипирование для проверки альтернативных путей и динамического поиска решений. Читать как: цикл “попытка, неудача, исправление, повтор” тратит меньше контекста на каждую итерацию.
- Длинный горизонт планирования. Многошаговые рабочие процессы и использование инструментов в масштабе. Читать как: цепочки из 30+ вызовов инструментов перестают деградировать.
- Сохранение цепочки рассуждений. Промежуточные рассуждения теперь автоматически сохраняются в многоходовых диалогах — изменения в API не требуются. Подробнее об этом в разделе 12.
- Новый уровень усилий (effort) по умолчанию.
mediumзаменяетвысокийв качестве уровня мышления по умолчанию. Подробнее об этом в разделе 5. - Улучшенный низкий уровень мышления. The
Низкийуровень теперь “значительно улучшен” для задач кодинга и агентских задач, требующих меньше шагов — высокое качество при более низкой задержке и стоимости. Подробнее в разделе 6. - Релиз GA. Стабильная версия. Больше никаких подводных камней SLA для “preview”. Теперь поддерживается использование в продакшене.
4. Характеристики и возможности модели
Контекстное окно: 1 000 000 входных токенов
Макс. вывод: 65 536 токенов
Мышление: поддерживается (low / medium / high)
Уровень по умолчанию: medium
Инструменты: такие же, как в Gemini 3 Flash
Мультимодальность: текст + изображения + аудио + видео на входе
Computer Use: не поддерживается (пока что)
Цены: см. официальную страницу с тарифами
Статус: Generally Available (GA), стабильно
Интерфейс инструментов не изменился по сравнению с 3 Flash, поэтому любые ваши существующие grounding-with-google-search, code-execution, url-context, и пайплайны function-calling продолжают работать без правок. Если вы сталкивались с 1% лимитом thinking-budget в Claude Opus в Antigravity, новые уровни effort в 3.5 Flash дают вам достойную альтернативу со стороны Gemini для задач deep reasoning.
5. Default Effort: high → medium
Это то самое изменение, которое скорее всего вас удивит и которое легче всего пропустить в changelog. В 3 Flash, когда вы вызывали API без установки уровня effort, модель по умолчанию использовала high. В 3.5 Flash значение по умолчанию теперь medium.
Для большинства задач это чистая выгода — уровень medium в 3.5 Flash примерно эквивалентен уровню high в 3 Flash, при меньшей задержке и стоимости. Но если вы полагались на неявный high чтобы получить надежное агентное поведение в сложной долгосрочной задаче, ваш трафик просто незаметно деградировал. Паттерн похож на скрытый даунгрейд модели поведение, которое Antigravity уже демонстрирует при нехватке квот. Два варианта:
- Аудит и явная установка. Выполните grep по кодовой базе для поиска вызовов, в которых отсутствует
thinking_configи решите для каждого места вызова, нужен ли вамmedium(дешевле, быстрее, официально в GA) илиhigh(старое неявное поведение). - Установите high один раз глобально. Если у вас есть общая обертка клиента, установите
effort: "high"в качестве глобального значения по умолчанию, а позже пересмотрите переопределения для конкретных вызовов.
6. Режим 'low' стал умнее
Еще одно малозаметное изменение заключается в том, что low уровень был переписан. Формулировка Google: “low теперь значительно улучшена для работы с кодом и агентских задач, требующих меньше шагов, обеспечивая высокое качество при меньшей задержке и стоимости.”
Перевод: задачи, которые раньше приходилось отправлять на medium для получения пригодного результата, теперь будут выполняться на low. Для пользователей Antigravity это означает, что большая часть работы по очистке, переименованию и небольшому рефакторингу, на которую тратились кредиты уровня medium, теперь может быть переведена на low. Попробуйте это для:
- Переименования переменных и файлов в небольшом наборе файлов
- Генерации JSDoc / docstring
- Заготовок юнит-тестов для отдельных функций
- Форматирования кода и применения правил линтера
- Одношаговых вызовов инструментов (чтение файла, редактирование файла, запуск теста)
Ознакомьтесь с нашим руководством по экономии токенов для получения подробных инструкций по распределению задач на наиболее экономичные уровни сложности, которые справляются с работой.
7. Миграция на Interactions API
Руководство для разработчиков рекомендует установить последнюю версию Google Gen AI SDK и отмечает, что во всех примерах используется новый Interactions API, представленный как “новый стандартный примитив для разработки с Gemini, рекомендованный для всех новых проектов.” Более старый GenerateContent API по-прежнему поддерживается, и к нему применимы те же параметры конфигурации.
На практике, если вы создаете нового агента, используйте Interactions. Если у вас уже есть пайплайн GenerateContent, переписывать его сегодня не обязательно — но API оптимизируется под агентные рабочие процессы, управление состоянием на стороне сервера и сложные мультимодальные многоходовые диалоги. Именно так устроены субагенты Antigravity. Миграция оправдает себя в будущем.
8. Код для быстрого старта
Минимальный вызов 3.5 Flash на Python через Interactions API:
Три важных момента. Во-первых, ID модели — это gemini-3.5-flash — без -preview или -latest суффикса, так как это GA. Во-вторых, параметр effort задан явно, хотя medium
является значением по умолчанию; это защитит вас, если Google снова его изменит. В-третьих, не нужно вручную вести учет потоков — Interactions берет на себя управление состоянием на стороне сервера.
9. 3.5 Flash против 3.1 Pro

| . | Параметр | Gemini 3.5 Flash |
|---|---|---|
| Позиционирование | Уровень Frontier Pro | Самая интеллектуальная модель Flash |
| Окно контекста | 1M input | 1M input |
| Max output | 65k токенов | 65k токенов |
| Бенчмарки по кодингу | Сильные показатели | Лучше — “огромный прогресс” по словам Сундара |
| Скорость генерации (output) | Задержка уровня Pro | В ~4 раза быстрее аналогов уровня frontier |
| Default effort | (за вызов) | средний (изменено с высокого) |
| Сохранение рассуждений (Thought preservation) | Ограничено между репликами | Автоматически, без изменений в API |
| Computer Use | Поддерживается | Пока нет |
Разрыв в возможностях Computer Use — единственная причина оставить 3.1 Pro в своем арсенале — для любых задач, требующих управления браузером или работы с UI, Flash сегодня не подходит. Для всего остального в процессе написания кода более дешевая, быстрая GA модель теперь показывает более высокие результаты в бенчмарках. Это необычно.
10. 3.5 Flash внутри Antigravity
Сундар упомянул это отдельно: “Gemini 3.5 Flash уже доступна всем пользователям Antigravity, а также во всех наших продуктах и API.” Логан Килпатрик дополнил это полным списком доступности:
Попробуйте во всех интерфейсах Google
3.5 Flash стала доступна одновременно в Gemini API, Google AI Studio, Antigravity, AI Mode, приложении Gemini и во всех остальных интерфейсах Gemini в первый же день — без списков ожидания.
Она уже доступна в меню выбора моделей (Settings → Models) на тарифах Pro и Ultra, начиная с презентации 19 мая 2026 года. Несколько практических замечаний:
- В меню выбора могут отображаться две записи Flash во время этапа развертывания — 3 Flash и 3.5 Flash. Выбирайте 3.5, если у вас нет веской причины для иного. Если вы видите только одну, вероятно, вашему клиенту требуется перезапуск.
- Настройки уровней Effort по-прежнему находятся там же — трехступенчатый переключатель low/medium/high в разделе Settings → Models. По умолчанию теперь установлено значение medium.
- Потребление кредитов должно снизиться для большинства рабочих нагрузок так как уровень medium дешевле, чем high, а многие задачи, требовавшие medium, теперь могут выполняться на low. Отслеживайте использование с помощью руководства по мониторингу Cockpit.
- Интеграция браузерных субагентов работает на 3.5 Flash для задач чтения / анализа, но для полного управления через Computer Use по-прежнему требуется 3.1 Pro.
11. Spark, Antigravity 2.0 и почему Flash важен
Анонс 3.5 Flash GA вышел не сам по себе. Два других запуска тем же утром на I/O объясняют, почему Google нужно было сделать Flash одновременно умным и быстрым.
- Antigravity 2.0 — переработанное автономное десктопное приложение с мультиагентными командами, запланированными задачами, нативной поддержкой голоса и интеграцией с другими продуктами Google в один клик. Запланированные задачи и мультиагентные команды означают, что Google хотела получить модель, способную выполнять длительную агентную работу без огромных затрат. В посте о запуске есть полный разбор всех интерфейсов.
- Antigravity CLI — новый терминальный агент на базе Go, который заменяет Gemini CLI в качестве поддерживаемого интерфейса командной строки. По умолчанию «из коробки» используется 3.5 Flash. Если вы живете в терминале, это именно тот интерфейс, под который оптимизировали 3.5 Flash.
- Gemini Spark — персональный ИИ-агент, работающий 24/7 внутри приложения Gemini, “построенный на Antigravity”, запущенный на выделенных виртуальных машинах в Google Cloud и работающий непосредственно на Gemini 3.5. Spark — это ориентированная на потребителя причина, по которой 3.5 Flash должен был выйти в GA сегодня: каждая фоновая задача пользователя Spark — это вызов 3.5 Flash.
Antigravity 2.0 запускается вместе с 3.5 Flash
Официальный анонс @antigravity автономного десктопного приложения 2.0 — мультиагентные команды, запланированные задачи, нативный голос, интеграция с Google в один клик. Платформа, для работы которой и создавалась 3.5 Flash.
Заключительные слова Логана отражают главную мысль: “Модель — это и есть продукт.” 3.5 Flash — это не просто отдельный релиз — это движок, который необходим Google, чтобы Spark был дешевым, Antigravity 2.0 — агентным, а AI Mode — быстрым, и всё это одновременно.
Если рассматривать три анонса вместе, 3.5 Flash — это «рабочая лошадка», на которой Google планирует запускать каждый длительный агентный цикл — субагенты Antigravity, фоновые задачи Spark, запланированные задачи. Pro и Ultra Pro остаются зарезервированными для случаев, когда вам специально требуется большая глубина рассуждений или Computer Use.
12. Сохранение рассуждений между ходами
Самое незаметное, но важное изменение возможностей — это сохранение рассуждений. Согласно руководству: “Модель автоматически сохраняет промежуточные рассуждения в многоходовых диалогах. Изменения в API не требуются.”
В 3 Flash каждый ход начинался с нового этапа обдумывания. Если на первом ходу модель тщательно проанализировала вашу структуру данных и выдала ответ, то на втором ходу она бы заново выводила всё необходимое с нуля. В 3.5 Flash эти промежуточные следы рассуждений переносятся на стороне сервера. Модель продолжает с того места, где остановилась.
Влияние на рабочие процессы Antigravity:
- Длительные сессии планирования перестают терять нить на 8-м шаге.
- При “handoffs” между субагентами, когда один агент передает задачу другому, сохраняется больше исходной цепочки рассуждений.
- Вы можете отправить промпт “OK now do the same for the other module” и действительно получить тот же подход, а не заново выведенную параллельную попытку.
- Единственный недостаток: неверное предположение на 1-м шаге может отравить шаги 2–N. Если сессия пошла не так, лучше начать новый чат, чем пытаться переубедить агента и заставить его отказаться от сохраненных рассуждений.
13. Что Flash все еще не умеет
Руководство для разработчиков гласит: Computer Use на данный момент не поддерживается в 3.5 Flash. Все остальные возможности инструментов 3 Flash доступны.
Если вашему агенту нужно управлять браузером, заполнять формы, перемещаться по интерфейсу или делать скриншоты и кликать по ним — то есть выполнять работу, с которой справляется режим Computer Use в 3.1 Pro — вам придется либо оставить 3.1 Pro в логике маршрутизации для таких вызовов, либо дождаться выхода 3.5 Pro или версии Computer Use уровня 3.5.
Элегантный способ реализовать это в субагентах Antigravity — назначить по умолчанию для coder и planner ролей модель 3.5 Flash, и направлять только browser-driver роль на 3.1 Pro. Вызов browser-driver обычно составляет лишь малую часть токенов в сессии, поэтому вы получаете профиль затрат 3.5 Flash для основной части работы, не теряя при этом возможности Computer Use.
14. Влияние на стоимость и квоты
Google не опубликовала новую тарифную сетку вместе с анонсом — руководство ссылается на существующую страницу с ценами. Практические последствия для Antigravity вытекают из трех фактов:
- Уровень усилий (effort) по умолчанию снизился на одну ступень (high → medium). При том же количестве вызовов это дешевле в пересчете на один запрос.
- Уровень Low стал умнее. Больше запросов, для которых раньше требовался medium, теперь могут выполняться на low. Еще больше экономии.
- Сохранение цепочки рассуждений (thought preservation) сокращает избыточные вычисления. На итерации N вы перестаете платить за то, что уже было вычислено на итерациях с 1 по N-1.
Итог: типичные сессии Antigravity на 3.5 Flash должны потреблять заметно меньше вашей недельной квоты, чем аналогичные сессии на 3 Flash. Если вы были близки к лимиту, этот анонс фактически дает вам запас. Подробнее о механике квот см. разъяснение кредитов и цен и время восстановления недельной квоты.
15. Чек-лист по миграции
Если у вас настроен рабочий процесс в Antigravity или прямая интеграция с Gemini API, выполните на этой неделе следующие действия по порядку:
- Переключите выбор модели на
gemini-3.5-flashв качестве основной модели для написания кода в Antigravity. Перезапустите клиент, если она не отображается. - Определитесь с политикой усилий (effort policy). Выберите глобальное значение по умолчанию (medium или high) и зафиксируйте его. Установите его явно в обертке вашего клиента, чтобы будущее изменение настроек по умолчанию не стало для вас сюрпризом.
- По возможности переходите на уровень ниже. Попробуйте выполнять задачи по очистке, переименованию, форматированию и simple-tool-call на
низкомуровне в первую очередь. - Оставьте 3.1 Pro для Computer Use. Явно направляйте любых субагентов для управления браузером на 3.1 Pro; 3.5 Flash с этим не справится.
- Чаще начинайте новые чаты. Сохранение контекста размышлений делает устаревшие предположения более критичными — предвзятость в рассуждениях переносится на следующие итерации.
- Переведите новых агентов на Interactions API. Пока не переписывайте существующий код GenerateContent. Просто перестаньте добавлять новый код на старом API.
- Если вы используете Gemini CLI, запланируйте миграцию CLI. Google прекращает поддержку Gemini CLI для индивидуальных пользователей Pro / Ultra / бесплатного Code Assist 18 июня 2026 года. Заменой станет Antigravity CLI, который по умолчанию использует 3.5 Flash. См. руководство по миграции Gemini CLI → Antigravity CLI для получения пошаговых инструкций.
- Обновите базовые показатели ваших бенчмарков. Любые внутренние наборы тестов, в которых предполагалось, что Pro > Flash, необходимо запустить заново. Ранжирование изменилось.
16. Вердикт
Gemini 3.5 Flash — это первый релиз Flash, в котором использование Flash больше не является компромиссом для задач программирования. Она быстрее, дешевле и умнее почти во всех бенчмарках, представленных Google на I/O, имеет статус GA stable и уже интегрирована в Antigravity. Единственная веская причина оставить 3.1 Pro в маршрутизации по умолчанию — это Computer Use; для всего остального 3.5 Flash — лучший выбор на каждый день.
Если вы планируете сделать сегодня только что-то одно: откройте Antigravity, переключите модель по умолчанию на Gemini 3.5 Flash и перезапустите вчерашнюю самую сложную сессию кодинга. Результат будет на редкость очевидным.
Похожие руководства
Другие запуски I/O 2026
- → Запуск Antigravity 2.0: всё, что выпустила Google
- → Глубокое погружение в Antigravity CLI
- → Миграция с Gemini CLI на Antigravity CLI (дедлайн 18 июня)
Место 3.5 Flash в стеке
- → Gemini 3.1 Pro против Claude Opus 4.6 в Antigravity
- → Мультиагентная оркестрация в Antigravity
- → Когда Opus заканчивается: Fallback Workflow
- → Исправление: лимит Claude Thinking Budget ограничен 1%