19 de maio de 2026

Google Gemini 3.5 Flash: O Modelo Que Está a Mudar as Regras do Jogo

Lançado hoje no Google I/O 2026, o Gemini 3.5 Flash chega com 289 tokens por segundo, custo 50% abaixo da concorrência e foco total em agentes autónomos. O ritmo da Google está a deixar toda a indústria sem fôlego.

A Google acaba de lançar o Gemini 3.5 Flash durante o Google I/O 2026, e a mensagem é clara: a era dos chatbots acabou. O que vem a seguir são agentes de IA que trabalham por ti, tomam decisões e executam tarefas enquanto dormes.

O que é o Gemini 3.5 Flash?

O Gemini 3.5 Flash é o mais recente modelo de inteligência artificial da Google, disponível hoje mesmo para utilizadores globais através da app Gemini, do Google Search e da API para developers. Mas o que o torna diferente não é apenas a velocidade ou os benchmarks. É a visão estratégica por trás dele.

O CEO da Google, Sundar Pichai, foi direto: a próxima onda de IA não é sobre "responder perguntas melhor". É sobre agir no mundo real. Reservar consultas, escrever e executar código, gerir workflows complexos com intervenção humana mínima.

Números que impressionam

O Gemini 3.5 Flash atinge 289 tokens por segundo, tornando-o 4 vezes mais rápido do que qualquer outro modelo frontier da indústria. O tempo até à primeira resposta é de apenas 0.2 segundos. Comparando, o anterior Gemini 3.1 Pro ficava pelos 40-50 tokens por segundo.

Em tarefas agentic, o modelo alcança um Elo de 1656 no benchmark GDPval-AA, ficando apenas a um passo do GPT-5.4 da OpenAI, que marca 1674. Mas com uma diferença crucial: o Gemini 3.5 Flash custa menos de metade do preço.

Input: $1,50 por milhão de tokens
Output: $9,00 por milhão de tokens
Janela de contexto: 1 milhão de tokens

A aposta nos agentes

O modelo inclui pela primeira vez um modo de pensamento configurável, permitindo raciocínio interno antes de responder. Isto é fundamental para coordenar múltiplos sub-agentes em tarefas longas e complexas.

A capacidade multimodal é nativa: texto, imagens, vídeo até 1 hora e áudio num único pipeline, sem junção de modelos separados. Em benchmarks de compreensão multimodal (MMMU-Pro), o Gemini 3.5 Flash marca 84%, o valor mais alto já registado.

O impacto para as empresas

A Google estima que empresas com volumes elevados de utilização podem poupar mais de mil milhões de dólares por ano ao migrar workloads para o Gemini 3.5 Flash. Para uma empresa média, a poupança pode rondar os 80 a 100 milhões anuais.

Lançado apenas 3 meses após o Gemini 3.1 Pro, o Flash já o ultrapassa na maioria dos benchmarks. Esta cadência de 6 em 6 meses é o sinal mais claro de que a Google não está a brincar. OpenAI e Anthropic estão sob pressão real.

O que isto muda

Quem ainda está a avaliar se deve apostar em IA nos seus processos, está a perder tempo. Com um modelo que é simultaneamente mais rápido, mais barato e mais capaz em tarefas autónomas do que quase tudo o que existe, o custo de ficar parado nunca foi tão alto.

O futuro da IA não está na próxima conversa. Está no próximo workflow que a IA vai executar por ti.

Pa burros

Gemini 3.5 Flash: Modelo de inteligência artificial da Google, otimizado para velocidade e tarefas autónomas
Agente de IA: Sistema de IA capaz de executar tarefas de forma autónoma, sem intervenção humana constante
Token: Unidade de texto processada por modelos de IA (aproximadamente 3/4 de uma palavra em inglês)
Benchmark: Teste padronizado para medir e comparar o desempenho de sistemas de IA
Workflow: Sequência de tarefas ou processos organizados para atingir um objetivo
API: Interface de Programação de Aplicações, permite que sistemas diferentes comuniquem entre si
Multimodal: Capaz de processar diferentes tipos de dados em simultâneo (texto, imagem, vídeo, áudio)
Elo: Sistema de classificação de desempenho, originalmente usado em xadrez, adaptado para comparar modelos de IA