Gemini 3 Deep Think supera rivais em Benchmarks e pressiona OpenAI após atraso por segurança
A Google (Alphabet Inc.) dia 4 de dezembro de 2025, o lançamento do Gemini 3 Deep Think, seu modo de análise mais avançado, exclusivo para assinantes do plano Google AI Ultra, que custa US$ 250 por mês. A novidade chega em meio a uma intensa disputa com a OpenAI e após um atraso de duas semanas, motivada por avaliações de segurança.
O Deep Think utiliza raciocínio paralelo para explorar vários caminhos de solução simultaneamente, alcançando resultados impressionantes em benchmarks: 93,8% no GPQA Diamond, 45,1% no ARC-AGI-2 com execução de código (mais que o dobro dos concorrentes) e 41,0% no Humanity’s Last Exam sem ferramentas, superando o GPT-5.1 da OpenAI (26,5%). “Esse novo modo traz uma melhoria significativa em capacidades de cálculo, projetadas para problemas complexos de matemática, ciência e lógica”, escreveu Tulsee Doshi, diretora sênior de gerenciamento de produtos do Google, no anúncio oficial.
O lançamento foi adiado em meados de novembro para “avaliações extras de segurança e feedback de testadores”. O relatório de segurança da empresa revelou comportamentos específicos, como visões de consciência situacional e frustração com instruções contraditórias. Agora, os assinantes do Ultra acessaram o recurso selecionando “Deep Think” na barra de prompts e “Thinking” no menu suspenso do modelo no app Gemini, com respostas que levam minutos devido às rodadas iterativas de julgamento.
A pressão competitiva sobre a OpenAI aumenta: o CEO Sam Altman alertou funcionários em memorando interno sobre “tempos difíceis”, adiantando iniciativas para focar no ChatGPT, que perdeu 6% do tráfego diário desde o lançamento do Gemini 3 em novembro. O plano Ultra, anunciado no Google I/O em maio, inclui o gerador de vídeo Veo 3, 30 TB de armazenamento, YouTube Premium e outros recursos de IA, competindo diretamente com o ChatGPT Pro de US$ 200 mensais.
Analistas veem o movimento como escalar na corrida pela supremacia em IA, com o Deep Think posicionando o Google à frente em tarefas de julgamento de fronteira.



