O Google DeepMind lançou na quarta-feira o Gemma 4, uma nova família de modelos de IA de pesos abertos construída com base na mesma pesquisa e tecnologia por trás do Gemini 3, marcando uma grande expansão dos esforços de IA de código aberto da empresa em meio à intensificação da concorrência com rivais chineses como DeepSeek e Qwen da Alibaba.
O lançamento inclui quatro tamanhos de modelo — Effective 2B, Effective 4B, um 26B Mixture of Experts e uma variante 31B Dense — todos licenciados sob a licença Apache 2.0, comercialmente permissiva, dando aos desenvolvedores controle total sobre implementação e modificação.
Desempenho Acima do Esperado
O Google afirmou que o modelo Dense de 31B, o maior da família Gemma 4, ocupa a terceira posição no ranking do Arena AI text leaderboard, onde supera modelos muito maiores. Na categoria de código aberto desse ranking, modelos chineses têm dominado as primeiras posições, tornando o Gemma 4 uma entrada notável para um laboratório sediado nos EUA.
Os modelos MoE de 26B e Dense de 31B oferecem o que o Google descreveu como “capacidades de fronteira com sobrecarga de hardware significativamente menor”, funcionando em uma única GPU Nvidia H100 de 80GB. Os modelos menores E2B e E4B são destinados a dispositivos móveis, IoT e de borda, incluindo Raspberry Pi e Jetson Nano.
Todos os quatro modelos suportam entradas multimodais — processando vídeo, imagens, áudio e texto — além de fluxos de trabalho agênticos, chamadas de função, instruções de sistema nativas e geração de código. Eles foram treinados em mais de 140 idiomas e apresentam janelas de contexto mais longas do que seus predecessores.
Uma Jogada Open-Source Contra Rivais Globais
O lançamento acontece em um momento em que o cenário de modelos abertos tem se tornado cada vez mais competitivo. Os modelos Gemma foram baixados mais de 400 milhões de vezes, e o Google citou mais de 100.000 variantes desenvolvidas pela comunidade. A empresa destacou personalizações do mundo real já em andamento, incluindo um modelo de linguagem focado no búlgaro e o modelo Cell2Sentence-Scale da Universidade de Yale para pesquisas sobre câncer.
Indícios do lançamento circularam nos dias anteriores, depois que o CEO do Google DeepMind, Demis Hassabis, postou quatro emojis de diamante no X e Logan Kilpatrick, que lidera o Google AI Studio e a API Gemini, postou uma mensagem contendo apenas a palavra “Gemma”. Um modelo anônimo se autodenominando “significant-otter” também havia aparecido no LMSYS Chatbot Arena, identificando-se como Gemma 4 quando solicitado.
O Gemma 4 está disponível através do Google AI Studio para os modelos de 31B e 26B, Google AI Edge Gallery para as variantes menores, e plataformas incluindo Hugging Face, Nvidia NIM, Ollama e Docker. Os modelos são otimizados para GPUs Nvidia, GPUs AMD e TPUs do Google Cloud.
#gemma4 #google






