Xiaomi lança modelos de IA MiMo-V2.5 com capacidades multimodais nativas.

A Xiaomi lançou na quarta-feira a série de modelos de IA MiMo-V2.5, uma atualização rápida em relação ao MiMo-V2-Pro, lançado apenas cinco semanas antes. A nova linha inclui o MiMo-V2.5-Pro, modelo de fundação flagship da empresa, além do MiMo-V2.5, um modelo nativamente multimodal capaz de processar imagens, vídeo, áudio e texto em uma única arquitetura.

A série V2.5 entrou em beta público em 22 de abril, com a Xiaomi sinalizando planos de disponibilizar os modelos como código aberto. A empresa também atualizou seu sistema de assinatura TokenPlan para cobrir todos os modelos V2.5, mantendo a estrutura de quatro faixas de preço introduzida no início de abril.

Construindo sobre a Base do V2-Pro

O MiMo-V2-Pro chegou em 18 de março como um modelo somente de texto com mais de um trilhão de parâmetros totais e 42 bilhões ativos por meio de uma arquitetura mixture-of-experts. Rapidamente chamou atenção ao aparecer anonimamente no OpenRouter sob um codinome, levando muitos a especular que se tratava do DeepSeek V4, antes de a Xiaomi reivindicar a autoria.

O V2.5-Pro mantém a mesma arquitetura de trilhão de parâmetros com 42 bilhões ativos e uma janela de contexto de um milhão de tokens. No lado agêntico, a Xiaomi afirma que ele se equipara ao Claude Opus 4.6 em cenários exigentes e figura entre os melhores modelos em benchmarks como ClawEval, GDPVal e SWE-bench Pro.

Modelo Multimodal a Menor Custo

O grande destaque é o MiMo-V2.5, a variante omnimodal. Ao contrário do design exclusivamente textual do V2-Pro, o MiMo-V2.5 compreende nativamente imagens, vídeo, áudio e texto, permitindo percepção cross-modal e raciocínio de longo alcance. Segundo o OpenRouter, o MiMo-V2.5 oferece “desempenho agêntico de nível Pro a aproximadamente metade do custo de inferência” — com preço de $0,40 por milhão de tokens de entrada e $2 por milhão de tokens de saída, em comparação com $1 e $3 do V2-Pro, respectivamente.

A Xiaomi posiciona o modelo multimodal como adequado para aplicações de percepção-ação em tempo real, incluindo robótica e integração com casas inteligentes — em linha com sua estratégia mais ampla de ecossistema “Human x Car x Home”. O modelo também vem com capacidades agênticas integradas para navegação, raciocínio e execução de tarefas.Expansão do Ecossistema e Estratégia de Preços

Junto com o lançamento do modelo, a Xiaomi expandiu seu TokenPlan para suportar assinaturas mensais e anuais em toda a série V2.5 e V2. Os quatro planos vão desde um plano Lite para desenvolvedores individuais até um plano Max para usuários com alto consumo, com créditos debitados conforme o uso de tokens. A Xiaomi informou que sua plataforma MiMo processou mais de um trilhão de tokens no primeiro dia de disponibilidade comercial, no início de abril.

A série V2.5 é compatível com as principais ferramentas de desenvolvimento, incluindo OpenCode, OpenClaw e Claude Code, reforçando a aposta da Xiaomi em consolidar o MiMo como infraestrutura para o crescente ecossistema de agentes de IA.

#Xiaomi #Ia

Xiaomi lança modelos de IA MiMo-V2.5 com capacidades multimodais nativas.

Construindo sobre a Base do V2-Pro

Modelo Multimodal a Menor Custo

Comments

Deixe um comentário Cancelar resposta