O novo modelo chinês de código aberto rivaliza com líderes globais, usa menos memória e avança na independência de chips Nvidia. Entenda por que ele pode acelerar a adoção de IA em larga escala.
Em 24 de abril de 2026, a DeepSeek lançou a prévia do V4, seu modelo de IA mais avançado até agora. O lançamento traz avanços reais em eficiência e custo, com foco em contexto longo e tarefas complexas.
O V4 chega em duas versões principais: V4-Pro, mais potente para programação e agentes, e V4-Flash, otimizado para velocidade e baixo custo. Ambas estão disponíveis para download, uso via API e modificação, mantendo a tradição de código aberto da empresa chinesa.
Desempenho que compete com os gigantes
O V4-Pro entrega resultados próximos aos principais modelos fechados do mercado. De acordo com benchmarks divulgados pela DeepSeek, ele empata ou supera o Claude Opus 4.6 (Anthropic), GPT-5.4 (OpenAI) e Gemini 3.1 (Google) em várias avaliações.
Em tarefas de programação, matemática e áreas STEM, o modelo supera outros grandes nomes de código aberto, como Qwen 3.5 (Alibaba) e GLM 5.1 (Z.ai). Ele também se destaca em cenários de agentes e raciocínio em múltiplas etapas.
Uma pesquisa interna com 85 desenvolvedores experientes mostrou que mais de 90% colocaram o V4-Pro entre suas principais opções para codificação. A DeepSeek otimizou o modelo especialmente para frameworks populares como Claude Code, OpenClaw e CodeBuddy.
Preços que democratizam o acesso
Os valores praticados impressionam:
- V4-Pro: US$ 1,74 por milhão de tokens de entrada e US$ 3,48 por milhão de saída.
- V4-Flash: cerca de US$ 0,14 por milhão de entrada e US$ 0,28 por milhão de saída.
Esses preços representam uma fração do custo de modelos equivalentes de concorrentes americanos. O Flash, em especial, surge como uma das opções mais acessíveis entre modelos de ponta, ideal para aplicações em escala e testes rápidos.
Inovação em contexto longo e eficiência de memória
Uma das grandes novidades é a janela de contexto de 1 milhão de tokens. Isso equivale a processar de uma só vez o equivalente aos três volumes de O Senhor dos Anéis mais O Hobbit.
O segredo está na arquitetura. Em vez de tratar todo o histórico de texto com a mesma importância, o V4 comprime informações mais antigas e prioriza o que realmente importa no momento. Com isso:
- No contexto máximo, o V4-Pro usa apenas 27% da computação e 10% da memória em relação ao modelo anterior.
- O V4-Flash chega a 10% da computação e 7% da memória.
Essa eficiência abre caminho para aplicações que antes eram proibitivas, como assistentes que analisam bases de código inteiras ou agentes que processam longos documentos sem perder o fio da meada.
Avanço na independência tecnológica da China
O V4 marca o primeiro modelo da DeepSeek otimizado nativamente para chips chineses, especialmente a linha Ascend da Huawei. Isso representa um teste importante para a estratégia de autossuficiência de Pequim em IA.
A Huawei já confirmou suporte completo ao modelo em seus supernós. A expectativa é que os custos caiam ainda mais quando a produção em escala dos chips Ascend 950 avançar no segundo semestre de 2026.
Embora o treinamento ainda possa envolver chips Nvidia em alguma medida, a inferência (uso do modelo) já roda bem em hardware chinês. Esse movimento reduz a dependência de tecnologia estrangeira em um setor estratégico.
O que esperar nos próximos meses
O DeepSeek V4 não deve “abalar” o mercado da mesma forma que o R1 fez em 2025, mas consolida a empresa como uma força relevante no cenário global de IA aberta. Seus avanços em custo, contexto e eficiência tornam o modelo especialmente atrativo para:
- Desenvolvedores independentes
- Empresas que querem reduzir custos de IA
- Projetos que precisam de processamento de documentos longos
- Times que constroem agentes autônomos
3 razões para acompanhar o V4 de perto
- Custo-benefício imbatível – Preços baixos combinados com desempenho de fronteira democratizam o acesso a IA avançada.
- Eficiência real em contexto longo – A nova abordagem de atenção seletiva resolve um dos maiores gargalos atuais dos modelos.
- Impulso à soberania tecnológica – Avanço concreto no uso de hardware chinês, com potencial de reduzir custos ainda mais.
O modelo já está disponível no site e app da DeepSeek, com API aberta para desenvolvedores. Quem trabalha com IA tem mais um poderoso aliado de código aberto para testar imediatamente.










