Novo modelo NVIDIA disponível no Amazon Bedrock
A AWS anunciou o suporte ao NVIDIA Nemotron 3 Nano 30B, o mais recente avanço da NVIDIA em modelagem de linguagem eficiente. Este modelo traz uma combinação interessante de desempenho em raciocínio, suporte nativo para chamadas de ferramentas e processamento de contexto estendido com janela de contexto de 256 mil tokens.
O que diferencia este modelo é sua arquitetura híbrida de Mistura de Especialistas (Mixture-of-Experts — MoE), projetada para oferecer throughput superior em comparação com seus antecessores, mantendo a profundidade de raciocínio de um modelo maior. Isso o torna particularmente adequado para cargas de trabalho relacionadas a agentes de IA e desenvolvimento de código.
Capacidades e casos de uso
O Nemotron 3 Nano foi treinado com técnicas avançadas de aprendizado por reforço e pós-treinamento em múltiplos ambientes em escala, o que resulta em controles explícitos de raciocínio e maior precisão. Esses atributos fazem dele uma opção versátil para:
- Empresas e startups construindo workflows multi-agentes complexos
- Ferramentas de produtividade para desenvolvedores
- Automatização de processos
- Análise de raciocínio científico e matemático
Infraestrutura: Project Mantle e distribuição global
A execução do Nemotron 3 Nano no Amazon Bedrock é possível graças ao Project Mantle, um novo mecanismo de inferência distribuída específico para atender modelos de aprendizado de máquina em larga escala. O Project Mantle simplifica e acelera a integração de novos modelos ao Amazon Bedrock, além de oferecer:
- Inferência serverless altamente performática com controles sofisticados de qualidade de serviço
- Quotas padrão de clientes mais altas com gerenciamento automatizado de capacidade e pools unificados
- Compatibilidade pronta com as especificações de API OpenAI
O modelo está disponível a partir de hoje em oito regiões da AWS: US East (N. Virginia), US East (Ohio), US West (Oregon), Asia Pacific (Tokyo), Asia Pacific (Mumbai), South America (São Paulo), Europe (London) e Europe (Milan). Suporta tanto endpoints de serviço unificados quanto endpoints compatíveis com a API OpenAI no Amazon Bedrock.
Próximos passos
Para começar a usar o Nemotron 3 Nano, você pode acessar o console do Amazon Bedrock ou consultar a documentação do serviço. Desenvolvedores interessados em endpoints compatíveis com a API OpenAI encontram mais detalhes na documentação específica.
Fonte
NVIDIA Nemotron 3 Nano now available on Amazon Bedrock (https://aws.amazon.com/about-aws/whats-new/2025/12/nvidia-nemotron-3-nano-amazon-bedrock)
Leave a Reply