NVIDIA Nemotron 3 Nano agora disponível no Amazon Bedrock

Novo modelo NVIDIA disponível no Amazon Bedrock

A AWS anunciou o suporte ao NVIDIA Nemotron 3 Nano 30B, o mais recente avanço da NVIDIA em modelagem de linguagem eficiente. Este modelo traz uma combinação interessante de desempenho em raciocínio, suporte nativo para chamadas de ferramentas e processamento de contexto estendido com janela de contexto de 256 mil tokens.

O que diferencia este modelo é sua arquitetura híbrida de Mistura de Especialistas (Mixture-of-Experts — MoE), projetada para oferecer throughput superior em comparação com seus antecessores, mantendo a profundidade de raciocínio de um modelo maior. Isso o torna particularmente adequado para cargas de trabalho relacionadas a agentes de IA e desenvolvimento de código.

Capacidades e casos de uso

O Nemotron 3 Nano foi treinado com técnicas avançadas de aprendizado por reforço e pós-treinamento em múltiplos ambientes em escala, o que resulta em controles explícitos de raciocínio e maior precisão. Esses atributos fazem dele uma opção versátil para:

  • Empresas e startups construindo workflows multi-agentes complexos
  • Ferramentas de produtividade para desenvolvedores
  • Automatização de processos
  • Análise de raciocínio científico e matemático

Infraestrutura: Project Mantle e distribuição global

A execução do Nemotron 3 Nano no Amazon Bedrock é possível graças ao Project Mantle, um novo mecanismo de inferência distribuída específico para atender modelos de aprendizado de máquina em larga escala. O Project Mantle simplifica e acelera a integração de novos modelos ao Amazon Bedrock, além de oferecer:

  • Inferência serverless altamente performática com controles sofisticados de qualidade de serviço
  • Quotas padrão de clientes mais altas com gerenciamento automatizado de capacidade e pools unificados
  • Compatibilidade pronta com as especificações de API OpenAI

O modelo está disponível a partir de hoje em oito regiões da AWS: US East (N. Virginia), US East (Ohio), US West (Oregon), Asia Pacific (Tokyo), Asia Pacific (Mumbai), South America (São Paulo), Europe (London) e Europe (Milan). Suporta tanto endpoints de serviço unificados quanto endpoints compatíveis com a API OpenAI no Amazon Bedrock.

Próximos passos

Para começar a usar o Nemotron 3 Nano, você pode acessar o console do Amazon Bedrock ou consultar a documentação do serviço. Desenvolvedores interessados em endpoints compatíveis com a API OpenAI encontram mais detalhes na documentação específica.

Fonte

NVIDIA Nemotron 3 Nano now available on Amazon Bedrock (https://aws.amazon.com/about-aws/whats-new/2025/12/nvidia-nemotron-3-nano-amazon-bedrock)

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *