CloudTroop Weekly #005 — 2026-w13





CloudTroop Weekly #005 — 2026-w13

29 de março de 2026

Resumo da Semana

A semana foi dominada por dois eixos: infraestrutura para IA em produção e segurança de acesso na AWS. No lado de IA, SageMaker ganhou GPU reservada para inferência, o Bedrock passou a suportar fine-tuning com APIs compatíveis OpenAI e o Amazon Nova chegou a 0,03% de alucinações — número que abre portas para setores regulados. Em segurança, políticas IAM e controle de visibilidade no console voltaram ao centro do debate. O EKS subiu o patamar com SLA 99,99% e nova camada 8XL. Semana densa, com impacto direto em arquitetura, custo e compliance.

O que muda na prática

  • GPU reservada no SageMaker traz previsibilidade de custo e disponibilidade para endpoints de inferência em produção — fim da roleta de capacidade em picos de demanda.
  • EKS agora oferece SLA de 99,99% com camada 8XL: contratos de disponibilidade para workloads críticos em Kubernetes precisam ser revistos à luz dessa nova garantia.
  • Controle de visibilidade de serviços e regiões no Console AWS permite reduzir superfície de ataque sem custo adicional — mudança operacional que reforça menor privilégio de forma imediata.

Ações da semana

  • Revise as políticas IAM do seu ambiente multi-conta e mapeie quais usuários enxergam serviços e regiões desnecessários no Console — o artigo do rank 4 traz o passo a passo.
  • Se você opera endpoints de inferência com picos previsíveis, avalie agora a capacidade reservada de GPU no SageMaker e compare com o custo atual sob demanda antes do próximo ciclo de orçamento.

Top 10 da Semana

1

Políticas de IAM: como e quando usá-las na sua estratégia

Dominar os tipos de políticas IAM é base para qualquer estratégia de segurança multi-conta e afeta diretamente decisões de arquitetura e compliance.

Para quem: Arquitetos de segurança, engenheiros cloud e times de plataforma que gerenciam ambientes multi-conta na AWS.

Segurança IAM

2

Amazon EKS: SLA 99.99% e nova camada 8XL para clusters

O novo SLA e a camada 8XL mudam o patamar de confiabilidade do EKS para workloads críticos, impactando decisões de arquitetura e contratos de disponibilidade.

Para quem: Engenheiros de plataforma e arquitetos que operam clusters Kubernetes de grande escala em produção.

Kubernetes Containers

3

IA Agentic em Serviços Financeiros: 7 princípios de segurança

Com IA autônoma avançando em setores regulados, os sete princípios apresentados oferecem um framework prático para conformidade e accountability que vai além do setor financeiro.

Para quem: Arquitetos de segurança e líderes técnicos que estão avaliando ou implantando sistemas de IA agentic em ambientes regulados.

IA Segurança

4

AWS Console: controle de visibilidade de serviços e regiões

Limitar o que usuários enxergam no console reduz superfície de ataque, simplifica onboarding e reforça o princípio do menor privilégio sem custo adicional.

Para quem: Administradores de nuvem e times de segurança que gerenciam acesso de múltiplos usuários ao AWS Management Console.

Segurança Governança

5

Eliminando alucinações em LLMs com Amazon Nova: 0,03% de erro

Uma taxa de alucinação de 0,03% via fine-tuning não-generativo abre caminho real para uso de LLMs em saúde e finanças, onde confiabilidade é requisito regulatório.

Para quem: Cientistas de dados e arquitetos de IA que desenvolvem soluções para setores regulados como saúde, finanças e jurídico.

IA Confiabilidade

6

Aprendizado por Reforço no Bedrock com APIs compatíveis OpenAI

Suporte a RFT com APIs OpenAI-compatíveis reduz a barreira de entrada para customização avançada de modelos, permitindo reaproveitamento de pipelines existentes.

Para quem: Engenheiros de ML e times de produto que já usam APIs OpenAI e querem customizar modelos em escala empresarial na AWS.

IA MLOps

7

AWS Neuron DRA: alocação dinâmica de GPUs no EKS

Separar decisões de infraestrutura de aceleradores das preocupações de ML no Kubernetes reduz fricção operacional e otimiza custos de instâncias Trainium.

Para quem: Engenheiros de MLOps e plataforma que orquestram workloads de treinamento e inferência de IA em clusters EKS.

IA Infraestrutura

8

SageMaker: capacidade de GPU reservada para inferência

Reservar GPU para endpoints de inferência traz previsibilidade de custo e disponibilidade, resolvendo um dos maiores pontos de dor em produção de modelos.

Para quem: Times de MLOps e engenheiros de infraestrutura que gerenciam endpoints de inferência com picos de demanda previsíveis.

MLOps Custos

9

Agent Plugin para AWS Serverless acelera dev com IA

Integrar assistentes de codificação com IA diretamente ao fluxo serverless reduz erros de configuração e acelera o ciclo de desenvolvimento de funções e APIs.

Para quem: Desenvolvedores serverless que usam ferramentas como Cursor ou Claude Code e querem produtividade maior no ciclo de build e deploy.

Serverless Produtividade

10

CloudWatch Logs Infrequent Access ganha OpenSearch PPL e SQL

Consultar logs arquivados com SQL e PPL sem mover dados para outro serviço reduz custo de análise e simplifica investigações de segurança e compliance.

Para quem: Engenheiros de operações e times de segurança que analisam logs históricos e precisam equilibrar custo e capacidade analítica.

Observabilidade Custos


Comments

Leave a Reply

Your email address will not be published. Required fields are marked *