CloudTroop Weekly #005 — 2026-w13
29 de março de 2026
Resumo da Semana
A semana foi dominada por dois eixos: infraestrutura para IA em produção e segurança de acesso na AWS. No lado de IA, SageMaker ganhou GPU reservada para inferência, o Bedrock passou a suportar fine-tuning com APIs compatíveis OpenAI e o Amazon Nova chegou a 0,03% de alucinações — número que abre portas para setores regulados. Em segurança, políticas IAM e controle de visibilidade no console voltaram ao centro do debate. O EKS subiu o patamar com SLA 99,99% e nova camada 8XL. Semana densa, com impacto direto em arquitetura, custo e compliance.
O que muda na prática
- GPU reservada no SageMaker traz previsibilidade de custo e disponibilidade para endpoints de inferência em produção — fim da roleta de capacidade em picos de demanda.
- EKS agora oferece SLA de 99,99% com camada 8XL: contratos de disponibilidade para workloads críticos em Kubernetes precisam ser revistos à luz dessa nova garantia.
- Controle de visibilidade de serviços e regiões no Console AWS permite reduzir superfície de ataque sem custo adicional — mudança operacional que reforça menor privilégio de forma imediata.
Ações da semana
- Revise as políticas IAM do seu ambiente multi-conta e mapeie quais usuários enxergam serviços e regiões desnecessários no Console — o artigo do rank 4 traz o passo a passo.
- Se você opera endpoints de inferência com picos previsíveis, avalie agora a capacidade reservada de GPU no SageMaker e compare com o custo atual sob demanda antes do próximo ciclo de orçamento.
Top 10 da Semana
Políticas de IAM: como e quando usá-las na sua estratégia
Dominar os tipos de políticas IAM é base para qualquer estratégia de segurança multi-conta e afeta diretamente decisões de arquitetura e compliance.
Para quem: Arquitetos de segurança, engenheiros cloud e times de plataforma que gerenciam ambientes multi-conta na AWS.
Segurança IAM
Amazon EKS: SLA 99.99% e nova camada 8XL para clusters
O novo SLA e a camada 8XL mudam o patamar de confiabilidade do EKS para workloads críticos, impactando decisões de arquitetura e contratos de disponibilidade.
Para quem: Engenheiros de plataforma e arquitetos que operam clusters Kubernetes de grande escala em produção.
Kubernetes Containers
IA Agentic em Serviços Financeiros: 7 princípios de segurança
Com IA autônoma avançando em setores regulados, os sete princípios apresentados oferecem um framework prático para conformidade e accountability que vai além do setor financeiro.
Para quem: Arquitetos de segurança e líderes técnicos que estão avaliando ou implantando sistemas de IA agentic em ambientes regulados.
IA Segurança
AWS Console: controle de visibilidade de serviços e regiões
Limitar o que usuários enxergam no console reduz superfície de ataque, simplifica onboarding e reforça o princípio do menor privilégio sem custo adicional.
Para quem: Administradores de nuvem e times de segurança que gerenciam acesso de múltiplos usuários ao AWS Management Console.
Segurança Governança
Eliminando alucinações em LLMs com Amazon Nova: 0,03% de erro
Uma taxa de alucinação de 0,03% via fine-tuning não-generativo abre caminho real para uso de LLMs em saúde e finanças, onde confiabilidade é requisito regulatório.
Para quem: Cientistas de dados e arquitetos de IA que desenvolvem soluções para setores regulados como saúde, finanças e jurídico.
IA Confiabilidade
Aprendizado por Reforço no Bedrock com APIs compatíveis OpenAI
Suporte a RFT com APIs OpenAI-compatíveis reduz a barreira de entrada para customização avançada de modelos, permitindo reaproveitamento de pipelines existentes.
Para quem: Engenheiros de ML e times de produto que já usam APIs OpenAI e querem customizar modelos em escala empresarial na AWS.
IA MLOps
AWS Neuron DRA: alocação dinâmica de GPUs no EKS
Separar decisões de infraestrutura de aceleradores das preocupações de ML no Kubernetes reduz fricção operacional e otimiza custos de instâncias Trainium.
Para quem: Engenheiros de MLOps e plataforma que orquestram workloads de treinamento e inferência de IA em clusters EKS.
IA Infraestrutura
SageMaker: capacidade de GPU reservada para inferência
Reservar GPU para endpoints de inferência traz previsibilidade de custo e disponibilidade, resolvendo um dos maiores pontos de dor em produção de modelos.
Para quem: Times de MLOps e engenheiros de infraestrutura que gerenciam endpoints de inferência com picos de demanda previsíveis.
MLOps Custos
Agent Plugin para AWS Serverless acelera dev com IA
Integrar assistentes de codificação com IA diretamente ao fluxo serverless reduz erros de configuração e acelera o ciclo de desenvolvimento de funções e APIs.
Para quem: Desenvolvedores serverless que usam ferramentas como Cursor ou Claude Code e querem produtividade maior no ciclo de build e deploy.
Serverless Produtividade
CloudWatch Logs Infrequent Access ganha OpenSearch PPL e SQL
Consultar logs arquivados com SQL e PPL sem mover dados para outro serviço reduz custo de análise e simplifica investigações de segurança e compliance.
Para quem: Engenheiros de operações e times de segurança que analisam logs históricos e precisam equilibrar custo e capacidade analítica.
Observabilidade Custos
Patrocínio
Quer patrocinar a CloudTroop Weekly? Entre em contato
Leave a Reply