Gerencie os Custos de IA com Amazon Bedrock Projects

O desafio de entender os gastos com IA

Conforme as organizações ampliam suas operações de IA no Amazon Bedrock, compreender o que está impulsionando os gastos se torna essencial. Equipes precisam realizar cobranças internas, investigar picos de custo e orientar decisões de otimização — tudo isso exigindo uma atribuição de custos no nível da carga de trabalho. O desafio cresce quando múltiplos projetos, ambientes e times utilizam os mesmos recursos.

Para endereçar essa necessidade, a AWS desenvolveu o Amazon Bedrock Projects, um recurso que permite atribuir custos de inferência a cargas de trabalho específicas e analisar esses gastos usando ferramentas de billing já consolidadas na plataforma, como AWS Cost Explorer e AWS Data Exports.

Como funcionam os Bedrock Projects e a alocação de custos

Na prática, um projeto no Amazon Bedrock é uma demarcação lógica que representa uma carga de trabalho — pode ser uma aplicação, um ambiente ou até um experimento. Para atribuir custos a esse projeto, você anexa etiquetas de recurso (resource tags) e passa o ID do projeto nas chamadas de API. Posteriormente, essas etiquetas podem ser ativadas como etiquetas de alocação de custos no AWS Billing, permitindo filtrar, agrupar e analisar gastos no Cost Explorer e nos Data Exports.

O fluxo é simples: usuários e aplicações enviam requisições de API com o ID do projeto, que passa por Foundation Models (como OpenAI, Meta e DeepSeek). As etiquetas associadas ao projeto fluem para o AWS Billing & Cost Management, onde você ativa a alocação de custos de forma única. A partir daí, todas as ferramentas de análise ficam cientes dessa dimensão de custo.

Fluxo de atribuição de custos ponta a ponta com Amazon Bedrock Projects — Fonte: Aws

Pontos importantes sobre compatibilidade

O Amazon Bedrock Projects oferece suporte aos endpoints Mantle compatíveis com a API OpenAI, incluindo a Responses API e a Chat Completions API. Requisições que não incluem um ID de projeto são automaticamente associadas ao projeto padrão da sua conta AWS.

Preparação: pré-requisitos e permissões

Antes de começar, você precisa de:

Definindo sua estratégia de etiquetagem

As etiquetas que você vincula aos projetos tornam-se as dimensões que você pode filtrar e agrupar nos seus relatórios de custo. Recomenda-se planejar essas dimensões antes de criar o primeiro projeto. Uma abordagem comum é etiquetar por aplicação, ambiente, time e centro de custo:

Chave de Etiqueta Propósito Exemplos de Valores
Application Qual carga de trabalho ou serviço CustomerChatbot, Experiments, DataAnalytics
Environment Estágio do ciclo de vida Production, Development, Staging, Research
Team Responsabilidade ou propriedade CustomerExperience, PlatformEngineering, DataScience
CostCenter Mapeamento financeiro CC-1001, CC-2002, CC-3003

Para mais orientações sobre construir uma estratégia de alocação de custos, consulte Melhores Práticas para Etiquetar Recursos AWS. Com sua estratégia de etiquetagem definida, você está pronto para criar projetos e começar a atribuir custos.

Criando seu primeiro projeto

Com a estratégia de etiquetagem e as permissões em lugar, você pode criar seu primeiro projeto. Cada projeto tem seu próprio conjunto de etiquetas de alocação de custos que fluem para seus dados de billing. O exemplo a seguir demonstra como criar um projeto usando a Projects API.

Instalando dependências

Comece instalando as bibliotecas necessárias:

$ pip3 install openai requests

Criando um projeto com sua taxonomia de etiquetas

O OpenAI SDK utiliza a variável de ambiente OPENAI_API_KEY. Defina-a com sua chave de API do Bedrock:

import os
import requests

# Configuration
BASE_URL = "https://bedrock-mantle..api.aws/v1"
API_KEY = os.environ.get("OPENAI_API_KEY")

# Your Amazon Bedrock API key

def create_project(name: str, tags: dict) -> dict:
    """Create a Bedrock project with cost allocation tags."""
    response = requests.post(
        f"{BASE_URL}/organization/projects",
        headers={
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json"
        },
        json={"name": name, "tags": tags}
    )
    if response.status_code != 200:
        raise Exception(
            f"Failed to create project: {response.status_code} - {response.text}"
        )
    return response.json()

# Create a production project with full tag taxonomy
project = create_project(
    name="CustomerChatbot-Prod",
    tags={
        "Application": "CustomerChatbot",
        "Environment": "Production",
        "Team": "CustomerExperience",
        "CostCenter": "CC-1001",
        "Owner": "alice"
    }
)
print(f"Created project: {project['id']}")

A API retorna os detalhes do projeto, incluindo o ID e o ARN:

{
    "id": "proj_123",
    "arn": "arn:aws:bedrock-mantle:::project/"
}

Guarde o ID do projeto — você o usará para associar requisições de inferência na próxima etapa. O ARN é utilizado para anexação de políticas do IAM se você precisar restringir o acesso a esse projeto específico.

Repita esse processo para cada carga de trabalho. A tabela a seguir mostra uma estrutura de projeto de exemplo para uma organização com três aplicações:

Nome do Projeto Application Environment Team Cost Center
CustomerChatbot-Prod CustomerChatbot Production CustomerExperience CC-1001
CustomerChatbot-Dev CustomerChatbot Development CustomerExperience CC-1001
Experiments-Research Experiments Production PlatformEngineering CC-2002
DataAnalytics-Prod DataAnalytics Production DataScience CC-3003

Você pode criar até 1.000 projetos por conta AWS para atender às necessidades da sua organização.

Associando requisições de inferência ao seu projeto

Com seus projetos criados, você associa requisições de inferência passando o ID do projeto em suas chamadas de API. O exemplo a seguir utiliza a Responses API:

from openai import OpenAI

client = OpenAI(
    base_url="https://bedrock-mantle..api.aws/v1",
    project="",
    # ID returned when you created the project
)

response = client.responses.create(
    model="openai.gpt-oss-120b",
    input="Summarize the key findings from our Q4 earnings report."
)

print(response.output_text)

Para manter uma atribuição de custos limpa e consistente, sempre especifique um ID de projeto em suas chamadas de API em vez de depender do projeto padrão.

Ativando as etiquetas de alocação de custos

Antes que suas etiquetas de projeto apareçam nos relatórios de custo, você deve ativá-las como etiquetas de alocação de custos no AWS Billing. Esse é um processo de configuração único que conecta suas etiquetas de projeto ao pipeline de billing. Para mais informações, consulte a documentação de ativação de etiquetas de alocação de custos no AWS Billing.

Pode levar até 24 horas para as etiquetas se propagarem para o AWS Cost Explorer e AWS Data Exports. Recomenda-se ativar suas etiquetas imediatamente após criar seu primeiro projeto para evitar lacunas nos dados de custo.

Visualizando custos dos projetos

Com os projetos criados, as requisições de inferência etiquetadas e as etiquetas de alocação de custos ativadas, você consegue ver exatamente para onde seus gastos com Amazon Bedrock estão indo. Cada dimensão que você definiu em sua taxonomia agora está disponível como filtro ou agrupamento em seus relatórios de billing da AWS.

Usando o AWS Cost Explorer

O AWS Cost Explorer oferece a forma mais rápida de visualizar seus custos por projeto. Siga estes passos para revisar seus custos por projeto:

  • Abra o console de Billing e Gerenciamento de Custos da AWS e escolha Cost Explorer.
  • No painel Filtros, expanda Serviço e selecione Amazon Bedrock.
  • Em Agrupar por, selecione Etiqueta e escolha sua chave de etiqueta (por exemplo, Application).
Cost Explorer mostrando gastos diários de Amazon Bedrock agrupados pela etiqueta Application — Fonte: Aws

Para mais formas de refinar sua visualização, consulte Analisando seus custos e uso com AWS Cost Explorer.

Análise mais granular com Data Exports

Para análise mais granular e detalhes de linha de item com suas etiquetas de projeto, consulte Criando Data Exports na documentação do AWS Billing.

Conclusão

Com o Amazon Bedrock Projects, as organizações conseguem atribuir custos a cargas de trabalho individuais e acompanhar gastos utilizando as ferramentas de billing que já dominam. Conforme suas operações de IA escalam, utilize a estratégia de etiquetagem e os padrões de visibilidade de custos apresentados neste artigo para manter a responsabilidade entre equipes e aplicações.

Para mais informações, consulte a documentação do Amazon Bedrock Projects e o AWS Cost Management User Guide.

Fonte

Manage AI costs with Amazon Bedrock Projects (https://aws.amazon.com/blogs/machine-learning/manage-ai-costs-with-amazon-bedrock-projects/)

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *