O Desafio das Devoluções no Varejo Online
O comércio eletrônico enfrenta um problema estrutural: a cada quatro peças de roupa compradas online, uma é devolvida. Esse cenário alimenta um problema de US$ 890 bilhões em devoluções apenas nos Estados Unidos em 2024. A razão é simples e intuitiva: os clientes não conseguem avaliar adequadamente o caimento, o estilo e a qualidade de uma roupa através de uma tela.
Entre as principais causas para devoluções de itens de moda estão inadequação do tamanho, caimento errado ou descompasso com o estilo esperado. Para varejistas, isso representa um desafio crítico, especialmente considerando que seus clientes mais valiosos são frequentemente os que mais devolvem produtos. Isso força as empresas a manter políticas generosas de devolução, apesar dos custos elevados de processamento e do impacto ambiental significativo.
Cada devolução gera 30% mais emissões de carbono do que a entrega inicial e representa uma oportunidade de venda perdida enquanto o item é reprocessado no estoque.
A Tecnologia de Prova Virtual como Solução
À medida que as compras digitais crescem, a tecnologia de prova virtual surge como uma estratégia promissora para reduzir devoluções sem sacrificar a conveniência do cliente. Porém, as implementações iniciais enfrentavam limitações significativas: falta de precisão, dificuldades de escalabilidade e perda de detalhes importantes como drapeado de tecidos, padrões e logos.
A Amazon Nova Canvas aborda esses desafios através de sua capacidade nativa de prova virtual. O modelo funciona com dois inputs de imagem bidimensionais: uma imagem de origem (mostrando uma pessoa ou espaço) e uma imagem de referência (do produto a ser visualizado). O sistema oferece posicionamento automático de produtos via funcionalidade de máscara automática, além de controles manuais para ajustes precisos.
Durante todo o processo, o modelo preserva cuidadosamente detalhes cruciais como logos e texturas, enquanto oferece controles abrangentes de estilo para customização. Essa tecnologia pode ser implantada em múltiplos canais de engajamento com clientes: desde websites de ecommerce e aplicativos mobile até quiosques em lojas físicas, plataformas de shopping social e showrooms virtuais.
Imagine acessar um site de ecommerce, fazer upload de sua foto pessoal e visualizar como diferentes roupas e acessórios ficariam em você. É exatamente esse o tipo de experiência que a prova virtual em escala torna viável.
Visão Geral da Solução Técnica
Varejistas e empresas de ecommerce podem integrar visualização de produtos diretamente em seus pontos de contato com clientes — existentes ou novos — utilizando apenas upload de foto e seleção de produto. Os clientes conseguem visualizar como itens ficariam em si mesmos, em um modelo ou em outro contexto desejado.
É possível experimentar a capacidade de prova virtual no Amazon Bedrock playground. Além disso, a AWS fornece orientações para implementar uma solução completa dessa funcionalidade em seu próprio ambiente Amazon Web Services.
A solução utiliza a prova virtual recém-lançada no Amazon Nova Canvas, integrado ao Amazon Bedrock. Esse modelo oferece velocidades de inferência rápidas, tornando-o adequado para aplicações em tempo real como ecommerce. Simultaneamente, preserva detalhes de alta fidelidade dos itens de referência, incluindo padrões, texturas e logos, mantendo manipulações semânticas precisas dentro das cenas.
A arquitetura combina serviços serverless da AWS com capacidades de processamento de IA em uma estrutura orientada a eventos. Amazon DynamoDB Streams dispara fluxos de trabalho AWS Step Functions e eventos Amazon Simple Storage Service (S3) para gerenciar entrega de resultados. O Amazon Nova Canvas no Amazon Bedrock gerencia tanto a geração de máscaras quanto a detecção de pose. A solução segue um pipeline de processamento assíncrono com atualizações de status em tempo real, onde conexões WebSocket mantêm comunicação em tempo real com clientes, viabilizando engajamento contínuo durante todo o processo.
Explicação Detalhada da Arquitetura
Fluxo de Iniciação de Requisição
O Amazon S3 armazena as fotos de modelo enviadas pelos clientes e as imagens de produtos. Cada upload gera uma mensagem enviada para uma fila Amazon Simple Queue Service (SQS). Uma função AWS Lambda cria os metadados correspondentes e o caminho S3, armazenando-os na tabela de produtos DynamoDB para recuperação posterior. O Amazon API Gateway gerencia as conexões WebSocket para atualizações de status em tempo real entre o cliente e o serviço de prova virtual.
Lambda processa requisições iniciais recuperando informações de produtos na tabela DynamoDB e criando entradas de trabalho no DynamoDB.
Estrutura de Dados — Tabelas DynamoDB
A solução utiliza quatro tabelas DynamoDB fundamentais:
- Tabela de Produtos (vto-products): Armazena itens de catálogo disponíveis para prova virtual, incluindo localização da imagem no S3.
- Tabela de Trabalhos (vto-jobs): Rastreia o estado de cada requisição de prova virtual.
- Tabela de Modelos (vto-models): Armazena catálogo de imagens de clientes usadas para prova virtual.
- Tabela de Conexões WebSocket (vto-connections): Rastreia conexões WebSocket ativas para atualizações de status em tempo real.
Cada tabela segue esquemas específicos que suportam o fluxo completo da solução, desde a recepção de requisições até a entrega final de resultados visuais.
Geração da Prova Virtual
Após a criação de um trabalho, o DynamoDB Streams dispara workflows do AWS Step Functions para processar requisições de prova virtual de forma assíncrona. O Step Functions orquestra a geração da prova virtual, acionando uma função Lambda que invoca o modelo Amazon Nova Canvas através do Amazon Bedrock. A tabela DynamoDB de trabalhos é atualizada com o status da prova virtual.
Entrega de Resultados
O Amazon S3 armazena as imagens de prova virtual geradas com metadados de ID de trabalho. O Amazon SQS gerencia notificações de eventos S3 para imagens de prova concluídas. Uma função Lambda envia a URL do Amazon S3 do resultado de volta ao usuário através do WebSocket. Esse processo completo típico leva entre 7 e 11 segundos.
Funcionamento Passo a Passo da Solução
Quando um cliente inicia uma requisição de prova, primeiro realiza autenticação no Amazon Cognito e depois faz upload de suas fotos armazenadas no Amazon S3. Um workflow está disponível para popular automaticamente a tabela de produtos no DynamoDB através de eventos do S3.
O cliente estabelece uma conexão WebSocket através do API Gateway, criando um canal persistente para atualizações em tempo real. Em seguida, envia o ID do produto que deseja experimentar virtualmente, juntamente com a URL S3 da imagem de modelo estático que deseja usar.
Uma função Lambda processa essa requisição recuperando a URL da imagem de produto do DynamoDB e criando uma entrada de trabalho com ambas as URLs de imagem, retornando um ID de trabalho único para rastreamento.
O DynamoDB stream dispara então um step function para coordenar diferentes escritas e atualizações na tabela DynamoDB. O step function também invoca a funcionalidade de prova virtual do Amazon Nova Canvas.
Processamento de Imagens e Máscaras
O modelo recebe como entrada: a imagem de origem (imagem base que você deseja modificar, por exemplo, a foto do cliente) e a imagem de referência (contendo o produto que você deseja inserir na imagem base). Para peças de roupa, a imagem de referência pode conter roupas com corpo ou sem corpo, podendo inclusive conter múltiplos produtos representando componentes distintos de um outfit (como camiseta, calça e sapatos em uma única imagem).
Por padrão, uma máscara é calculada automaticamente usando inputs auxiliares — maskType: "GARMENT" ou maskType: "PROMPT". A imagem de máscara pode ser fornecida diretamente pelo desenvolvedor (maskType: "IMAGE").
Quando maskType: "GARMENT" é especificado, o Amazon Nova Canvas cria uma máscara sensível a roupas baseada no valor do parâmetro garmentClass. As classes de roupa de alto nível mais comuns incluem:
"UPPER_BODY" – Cria uma máscara que inclui comprimento total dos braços.
"LOWER_BODY" – Cria uma máscara que inclui comprimento total das pernas sem gap entre elas.
"FOOTWEAR" – Cria uma máscara que se ajusta ao perfil do sapato mostrado na imagem de origem.
"FULL_BODY" – Cria uma máscara equivalente à combinação de "UPPER_BODY" e "LOWER_BODY".
Usando maskType: "PROMPT", é possível utilizar linguagem natural para descrever qual item na imagem de origem você deseja substituir. Isso é particularmente útil para imagens de itens além de roupas. Esse recurso utiliza a mesma funcionalidade de máscara automática presente na tarefa “INPAINTING” do Nova Canvas usando o parâmetro maskPrompt.
Uma vez que a máscara é entendida e as áreas de roupa que precisam ser substituídas são identificadas, a imagem de produto é inserida na foto do usuário como entrada. O modelo gera então a imagem de prova, que é armazenada no Amazon S3 com o ID do trabalho como metadados. Durante todo esse processo, o sistema envia atualizações de progresso através da conexão WebSocket.
Uma notificação de evento do Amazon S3 dispara uma função Lambda através do Amazon SQS. A função gera uma URL pré-assinada para a imagem de resultado e a entrega ao cliente através da conexão WebSocket estabelecida, completando todo o ciclo.
Detalhes de Implementação — Estrutura de Dados
A solução pressupõe que a tabela de produtos está pré-populada com o inventário do varejista. Produtos são automaticamente populados quando imagens são enviadas para a pasta /products/ do S3.
O esquema da tabela de produtos inclui: identificador único do produto, URL S3 da imagem original, nome de exibição, categoria, descrição detalhada (incluindo estilo, cor e opções de tamanho), sinalizador indicando importação automática, e timestamps de criação e atualização.
A tabela de modelos armazena o catálogo de imagens de clientes usadas para prova virtual, automaticamente populadas quando imagens são enviadas para a pasta /models/ do S3, com esquema similar incluindo ID único do modelo, URL S3, nome de exibição, categoria, descrição e timestamps.
A tabela de trabalhos de prova virtual mantém informações de estado e rastreamento para cada requisição durante o fluxo de processamento. Seu esquema inclui: ID único para cada trabalho, referência ao modelo utilizado, referência ao produto sendo experimentado, URL S3 da foto do cliente, URL S3 da imagem de produto, URL S3 da imagem de resultado gerada, status atual do trabalho (criado, processando, completado ou erro), mapa de parâmetros da API de prova virtual, ID de conexão WebSocket para atualizações em tempo real, detalhes de erro se o trabalho falhar, e timestamps de criação e última atualização.
A tabela de conexões WebSocket rastreia conexões ativas para atualizações de status de trabalho em tempo real. Informações técnicas adicionais sobre implementação de WebSocket API podem ser encontradas no tutorial Create a WebSocket chat app with a WebSocket API, Lambda, and DynamoDB. O esquema inclui identificador de conexão WebSocket como chave de partição, timestamp de quando a conexão foi estabelecida, e um valor de time-to-live para limpeza automática de conexões obsoletas.
Começando a Implementação
Para começar rapidamente, a AWS fornece uma GitHub sample completa com pré-requisitos, scripts de implantação, código de exemplo e um documento de guia de solução abrangente com melhores práticas e detalhes de configuração. Esse guia permite começar imediatamente a experimentar a solução.
Conclusão e Perspectiva Estratégica
Conforme o ecommerce continua crescendo exponencialmente, reduzir taxas de devolução mantendo satisfação do cliente se torna criticamente importante para lucratividade e sustentabilidade dos varejistas. A solução de prova virtual demonstra como serviços serverless da AWS podem ser combinados com inteligência artificial generativa para endereçar um desafio significativo do varejo moderno.
Ao utilizar Amazon Nova Canvas junto com uma arquitetura serverless robusta, varejistas conseguem oferecer aos clientes visualização precisa de produtos com preservação de pose, enquanto mantêm a experiência de compra contínua que seus clientes mais leais esperam.
Considerações de implementação vão além da arquitetura técnica. Implantação bem-sucedida requer atenção cuidadosa a quotas de serviço, monitoramento e otimização de custos. O guia de solução fornece recomendações detalhadas para gerenciar conexões WebSocket, implementar estratégias de retry e otimizar utilização de recursos. Esses aspectos operacionais são cruciais para manter desempenho confiável durante períodos de pico de compras enquanto gerencia custos de forma efetiva.
Fonte
Building a scalable virtual try-on solution using Amazon Nova on AWS: part 1 (https://aws.amazon.com/blogs/machine-learning/building-a-scalable-virtual-try-on-solution-using-amazon-nova-on-aws-part-1/)