NEXUS, o modelo de IA para dados tabulares da Fundamental, chega ao Amazon SageMaker JumpStart

O que é o NEXUS e por que ele importa

A AWS anunciou o suporte ao NEXUS — modelo de fundação (FM, do inglês Foundation Model) desenvolvido pela Fundamental — no Amazon SageMaker AI. A novidade está disponível pelo Amazon SageMaker JumpStart e representa uma abordagem diferente para um problema antigo: extrair predições confiáveis de dados estruturados corporativos.

Enquanto os Modelos de Linguagem de Grande Escala (LLMs, do inglês Large Language Models) foram projetados para texto e as abordagens tradicionais de Aprendizado de Máquina (ML, do inglês Machine Learning) exigem meses de engenharia de features e treinamento, o NEXUS foi pré-treinado em bilhões de tarefas reais de predição sobre conjuntos de dados estruturados. Isso significa que ele chega ao ambiente do cliente já sabendo como encontrar sinais relevantes nos dados — sem a necessidade de pipelines manuais complexos.

Como um Grande Modelo Tabular (LTM, do inglês Large Tabular Model), o NEXUS traz inovações técnicas importantes:

  • Arquitetura determinística: ao contrário de LLMs probabilísticos, que podem gerar respostas diferentes para a mesma consulta, o NEXUS produz resultados consistentes e reproduzíveis a cada predição.
  • Compreensão tabular nativa: treinado em bilhões de tabelas, o modelo processa nativamente números, categorias, datas e texto não estruturado — sem engenharia de features manual.
  • Raciocínio não sequencial: diferentemente de modelos que predizem dados sequenciais (como a próxima palavra), o NEXUS analisa relações multidimensionais em tabelas corporativas. Por exemplo, ao prever churn de clientes, ele considera simultaneamente frequência de transações, tickets de suporte e indicadores econômicos.

Por que as abordagens atuais ficam aquém

O dado mais valioso das empresas vive em tabelas: planilhas, sistemas de Planejamento de Recursos Empresariais (ERP, do inglês Enterprise Resource Planning), sistemas de Gestão de Relacionamento com o Cliente (CRM, do inglês Customer Relationship Management) e bancos de dados relacionais. Mas as ferramentas disponíveis hoje apresentam limitações sérias:

  • O ML tradicional exige de 3 a 6 meses para que times de cientistas de dados construam, treinem e coloquem em produção um modelo para um único caso de uso.
  • Os LLMs são não-determinísticos e perdem contexto numérico durante a tokenização, gerando resultados imprecisos em dados estruturados e exigindo guardrails complexos.

O NEXUS foi arquitetado especificamente para dados tabulares e oferece vantagens como:

  • Invariância de permutação: reconhece que mudar a ordem das colunas não muda o significado dos dados — algo que os transformers tradicionais não fazem nativamente.
  • Capacidade para bilhões de linhas: processa conjuntos de dados massivos sem truncamento ou amostragem.
  • Raciocínio entre esquemas: conecta dados relacionados entre tabelas distintas de forma automática.
  • Limpeza autônoma de dados: realiza predições mesmo quando há entradas incompletas ou ausentes.

Como o NEXUS funciona no Amazon SageMaker AI

O modelo roda em uma instância de GPU dedicada, de locatário único e isolada em rede, dentro do ambiente gerenciado do SageMaker AI. O fluxo de trabalho completo envolve as seguintes etapas:

  • Assinatura e implantação: o usuário assina o pacote do modelo NEXUS no AWS Marketplace e o implanta como um endpoint de inferência gerenciado pelo SageMaker AI em uma instância ml.p5en.48xlarge (8× GPUs NVIDIA H200).
  • Instalação do SDK: instala-se o SDK Python da Fundamental e conecta-o ao endpoint do SageMaker. O SDK oferece uma API compatível com scikit-learn, com os estimadores NEXUSClassifier e NEXUSRegressor.
  • Upload dos dados para o Amazon S3: o SDK serializa os dados tabulares e faz o upload para um bucket do Amazon Simple Storage Service (Amazon S3) na conta do usuário.
  • Treinamento do modelo: basta chamar clf.fit(X_train, y_train). O NEXUS cuida automaticamente da limpeza de dados e da engenharia de features, sem necessidade de pipeline manual.
  • Geração de predições: use clf.predict(X_test) para predições determinísticas ou clf.predict_proba(X_test) para estimativas de probabilidade. Os resultados são armazenados de volta no bucket do Amazon S3.

Todo o fluxo mantém os dados dentro do ambiente AWS do cliente. O endpoint é isolado em rede e de locatário único, tornando o NEXUS adequado para cargas de trabalho corporativas com dados sensíveis.

Casos de uso por setor

Dados tabulares são a espinha dorsal da tomada de decisão empresarial — de registros financeiros a prontuários médicos, passando por logs de cadeia de suprimentos. A seguir, alguns exemplos práticos de aplicação do NEXUS destacados pela AWS:

Serviços financeiros

  • Detecção de fraudes: análise de padrões de transações em milhões de contas.
  • Modelagem de risco de crédito: processamento de portfólios de empréstimos com extração automatizada de features.
  • Conformidade regulatória: extração de dados estruturados a partir de documentos regulatórios não estruturados.

Saúde

  • Seleção para ensaios clínicos: identificação de pacientes elegíveis em sistemas de Registros Eletrônicos de Saúde (EHR, do inglês Electronic Health Records).
  • Descoberta de medicamentos: análise de dados de ensaios biológicos para triagem de compostos.
  • Estratificação de risco de pacientes: predição de riscos de readmissão usando dados de séries temporais de Unidades de Terapia Intensiva (UTI).

Manufatura e cadeia de suprimentos

  • Manutenção preditiva: previsão de falhas de equipamentos a partir de dados de sensores.
  • Previsão de demanda: antecipação de necessidades de estoque em redes globais de distribuição.
  • Análise de risco de fornecedores: avaliação de confiabilidade de fornecedores com base em histórico de compras.

Varejo e e-commerce

  • Predição de churn: identificação de clientes em risco com base em histórico de compras e comportamento de navegação.
  • Precificação dinâmica: otimização de preços com base em dados de concorrentes e níveis de estoque.
  • Análise de abandono de carrinho: compreensão dos motivos pelos quais clientes abandonam itens no carrinho.

Por que usar o NEXUS no Amazon SageMaker AI

Implantar um modelo é apenas metade da equação. A infraestrutura onde ele roda determina a velocidade de ir da experimentação à produção. O SageMaker AI oferece um ambiente gerenciado, seguro e escalável para rodar o NEXUS em escala corporativa, com benefícios como:

  • Aceleração do tempo de valor: contêineres e scripts pré-configurados reduzem o tempo de implantação.
  • Eficiência de custos: a infraestrutura gerenciada do SageMaker AI reduz o overhead operacional.
  • Escalabilidade: escala automaticamente para conjuntos de dados em escala de petabytes.
  • Conformidade pronta: atende aos requisitos de GDPR, HIPAA e SOC 2 por padrão.
  • Aprendizado contínuo: integração nativa com o Amazon SageMaker Pipelines para retreinamento de modelos.
  • Suporte multiplex: suporta múltiplas operações de fit e predict em um único endpoint do SageMaker AI, eliminando a necessidade de recursos dedicados para cada caso de uso.

A Fundamental firmou uma parceria estratégica com a AWS para acelerar a adoção corporativa do NEXUS, com integração nativa via AWS Marketplace, infraestrutura segura e suporte de Arquitetos de Soluções AWS dedicados.

Como começar

Para experimentar o NEXUS, basta acessar o Amazon SageMaker JumpStart e buscar por “Fundamental NEXUS”. Estão disponíveis o modelo base (pré-treinado em mais de 10 bilhões de linhas tabulares) e variantes específicas para setores como finanças, saúde e manufatura.

Para quem quiser ir além, a AWS disponibiliza um notebook de exemplo gerenciado em um espaço JupyterLab no Amazon SageMaker AI. Mais detalhes técnicos estão na documentação do NEXUS e no Guia do Desenvolvedor do Amazon SageMaker AI. Para conversas sobre implementação, é possível entrar em contato com o time da Fundamental diretamente.

Fonte

Fundamental’s Large Tabular Model NEXUS is now available on Amazon SageMaker JumpStart (https://aws.amazon.com/blogs/machine-learning/fundamentals-large-tabular-model-nexus-is-now-available-on-amazon-sagemaker-jumpstart/)

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *