AWS ML Engineer Associate (MLA-C01) em português: guia completo

Como se preparar para a AWS MLA-C01 em PT-BR: domínios, formato da prova, SageMaker, pipelines de ML e deploy de modelos.

Por Leonardo Chiarelli · Atualizado em 21/06/2026 · 1 min de leitura

O que é a AWS MLA-C01?

A AWS Certified Machine Learning Engineer Associate (código oficial MLA-C01) é a certificação de nível Associate da AWS voltada para quem projeta, treina, implanta e monitora soluções de machine learning em produção. Lançada em 2024, ela valida habilidades práticas de engenharia de ML: preparação de dados, desenvolvimento de modelo, deploy em endpoints gerenciados, orquestração de pipelines e monitoramento contínuo de qualidade.

O exame tem 65 questões no total, sendo 50 pontuadas e 15 não pontuadas usadas para pesquisa interna. O tempo é de 130 minutos, em formato de múltipla escolha (uma resposta correta) e múltipla resposta (duas ou mais corretas). O score vai de 100 a 1000 e a nota de corte para aprovação é 720.

O custo oficial é de USD 150, mais impostos locais. No Brasil, o gateway de pagamento converte para reais e aplica IOF de cartão internacional, então o valor final fica acima de R$ 800 dependendo do câmbio. A prova está disponível em duas modalidades: remota via Pearson VUE OnVUE (de casa, com proctoring por webcam) ou presencial em centros credenciados Pearson VUE.

A certificação é válida por 3 anos. A prova é inteiramente baseada em cenários: você precisa entender o problema de ML, escolher o serviço AWS correto e saber por que. Não há console aberto durante a prova, mas o nível de detalhe técnico é bem maior do que nas certs Foundational. Página oficial: aws.amazon.com/certification/certified-machine-learning-engineer-associate.

Quem deve fazer a MLA-C01?

A MLA-C01 faz sentido para perfis que já têm experiência prática com dados, desenvolvimento de modelos ou operação de sistemas de ML. Os quatro perfis típicos:

Engenheiro de ML ou MLOps: profissional que trabalha no ciclo completo de um modelo, desde a ingestão de dados até o monitoramento em produção. A MLA-C01 valida formalmente esse escopo e adiciona credibilidade em processos seletivos.
Cientista de dados com interesse em deploy: quem sabe construir modelos no Jupyter mas ainda não domina o lado de infraestrutura, pipelines de CI/CD para ML e monitoramento de drift. A cert cobre exatamente essa lacuna.
Engenheiro de dados ou DevOps migrando para ML: profissional que já conhece S3, Glue, CloudFormation e quer agregar o conhecimento de treinamento e deploy de modelos sobre essa base.
Developer ou Solutions Architect com projetos de ML: quem integra modelos de ML em aplicações AWS e precisa tomar decisões de arquitetura sobre instâncias de treino, estratégias de endpoint e custo de inferência.

O que a prova NÃO exige (e que candidato frequentemente confunde):

Implementar algoritmos do zero em Python ou NumPy. A MLA-C01 cobre algoritmos como conceitos, não como código matemático.
Ser especialista em frameworks como PyTorch ou TensorFlow. Você precisa saber que o SageMaker suporta esses frameworks, não escrever camadas de rede neural.
Ter experiência profunda em estatística avançada. Correlação, variância, overfitting, bias-variance tradeoff: isso cai. Cálculo de gradiente ou álgebra linear: não cai.

Pré-requisitos recomendados

A MLA-C01 é nível Associate, o que significa que a AWS assume conhecimento prévio de nuvem e de ML aplicado. Não é um pré-requisito formal, mas candidatos sem base em pelo menos dois desses pontos vão precisar de mais tempo de estudo:

Conceitos básicos de nuvem AWS: regiões, IAM, S3, VPC, EC2 (equivalente ao CLF-C02)
Noções de ML supervisionado e não supervisionado: o que é treino, validação e teste; o que são hiperparâmetros; diferença entre classificação e regressão
Familiaridade com Amazon SageMaker em nível básico: Studio, Training Jobs, Endpoints
Entendimento básico de Python (você vai ler código nos enunciados, não escrever)

Se você ainda não tem a base de nuvem, fazer o CLF-C02 antes é um caminho razoável. Se você tem base técnica mas nunca usou SageMaker, reserve tempo para explorar o SageMaker Studio na prática, mesmo sem pagar nada usando o Free Tier.

Conteúdo do exame

A prova cobre 4 domínios oficiais, cada um com peso diferente no score. Fonte: Exam Guide oficial MLA-C01 publicado pela AWS, disponível gratuitamente em PDF na página da certificação.

Domínio 1: Preparação de Dados para ML (28%)

Maior domínio da prova e ponto onde muitos candidatos subestimam a profundidade cobrada. Subtópicos:

Ingestão e armazenamento (S3, Glue, Feature Store): como dados brutos chegam ao pipeline de ML. Amazon S3 como repositório central, AWS Glue para ETL e catálogo de dados, Amazon SageMaker Feature Store para armazenar features reutilizáveis entre modelos. A diferença entre online store (baixa latência, inferência) e offline store (batch, treino) é frequentemente cobrada.
Transformação e engenharia de features: normalização, padronização, encoding de variáveis categóricas (one-hot, ordinal), tratamento de valores ausentes, criação de features derivadas. No contexto AWS: SageMaker Processing Jobs para transformações em escala, AWS Glue DataBrew para transformações visuais sem código.
Integridade, balanceamento e splitting: como lidar com datasets desbalanceados (oversampling com SMOTE, undersampling, class weights), detectar e corrigir data leakage, estratégias de split treino/validação/teste para series temporais (nunca split aleatório nesse caso).
Rotulagem com Ground Truth: Amazon SageMaker Ground Truth para criar datasets rotulados usando labelers humanos ou modelos de rotulagem automática. Quando usar labeling workforce pública (Mechanical Turk), privada (equipe interna) ou de fornecedores especializados. Custo e tempo são variáveis de decisão em questões de cenário.

Domínio 2: Desenvolvimento de Modelo de ML (26%)

Segundo maior domínio, com foco em treino e avaliação. Subtópicos:

Seleção de algoritmo e abordagem: quando usar cada família de algoritmo. Regressão linear e logística para relações simples, XGBoost para dados tabulares estruturados, redes neurais para imagens e texto, k-means para clustering. Os algoritmos built-in do SageMaker (XGBoost, Linear Learner, BlazingText, Image Classification, etc.) têm características e casos de uso que caem diretamente na prova.
Treinamento e tuning de hiperparâmetros: SageMaker Training Jobs com instâncias específicas (treinamento distribuído para grandes datasets usando instâncias p3/p4 com GPU), estratégias de tuning de hiperparâmetros: grid search, random search e busca bayesiana via SageMaker Automatic Model Tuning (Hyperparameter Optimization). A busca bayesiana usa resultados anteriores para guiar o próximo experimento, sendo mais eficiente que grid/random.
Avaliação de métricas (precision, recall, AUC): escolher a métrica certa para o problema. Accuracy é enganosa com datasets desbalanceados. Precision é relevante quando falsos positivos custam caro (fraude). Recall é relevante quando falsos negativos custam caro (diagnóstico médico). AUC-ROC mede desempenho geral independente do threshold. F1-score balanceia precision e recall. SageMaker Clarify pode calcular e reportar essas métricas, além de métricas de fairness.
Mitigação de overfitting e underfitting: regularização L1 (Lasso) e L2 (Ridge), dropout para redes neurais, early stopping durante treino, aumento de dados (data augmentation) para imagens e texto, validação cruzada para melhor estimativa de performance.

Domínio 3: Deploy e Orquestração de Workflows de ML (22%)

Domínio técnico que diferencia engenheiro de ML de cientista de dados. Subtópicos:

Estratégias de deploy (endpoint, batch, serverless): SageMaker Real-Time Endpoints para inferência de baixa latência, SageMaker Batch Transform para inferência em grandes volumes sem endpoint persistente, SageMaker Serverless Inference para workloads intermitentes que toleram cold start. Multi-model endpoints permitem hospedar múltiplos modelos em um único endpoint para economizar custo.
Infraestrutura e escalabilidade: Application Auto Scaling para endpoints SageMaker, configuração de variantes de produção para A/B testing e shadow testing, instâncias de inferência (incluindo instâncias AWS Inferentia para custo reduzido em produção).
CI/CD e SageMaker Pipelines: SageMaker Pipelines é o serviço de orquestração de workflows de ML: define steps (processamento, treino, avaliação, deploy) como grafo acíclico dirigido. Integração com GitHub Actions e AWS CodePipeline para disparar pipelines ao fazer push em código ou ao detectar novos dados. Versionamento de modelos via SageMaker Model Registry com estágios (Staging, Production).
IaC (CloudFormation, CDK): provisionar endpoints SageMaker, pipelines e roles IAM via CloudFormation ou CDK em vez de clicar no console. Reprodutibilidade e rastreabilidade de infraestrutura são requisitos de ML em produção. A prova cobra quando usar CDK sobre CloudFormation (abstração de linguagem de programação vs YAML/JSON puro).

Domínio 4: Monitoramento, Manutenção e Segurança (24%)

Domínio frequentemente negligenciado em cursos, mas com peso expressivo na prova. Subtópicos:

Model Monitor e drift: Amazon SageMaker Model Monitor detecta data drift (mudança na distribuição dos dados de entrada) e model drift (degradação da qualidade das predições) comparando com uma baseline capturada no treino. Tipos de drift monitorados: qualidade de dados, qualidade do modelo, tendência de features e qualidade de viés. Gatilhos de re-treino automático via Amazon EventBridge.
Custo e otimização de recursos: selecionar instâncias corretas para treino versus inferência, usar Spot Instances para treinos tolerantes a interrupção (até 90% de desconto com checkpoint habilitado), SageMaker Savings Plans para comprometimento de uso, compressão de modelo (quantização, pruning) para reduzir custo de inferência.
Segurança, IAM e VPC para ML: least privilege para roles de treino e endpoint, SageMaker dentro de VPC privada sem acesso à internet pública, criptografia de dados em repouso (KMS) e em trânsito (TLS), isolamento de rede entre instâncias de treino em multi-node. SageMaker Model Cards para documentar modelos, incluindo riscos e uso pretendido.
Logging e auditoria com CloudWatch: CloudWatch Logs para capturar saída de containers de treino e inferência, CloudWatch Metrics para latência e invocações de endpoint, AWS CloudTrail para auditoria de chamadas de API no SageMaker, alarmes para auto-escala e re-treino.

Como estudar para a MLA-C01

Comece lendo o Exam Guide oficial da AWS. Esse documento lista os serviços e conceitos cobrados por domínio com o peso exato. Ignorar o Exam Guide é o erro número um do candidato.

Faça um simulado de baseline antes de estudar. A MLA-C01 tem questões de cenário com 4 alternativas que parecem todas plausíveis. O baseline vai revelar onde você trava em conceitos que pensava conhecer. Sem esse diagnóstico, você gasta horas iguais em domínios onde já está bem.

Foque no que pesa mais. O Domínio 1 (28%) e o Domínio 4 (24%) somam 52% da prova. Candidatos técnicos tendem a ir bem em desenvolvimento de modelo (Domínio 2) e erram mais em preparação de dados e monitoramento, que requerem conhecimento específico de serviços AWS.

Explore o SageMaker Studio na prática. A conta AWS oferece Free Tier com acesso a SageMaker Studio, S3 e Glue para experimentos pequenos. Criar um Training Job, ajustar hiperparâmetros e publicar um endpoint real vale mais do que horas de vídeo. O que você fez com as mãos, você não esquece.

Use flashcards SRS para serviços e comparações. Exemplos de cards úteis: "Quando usar SageMaker Batch Transform vs Real-Time Endpoint?" com resposta "Batch para grandes volumes sem latência crítica; Real-Time para respostas individuais em milissegundos." Outro: "Qual instância usar para treino com GPU de baixo custo?" com resposta "Instâncias p3 ou g4dn, com Spot Instance habilitada e checkpoint configurado."

Faça simulados frequentes. Cadência recomendada: simulado a cada 2 semanas, anotar todos os erros, transformar cada erro em flashcard, revisar os flashcards até dominar. Questões de cenário da MLA-C01 frequentemente eliminam alternativas com palavras-chave: "mais econômico", "menos overhead operacional", "melhor para dados em tempo real". Treinar leitura de enunciado faz diferença.

O AWS Skill Builder oferece cursos oficiais de SageMaker e MLOps, parte deles gratuita e parte disponível no plano Enhanced (pago). O curso "Machine Learning Learning Plan" é um bom complemento estruturado para quem está começando.

O fluxo descrito acima (baseline simulado, fraqueza identificada, flashcard SRS automático do erro, re-teste) é exatamente o loop que o CertAI automatiza em português brasileiro. Você gasta menos tempo organizando estudo e mais tempo estudando o que importa.

Custo e inscrição

O preço oficial da MLA-C01 é USD 150 (nível Associate, mais caro que o CLF-C02 de USD 100). No Brasil, o valor final com IOF e câmbio fica acima de R$ 800.

Vouchers de desconto existem em contextos específicos. Programa AWS re/Start (transição de carreira), AWS Partner Network para funcionários de empresas parceiras e AWS Summit presencial para participantes. Não planeje o estudo contando com voucher: trate-o como bônus se aparecer.

A inscrição é feita pelo portal aws.training/Certification ou direto no site da Pearson VUE. Você precisa de dois documentos com foto. O nome no documento deve bater 100% com o cadastro AWS, incluindo acentuação. Divergência leva a recusa de acesso à prova sem reembolso.

Duas opções de prova:

Online (OnVUE): de casa, com webcam, ambiente fechado. O proctor monitora por câmera. Qualquer movimento suspeito pode invalidar a prova. Mais flexível de agendar.
Centro presencial (Pearson VUE): em locais credenciados, principalmente nas capitais brasileiras. Mais previsível para quem tem ansiedade com proctoring remoto e sem risco de queda de internet.

Reagendamento é gratuito até 24 horas antes do horário marcado. Após esse prazo, o voucher é perdido e é necessário comprar nova inscrição.

Quanto tempo leva para passar?

Depende fortemente da base prévia em ML e AWS. Três cenários típicos:

Com base sólida em ML e SageMaker (MLOps ou Engenheiro de ML sênior): 4 a 6 semanas focando nos domínios de maior peso e nos serviços menos usados no dia-a-dia (Ground Truth, Model Monitor, SageMaker Pipelines).
Cientista de dados com Python/ML mas pouco SageMaker: 8 a 10 semanas. O conceito de ML você já tem; o mapeamento para serviços AWS e práticas de engenharia de produção precisa ser construído.
Engenheiro de dados ou DevOps migrando para ML: 10 a 14 semanas. A infraestrutura AWS você já conhece; os conceitos de treino, validação e avaliação de modelos precisam ser estudados do zero.

Não confie em posts de "passei em 2 semanas". São possíveis para quem já tem anos de SageMaker no trabalho. Para a maioria, planejar 8 a 10 semanas é mais honesto e menos sujeito a frustração.

Importante: candidatos que já têm CLF-C02 ou AIF-C01 podem reduzir o tempo de estudo nos fundamentos de nuvem e IAM. Mas a MLA-C01 exige profundidade técnica que as certs Foundational não cobrem.

Dicas práticas para o dia da prova

Você tem 130 minutos para 65 questões, o que dá 2 minutos por questão. A MLA-C01 tem questões mais longas do que a CLF-C02: enunciados de cenário com 3 a 5 parágrafos e alternativas detalhadas. Leia o enunciado completo antes de olhar as alternativas.
Use a flag "marcar para revisão" nas questões duvidosas. Não trave em uma questão por mais de 3 minutos. Marque, chute a mais provável e siga. Volte no final.
Preste atenção em modificadores de custo e operação. A AWS adora perguntas com "MOST cost-effective" e "LEAST operational overhead". Serviços gerenciados (SageMaker, Glue) vencem em overhead; Spot Instances vencem em custo para cargas tolerantes a interrupção.
Cuidado com armadilhas clássicas: confundir SageMaker Model Monitor (monitora produção) com SageMaker Clarify (detecta viés e explica predições, mas também pode ser usado em monitoramento), achar que Batch Transform precisa de endpoint persistente (não precisa), assumir que Serverless Inference tem latência equivalente a Real-Time Endpoints (não tem: há cold start).
O resultado sai na hora. Score preliminar aparece na tela ao terminar e confirmar. O certificado oficial e o badge digital chegam por e-mail em até 5 dias úteis. Score 721 ou 950 valem a mesma certificação.

Diferença entre MLA-C01 e AIF-C01

Os candidatos frequentemente ficam em dúvida entre as duas certificações de IA/ML da AWS. A distinção central:

AIF-C01 (AI Practitioner, Foundational): conceitual e gerencial. Cobre o que é IA generativa, foundation models, Amazon Bedrock, prompt engineering, IA responsável. Não exige programação nem experiência com ML. É para quem quer entender IA na nuvem, não para quem vai operar sistemas de ML.
MLA-C01 (ML Engineer Associate): técnico e prático. Cobre pipelines de ML, treinamento, deploy, monitoramento e segurança com SageMaker. Exige experiência com dados e desenvolvimento. É para quem vai construir e manter sistemas de ML em produção.

As duas certificações são complementares, não concorrentes. Se você é gestor ou profissional não técnico interessado em IA: AIF-C01. Se você é engenheiro que vai colocar modelos em produção: MLA-C01.

Próximos passos depois da MLA-C01

Especialização: AWS Certified Machine Learning Specialty (MLS-C01) é o próximo nível. Cobre algoritmos com mais profundidade, engenharia de features avançada, deep learning com frameworks como TensorFlow e PyTorch no SageMaker, e arquiteturas de ML para casos de uso específicos. É a certificação de ML mais valorizada pelo mercado AWS.

Arquitetura: AWS Solutions Architect Professional (SAP-C02) adiciona a visão de arquitetura empresarial, útil para engenheiros de ML que precisam desenhar soluções completas integrando ML com outros sistemas.

IA Generativa: a AIF-C01 cobre fundamentos. Quem quer aprofundar em Amazon Bedrock, agentes de IA e customização de modelos via fine-tuning pode combinar a MLA-C01 com treinamentos específicos do AWS Skill Builder em GenAI.

A MLA-C01 vence em 3 anos. A renovação pode ser feita sem refazer a prova: basta passar em qualquer certificação AWS de nível Professional ou Specialty dentro do período de validade.

Pronto para começar?

Loop fechado em PT-BR: simulado, flashcards do seu erro, revisão espaçada. 7 dias grátis.

Conhecer o CertAI

Preparar para a certificação (trial grátis)