AIF-C01 Domínio: Fundamentos de IA e ML (20% do exame)

Resumo de estudo de fundamentos de IA para a AIF-C01: conceitos de IA, ML e Deep Learning, tipos de aprendizado e ciclo de vida de ML.

Por Leonardo Chiarelli · Atualizado em 21/06/2026 · 1 min de leitura

AIF-C01 Domínio: Fundamentos de IA e ML (20% do exame)

Este domínio responde por 20% da nota na AWS Certified AI Practitioner (AIF-C01), o que significa aproximadamente 13 das 65 questões. O peso é menor que o domínio de Aplicações de Foundation Models (28%), mas é o piso conceitual de toda a prova: sem entender a diferença entre IA, ML e Deep Learning, as questões dos outros domínios ficam mais difíceis. Trate este domínio como vocabulário obrigatório, não como conteúdo secundário.

A AIF-C01 tem 65 questões no total, duração de 90 minutos e nota de corte 700 de 1000. O custo oficial é USD 100, mais impostos locais. É uma prova de nível Foundational, ou seja, não exige experiência prática com código ou com infraestrutura AWS.

Subtopic 1: Conceitos de IA, ML e Deep Learning

A prova distingue três camadas aninhadas. A ordem importa e cai diretamente em questões de conceito.

Inteligência Artificial (IA) é o campo mais amplo. Abrange qualquer técnica que permite a máquinas executar tarefas que, se feitas por humanos, exigiriam inteligência: reconhecer imagens, entender texto, jogar xadrez, recomendar produtos. IA não é sinônimo de ML: sistemas baseados em regras (if/else) explícitas também são IA, mesmo sem aprendizado.

Machine Learning (ML) é um subconjunto da IA. Em vez de regras escritas manualmente, o sistema aprende padrões a partir de dados. Você fornece exemplos (dados de treino), o algoritmo ajusta parâmetros internos (pesos) e o modelo resultante generaliza para novos exemplos. A lógica central: dados + algoritmo = modelo.

Deep Learning (DL) é um subconjunto do ML. Usa redes neurais com muitas camadas (daí "deep"). É o que viabiliza reconhecimento de imagem em escala (convolutional networks), geração de texto (transformers) e síntese de voz. A diferença prática: DL precisa de muito mais dados e poder computacional, mas aprende representações complexas sem engenharia de features manual.

A relação visual:

IA
  └─ ML
       └─ Deep Learning

Serviços AWS neste subtopic:

  • Amazon SageMaker: plataforma gerenciada para construir, treinar e implantar modelos de ML. Cobre todo o espectro, de algoritmos clássicos a redes neurais profundas.
  • Amazon Rekognition: serviço de visão computacional (DL) pré-treinado para detecção de objetos, faces e texto em imagens/vídeo.
  • Amazon Comprehend: processamento de linguagem natural (NLP) gerenciado para análise de sentimento, extração de entidades e classificação de texto.
  • Amazon Transcribe: reconhecimento automático de fala (ASR), também baseado em DL.

Pegadinhas comuns:

  • A prova costuma apresentar cenários descrevendo um sistema baseado em regras e perguntar "qual abordagem de IA está sendo usada". Regras explícitas = sistemas especialistas (IA clássica), não ML.
  • Confundir "modelo de ML" com "modelo de IA generativa". Modelos discriminativos (classificam, preveem) são ML tradicional. Modelos generativos (produzem texto, imagem, código) são um subconjunto de DL. Foundation models ficam nesse nível mais específico, cobertura do Domínio 2.
  • "Deep Learning requer sempre GPU" é uma afirmação que a prova pode usar como distrator verdadeiro em termos práticos, mas o conceito central é a arquitetura de múltiplas camadas, não o hardware.

Subtopic 2: Tipos de aprendizado

Este é o subtopic com maior densidade de vocabulário técnico cobrado na AIF-C01. A prova apresenta um cenário e pede para identificar qual paradigma de aprendizado está sendo usado.

Aprendizado supervisionado

O modelo treina com dados rotulados: cada exemplo de entrada já tem a resposta correta associada. O algoritmo ajusta parâmetros para minimizar o erro entre a previsão e o rótulo real.

Dois tipos principais:

  • Classificação: a saída é uma categoria discreta. Exemplo: "este e-mail é spam ou não é spam", "esta imagem contém gato, cão ou pássaro".
  • Regressão: a saída é um valor numérico contínuo. Exemplo: "qual será o preço desta casa", "quantas unidades serão vendidas no próximo mês".

Algoritmos comuns que a prova menciona: regressão linear, regressão logística, árvores de decisão, XGBoost, redes neurais com rótulos.

Serviço AWS central: Amazon SageMaker com algoritmos built-in como XGBoost, Linear Learner e Factorization Machines para tarefas supervisionadas.

Aprendizado não supervisionado

O modelo recebe dados sem rótulos. O objetivo é encontrar estrutura, padrões ou agrupamentos nos dados por conta própria.

Tarefas típicas:

  • Clustering (agrupamento): separar clientes em segmentos com comportamento similar, sem definir os segmentos com antecedência. Algoritmo clássico: K-means.
  • Redução de dimensionalidade: comprimir dados de alta dimensão preservando estrutura. Algoritmo: PCA (Principal Component Analysis).
  • Detecção de anomalia: identificar exemplos que fogem do padrão aprendido. Útil para fraudes e falhas de equipamento.

Serviço AWS: Amazon SageMaker com algoritmos como K-Means, PCA e Random Cut Forest (detecção de anomalias). O Amazon Lookout for Equipment e o Amazon Lookout for Metrics são serviços de detecção de anomalia gerenciados que a prova pode citar.

Aprendizado por reforço

O agente aprende interagindo com um ambiente. A cada ação, recebe uma recompensa (positiva ou negativa). O objetivo é maximizar a recompensa acumulada ao longo do tempo. Não há rótulos, só feedback.

Analogia: treinar um cão com petiscos. O cão tenta ações diferentes; as que geram petisco são reforçadas.

Casos de uso clássicos: jogos (xadrez, Go), robótica, otimização de rotas, lances em leilões de publicidade.

Serviço AWS: Amazon SageMaker RL (reinforcement learning) integra frameworks como Ray RLlib e Coach. A prova também pode citar o AWS DeepRacer, carro autônomo em escala de brinquedo usado para aprender reforço na prática.

Quadro comparativo (cai direto em questões de múltipla escolha)

| Paradigma | Dados de treino | Objetivo | Exemplo clássico | |---|---|---|---| | Supervisionado | Rotulados (input + output) | Minimizar erro vs rótulo | Detecção de spam | | Não supervisionado | Sem rótulo | Encontrar estrutura | Segmentação de clientes | | Por reforço | Feedback de ambiente | Maximizar recompensa | Jogo de xadrez |

Pegadinhas comuns:

  • A prova descreve um cenário onde "dados históricos de clientes são usados para prever churn" e oferece as três opções. Dados históricos com rótulo "churn/não churn" = supervisionado.
  • "Agrupamento de documentos sem categorias predefinidas" = não supervisionado (clustering). Não confundir com classificação, que é supervisionada e precisa de categorias rotuladas.
  • Qualquer menção a "agente", "recompensa" ou "ambiente" = reforço. Mesmo que o enunciado descreva um problema complexo, o vocabulário entrega o paradigma.
  • A prova pode citar aprendizado semi-supervisionado (poucos dados rotulados + muitos sem rótulo) como distrator. Não é um dos três paradigmas principais cobrados no escopo da AIF-C01, mas aparece em enunciados para confundir.

Subtopic 3: Ciclo de vida de ML e casos de uso

A AIF-C01 não exige implementação, mas exige entender as etapas de um projeto de ML e quais serviços AWS apoiam cada uma. Este subtopic conecta conceito com serviço, o padrão mais frequente nas questões.

As etapas do ciclo de vida

1. Definição do problema

Antes de qualquer dado ou modelo: o que se quer prever? Qual métrica de negócio melhora? Qual é o critério de sucesso? Etapa humana, sem serviço AWS direto.

2. Coleta e armazenamento de dados

Os dados precisam estar acessíveis e persistidos. AWS:

  • Amazon S3: armazenamento central de datasets (CSV, Parquet, JSON, imagens). É o ponto de entrada para quase todo pipeline de ML na AWS.
  • AWS Glue: catalogação e ETL (extract, transform, load) de dados. Descobre esquemas automaticamente e prepara dados para treino.
  • Amazon Kinesis Data Streams / Firehose: ingestão de dados em tempo real quando o dataset precisa ser continuamente atualizado.

3. Preparação e engenharia de features

Limpar dados, tratar valores ausentes, normalizar variáveis, criar features derivadas. É tipicamente 60-80% do esforço total de um projeto de ML.

AWS:

  • SageMaker Data Wrangler: interface visual para transformação e análise exploratória de dados, sem escrever código.
  • SageMaker Feature Store: repositório centralizado de features reutilizáveis entre projetos. Evita calcular a mesma feature várias vezes e garante consistência entre treino e inferência (treino/serving skew).
  • AWS Glue: também cobre transformação de dados em escala (Spark).

4. Treinamento do modelo

Selecionar algoritmo, configurar hiperparâmetros, rodar o treino com os dados preparados.

AWS:

  • Amazon SageMaker Training Jobs: executa jobs de treino em instâncias gerenciadas, com suporte a GPU, treino distribuído e checkpoints.
  • SageMaker Automatic Model Tuning (AMT): ajuste automático de hiperparâmetros via busca bayesiana ou grid/random search.
  • SageMaker JumpStart: biblioteca de modelos e soluções pré-treinados para partir de um ponto avançado.

5. Avaliação do modelo

Verificar se o modelo generaliza: medir métricas como acurácia, precisão, recall, F1, AUC-ROC em dados de teste que o modelo não viu no treino.

AWS:

  • SageMaker Experiments: rastreia e compara múltiplos runs de treino com diferentes hiperparâmetros e métricas.
  • SageMaker Clarify: avalia viés nos dados e no modelo, gera explicabilidade (SHAP values).

6. Implantação (deploy)

Colocar o modelo em produção para receber requisições.

AWS:

  • SageMaker Endpoints: endpoint HTTPS gerenciado para inferência em tempo real. Escala automática.
  • SageMaker Batch Transform: inferência em lote sobre um dataset inteiro sem manter endpoint ativo (mais barato para uso esporádico).
  • SageMaker Serverless Inference: inferência sem provisionar instância, ideal para tráfego intermitente.

7. Monitoramento e manutenção

Modelos degradam com o tempo quando a distribuição dos dados de entrada muda (data drift) ou quando o comportamento do mundo muda (concept drift). É preciso monitorar e retreinar.

AWS:

  • SageMaker Model Monitor: monitora qualidade de dados e qualidade do modelo em produção, dispara alertas quando métricas saem do baseline.
  • Amazon CloudWatch: logs e métricas de endpoints (latência, erros, throughput).
  • SageMaker Pipelines: orquestrador de pipelines MLOps para automatizar o ciclo (reprocessamento de dados, retreino, avaliação, deploy condicional).

Casos de uso que a prova associa a serviços

| Caso de uso | Serviço AWS recomendado | |---|---| | Detecção de fraude em transações | Amazon Fraud Detector | | Previsão de demanda (séries temporais) | Amazon Forecast | | Recomendação de produtos | Amazon Personalize | | Análise de sentimento de reviews | Amazon Comprehend | | Reconhecimento de objetos em imagens | Amazon Rekognition | | Extração de texto de documentos PDF | Amazon Textract | | Transcrição de áudio de call center | Amazon Transcribe | | Detecção de anomalias em sensores industriais | Amazon Lookout for Equipment |

A AIF-C01 gosta de descrever o caso de uso e pedir o serviço, ou descrever o serviço e pedir o caso de uso. Aprender as duas direções desta tabela vale questões diretas.

Pegadinhas comuns neste subtopic

  • SageMaker Feature Store vs Data Wrangler: Data Wrangler é para exploração e transformação interativa; Feature Store é para armazenar e reutilizar features entre pipelines. A prova descreve o cenário de reuso entre projetos e espera Feature Store.
  • SageMaker Pipelines vs Step Functions: ambos orquestram workflows, mas Pipelines é nativo para MLOps (tem conceito de pipeline de ML com rastreamento de experimentos integrado); Step Functions é orquestrador geral de serviços AWS.
  • Amazon Forecast vs SageMaker: Forecast é um serviço gerenciado específico para séries temporais, sem código de ML. SageMaker é genérico. Quando o enunciado diz "sem desenvolver algoritmo próprio", Forecast vence.
  • O ciclo de vida não é linear: treino, avaliação e ajuste de hiperparâmetros costumam ser iterativos. A prova pode descrever múltiplos ciclos como sinal de projeto maduro, não de problema.

O que a prova espera de você neste domínio

Questões típicas de "Fundamentos de IA e ML" seguem três formatos:

  1. Identificação de paradigma: "Uma empresa quer segmentar clientes por comportamento de compra sem categorias predefinidas. Qual tipo de ML é mais adequado?" (Resposta: não supervisionado.)

  2. Mapeamento de serviço para etapa do ciclo: "Uma equipe precisa monitorar se os dados de entrada do modelo estão sofrendo drift em relação ao baseline de treino. Qual serviço AWS atende?" (Resposta: SageMaker Model Monitor.)

  3. Distinção de conceitos: "Qual é a diferença fundamental entre Machine Learning e Deep Learning?" (Resposta: DL usa redes neurais com múltiplas camadas e aprende representações automaticamente; ML inclui algoritmos que podem exigir engenharia de features manual.)

O que não cai: código Python, configuração de VPC para SageMaker, custos de instância. Isso fica para a MLA-C01 (nível Associate, 65 questões em 130 minutos, corte 720).

Leia também

Pronto para testar o que aprendeu?

Simulado AIF-C01 em PT-BR: questões no formato real, flashcards dos erros, revisão espaçada. 7 dias grátis.

Conhecer o CertAI

Preparar para a certificação (trial grátis)