Treinamento

Nivelamento Teórico em Data Mining

Conceitos Fundamentais:

  • O que é Data Mining
  • Termos: Variável, Escalas de Medição (Nominal, Ordinal, Intervalar), Variável Aleatória, População, Amostra, Parâmetros, Estimadores (Viciados e Não Viciados)
  • Estatística Descritiva e Estatística Inferencial
  • Medidas Básicas: Média, Mediana, Moda, Variância, Desvio Padrão, Percentis, Coeficiente de Variação, Assimetria, Curtose etc
  • Medidas de Associação entre Duas Variáveis: Covariância, Correlação
  • Visualização dos Dados: Gráficos de Dispersão, Histogramas, Box-Plot, Matriciais etc
  • Tópicos Fundamentais
  • Overfitting (o que é, como minimizar)
  • Oversampling (o que é, como e quando implementar)
  • Cross-Validation (o que é, como e quando implementar)
  • Árvores de Decisão
  • O que é, para que serve
  • Tipos de Árvores de Decisão
  • Seleção de Modelos (Chi-Quadrado, Gini, Entropia, Teste F)

Aplicações:

  • Regressão Linear Simples Múltipla
  • Conceitos, aplicações e interpretação dos resultados
  • Exercícios do Primeiro Dia
  •   Regressão Logística Simples e Múltipla
  • Conceitos, aplicações e interpretação dos resultados
  • Redes Neurais
  • Conceitos, aplicações e interpretação dos resultados
  • Descobrimento de Padrões
  • Potenciais Prolemas nos dados (Transformações, Padronizações)

Análise de Clusters:

  • b1) Cluster Hierárquico: Tipos, Medidas de Distâncias, Gráficos de Apoio, Interpretação dos Resultados
  • b2) Cluster Não Hierárquico: Conceitos, Uso Individual e Combinado com os Clusters Hierárquicos

Interpretação dos Resultados:

  • Análise de Associação (Market Basket)
  • Conceitos, aplicações e interpretação dos resultados