UNIVERSIDADE DO ESTADO DO RIO DE JANEIRO
FORMULÁRIO DE IDENTIFICAÇÃO DA DISCIPLINA
 

UNIDADE: INSTITUTO DE QUÍMICA
DEPARTAMENTO: DEPTO. DE QUIMICA ANALITICA
DISCIPLINA: Ciência de Dados
CARGA HORÁRIA: 60 CRÉDITOS: 4 CÓDIGO: QUI04-17399
MODALIDADE DE ENSINO: Presencial TIPO DE APROVAÇÃO: Nota e Frequência
 
STATUSCURSO(S) / HABILITAÇÃO(ÕES) / ÊNFASE(S)
ObrigatóriaQUI - Engenharia Química (versão 6)
QUI - Engenharia Química (versão 7)

TIPO DE AULA CRÉDITO CH SEMANAL CH TOTAL
Teórica4460
TOTAL 4 4 60

EMENTA:

Introdução à Ciência de Dados: Tipos de dados: dados estruturados e não-estruturados, séries temporais, imagens.

Análise Exploratória de Dados (EDA): Medidas de posição e dispersão (média, moda, mediana, desvio padrão e

variância), medidas de correlação. Análise descritiva multivariada.

Qualidade de dados, pré-processamento e transformação de dados: Valores faltantes, valores redundantes, dados

inconsistentes, dados ruidosos, valores atípicos (outliers). Conversões e Transformação de Dados.

Métodos de Redução da Dimensionalidade: Análise de Componente Principal (PCA), Análise de Componentes

Independentes (ICA). Técnicas de Seleção de Atributos.

Detecção de Anomalias: Abordagem estatística, detecção de elementos baseada em proximidade, detecção de

elementos baseada em densidade. Técnicas baseadas em agrupamentos.

Introdução ao aprendizado não supervisionado: Métodos de Aglomeração (Clustering). Medidas de distância.

Validação de aglomerados: índice de Silhouette, índice de Jaccard. Técnicas de Aglomeração: método k-Means,

DBSCAN, Agrupamento Hierárquico. Aplicações em Engenharia Química.

Introdução ao aprendizado supervisionado

Regressão: Tipos de validação do modelo: hold out, leave one-out, validação cruzada e bootstrap. Medidas de

avaliação: MAE, MSE, RMSE. Regressão Linear. Compromisso viés variância. Métodos de Regularização: Ridge e

Lasso. Métodos com Redução de Dimensionalidade: PCR e PLS. Seleção de Modelos: Critério de Akaike e

Bayesiano. Aplicações em Engenharia Química.

Classificação: Classificação binária. Medidas de avaliação: Taxa de falso positivo, Taxa de falso negativo, Taxa de

verdadeiro positivo (Sensibilidade) Taxa de falso negativo (Especificidade), Precisão, Exatidão, Medida F1 e Curva

ROC. Algoritmos: k-vizinhos mais próximos, Naïve Bayes e Regressão Logística. Classificação n-ária. Aplicações em

Engenharia Química.

Métodos Preditivos Avançados: árvores de decisão, Splines de regressão multivariada adaptativa (MARS), Redes

Neurais Artificiais (ANN), Máquina de Vetor de Suporte (SVM). Aplicações em Engenharia Química.

Métodos Ensemble: Florestas Aleatórias e Extreme Gradient Boosting. Aplicações em Engenharia Química


OBJETIVO(S):

Introduzir os conceitos de ciência de dados no contexto da engenharia química

PRÉ-REQUISITO 1:

QUI08-17365 Métodos Computacionais Aplicados à Engenharia Química I
TRAVA:

150 créditos (Engenharia Química - versão 6)
150 créditos (Engenharia Química - versão 7)
 
BIBLIOGRAFIA:

? Amaral, Fernando. Introdução à Ciência de Dados, Alta Books Editora, Rio de Janeiro, 2016.

? Behrman, Kennedy R. Fundamentos de Python para Ciência de Dados, Grupo A Educação S. A., 2022, Porto

Alegre, RS.

? Morettin, Pedro Alberto e Singer, Julio da Motta. Estatística e Ciência de Dados, Livros Técnicos e Científicos,

Rio de Janeiro, 2023.

? Netto, Amílcar e Maciel Francisco. Python para Data Science, Editora Alta Books, 2021, Rio de Janeiro, RJ.

? https://towardsdatascience.com/

? https://archive.ics.uci.edu/ml/index.php

? https://www.kaggle.com/