158518 - Mineração de Dados

Créditos: 2 práticos e 2 teóricos
Requisito: Análise de Regressão
Requisitos Recomendados: Modelos Lineares Generalizados e Estatística Multivariada 2
Objetivos Gerais: Apresentar os principais problemas em mineração de dados (Data Mining) e explorar as técnicas e algoritmos utilizados para classificação, análise de associação e mineração de textos.
Ementa: Introdução à Mineração de Dados. Classificação e regressão: regressão linear sob um enfoque preditivista, regressão logística sob um enfoque preditivista. Bayes ingênuo, árvores de decisão, bagginge florestas aleatórias de classificação e regressão, medidas para avaliar a capacidade preditiva de um classificador. Análise de associação. Mineração de texto: modelo bag-of-words, n-gramas, regressão e classificação usando textos como covariáveis.

Bibliografia Básica: HASTIE, T., TIBSHIRANI, R., FRIEDMAN, J. The elements of statistical learning: data mining, inference, and prediction. 2a ed. New York: Springer, 2009. DINIZ, C. A. R., LOUZADA NETO, F., Modelagem estatística de detecção de fraude. Salvador: 10ª Escola de Modelos de Regressão, 2007. PANG-NING, T., STEINBACH, M., KUMAR, V., Introduction data mining, Boston: Pearson Education, 2006. THURAISINGHAM, B. M.. Data mining: technologies, techniques, tools and trends. Boca Raton: CRC, 1999.

Bibliografia Complementar: KOVALERCHUK, B., VITYAEV, E., Data Mining in Finance. Kluwer, 2000. JAMES, G., WITTEN, D., HASTIE, T. e TIBSHIRANI, R. An Introduction to Statistical Learning, with Applications in R, Springer 2013. Verão online disponível gratuitamente em http://www-bcf.usc.edu/~gareth/ISL/HAND, D.; MANNILA, H; SMITH, P. Principles of data mining. Cambridge: MIT 2001. RATNER, B. Statistical modeling and analysis for database marketing: effective techniques for mining big data. Boca Raton: Chapman & Hall, 2003. MITCHELL, T. M. Machine learning. Boston: MCB/McGraw-Hill, 1997.