Ingeniería de Datos e Inteligencia Artificial

Grado y Doble Grado. Curso 2026/2027.

MÉTODOS ESTADÍSTICOS PARA INGENIERÍA DE DATOS - 806403

Curso Académico 2026-27

Datos Generales

SINOPSIS

COMPETENCIAS

Generales
CG_ID3-Comprender y ser capaz de aplicar las herramientas básicas de investigación en la ingeniería de datos y la inteligencia artificial.
CG_ID6-Conocer los métodos, técnicas e instrumentos de análisis para el estudio de la ingeniería de datos y la inteligencia artificial.
CG_ID7-Capacidad para encontrar soluciones alternativas en el planteamiento de un problema o en la utilización de la ingeniería de datos y la inteligencia artificial.
Transversales
CT_ID6-Analizar, razonar críticamente, pensar con creatividad y evaluar el propio proceso de aprendizaje discutiendo asertiva y estructuradamente las ideas propias y ajenas, ejerciendo auténtico espíritu de liderazgo.
Específicas
CE_ID2-Capacidad de aplicar de forma metodológica técnicas propias de probabilidad y estadística para analizar y modelar fenómenos complejos y resolver problemas de optimización relacionados con la ingeniería de datos y la inteligencia artificial.

ACTIVIDADES DOCENTES

Clases teóricas
3 créditos.
Laboratorios
3 créditos.

Presenciales

6

Semestre

1

Objetivos

Resultados de aprendizaje: 

Resolver ejercicios con el software adecuado analizando el problema y diseñando la solución 

Clasificar problemas de tratamiento de datos y resolverlos según las técnicas estadísticas establecidas 

Comparar las técnicas estadísticas de regresión, clasificación, reducción de dimensionalidad e inferencia bayesiana seleccionando la solución más adecuada al problema planteado 

Conocer el papel de la optimización en el ajuste de modelos estadísticos 

Conocer la distinción entre los enfoques supervisados y no supervisados, y entre los problemas de regresión y clasificación 

Conocer las posibilidades de los modelos gráficos probabilísticos para la representación de problemas complejos y su aplicación en inferencia y toma de decisiones 

Conocer y aplicar las técnicas estadísticas establecidas para la resolución de problemas de inferencia, regresión, clasificación y reducción de la dimensionalidad 

Contenido

Descripción de contenidos mínimos: 

Métodos estadísticos para regresión. 

Métodos estadísticos para clasificación. 

Reducción de la dimensionalidad. 

Modelos gráficos probabilísticos. 

Introducción a la inferencia bayesiana para ID e IA. 

Programa detallado: 

1. Distribuciones de probabilidad multivariante. Métodos bayesianos. Cadenas de Markov. 

2. Métodos estadísticos para regresión:    • Estimación por mínimos cuadrados    • Regresión lineal múltiple    • Sesgo y varianza, selección de variables y bondad del ajuste    • Regresión regularizada: lasso y ridge 

3. Métodos estadísticos para clasificación:    • Métricas de bondad de clasificación    • Análisis discriminante    • Regresión logística    • Naive Bayes 

4. Reducción de la dimensionalidad:    • Análisis de componentes principales    • Análisis de componentes independientes    • Escalamiento multidimensional 

5. Modelos gráficos probabilísticos. 

Programa detallado en inglés: 

1. Multivariate probability distributions. Bayesian methods. Markov chains. 

2. Statistical methods for regression:    • Least squared estimation    • Multiple linear regression    • Bias and variance, feature selection, and goodness-of-fit    • Regression shrinkage methods: lasso and ridge 

3. Statistical methods for classification:    • Goodness-of-fit measures for classification    • Discriminant analysis    • Logistic regression    • Naive Bayes 

4. Dimensionality reduction:    • Principal component analysis    • Independent component analysis    • Multidimensional scaling 

5. Probabilistic graphical models. 

Evaluación

- Examen presencial en convocatoria ordinaria y extraordinaria (60%).
- Actividades prácticas realizadas en el aula (40%)

Será necesario superar el examen presencial para aprobar la asignatura.

Bibliografía

• Breiman,L.; Friedman,J.H. y otros (1993) Classification and Regresión Trees
• Gareth James, Daniela Witten, Trevor Hastie Robert Tibshirani (2021) An Introduction to Statistical Learning with Applications in R
• Hernández Orallo y otros (2005) Introducción a la minería de datos Pearson Reentice Hall
• Han J.,Kamber M. (2001) Data Mining Concepts and techniques. Morgan Kaufman P
• Hastie Trevor, R. Tibshirani. J.Friedman (2013) The Elements of Statistical Learning Data Mining, Inference, and Prediction
• Oded Maimon ¿ Lior Rokach Editors (2010) Data Mining and Knowledge Discovery Handbook Second Edition
•Matignon, Daniel. (2007) Data mining using SAS E . Miner , Wiley Intescience
• Peña, D. (2002) "Análisis de datos multivariantes" McGraw-Hill.
• Pérez L. C. (2007) Minería de Datos Técnicas y Herramientas. Thomson
• Torgo L.(2011). Data Mining with R: Learning with Case Studies
• Mathematics for Machine Learning. M. P. Deisenroth, A. A. Faisal, and C. S. Ong, 2021. https://mml-book.com.
• https://mml-book.github.io/book/mml-book.pdf
• Data mining and learning analytics: applications in educational research / ed. Hoboken, New Jersey : John Wiley & Sons, Inc., [2017]
• Data mining: practical machine learning tools and techniques / Ian Witten. Amsterdam, [Netherlands] : Elsevier, 2017
• Principles of Data Mining by Max Bramer. London : Springer, 2016
• Data Mining: The Textbook / by Charu C. Aggarwal. Cham : Springer International Publishing : Imprint: Springer, 2015

Otra información relevante

La ficha detallada se puede consultar en la sección de información docente de la Web de Facultad de Informática.

https://informatica.ucm.es/informacion-docente

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases teóricas y prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo D07/09/2026 - 11/12/2026MARTES 16:00 - 18:00Aula 11MARIA TERESA RODRIGUEZ BERNAL
MIÉRCOLES 16:00 - 18:00Aula 11MARIA TERESA RODRIGUEZ BERNAL