He estado revisando y ampliando los apuntes que escribí para la asignatura Estadística I del Grado en Matemáticas de la UAM y los publico en esta entrada. En este curso que comienza volveré a impartir la asignatura, lo que me dará una nueva oportunidad de mejorarlos. Estarán disponibles de forma permanente en este enlace y agradezco cualquier sugerencia o comentario sobre ellos.
Los apuntes contienen los temas siguientes:
- Descripción de datos
- Muestreo aleatorio
- Estimación puntual
- Intervalos de confianza
- Contrastes de hipótesis
- Bootstrap
- Estimación no paramétrica de la función de densidad
Los capítulos 1 a 5 constituyen los temas habituales de un curso de introducción a la estadística (visualización de datos, estimación, intervalos, contrastes) y son los que se cubren en la asignatura. He añadido un par de capítulos sobre bootstrap y estimación no paramétrica de densidades que pueden proporcionar material complementario. Se presupone conocimiento de los principales modelos de probabilidad, álgebra lineal y cálculo estándar en varias variables. He procurado justificar matemáticamente lo que se afirma sin que las matemáticas obstaculicen conseguir el objetivo principal, que es introducir los conceptos más importantes de la inferencia estadística. También por ello me limito a modelos muy sencillos dejando de lado con pesar el problema de regresión y el análisis de datos multivariantes, que por otra parte son esenciales en las aplicaciones (tendré que escribir otros apuntes).
Se mezcla el texto con ejemplos elaborados en R (con tidyverse). El objetivo de los ejemplos, además de mostrar la implementación, es sobre todo contribuir a mejorar la comprensión de la teoría y facilitar que los estudiantes puedan experimentar por sí mismos con las principales ideas. No es necesario comprender el código en su totalidad para seguir el texto.
En realidad los apuntes no están terminados. Estas son algunas de las tareas que tengo pensadas a medio plazo:
- He incluido algunos ejercicios en cada tema, procurando que en su mayoría no sean puramente mecánicos sino que aporten algo a la comprensión de la teoría. Pero la lista de momento es muy pobre así que mi objetivo es ampliarla. Eventualmente, se podría añadir un apéndice con algunas soluciones.
- Dentro de la parte de temas básicos quiero incluir un capítulo más sobre contrastes no paramétricos (bondad de ajuste, homogeneidad, independencia). Creo que son problemas apropiados para un curso de introducción pero que en la UAM, por falta de tiempo, se incluyen en la asignatura Estadística II, que se imparte a continuación de esta.
- Otro aspecto fundamental en estadística que no está cubierto es la selección de modelos (AIC, BIC). Si encuentro la forma de tratarlo a un nivel adecuado me gustaría incluir algo sobre ello.
- En la parte de temas complementarios me gustaría añadir un capítulo sobre computación bayesiana (MCMC, INLA), aunque realmente este tema solo interesa al considerar modelos más complejos con muchos parámetros.
- …
Termino recordando para los no suficientemente viejos este momento icónico de la televisión que me ha sugerido el título de la entrada, y que ha proporcionado al lenguaje popular una alternativa a la frase qué hay de lo mío: