Diez ideas estadísticas que cambiaron el mundo

Una serie de entrevistas en YouTube

Profesión
Historia
Fecha de publicación

23 de abril de 2024

Destaco aquí el interés de una serie de entrevistas en YouTube realizadas a estadísticos que desarrollaron algunas de las ideas más importantes de la disciplina en las últimas décadas del siglo XX. Los entrevistadores son Trevor Hastie y Robert Tibshirani, ellos mismos investigadores de primera línea, y los vídeos duran entre 20 y 25 minutos cada uno.

La confección de la lista surge a partir de un curso en la Universidad de Stanford, impartido por Tibshirani, cuya base era un conjunto de artículos históricos que han influido en la forma de analizar datos en muchas áreas de la ciencia. En la página del curso se puede encontrar más información, como por ejemplo los resúmenes y las presentaciones realizadas por los estudiantes del curso sobre los artículos originales.

Como dice Tibshirani en el vídeo de presentación, tal vez el título de la serie es un tanto hiperbólico, pero es verdad que algunas de las contribuciones han sido muy importantes. Tibshirani destaca tres: la regresión de Cox cambió la manera de analizar los datos de supervivencia (tiempo hasta que se produce un evento) en miles de ensayos clínicos, el bootstrap (Efron, 1979) fue una técnica pionera en usar cálculos intensivos de ordenador en lugar de fórmulas matemáticas para calcular el error típico de un estimador y, finalmente, el control de la tasa de descubrimientos falsos (Benjamini y Hochberg, 1995) es muy importante en la época de las ómicas en la que es posible medir miles de biomarcadores en un paciente para tratar de comprender las bases de su enfermedad.



Estas son las diez ideas según el orden en el que aparecen en la lista de vídeos. Para cada una de ellas pongo el enlace al vídeo, otro enlace a una página en la que se puede encontrar más información sobre la idea en cuestión (normalmente en Wikipedia) y la referencia al artículo de investigación original correspondiente.

1. Bootstrap (1979)

2. Modelo de regresión para datos de supervivencia (1972)

3. Control de la tasa de descubrimientos falsos (1995)

4. El algoritmo EM (1977)

5. Modelos de efectos aleatorios para datos longitudinales (1982)

6. Modelos lineales generalizados (1972)

7. Puntuación de propensión en estudios observacionales (1983)

8. Muestreo de Gibbs (Gibbs sampling, 1990)

9. Ecuaciones de estimación generalizadas (1986)

10. Modelos aditivos generalizados (1986)