Destaco aquí el interés de una serie de entrevistas en YouTube realizadas a estadísticos que desarrollaron algunas de las ideas más importantes de la disciplina en las últimas décadas del siglo XX. Los entrevistadores son Trevor Hastie y Robert Tibshirani, ellos mismos investigadores de primera línea, y los vídeos duran entre 20 y 25 minutos cada uno.
La confección de la lista surge a partir de un curso en la Universidad de Stanford, impartido por Tibshirani, cuya base era un conjunto de artículos históricos que han influido en la forma de analizar datos en muchas áreas de la ciencia. En la página del curso se puede encontrar más información, como por ejemplo los resúmenes y las presentaciones realizadas por los estudiantes del curso sobre los artículos originales.
Como dice Tibshirani en el vídeo de presentación, tal vez el título de la serie es un tanto hiperbólico, pero es verdad que algunas de las contribuciones han sido muy importantes. Tibshirani destaca tres: la regresión de Cox cambió la manera de analizar los datos de supervivencia (tiempo hasta que se produce un evento) en miles de ensayos clínicos, el bootstrap (Efron, 1979) fue una técnica pionera en usar cálculos intensivos de ordenador en lugar de fórmulas matemáticas para calcular el error típico de un estimador y, finalmente, el control de la tasa de descubrimientos falsos (Benjamini y Hochberg, 1995) es muy importante en la época de las ómicas en la que es posible medir miles de biomarcadores en un paciente para tratar de comprender las bases de su enfermedad.
Estas son las diez ideas según el orden en el que aparecen en la lista de vídeos. Para cada una de ellas pongo el enlace al vídeo, otro enlace a una página en la que se puede encontrar más información sobre la idea en cuestión (normalmente en Wikipedia) y la referencia al artículo de investigación original correspondiente.
1. Bootstrap (1979)
- Entrevista con Bradley Efron
- Una entrada de Caminos Aleatorios en la que se explica la idea
- Efron, B. (1979). Bootstrap Methods: Another Look at the Jackknife. The Annals of Statistics, 7, 1-26.
2. Modelo de regresión para datos de supervivencia (1972)
- Entrevista con David Cox
- Modelo de regresión de Cox en Wikipedia
- Cox, D.R. (1972). Regression models and life-tables. Journal of the Royal Statistical Society: series B, 34, 187-202.
3. Control de la tasa de descubrimientos falsos (1995)
- Entrevista con Yoav Benjamini
- Tasa de falsos descubrimientos en Wikipedia
- Benjamini, Y. y Hochberg, Y. (1995). Controlling the false discovery rate: a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society: series B, 57, 289-300.
4. El algoritmo EM (1977)
- Entrevista con Nan Laird y Art Dempster
- Una entrada reciente en Caminos Aleatorios sobre este tema
- Dempster, A. P., Laird, N. M., y Rubin, D. B. (1977). Maximum likelihood from incomplete data via the EM algorithm. Journal of the Royal Statistical Society: series B, 39, 1-22.
5. Modelos de efectos aleatorios para datos longitudinales (1982)
- Entrevista con Nan Laird
- Modelo de efectos aleatorios en Wikipedia
- Laird, N.M., y Ware, J.H. (1982). Random-effects models for longitudinal data. Biometrics, 38, 963-974.
6. Modelos lineales generalizados (1972)
- Entrevista con Peter McCullagh
- Modelos lineales generalizados en Wikipedia
- Nelder, J.A. y Wedderburn, R.W. (1972). Generalized linear models. Journal of the Royal Statistical Society: Series A, 135, 370-384.
7. Puntuación de propensión en estudios observacionales (1983)
- Entrevista con Don Rubin
- Puntuación de propensión en Wikipedia
- Rosenbaum, P. R. y Rubin, D. B. (1983). The central role of the propensity score in observational studies for causal effects. Biometrika, 70, 41-55.
8. Muestreo de Gibbs (Gibbs sampling, 1990)
- Entrevista con Adrian Smith
- Un artículo divulgativo sobre Gibbs sampling (pdf)
- Gelfand, A. E., y Smith, A. F. (1990). Sampling-based approaches to calculating marginal densities. Journal of the American statistical association, 85, 398-409.
9. Ecuaciones de estimación generalizadas (1986)
- Entrevista con Scott Zeger
- Ecuaciones de estimación generalizadas en Wikipedia
- Liang, K.Y. y Zeger, S.L. (1986). Longitudinal data analysis using generalized linear models. Biometrika, 73, 13-22.
10. Modelos aditivos generalizados (1986)
- Entrevista con Trevor Hastie y Robert Tibshirani
- Modelos aditivos generalizados en Wikipedia
- Hastie, T. y Tibshirani, R. (1986). Generalized Additive Models. Statistical Science, 1, 297-310.