Cómo decir la verdad con la estadística

Sobre el libro de estadística más vendido de la historia y otro libro fantasma del mismo autor

Profesión
Historia
Libros
Fecha de publicación

2 de julio de 2024

La palabra estadística siempre suele aparecer en contextos negativos: fallos de predicción de las encuestas electorales, manipulación interesada, clases aburridas, … Todo lo contrario ocurre con la apasionante ciencia de datos: se comentan sus éxitos al diagnosticar enfermedades, sus aplicaciones en genética y proteómica, o sus usos en inteligencia artificial. Y sin embargo será difícil para cualquiera explicar la diferencia entre ambas. Las posibilidades de la estadística como herramienta para manipular una afirmación se han señalado (incluso con cierta delectación) desde hace mucho tiempo. Uno de los grandes clásicos en esta línea es How to Lie with Statistics, el libro de Darrell Huff publicado originalmente en 1954. Comento aquí algunos datos acerca de este libro y de su autor, así como una historia posterior, bastante más oscura, sobre otro libro de Huff que nunca llegó a publicarse.

How to Lie with Statistics

Conocí How to Lie with Statistics gracias al clásico texto de Daniel Peña Fundamentos de Estadística, donde se describía como “un libro excelente sobre cómo prevenir la manipulación con la estadística”. Unos años más tarde compré un ejemplar correspondiente a una edición de 1993 (véase la foto que encabeza la entrada), una de las muchas ediciones que han venido sucediéndose desde que se publicó el libro en 1954. He leído que en 2005 se habían vendido alrededor de un millón y medio de ejemplares, lo que tal vez lo convierte en el libro sobre estadística más popular de la historia.

Durrell Huff (1913-2001) era un periodista que, antes de convertirse en escritor independiente, había sido editor de las revistas Better Homes and Gardens y Liberty. No tenía ninguna formación específica en estadística. Como periodista independiente escribió varios libros cuyo título empezaba con “How to…”, entre ellos uno sobre las reglas de la probabilidad (How to Take a Chance: The Laws of Probability, 1959) pero también otros sin relación alguna con la estadística (How to Work With Concrete and Masonry, 1968)

J. Michael Steele ha enumerado algunas de las razones por las que el libro de Huff se convirtió en un superventas. En primer lugar, su título. Como dijo el ilustrador Irving Geis: “Huff could have well titled it An Introduction to Statistics and it would have sold a few hundred copies for a year or two. But with that title, it’s been selling steadily since 1954”. En segundo lugar, las ilustraciones del propio Geis, con su aire vintage (y en algún caso, sexista) cuando se miran setenta años después:

Hoy en día no es raro encontrar libros divulgativos en los que aparecen dibujos que aportan un toque de humor, pero en aquella época la fórmula era más novedosa. Steele también menciona unos contenidos bien elegidos: los tres primeros capítulos se refieren a medidas descriptivas numéricas, los capítulos 4 a 7 tratan sobre visualización de datos. Los tres capítulos finales son más heterogéneos y se dedican a discutir lo que llamaríamos pensamiento estadístico crítico. Todo ello en 142 páginas.

Durrell Huff y las tabacaleras

Huff también escribió un libro que nunca se llegó a publicar cuyo título era How to Lie with Smoking Statistics.

A principios de los años 60 se habían encontrado bastantes indicios de los efectos perjudiciales que el consumo de tabaco podía tener en la salud. En 1965 se aprobó una norma para que en las cajetillas de tabaco apareciera el mensaje Caution: Cigarette Smoking May Be Hazardous to Your Health. Se había propuesto un mensaje mucho más contundente pero las compañías tabacaleras lograron suavizarlo.

Las compañías trataban de transmitir la idea de que no había evidencia científica sobre los efectos del consumo de tabaco en la salud. Como parte de esta estrategia contrataron a Huff en 1964 para escribir un libro en el que se criticaran los análisis estadísticos de los estudios publicados sobre el tema. Huff trabajó en colaboración con el abogado Edwin Jacob quien sugería comentarios y temas de acuerdo con la conveniencia de las tabacaleras. El manuscrito solo se conoció en 1998, gracias al Tobacco Settlement Agreement que hizo pública mucha documentación de los casos legales contra las tabacaleras, y en particular una parte de la correspondencia de Huff.

Por ejemplo, en la carta que aparece debajo, Huff le envía a Jacob un borrador del capítulo I y espera que esta versión “comes close to doing the job”. También pregunta el momento apropiado para solicitar más dinero:

El borrador del libro comienza con este párrafo:

If we want to know what effect, if any, smoking cigerettes has on human health, there is an obvious and direct way to set about finding out. Essentially, we should set up an experiment in which half the population is directed to smoke and the other half is prevented from doing so. Observation of the two groups should eventually tell us what we want to know.

If it is not feasible to conduct such an experiment, even on a small scale -as indeed appears to be the case- we can only approach the problem indirectly.

Obviamente, la evidencia de los efectos del tabaco en la salud no se obtuvo a partir de un experimento controlado sino gracias a la combinación de cientos de estudios y experimentos que aportaban evidencias indirectas del efecto. La crítica de Huff se dirigía a puntos débiles de cada uno de estos estudios individuales.

En 1968 Huff llegó a un acuerdo con la editorial MacMillan para publicar una edición del libro en tapa dura a la que seguiría una tirada de bolsillo de 100000 ejemplares. Sin embargo, el proceso de publicación se interrumpió poco después porque se descubrió que las tabacaleras estaban detrás de artículos supuestamente independientes publicados en favor del tabaco en las revistas True (paradójico nombre, en lo que se refiere a este asunto) y National Enquirer. Se consideró incluir un aviso en el libro informando de la financiación que había recibido Huff, pero el hecho es que el libro finalmente no se llegó a publicar sin que se hayan documentado claramente las razones. Andrew Gelman aventura que el propio Huff no quiso que se publicara para que no perjudicara su reputación.

Cómo decir la verdad con la estadística

Aunque no está de más ser consciente de las posibles manipulaciones que podemos sufrir cuando nos presentan cifras relacionadas con un hecho, me interesan mucho más los libros que ponen el énfasis en la forma de usar los datos para presentar la realidad certera y honradamente, es decir, aquellos que enseñan cómo decir la verdad con la estadística. Concluyo mencionando tres ejemplos recientes de este tipo de libros: Piensa claro, de Kiko Llaneras, El arte de la estadística de David Spiegelhalter o ¿Cómo sobrevivir a la incertidumbre? de Anabell Forte Deltell.

Referencias

Toda la documentación de la relación de Huff con las compañías de tabaco, así como el manuscrito inédito se pueden encontrar aquí. La información que aparece en esta entrada la he leído en los tres artículos siguientes: