Cómo mentir con estadísticas — Darrell Huff

Este breve libro es un clásico sobre las estadísticas y como se puede mentir interpretando datos, es decir, no es necesaria una encuesta amañada —es decir: que los resultados se distorsionen en forma deliberada— para crear una falsa impresión. Una tendencia en la muestra misma, sesgada en una dirección determinada, puede amañar la encuesta automáticamente.

Un truco consiste en usar un promedio distinto en cada una de las dos oportunidades, siendo que la palabra «promedio» tiene un significado muy elástico. Es un truco usado frecuentemente, a veces de un modo inocente pero la mayoría de las veces con culpabilidad, por sujetos que desean influir sobre la opinión pública o vender espacio publicitario.
Cuando le digan que algo es un promedio, seguirá sin saber demasiado a menos que le digan también cual de los promedios más comunes fue el utilizado. ¿Fue una «media», una «mediana» o una «moda»?

El ignorar estos errores, que están implícitos en todos los estudios por muestreo, ha llevado a algunos comportamientos notoriamente estúpidos. Existen editores de revistas para los cuales las encuestas de lectores son la Biblia, principalmente porque no las entienden. Si no puede demostrar lo que quiere demostrar, demuestre otra cosa y después pretenda que se trata de lo mismo. En el aturdimiento que se produce cuando las estadísticas chocan contra la mente humana, difícilmente alguien se dé cuenta de la diferencia. El número semi relacionado es un dispositivo con garantía de mantenerlo por la buena senda. Siempre lo ha sido.
No podrá probar que su panacea cura el resfrío, pero puede usted publicar (con tipografía bien grande) el informe garantizado por un laboratorio en donde se afirma que la cosa mató 31.108 microbios en un tubo de ensayo en 11 segundos. Asegúrese, eso sí, de que el laboratorio en cuestión tenga una buena reputación o al menos un nombre impresionante.

Sin embargo, la falacia es una de las más antiguas y tiene una fuerte tendencia a aparecer en las estadísticas pudiéndosela distinguir por un cúmulo de números impresionantes. La falacia es la que dice que si B ocurre después de A, entonces A ha causado a B. En este caso se ha partido del falso supuesto formulado como: puesto que el fumar y las bajas calificaciones aparecen juntas, el fumar causa bajas calificaciones. ¿Acaso no podría ser a la inversa? ¿No serán las bajas calificaciones que impulsan a los estudiantes al tabaco en lugar de llevarlos al alcohol? Si uno se detiene a pensarlo, esta última conclusión es por lo menos tan probable como la anterior y está al menos tan bien sostenida por los datos que se tienen. Pero puede no ser igualmente útil a los efectos de cierta propaganda.
Con todo, lo más probable es que ninguna de las dos cosas es causa de la otra sino que ambas son producto de un tercer factor.

La pregunta sobre si lo informado tiene sentido muchas veces pondrá a la estadística en su lugar cuando todo el galimatías esté basado sobre una suposición indemostrada.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s