Cómo mentir con estadísticas — Darrell Huff / How to Lie with Statistics by Darrell Huff

Este breve libro es un clásico sobre las estadísticas y como se puede mentir interpretando datos, es decir, no es necesaria una encuesta amañada —es decir: que los resultados se distorsionen en forma deliberada— para crear una falsa impresión. Una tendencia en la muestra misma, sesgada en una dirección determinada, puede amañar la encuesta automáticamente.

Un truco consiste en usar un promedio distinto en cada una de las dos oportunidades, siendo que la palabra «promedio» tiene un significado muy elástico. Es un truco usado frecuentemente, a veces de un modo inocente pero la mayoría de las veces con culpabilidad, por sujetos que desean influir sobre la opinión pública o vender espacio publicitario.
Cuando le digan que algo es un promedio, seguirá sin saber demasiado a menos que le digan también cual de los promedios más comunes fue el utilizado. ¿Fue una «media», una «mediana» o una «moda»?

El ignorar estos errores, que están implícitos en todos los estudios por muestreo, ha llevado a algunos comportamientos notoriamente estúpidos. Existen editores de revistas para los cuales las encuestas de lectores son la Biblia, principalmente porque no las entienden. Si no puede demostrar lo que quiere demostrar, demuestre otra cosa y después pretenda que se trata de lo mismo. En el aturdimiento que se produce cuando las estadísticas chocan contra la mente humana, difícilmente alguien se dé cuenta de la diferencia. El número semi relacionado es un dispositivo con garantía de mantenerlo por la buena senda. Siempre lo ha sido.
No podrá probar que su panacea cura el resfrío, pero puede usted publicar (con tipografía bien grande) el informe garantizado por un laboratorio en donde se afirma que la cosa mató 31.108 microbios en un tubo de ensayo en 11 segundos. Asegúrese, eso sí, de que el laboratorio en cuestión tenga una buena reputación o al menos un nombre impresionante.

Sin embargo, la falacia es una de las más antiguas y tiene una fuerte tendencia a aparecer en las estadísticas pudiéndosela distinguir por un cúmulo de números impresionantes. La falacia es la que dice que si B ocurre después de A, entonces A ha causado a B. En este caso se ha partido del falso supuesto formulado como: puesto que el fumar y las bajas calificaciones aparecen juntas, el fumar causa bajas calificaciones. ¿Acaso no podría ser a la inversa? ¿No serán las bajas calificaciones que impulsan a los estudiantes al tabaco en lugar de llevarlos al alcohol? Si uno se detiene a pensarlo, esta última conclusión es por lo menos tan probable como la anterior y está al menos tan bien sostenida por los datos que se tienen. Pero puede no ser igualmente útil a los efectos de cierta propaganda.
Con todo, lo más probable es que ninguna de las dos cosas es causa de la otra sino que ambas son producto de un tercer factor.

La pregunta sobre si lo informado tiene sentido muchas veces pondrá a la estadística en su lugar cuando todo el galimatías esté basado sobre una suposición indemostrada.

This short book is a classic about statistics and how you can lie by interpreting data, that is, you do not need a rigged survey – that is, that results are deliberately distorted – to create a false impression. A trend in the sample itself, biased in a certain direction, can rig the survey automatically.

One trick is to use a different average on each of the two opportunities, since the word “average” has a very elastic meaning. It is a trick used frequently, sometimes in an innocent way but most of the time with guilt, by subjects who wish to influence public opinion or sell advertising space.
When they tell you that something is an average, they will still not know too much unless they also tell you which of the most common averages was the one used. Was it a “media”, a “median” or a “fashion”?

Ignorance of these errors, which are implicit in all sample studies, has led to some notoriously stupid behaviors. There are magazine editors for whom reader surveys are the Bible, mainly because they do not understand them. If you can not prove what you want to prove, prove something else and then pretend that it is the same. In the daze that occurs when statistics collide with the human mind, it is difficult for anyone to realize the difference. The semi-related number is a device with the guarantee of keeping it on track. Always has been.
You will not be able to prove that your panacea cures the cold, but you can publish (with big typography) the report guaranteed by a laboratory stating that the thing killed 31,108 microbes in a test tube in 11 seconds. Be sure, however, that the laboratory in question has a good reputation or at least an impressive name.

However, the fallacy is one of the oldest and has a strong tendency to appear in statistics can be distinguished by a cluster of impressive numbers. The fallacy is the one that says that if B occurs after A, then A has caused B. In this case the false assumption formulated as: since smoking and low grades appear together, smoking causes low grades. Could it not be the other way around? Are not the low grades that drive students to tobacco instead of alcohol? If you stop to think about it, this last conclusion is at least as probable as the previous one and is at least as well sustained by the data you have. But it may not be equally useful for the purposes of certain propaganda.
However, it is most likely that neither is the cause of the other, but both are the product of a third factor.

The question of whether the informed makes sense many times will put statistics in their place when all the gibberish is based on an unproven assumption.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios .