Estadísticas y su interpretación

Publicado el 24 de febrero de 2005 en Curiosidades por omalaled . Historias de la ciencia



Un error muy común del ciudadano de a pie, la mayoría de políticos y medios de comunicación es tratar las estadísticas como cifras sagradas y darle una serie de significados y consecuencias (a veces dramáticas), sin un mayor análisis. Si supiéramos un poquito más sobre estadística, podríamos tener mejor criterio a la hora de escuchar cifras.

Una confusión muy extendida es la que se da entre causa y correlación. Por ejemplo, si nos dicen que ciertos estudios han demostrado que los niños de brazos más largos razonan mejor que los de brazos más cortos, ¿lo aceptamos sin más argumentando que lo dicen las estadísticas?  La verdadera causa es que los niños de brazos más largos razonan mejor porque tienen más edad.

Otro ejemplo podría ser el que relaciona el agua mineral con la salud infantil. Parece ser que el agua mineral es milagrosa, pero es más probable que las familias que beben agua mineral tengan mejor economía, hijos más sanos, la estabilidad y los medios para disponer de comida, cobijo y educación. Todo de calidad. El agua podría ser perfectamente circunstancial.

Otro error común es la falta de definición. Por ejemplo, muchas veces se nos dice que según las estadísticas la mujer gana menos que el hombre. ¿Significa esa cifra que desempeñando exactamente el mismo empleo en la misma empresa que un hombre, el salario de una mujer es más bajo? ¿Tiene esa cifra en cuenta edad y experiencia? ¿Tiene en cuenta los empleos relativamente mal pagados que tienen muchas mujeres (recepcionistas, mujeres de la limpieza, etc.)? ¿Tiene en cuenta el hecho de que generalmente el empleo del marido determina el lugar de residencia de una pareja? ¿Tiene en cuenta el alto porcentaje de mujeres con contratos temporales?  No dudo que el trabajo sea muy sexista, pero estoy seguro que ese estudio no tiene en cuenta ninguna de estas posibles causas, y son muy relevantes.

En los sondeos sobre creencias religiosas pocas personas reconocerían abiertamente su falta de fe. Los sondeos sobre sexualidad son poco de fiar por la sencilla razón de que las personas tienden a mentir cuando un desconocido les pregunta por su vida sexual. ¿Cómo se explica, si no, que los hombres heterosexuales declaren haber tenido más parejas sexuales por término medio que las mujeres heterosexuales? Sin embargo, la publicación de estos sondeos influye en la vida sexual de las personas, y lo que están dispuestas a divulgar o inventar, contribuye a definir su concepción de la sexualidad.

Otro ejemplo de confusión estadística es el de la probabilidad condicional. Supongamos que haya un análisis para detectar el cáncer con una fiabilidad del 98%, es decir: si uno tiene cáncer, dará positivo el 98% de las veces y negativo el 2%; y si no lo tiene, dará negativo el 98% de las veces y el 2% positivo. Supongamos, además que el 0,5% de la población (una de cada 200 personas) padece verdaderamente cáncer. Imaginemos que te sometes a un análisis y da positivo. ¿Te deprimes? Pues no deberías hacerlo. Si lo hacemos a 10.000 personas: 50 tendrán cáncer y como darán positivos el 98% tendremos 49 análisis positivos. Por otro lado, 9.950 personas no tienen cáncer y darán positivo el 2%, o sea, 199. Así del total de 248 positivos sólo 49 serán reales … aproximadamente el 20%. Este resultado es debido a que el 98% será real siempre y cuando tengamos cáncer, pero sin esa condición el experimento no sirve para nada. 

Además, muchos tests son incluso menos fiables (del orden del 75%). Este resultado debería dar qué pensar a más de un político cuando se plantea instituir análisis obligatorios o generalizados para detectar el consumo de drogas, el SIDA o lo que sea.

La moraleja es que hay que ser muy crítico con la interpretación de las estadísticas.


Fuentes:
“El hombre anumérico”, John Allen Paulos
“Erase una vez un número”, John Allen Paulos

Comentarios

Entradas populares