Mientras las agencias de noticias del mundo entero anuncian un nuevo gobierno de Hugo Chávez, al ganar nuevamente las elecciones en Venezuela, se me vino a la mente la idea de ilustrar sobre el conteo de votos y, sobre todo, de la intención de voto. Y encontré un estupendo artículo en Ciencia Explicada.Advertencia: Antes de leer este post debemos advertirle que es un artículo científico y no artículo político. Si desea conocer sobre la victoria de Hugo Chávez puede informarse, minuto a minuto, aquí. Ahora si los dejo con el post:
Cuando se habla de cómo varía la intención de voto según encuestas, encontramos el término " estadísticamente significativo" en casi todos los medios internacionales (e.g. ABCNews, Washington Times, New York Times, CBS News,...).
Por el contrario, no recuerdo haber leído nunca nada parecido en un periódico español. Como ejemplo para la entrada de hoy, voy a basarme en el último artículo de El País (14/04/2012) sobre el tema (no es por nada en particular: todos los diarios parecen ignorar por igual la estadística). Veremos qué afirmaciones de las que se hacen tienen sentido y cuáles tienen el mismo valor que decir que no hay calentamiento global porque hoy hace más frío que ayer.
Las mismas ideas se podrán aplicar también a comparaciones del número de accidentes de tráfico, del valor de las acciones de un día para otro, el número de días que no ha llovido en cada año, la opinión de los españoles sobre cuáles son los principales problemas del país, etc.
1. Objetivos de esta entrada
Al terminar de leer esta entrada, sabrás:
- Qué significa, intuitiva y visualmente, la "incertidumbre" en una cifra.
- ¿A qué se refieren cuando dicen que un "margen de error" es "del 95,5%"? ¿Qué es eso de "p=q=50"? ¿Me afecta en algo? ¿Qué tiene que ver Yao Ming en todo esto? ;-)
- Cómo calcular el margen de error de una encuesta, más exactamente incluso que las cifras que se suelen dar en las fichas técnicas ya que esas son para el peor caso posible.
- A interpretar si un margen de diferencia entre dos partidos o entre el mismo partido en dos momentos distintos es estadísticamente significativo.
Si es lo segundo, y aparte de la reflexión de cómo es posible que no se enseñen estas cosas en las facultades de Periodismo, espero que con un mínimo, muy mínimo de esfuerzo sea posible entender lo que voy a explicar. Creo que es posible, y muy fácil, mejorar la calidad técnica de nuestras publicaciones nacionales. Al lío...
2. ¿Qué es la "incertidumbre"?
Para entender qué es un "margen de error" en una medida, también llamado "intervalo de confianza", hay que interiorizar primero qué es la incertidumbre.
Muchas veces manejamos "valores"... de los que realmente no conocemos su valor, por mucho que sepamos por ejemplo su valor medio (p.ej. el salario medio) o una estimación (p.ej. las estimaciones de voto a partir de encuestas).
Veamos un ejemplo: si cogemos a un hombre al azar, ¿cuál sería su altura?
Según estadísticas, en EEUU la altura media está en 1 metro y 78 cm. Pero esto no responde a la pregunta, porque si empezamos a medir a gente al azar: ¿veríamos muchas alturas cerca de 1,78m? ¿habrá mucha gente que mida menos de 1,60m? Y, ¿cómo de raro es encontrar a personas de 2,29m como Yao Ming?
Está claro que un valor medio, por sí sólo, apenas nos dice nada. La animación siguiente muestra una línea negra que va saltando emulando "medidas de altura" que hiciéramos a hombres al azar, en comparación con el valor medio (la línea roja discontinua). Cada "salto" que da sería una medida a un nuevo individuo:
Estoy seguro que todos reconoceréis la forma a la que tiende este contador, llamado "histograma": tiende a una campana de Gauss (distribución de probabilidad Gausiana, también llamada normal).
De estas dos medidas, la de la derecha tiene mucha menos incertidumbre ya que los valores se dispersan menos. |