Mientras las agencias de noticias del mundo entero anuncian un nuevo gobierno de Hugo Chávez, al ganar nuevamente las elecciones en Venezuela, se me vino a la mente la idea de ilustrar sobre el conteo de votos y, sobre todo, de la intención de voto. Y encontré un estupendo artículo en Ciencia Explicada.Advertencia: Antes de leer este post debemos advertirle que es un artículo científico y no artículo político. Si desea conocer sobre la victoria de Hugo Chávez puede informarse, minuto a minuto, aquí. Ahora si los dejo con el post:
Los números resultantes de hacer una medición no significan nada, a menos
que conozcamos sus márgenes de error e incluso cómo se correlan entre
ellas. Por obvio que parezca, es algo que se olvida a menudo.
Cuando se habla de cómo varía la intención de voto según encuestas, encontramos el término " estadísticamente significativo" en casi todos los medios internacionales (e.g. ABCNews, Washington Times, New York Times, CBS News,...).
Por el contrario, no recuerdo haber leído nunca nada parecido en un periódico español. Como ejemplo para la entrada de hoy, voy a basarme en el último artículo de El País (14/04/2012) sobre el tema (no es por nada en particular: todos los diarios parecen ignorar por igual la estadística). Veremos qué afirmaciones de las que se hacen tienen sentido y cuáles tienen el mismo valor que decir que no hay calentamiento global porque hoy hace más frío que ayer.
Las mismas ideas se podrán aplicar también a comparaciones del número de accidentes de tráfico, del valor de las acciones de un día para otro, el número de días que no ha llovido en cada año, la opinión de los españoles sobre cuáles son los principales problemas del país, etc.
Cuando se habla de cómo varía la intención de voto según encuestas, encontramos el término " estadísticamente significativo" en casi todos los medios internacionales (e.g. ABCNews, Washington Times, New York Times, CBS News,...).
Por el contrario, no recuerdo haber leído nunca nada parecido en un periódico español. Como ejemplo para la entrada de hoy, voy a basarme en el último artículo de El País (14/04/2012) sobre el tema (no es por nada en particular: todos los diarios parecen ignorar por igual la estadística). Veremos qué afirmaciones de las que se hacen tienen sentido y cuáles tienen el mismo valor que decir que no hay calentamiento global porque hoy hace más frío que ayer.
Las mismas ideas se podrán aplicar también a comparaciones del número de accidentes de tráfico, del valor de las acciones de un día para otro, el número de días que no ha llovido en cada año, la opinión de los españoles sobre cuáles son los principales problemas del país, etc.
1. Objetivos de esta entrada
Al terminar de leer esta entrada, sabrás:
- Qué significa, intuitiva y visualmente, la "incertidumbre" en una cifra.
- ¿A qué se refieren cuando dicen que un "margen de error" es "del 95,5%"? ¿Qué es eso de "p=q=50"? ¿Me afecta en algo? ¿Qué tiene que ver Yao Ming en todo esto? ;-)
- Cómo calcular el margen de error de una encuesta, más exactamente incluso que las cifras que se suelen dar en las fichas técnicas ya que esas son para el peor caso posible.
- A interpretar si un margen de diferencia entre dos partidos o entre el mismo partido en dos momentos distintos es estadísticamente significativo.
Si es lo segundo, y aparte de la reflexión de cómo es posible que no se enseñen estas cosas en las facultades de Periodismo, espero que con un mínimo, muy mínimo de esfuerzo sea posible entender lo que voy a explicar. Creo que es posible, y muy fácil, mejorar la calidad técnica de nuestras publicaciones nacionales. Al lío...
2. ¿Qué es la "incertidumbre"?
Para entender qué es un "margen de error" en una medida, también llamado "intervalo de confianza", hay que interiorizar primero qué es la incertidumbre.
Muchas veces manejamos "valores"... de los que realmente no conocemos su valor, por mucho que sepamos por ejemplo su valor medio (p.ej. el salario medio) o una estimación (p.ej. las estimaciones de voto a partir de encuestas).
Veamos un ejemplo: si cogemos a un hombre al azar, ¿cuál sería su altura?
Según estadísticas, en EEUU la altura media está en 1 metro y 78 cm. Pero esto no responde a la pregunta, porque si empezamos a medir a gente al azar: ¿veríamos muchas alturas cerca de 1,78m? ¿habrá mucha gente que mida menos de 1,60m? Y, ¿cómo de raro es encontrar a personas de 2,29m como Yao Ming?
Está claro que un valor medio, por sí sólo, apenas nos dice nada. La animación siguiente muestra una línea negra que va saltando emulando "medidas de altura" que hiciéramos a hombres al azar, en comparación con el valor medio (la línea roja discontinua). Cada "salto" que da sería una medida a un nuevo individuo:
¿Cómo podríamos cuantificar la "incertidumbre" de la altura? ¿El "cuánta variación" existe?
Una manera muy intuitiva es ir contando cuántas veces nos aparece cada uno de los valores (la altura 177cm, la 178cm, la 179cm, etc.).
La siguiente gráfica muestra este proceso, con una "torre" que va
creciendo en cada valor de centímetro según las veces que ha aparecido:
Estoy seguro que todos reconoceréis la forma a la que tiende este contador, llamado "histograma": tiende a una campana de Gauss (distribución de probabilidad Gausiana, también llamada normal).
Cuanto más estrecha sea la campana, menos incertidumbre tiene nuestra medida
(o si hablamos de una estimación como las de las encuestas, menos
"margen de error"). Una campana más ancha claramente quiere decir que
los valores se extienden más a lo largo y eso los hace más "imprecisos".
De estas dos medidas, la de la derecha tiene mucha menos incertidumbre ya que los valores se dispersan menos. |
Por una serie de razones técnicas en las que no hace falta entrar, se da la casualidad de que muchas, muchas de las incertidumbres del mundo real tienen precisamente forma de campana de Gauss. De ahí su importancia.
La forma de medir "el ancho" de una campana, lo incierta que es, es lo que se llama desviación estándar. Este "ancho" es la famosa sigma (σ). Para el ejemplo de las alturas de hombres, se ha medido que la sigma es de σ=7,11cm.
Y por fin llegamos al concepto intervalo de confianza, casi similar al del margen de error de
las encuestas (luego vemos la sutil diferencia). Conociendo la media y
la sigma σ, se puede demostrar matemáticamente (*) que a pesar de ser
hechos aleatorios, que parecen fuera de control alguno, si medimos
muchos siempre tendremos un 68% de ellos dentro del intervalo centrado
en la media y de ancho 2 sigmas.
Es decir: que desde la "media menos σ" hasta "media más σ" estarán el 68% de los casos. Normalmente esto se escribe media ± σ. Igualmente, dentro del rango media ± 2σ, que es más ancho y por lo tanto abarca más casos, se demuestra que entran aproximadamente un 95,5% de los casos.
Estos "rangos" son justamente los intervalos de confianza o márgenes de error, y precisamente el famoso "95% de probabilidad" con el que se dan los resultados de encuestas vienen de incluir todas las posibilidades dentro de un ancho de ±2σ alrededor de la media o la estimación. ¡Fácil, verdad!
¿Por qué ±2σ y no ±3σ o ±4σ?
Realmente es un compromiso entre incluir la mayoría de los casos
habituales dentro del margen de error sin hacerlo demasiado grande para
que entren los valores "raros" o dispersos. Por ejemplo, para incluir la altura de Yao Ming dentro del margen de error de las alturas que esperamos encontrar habría que usar ±7σ (¡siete sigmas!) ... lo que sería absurdo porque ya con ±4σ nos
estaríamos pasando al ampliar demasiado el margen de error para incluir
al 99.9936% de los casos: lo siento, pero Yao Ming, te quedas fuera de
cualquier margen razonable, ¡eres un bicho raro!
Lea el artículo completo en: