Latest Posts:

17 de agosto de 2013

Estadística: Cuando hables de salarios utiliza la mediana

El pasado sábado en La Sexta Noche, programa de análisis político que se emite en La Sexta los sábados por la noche, nos mostraban unos datos sobre sueldos (sí, con un espacio entre las dos palabras) en España frente a los cuales el economista José Carlos Díez comentaba que era más conveniente utilizar el salario mediano en vez del salario medio. Es decir, la mediana en vez de la media. Y no estamos muy acostumbrados a que en los medios de comunicación se haga esto, más bien al contrario: estamos acostumbrados a que con la media se basten y se sobren para sacar conclusiones. Vamos a explicar qué es la mediana y a comentar por qué es más conveniente que la media en casos como éste, pero antes veamos el vídeo:



(Podéis ver el programa íntegro aquí.)

Sí, cierto, José Carlos Díez se lía un pelín durante su explicación, pero para eso estamos nosotros aquí, ¿no? Vamos a ello.

Como todo el mundo sabe, la media de un conjunto de datos se calcula sumándolos todos y dividiendo el resultado entre el número de ellos. Por ejemplo, la media del conjunto

10,3,3,4,6,50,5,3,2,4
 es

\mbox{Media}=\cfrac{10+3+3+4+6+50+5+3+2+4}{10}=\cfrac{90}{10}=9

Imaginemos que estos números corresponden a la cantidad de primos que tienen 10 personas (sí, tener 50 primos ó más puede parecer algo muy exagerado, o irreal, pero hay casos conocidos, como el de nuestro gran amigo José Manuel López Nicolás, aka Scientia, que tiene 60). Si interpretamos la media como una medida representativa del número de primos de estas 10 personas obtenemos por un lado que de media estas personas tienen 9 primos, pero por otro lado se da la situación siguiente, aparentemente paradójica: 8 de esas 10 personas tienen un número de primos por debajo de la media. ¿Es entonces la media una medida representativa de verdad de la situación real? Parece que no.

¿Por qué ocurre esto? Pues porque, como bien me dijeron a mí en Estadística de 1º, la media es muy sensible a valores extremos. Es decir, si tenemos algún valor mucho mayor que la mayoría de los datos la media nos saldrá muy grande respecto a los mismos (que es lo que ocurre con los primos), y al revés si el valor extremo es mucho más pequeño que los demás. Por ello, en casos así la media no es representativa de la situación, por lo que no es conveniente dar el valor medio como dato realista de la población.

Ahora, sí querríamos saber cómo anda la cantidad intermedia de primos. Ese dato sería el que quede justo en el centro de todos (ordenados de menor a mayor), el que deja a la mitad más pequeña de los datos a su izquierda y a la mitad más grande a su derecha. Ese dato se denomina mediana, y en casos así representa la situación real mucho mejor que la media.

¿Cómo calculamos la mediana? Pues muy sencillo:
Ordenamos los datos de menor a mayor. Si tenemos un número impar de datos, la mediana es el dato central. Y si tenemos un número par de datos, la mediana se calcula sumando los dos centrales y dividiendo entre 2 el resultado.
Veamos qué ocurre en el caso de los primos. Ordenamos de menor a mayor:

2,3,3,3,4,4,5,6,10,50

Y ahora, como tenemos una cantidad par de ellos, sumamos los dos datos centrales y dividimos entre 2:

\mbox{Mediana}=\cfrac{4+4}{2}=\cfrac{8}{2}=4

Esto significa que al menos la mitad de las personas estudiadas tienen 4 primos o menos y la otra mitad tienen 4 primos o más. Como podéis ver, la mediana es mucho más representativa que la media en este caso.

Pues con los salarios ocurre lo mismo. La media solamente sería representativa si los salarios de las personas estudiadas fueran muy homogéneos (muy parecidos todos), pero creo que está bastante claro que en realidad eso no es así. Un ejemplo muy simple:
Imaginad una empresa con 100 trabajadores en la que 60 de ellos cobran un sueldo de 900 €, 20 de ellos cobran 1100, 15 cobran 1400, 4 cobran 2500 y el que queda, el dueño, cobran 20000. Una situación nada descabellada, ¿verdad? Bien, la mediana de los salarios de estos miembros de la empresa es 900, mientras que la media es 1270.
¿Cuál de estos dos datos creéis que representa de una forma más realista la situación de los sueldos de esta empresa? Claramente la mediana, ¿verdad? Sin duda (ya les gustaría a los de abajo, la gran mayoría, que no fuera así). Pues lo mismo ocurre cuando se habla de salarios en España (o en cualquier otro sitio). Si queremos dar un dato que dé información real sobre lo que cobra un español intermedio debemos dar el salario mediano, ya que si damos la media estaremos dando un dato alejado de la realidad.

Por todo ello me alegro de que en La Sexta alguien haya incidido en este detalle (igual que a veces criticamos lo que hacen mal también es justo destacar lo que hacen bien). A ver si de una vez por todas nos damos cuenta todos, tanto los que proporcionan los datos (los que realizan los estudios) como los que los comunican (normalmente los medios de comunicación), de que cuando hablemos de salarios lo más justo y lo más realista es utilizar la mediana en vez de la media. Y no sólo cuando hablemos de salarios, sino, en general, cuando hablemos de pasta: lo que la gente gasta en rebajas, lo que la gente debe a los bancos, o lo que la gente invierte en Lotería de Navidad.

Evidentemente este cambio de medida no se puede hacer de manera radical a los ojos y oídos de la población. Estamos tan acostumbrados a la media que el hecho de cambiar así sin más a mediana podría verse como un intento de manipulación, cuando en realidad es justo lo contrario. Por ello lo ideal sería ir introduciendo el concepto poco a poco y, evidentemente, explicar con claridad ambos conceptos (ejemplos tipo los que aparecen en esta entrada pueden ser interesantes) para que la gente termine por interiorizar la idoneidad del uso de la mediana.

Esperemos que así sea.

Sobre este tema (y alguna cosa más), os recomiendo leer este post que nuestra admirada Clara Grima escribió para JotDown el pasado mes de junio.

Fuente:

Gaussianos
google.com, pub-7451761037085740, DIRECT, f08c47fec0942fa0