Latest Posts:

Mostrando las entradas con la etiqueta causalidad. Mostrar todas las entradas
Mostrando las entradas con la etiqueta causalidad. Mostrar todas las entradas

19 de agosto de 2015

Variable dependiente e independiente (para niños)

Saludos

Una de los indicadores del área de Ciencia y Ambiente nos invita a enseñar a los alumnos (de quinto y seto grados de educación primaria) la diferencia y, al mismo tiempo, la relación entre variables dependientes e independientes en las hipótesis; hipótesis que os mismos niños deben de construir.

La capacidad es: Genera y registra datos e información.

El indicador es: Elabora tablas de doble entrada identificando la posición de las variables dependiente e independiente.

Antes de empezar la actividad

Antes de presentarles este documento tenemos que aclarar que se debe iniciar a los estudiantes en el manejo de variables como una relación de causalidad, es decir estableciendo diferencias entre las causas y efectos de fenómenos relacionados con la ciencia y la tecnología. Inclusive se pueden emplear os términos CAUSA y EFECTO como sinónimos de variable independiente y variable dependiente.

En este fragmento del documento se presenta la introducción a ese nuevo y fascinante tema; en el documento completo se incluyen siete preguntas investigativas, cada una de estas preguntas con sus respectivas variables, ¡y todo listo para aplicar en las aulas!

No dude en contactarme para cualquier clase de consulta:

leonardo.sanchez.coello@gmail.com


Hasta pronto



1 de septiembre de 2014

Diagramas Causa-Efecto

DIAGRAMAS CAUSA-EFECTO

La efectividad de las estrategias de Aprendizaje Visual para la construcción y comprensión de nuevos conocimientos y para desarrollar habilidades de pensamiento de orden superior, es reconocida por docentes del mundo entero. 
La elaboración de diagramas visuales ayuda a los estudiantes a procesar, organizar y priorizar nueva información, de manera que puedan integrarla significativamente a su base de conocimientos previos. Además, les permite identificar ideas erróneas y visualizar patrones e interrelaciones en la información, factores necesarios para la comprensión e interiorización profunda de los conceptos. 
Sin embargo, para que la aplicación en el aula de las diferentes estrategias de Aprendizaje Visual sea realmente efectiva, es necesario tener en cuenta los objetivos de aprendizaje que se desea que los estudiantes alcancen. 
Por ejemplo, si lo que se quiere es que los estudiantes ubiquen, dentro de un periodo de tiempo determinado, los sucesos relacionados con el descubrimiento de América para que visualicen y comprendan la relación temporal entre estos, el método u organizador gráfico idóneo es una Línea de Tiempo. Por el contrario, si lo que se desea es que los estudiantes comprendan la relación entre los conceptos mas importantes relacionados con el descubrimiento de América tales como: Nuevo mundo, conquista, colonia, economía y navegación, la herramienta idónea es un Mapa Conceptual
Así mismo, cuando el objetivo de aprendizaje es que los estudiantes descubran las causas de un problema o de un suceso, o las relaciones causales entre dos o más fenómenos, el organizador gráfico ideal es un Diagrama Causa-Efecto
Siguiendo con el ejemplo anterior, al elaborar este diagrama los estudiantes identificarían cómo el cambio de las concepciones sobre la forma de La Tierra (redonda), el bloqueo del comercio de especias por el Mediterráneo [1], la posición estratégica de España en la Península Ibérica y los avances tecnológicos en materia de navegación, fueron eventos que, relacionados unos con otros, causaron el descubrimiento de América.
Los Diagramas Causa-Efecto ayudan a los estudiantes a pensar sobre todas las causas reales y potenciales de un suceso o problema, y no solamente en las más obvias o simples. Además,son idóneos para motivar el análisis y la discusión grupal, de manera que cada equipo de trabajo pueda ampliar su comprensión del problema, visualizar las razones, motivos o factores principales y secundarios, identificar posibles soluciones, tomar decisiones y, organizar planes de acción. 
El Diagrama Causa-Efecto es llamado usualmente Diagrama de “Ishikawa” porque fue creado por Kaoru Ishikawa, experto en dirección de empresas interesado en mejorar el control de la calidad; también es llamado “Diagrama Espina de Pescado” por que su forma es similar al esqueleto de un pez: Está compuesto por un recuadro (cabeza), una línea principal (columna vertebral), y 4 o más líneas que apuntan a la línea principal formando un ángulo aproximado de 70º (espinas principales). Estas últimas poseen a su vez dos o tres líneas inclinadas (espinas), y así sucesivamente (espinas menores), según sea necesario.

 

Esquema elaborado con el software CmapTools (http://www.eduteka.org/HerramientasVisuales.php)

Aunque la mayoría de Diagramas Causa-Efecto se representan de esta manera, estos se pueden elaborar siguiendo otros formatos. En la dirección http://www.educationoasis.com/curriculum/GO/cause_effect.htm usted puede encontrar otros modelos para construir Diagramas Causa-Efecto.

 

PASOS PARA CONSTRUIR UN DIAGRAMA CAUSA-EFECTO

1. IDENTIFICAR EL PROBLEMA

Identifique y defina con exactitud el problema, fenómeno, evento o situación que se quiere analizar. Éste debe plantearse de manera específica y concreta para que el análisis de las causas se oriente correctamente y se eviten confusiones. 

Los Diagramas Causa-Efecto permiten analizar problemas o fenómenos propios de diversas áreas del conocimiento. Algunos ejemplos podrían ser: la falta participación de los alumnos del grado 9-A en las votaciones estudiantiles, la extinción de los dinosaurios, el establecimiento del Frente Nacional en Colombia, la migración de las aves, entre otros. 

Una vez el problema se delimite correctamente, debe escribirse con una frase corta y sencilla, en el recuadro principal o cabeza del pescado, tal como se muestra en el siguiente ejemplo: Bajo rendimiento en Matemáticas.


Diagrama elaborado con el software SmartDraw (http://www.eduteka.org/HerramientasVisuales.php)

El artículo completo en:

21 de abril de 2014

Correlación, causalidad… y grafos: lo más fundamental (e ignorado) en estadística

Una deficiente comprensión de conceptos estadísticos y la enorme presión a que los investigadores de todas las áreas nos vemos sometidos para publicar podría ser la causa de que la mayoría de los estudios científicos de áreas médicas, biológicas y de ciencias sociales lleguen a conclusiones erróneas con tal de publicar.Hace ya ocho años que el profesor John Ioannidis publicó esta rotunda afirmación [1], para sorpresa de parte de la comunidad científica y alivio de otros que por fin veían señalado al elefante en la habitación. Pero los años pasan y es frustrante ver que seguimos igual, tanto por parte de algunos autores (como el criticado aquí) como por periodistas que se “tragan” acríticamente cualquier cosa que comience por el manido “un estudio científico demuestra que…“.
 
(Créditos: XKCD-es)

Por esto he decidido dedicar (otra) entrada a aclarar concepciones erróneas que pululan sobre la estadística, una de las herramientas más potentes que tenemos y sin embargo con peor fama entre el público general precisamente por su mal uso.

Sé que otros blogs ya han hablado del tema “causalidad vs. correlación”, así que le doy a dar un enfoque nuevo: explicar la verdadera relación que existe entre correlación, causalidad y grafos.

Chocolate y premios Nobel

“Los países con mayor consumo de chocolate tienen más premios Nobel, por lo que se recomienda su consumo para mejorar la inteligencia.”
¿Te parece absurdo? A mí mucho. Pues esta asociación se llegó a publicar en una revista científica [2] y generó una ristra de titulares en todo tipo de medios, p.ej. aquí, aquí o aquí.
Los autores del estudio hipotetizaban que el efecto de los flavonoides del cacao sobre las capacidades cognitivas era tan importante que permitía la aparición de más premios Nobel allí donde más se consume. Rápidamente aparecieron críticas en las revistas científicas [3], donde se señalaba (entre otros puntos débiles del estudio) que muchos otros índices aparte del chocolate tienen una alta correlación con el número de premiados así que… ¿cuál es realmente la causa última?

Por ejemplo, entre los índices que correlaban salió el número de tiendas de IKEA en cada país:

Dos variables se dice que están correladas cuando el aumento (o disminución) de una provoca un cambio claro en la otra, lo que se suele traducir en que los datos representados como gráfica “parecen caer” sobre una línea en lugar de ser una “nube amorfa”. 

No creo que guardar los libros en armarios con nombres de pueblos noruegos te haga más listo. De hecho, puede que para llegar a ser un Nobel tenga más importancia el nivel socioeconómico de un país que la “inteligencia” de sus gentes.

Lo que se quería resaltar con esta anécdota de las tiendas IKEA es que, buscando, seguro se acabarán encontrando relaciones absurdas, así que sólo la correlación no justifica en absoluto la existencia de una relación de causa-efecto. De hecho, y aunque esto sea ya otro tema, la ausencia de correlación tampoco implica que no exista relación causa-efecto, ya que siempre quedará una probabilidad (pequeñísima) de haber obtenido una combinación de datos especialmente adversa.

Un error demasiado común

Antes de pasar a explicar el porqué aparecen estas correlaciones sin relación causal directa, quiero recopilar algunos “un estudio científico demuestra que…” para echar unas risas:
  • Lo del corazón partío les pasa factura a los solteros: “Los felizmente casados sobreviven más que los solteros tras un ‘by-pass’” (ElMundo)
  • Lo mejor para dormir tranquilo es no enterarse de las noticias: “La sobreinformación es la causante del «síndrome de fatiga informativa»” (ABC)
  • No es por no moverse del sofá, no, sino por mirar una pantalla: “Ver la televisión acorta la vida hasta en cinco años” (El Economista)
  • Y este estudio fue ya de traca: “El tamaño del pene está relacionado con el crecimiento del PIB: Un investigador de la Universidad de Helsinki (Finlandia) ha llegado a la conclusión en un reciente estudio que el tamaño promedio del pene en un país, tiene directa relación con el crecimiento del Producto Interno Bruto (PIB) de cada nación.” (Noticias Terra)
Eje vertical: PIB. Eje horizontal: tamaño medio del miembro masculino. No, no es coña: alguien quiso imaginarse una correlación en esta nube de puntos…o quiso hacerse famoso. (Fuente)

Grafos y causalidad

Vamos al meollo: ¿por qué aparece correlación entre variables? Hay varias posibilidades:
  • (1) Causalidad directa: Una variable realmente se encuentra entre las causantes de la otra.
  • (2) Causalidad indirecta: Existe un tercer hecho (o varios) que relaciona indirectamente los dos bajo estudio.
  • (3) Casualidad con los datos: Si se seleccionan muy mal los datos, con sesgo intencionado o simplemente muy pocas muestras, puede “parecer” que hay correlación simplemente por azar. A veces también ocurre que simplemente existe correlación sin relación causal remota; p.ej. el precio del tomate en Cuenca puede subir a la par que el número de cines abiertos en China.
Los casos (1) son los típicos explorados en Física, donde existen modelos bastante buenos de sistemas sencillos y cerrados donde se controlan todas las variables de los experimentos. Los casos (3) suelen ser fácilmente identificables con el sentido común, p.ej. el caso del PIB y el tamaño del pene que menciono arriba.
 
Los casos verdaderamente problemáticos son los segundos, los de causalidad indirecta. Y aquí vemos el papel que juegan los grafos.

Uno de los modelos gráficos más usados en estadística es el que representa las variables como nodos y las relaciones causales como arcos dirigidos (con “flechitas”). Este modelo se llama red Bayesiana y es un formalismo matemático extremadamente potente.Veamos un ejemplo clásico en este tema: las relaciones entre que haya llovido (LL), que la hierba esté húmeda (H) y que hayan funcionado los aspersores o rociadores para regar (R). Se tienen tres nodos y las relaciones son:
 
(Créditos)

Cada flecha A -> B indica que A influye (es una causa) de B. Leamos la información que codifican los arcos del ejemplo:
  • LL->R: Si llueve no se enciende el aspersor, ya que no hace falta.
  • R->H: Si se ha regado, la hierba estará mojada.
  • LL->H: Si llueve, la hierba estará mojada.
Aunque no vamos a entrar en estos detalles, las “flechitas” no son siempre deterministas sino que normalmente implican incertidumbre, p.ej. si llueve hay un 80% de probabilidad de que no se enciendan los aspersores. Esto no es ninguna limitación, al contrario: permiten trabajar con información del mundo real donde casi todos los modelos tienen componentes desconocidas.

Correlación y distribuciones marginales

Por fin llegamos al quid de la cuestión: ¿qué pasa cuando estudiamos la correlación entre variables de un grafo?

Esto es lo que normalmente se hace con los estudios médicos y de otro tipo: se escogen dos (o más) variables entre las que se hipotetiza una relación causal y se pone a prueba mediante técnicas estadísticas (e.g. test chi2, etc.). Ahora, si la realidad es que A implica B, el modelo real es:



y se debería encontrar correlación. Por tanto, la clave para poder asociar correlación con causalidad de manera rotunda es estar seguros de que la única causa posible de B es A… o que tiene más causas pero todas ellas son independientes de A. Algo bastante difícil de asegurar en cualquier modelo complejo como puede ser la salud de una persona donde intervienen tantos y tantos factores.

Veamos algo más interesante: qué ocurre cuando se ignoran hechos. Por ejemplo, imaginemos un evento C que es la causa de A y de B, como representa este grafo:


La distribución de probabilidad que modela perfectamente este sistema depende de tres variables, pero según la teoría de modelos gráficos podemos separarla (“factorizar” es el término matemático) en el producto de las funciones que modelan cada relación causal por separado:

P(a,b,c)=P(a|c)P(b|c)P(c)
 

¿Qué problema tiene esto? Pues que si estudiamos solamente A y B, olvidándonos de C, realmente se trabaja con la función:

P(a,b)
 

donde se dice que C ha sido “marginalizado“, y toda la información de sus arcos pasan a crear un nuevo “arco” entre A y B… ¡Aunque inicialmente no existía relación causal alguna entre ellas!
En resumen: si se estudian dos variables dejando fuera causas comunes, se detectará una correlación entre ellas aunque no exista relación causal directa alguna. Este es el mayor peligro en cualquier estudio científico.


Curiosamente este efecto depende del sentido de las flechas: si ahora estudiamos solamente las variables A y B dejando fuera una C que es efecto de ambas, no detectaremos correlación entre A y B. Si reflexionas un momento sobre qué significan las flechas entenderás por qué esto es así de manera intuitiva.



Una regla general para saber si el ignorar un nodo C introduce correlación entre A y B es esta: si los caminos desde A a B se encuentran en una configuración “flecha-flecha” (como en este último dibujo), no aparece correlación, y sí aparece en cualquier otro caso.

Un ejemplo práctico: delincuencia y boy scouts

Quería terminar con un ejemplo numérico para aclarar los conceptos a quien nunca antes de hoy hubiese oído hablar de probabilidades marginales y cia. Lo he sacado de este excelente curso de la PennState University (EEUU).

Tenemos los siguientes datos sobre 800 chicos a los que se clasifica por nivel socioeconómico (S), si son o no boy-scouts (B) y si tienen o no antecedentes delictivos (D):


¿Qué pasa si estudiamos la hipotética relación entre ser boy-scout y delinquir? Pues que tendríamos que “ignorar” (marginalizar) el nivel socioeconómico, sumando los datos sobre los distintos niveles (aquí un ejemplo del proceso) y llegando a:


Estos números, sometidos a tests estadístico gritan un: sí, existe correlación (negativa) entre ser boy-scout y delinquir. Luego: ¿los boy-scout son mejores personas? No tan rápido…

¿Y si el modelo subyacente a los datos fuese que el nivel socioeconómico fuese la causa de ambos, ser boy-scout y delinquir, sin que exista relación directa alguna entre estas últimas?

 Posible modelo causal alternativo: c: Nivel socioeconómico,  a: ser boy-scout, b: delinquir. 

Poner a prueba este modelo es sencillo: se puede determinar si existe relación causal directa entre “a” y “b” en el grafo del dibujo poniendo a prueba la correlación de la distribución condicional de éstas para cada valor dado de “c”:


P(a,b|c)
En la práctica esto se traduce en volver a la tabla original:


Y hacer tres pruebas de correlación entre ser boy-scout y delinquir para cada trozo de 2×2 de los datos, uno por cada nivel socioeconómico (low, medium, high).

Estas pruebas dan un resultado de correlación nula (la hipótesis nula arroja χ2=0.16), luego la apresurada hipótesis de que ser boy-scout te hace menos propenso a delinquir era errónea: el detonante real es el nivel socioeconómico, que a su vez condiciona que un chico se pueda permitir hacerse boy-scout o no.

Aunque el artículo me ha quedado “algo” denso y largo, ¡espero que lo hayas disfrutado! Puedes leer más en los enlaces que dejo abajo.
Referencias:

Tomado de:

Ciencia Explicada

google.com, pub-7451761037085740, DIRECT, f08c47fec0942fa0