Estudio
de variables bidimensionales
Unidad 1
Tus
profesores te habrán explicado que a veces interesa comparar dos series de
datos estadísticos para descubrir influencias o paralelismos entre ellos. Por
ejemplo: ¿Existe alguna relación entre el número de películas vistas por
Televisión en un mes y el número de horas que cada uno de vosotros dedica al
estudio?
Se
llaman variables bidimensionales a
esos datos que se obtienen por parejas, de dos en dos: Número de zapato que
calzas y tu estatura, tu edad y tu nivel de colesterol en sangre, etc.
Inicia
el programa
OpenOffice.org Calcl. Abre el libro
bidimen1.ods
Observa
que contiene una tabla de datos (área de
datos o tabla principal), un número llamado R y un gráfico del tipo de nube
de puntos que representa los números de la tabla.
La
tabla está formada por dos columnas, una rotulada con X y otra con Y. Contiene
por tanto dos variables estadísticas.
La variable X contiene las horas de estudio semanal de un grupo de amigos y la
Y las notas de 0 a 10 en un examen.
Elige un
par de valores relacionados, por ejemplo x=7
y=4, que corresponde a alguien que estudia 7 horas a la semana y que sacó
un 4. Busca qué punto representa a este par en el gráfico. Puedes ir pasando el
ratón sobre los puntos de la nube para verlo mejor. Haz lo mismo
con algún otro.
Intenta
lo contrario, buscar un punto en la gráfica y localizar a qué par (x,y) representa. Usa el ratón.
Observa
el valor de R=0,84803. En este momento ese valor no te dirá nada.
Vamos a cambiarlo moviendo los puntos. Para eso debes simplemente cambiar
valores de X o de Y. Inténtalo: altera algunos valores de la tabla y observa si
R cambia.
El valor del número R, llamado coeficiente de correlación, depende de
los valores de X e Y
Para
entenderlo mejor vas a copiar algunas tablas que contiene el libro bidim1.ods un
poco más abajo.
Borra
el área de datos (tabla principal) con Supr
Selecciona
la Tabla núm. 1. Usa Copiar y Pegar para trasladar sus valores a la
tabla principal.
Copia
el valor de R junto a la Tabla 1. Copia también a su derecha la nube de puntos
que ha resultado. Observa que R vale 0,99
Haz lo
mismo con la segunda tabla. Ves que R es prácticamente cero. ¿Por qué será tan pequeño? Para responder compara la primera
nube con la segunda. Si observas algo interesante escríbelo:
La
primera R es mayor porque la nube____________________________________
La
segunda R es muy pequeña porque la nube ______________________________
Haz lo
mismo con las tablas 3 y 4. ¿Entiendes mejor lo que significa R? Responde:
__________________________________________________________
¿Por
qué la tercera tabla tiene un coeficiente
de correlación R negativo y la primera positivo? ________________
¿Por
qué la segunda y la cuarta tienen R casi nula? __________________________
¿Qué
figura geométrica recuerda la primera nube? ___________________________
Copia
la tercera tabla de nuevo. Recuerda que R vale -0,885.
Intenta
ahora algo muy interesante: Cambia algunos valores de X y de Y para conseguir
que R se acerque a -1, es decir, que valga -0,95 ó -0,99, etc.
¿Qué le
ocurre entonces a la nube? Explícalo: ______________________________
__________________________________________________
Ahora
intenta que R se acerque a 0, que valga -0,03 ó -0,1, etc.
¿Qué le
ocurre entonces a la nube? Explícalo: ______________________________
__________________________________________________
Copia
ahora la tabla 1, que como sabes, tiene un coeficiente
de correlación R de 0,99
Intenta
que R sea mayor que 1 cambiando valores. ¿Se puede lograr? ________
Resume
lo que has aprendido:
Los
valores de R no pueden pasar de _______
Si
R se acerca a 1 o a -1 los puntos están _____________________
Si
R se acerca a 0 los puntos están _______________________
Inventa
una tabla con 10 pares de puntos y que su coeficiente
de correlación R se acerque a 1
|
X |
Y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ahora
otra en la que se acerque a
cero
|
X |
Y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Inicia
el programa OpenOffice.org
Calc. Abre el libro
bidimen2.ods
Observa
que es parecido al libro anterior, pero hay dos novedades interesantes:
·
En la nube de puntos aparece una línea de tendencia
·
Hay dos celdas para hacer pronósticos
Esto es
así porque las nubes de puntos, cuando tienen la forma adecuada, sirven para
pronosticar qué pasaría con los valores de X que no están en las tablas.
Por ejemplo, en la celda G17, rotulada con Para X = escribe un valor que no
esté en las tablas, por ejemplo 12 y obtendrás debajo un pronóstico para el
valor correspondiente de Y: 35,2667 si la tendencia de la tabla se mantiene.
Los
pronósticos se calculan siguiendo la línea de tendencia que ves en el gráfico,
llamada recta de regresión. Esta
recta es la que mejor se adapta a la nube.
¿Crees
que con la tabla del ejemplo hay un buen ajuste entre nube y recta? ____________
¿Influye
el valor de R? Para responder a esto cambia algunos valores de Y de forma que sus
puntos en la nube se alejen de la recta. ¿Cómo cambia entonces el valor
de R? _________________
Ahora
intenta cambiar valores para que se acerquen a la recta. ¿Qué le ocurre a R?
_______________
Copia
en el área de datos las tablas que hay más abajo. Observa qué relación hay
entre el ajuste de la recta con la nube de puntos y el valor de R.
Resume:
Si
los puntos se acercan a la recta de regresión el coeficiente de correlación R
se acerca a ________ y si se alejan se acerca a ________
¿Qué
ocurre con los pronósticos? Si la R se acerca a 1, ¿tendrán menos errores que
si la R es pequeña? Para verlo vas copiando las tablas de nuevo en el área de
datos y escribe en los pronósticos valores de
la tabla y compara su verdadero valor con el pronóstico que te daría la
recta de regresión. Rellena la tabla de abajo con lo que has experimentado:
|
|
Valor
de X |
Valor
de Y |
Pronóstico |
Error |
|
Tabla
núm. 1 |
|
|
|
|
|
Tabla
núm. 1 |
|
|
|
|
|
Tabla
núm. 2 |
|
|
|
|
|
Tabla
núm. 2 |
|
|
|
|
|
Tabla
núm. 3 |
|
|
|
|
|
Tabla
núm. 3 |
|
|
|
|
|
Tabla
núm. 4 |
|
|
|
|
|
Tabla
núm. 4 |
|
|
|
|
Habrás
descubierto que si R se acerca a 1 o a -1 los errores son más __________ y si
se acerca a 0 son más __________
Para
verlo mejor en conjunto abre el libro
bidimen3.ods.
Podrás
observar que este libro contiene pronósticos para toda la tabla y los errores
cometidos.
Mira en
el gráfico una novedad, y es que te aparece la ecuación de la recta de
regresión, la que sirve para pronosticar. Es una ecuación de primer grado, del
tipo y = ax+b.
También figura R2, que es el cuadrado del coeficiente de
correlación, que por ahora no vamos a analizar. Por si tienes curiosidad, es el
porcentaje de variabilidad que es explicado por el modelo.
En el modelo bidimen4.ods puedes consultar todos los cálculos.