Temas de Estadística Práctica
Antonio Roldán Martínez

Portada > Inicio temas Tema 2 - Medidas de tipo paramétrico

 

Tema 2                              

 

Medidas de tipo paramétrico

 

Cuestión - Ejemplo

¿Cómo ha influido mi cambio de método?

Una profesora de idiomas decide cambiar el método de enseñanza del vocabulario. Pasa a sus alumnos una prueba que produce una calificación del 0 al 5. Establece en sus clases el nuevo método durante dos meses y vuelve a pasar una prueba de dificultad proporcionada al nuevo aprendizaje. Después de corregirla desea saber si ha subido el nivel de clase y si el nuevo método ha acercado los niveles de los alumnos o si, por contra, los ha dispersado.

Los resultados de ambas pruebas, ordenados de 0 a 5 (no por alumnos) han sido los siguientes

Antes del cambio de método

0 0 0 1 1 1 2 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5 5  

Después del cambio

0 0 1 1 1 1 2 2 2 2 3 3 3 3 3 4 4 4 4 4 4 5 5 5 5

 

Para estudiar diferencias que no se aprecian por simple inspección de las tablas (en el ejemplo parece que el nivel ha subido algo, pero no se tiene la seguridad) debemos calcular los estadísticos de la muestra. Llamamos estadísticos a todas las medidas realizadas sobre el conjunto (muestra) que se estudia, y que pueden resumir algunos aspectos interesantes del mismo:

Medidas centrales: Mediana, media, moda

Son medidas que buscan el centro de los datos. En nuestro ejemplo, para comprobar que el nuevo método es mejor, bastará ver que el centro (la media o la mediana) ha aumentado su valor.


Medidas de dispersión: Desviación típica, rango,...

Estas medidas evalúan la variabilidad de los datos. Si son grandes, es que los datos están más dispersos, y si son pequeñas, más homogéneos. En este ejemplo sería un peligro el hecho de que el nuevo método dispersara a los alumnos.


Medidas de asimetría y aplastamiento

No las usaremos en este ejemplo. Consulta la teoría si lo deseas.

En esta sesión sólo estudiaremos las medidas de tipo paramétrico, llamadas así porque se usan en estimaciones en las que se tienen en cuenta los parámetros de la población, que son las medidas del mismo tipo que los estadísticos, pero correspondientes a la población y no a la muestra. Es una distinción técnica. No te preocupes por ella en este momento.

 

Para recordar las medidas más frecuentes de tipo paramétrico que se realizan sobre una muestra puedes leer el resumen teórico. Por ahora basta que leas la primera parte de Medidas de Tendencia Central.

 


Práctica 1


Abre el modelo media1.ods. Contiene los datos obtenidos por la profesora ordenados en columnas.

Nombre de rangos

En primer lugar, dotaremos de un nombre a las dos columnas. Selecciona todos los números de la primera columna (el rótulo Antes no) con la secuencia Insertar - Nombres - Definir. Asígnale el nombre de Antes.  Haz lo mismo con la segunda columna y le defines el nombre de Después (recuerda luego si has escrito la tilde).

Funciones estadísticas en OpenOffice

Para calcular la media de las pruebas anteriores al cambio de método podemos utilizar una función de tipo estadístico. OpenOffice posee muchísimas funciones, que son palabras reservadas (PROMEDIO, MIN, SUMA, CONTAR,...) que aplicadas a unos datos nos devuelven los cálculos que deseemos. Consulta algunas en la Guía Rápida de OpenOffice o en la ayuda del programa.

Media

La media de un conjunto de tipo cuantitativo es un número que representa el resultado de dividir la suma de todos los datos entre el número de ellos. Es como un reparto equitativo:

Llamaremos media aritmética o simplemente media al valor resultante de sumar todos los datos y después dividir el resultado entre el número de ellos. Es, pues, el resultado de un reparto igualitario de los valores. También se puede interpretar como el centro de gravedad de los datos.

Su fórmula más simple es


que se interpreta como la suma de datos dividida entre el número de ellos.

En este caso basta escribir =PROMEDIO(Antes) para que OpenOffice nos calcule la media de la primera columna. Elige una celda cualquiera a la derecha de las tablas y escribe esa expresión (no olvides el signo =). Automáticamente aparecerá la media deseada: 2,6. Si quieres, con las órdenes Formato - Celda - Número le puedes aumentar los decimales a 4. Escribe en una celda próxima un rótulo que recuerde que esta es la media de la primera columna.

Elige otra celda y escribe =PROMEDIO(Después)

Las mayúsculas o minúsculas no influyen en el resultado

Deberás obtener unas celdas parecidas a estas:

en las que hemos cambiado los caracteres a negrita y dotado de color al fondo.

Si quieres repasar los formatos, consulta la Guía de OpenOffice.

Por tanto, ya tenemos una primera respuesta: El método ha subido el nivel del grupo en 0,24 puntos.


Para comparar cambios de nivel en una magnitud usaremos las medidas centrales.

Si las medidas son de tipo ordinal usaremos la mediana (que estudiaremos más adelante), pero si son de un tipo superior, en la mayoría de los casos es preferible comparar las medias.
 

 

 

 

 

 

Desviación típica

La otra cuestión que se planteaba era si el nuevo método había agrupado los rendimientos de los alumnos o los había dispersado. Una respuesta a esta cuestión nos la da la Desviación típica

La fórmula y la definición de la Desviación típica es complicada, pero es tan útil y universal, que se debe usar desde el primer momento. Su fórmula es la siguiente: 



que se interpreta como el reparto equitativo de la variabilidad que presentan todos los datos que estemos estudiando. Para ello suma todas las desviaciones que presentan los datos (elevadas al cuadrado, que así se da importancia a los más lejanos), se reparten entre el número de ellos y se le halla la raíz cuadrada para que el resultado se mida en las mismas unidades que los datos.

Si el párrafo anterior no lo entiendes bien, ignóralo por ahora.

La desviación típica s es base de muchas técnicas, al igual que la media . Su gran ventaja es estar medida en las mismas unidades que los datos y la media, lo que permite establecer razones y proporciones entre ellas.

 La función que devuelve la desviación típica es DESVESTP. Resulta extraño este nombre, pero es que hay varias desviaciones típicas distintas y las consonantes sirven para distinguirlas.

Puedes leer ahora el resumen teórico. en su parte de Medidas de Variabilidad. especialmente lo relativo a la Desviación Típica

Elige otras celdas y escribe en una =DESVESTP(Antes) y en otra =DESVESTP(Después) y obtendrás otras dos celdas como estas:

Esto responde a la segunda cuestión: Los alumnos se han dispersado un poco más, unas dos centésimas. Como esta diferencia es muy pequeña, podemos admitir que la dispersión es sensiblemente la misma.


Para comparar cambios en la dispersión o variabilidad usaremos las medidas de dispersión.

La más interesante es la desviación típica, si las medidas son de intervalo o razón.

 

 

 

 

 

 

Así se resuelven los cálculos estadísticos a base de funciones de OpenOffice. Para practicar, escribe en otras celdas las siguientes (una para Antes  y otra para Después)

Asimetría: =COEFICIENTE.ASIMETRIA(ANTES)

Curtosis: CURTOSIS(ANTES)

Deberá darte

Estas dos medidas corresponden a la asimetría y al aplastamiento de los datos. Son cuestiones secundarias. La Media y la Desviación Típica sí son fundamentales. No obstante, si te interesa, profundiza en el Resumen Teórico.


Asistente de funciones

Para repasar las funciones estadísticas que has aprendido y saber dónde buscarlas, observa que junto a la línea de edición figura un pequeño símbolo f(x) que representa al Asistente  de Funciones, o Buscador de Funciones.

Si señalas una celda vacía y pulsas sobre ese símbolo se te abrirá todo el catálogo de funciones. Elige Estadísticas para ver las que tienes disponibles. Son muchas:

Elige, por ejemplo, MODA. Si pulsas Aceptar se te abrirá el marco de MODA en el que habrás de escribir o señalar el conjunto sobre el que actuará la moda.

En la línea del número 1 escribe, por ejemplo Después y te devolverá la Moda de Después, que es 4. Haz lo mismo con la moda de Antes y te deberá dar 2

La Moda también te da una pista sobre el hecho de que el método nuevo de la profesora aumenta el nivel, porque la nota más numerosa ha pasado de 2 a 4.

 

Otras medidas

Coeficiente de Variación

Cuando se comparan conjuntos de medias muy distintas (como podrían ser los diámetros de los planetas y la altura de mis alumnos) no sirve de nada comparar las distintas variabilidades. Entre las dos desviaciones típicas existiría una diferencia enorme en magnitud. Por ello, se suele corregir la desviación típica dividiéndola entre su media. De esta forma obtenemos una medida relativa de la variablidad, que permite las comparaciones. 

No es este el caso, pero por practicar, calcula el coeficiente de variación del conjunto Antes y el conjunto Después. Puedes usar esta fórmula

=DESVESTP(Antes)/PROMEDIO(Antes) para el primer conjunto y otra similar para el segundo. Comprueba estos resultados:

Coef. Var(Antes) = 0,59 = 59%            Coef. Var(Después) = 0,54 = 54%

Como ves, esto confirma la impresión de que no hay cambios en la dispersión de los datos.

 

Medianas y Modas

Para familiarizarte con algunas medidas, intenta comprobar estas otras funciones:

Medianas: MEDIANA(ANTES) = 3        MEDIANA(DESPUÉS) = 3

Máximo: MÁX(DESPUES) = 5        MÁX(DESPUES) = 5

Las medias armónica y geométrica no admiten nombres de celdas. Si quieres conocerlas comprueba estos resultados:

Media armónica:  =MEDIA.ARMO(2;5;9) = 3,6986

Media geométrica: =MEDIA.GEOM(4;9;100) = 15,3261

En otras sesiones veremos algunas de ellas.

 


Práctica 2


Estudio gráfico

Tal como están los datos de la profesora son muy difíciles de representar. Abre de nuevo el modelo media1.ods., pero ahora en su Hoja2, en la que verás los mismos datos pero agrupados en una tabla de frecuencias. Repasa la Sección 1 para recordar las técnicas correspondientes.

En esta tabla volvemos a ver las modas, porque antes la nota más frecuente era el 2 y después el 4.

Ahora sí podemos iniciar el estudio gráfico. Selecciona toda la tabla, incluidos los rótulos azules (el título "Datos distribuidos..."  no) y pide Insertar - Diagrama. Sigue bien los pasos del asistente:

Primer paso

Debes activar la opción de Primera Columna como etiqueta y dejar también activada Primera fila como etiqueta.

Segundo paso

Elige el tipo lineal, pero si lo prefieres, el de columnas o cualquier otro.

Tercer paso

Como subtipo puedes elegir el que contiene símbolos para los datos

Cuarto paso

Concreta el Título y las leyendas y pulsa en el botón Crear

Te deberá resultar un gráfico como el siguiente, que no tiene ningún atractivo.

Lee en las Guías de OpenOffice las formas de mejorar un gráfico.

Observa a continuación el nuevo formato que podría quedar en este caso:

Se observa que en las frecuencias azules (Antes) los mayores valores se encuentran alrededor del 2, mientras que en las rojas se desvía al 4, lo que indica una mejora en el rendimiento.

 


Práctica 3 (Profundización)


Obtención de medidas mediante agrupación

Cuando los datos son continuos o muy numerosos, se suelen agrupar en intervalos. Esta operación puede falsear los resultados, debido a que se suelen admitir dos hipótesis que pueden no tener fundamento:

a) En el cálculo de la media se supone que todos los elementos de un mismo intervalo coinciden con el punto medio del mismo.

b) Para calcular la mediana hay que suponer que los datos se reparten de manera uniforme por todo el intervalo.

Ambas hipótesis son contradictorias y en la práctica falsas las dos, pero lo suficientemente aproximadas para permitirnos calcular la media y la mediana.

Investigaremos los posibles errores con la siguiente práctica:

Los datos contenidos en la tabla corresponden a las notas que un profesor universitario ha obtenido al corregir un examen de Psicología Matemática:

3,6

6,1

5

7,2

7,5

6,6

8

5

6

4,4

3,8

3,7

2

1,8

7,2

8,7

8,3

6

6,1

4,1

5,7

4,1

6,7

7,5

8

9,5

9,3

8

6,8

7,6

2,7

3

1,2

1,2

4

6,2

6,5

8,5

9

0,7

4

0

5,3

 

 

 

 

 

Abre el modelo recoge3.ods. Si te consulta si ejecuta Macro, responde que sí.

Selecciona todos los datos de la siguiente tabla y pide Edición - Copiar (en este mismo documento que lees)

Señala la primera celda de la zona de entrada de datos y pide Pegar. No te preocupes si se altera el color. Borra la celda que contiene el texto "Formato HTML". Deberás obtener en esa zona de entrada una copia de la tabla anterior.

Pasa a la hoja Agrupación. Como límite inferior elige 0 y como superior el 10, y fija en 10 el número de intervalos.

Obtendrás esta tabla:

Como ves, una Hoja de Cálculo bien programada te puede ahorrar mucho trabajo en la agrupación de datos. La X de la tabla es el punto medio de cada intervalo.

Abre la hoja de Med. paramétricas y toma nota de los valores de la media y la desviación típica. Después altera el valor del número de intervalos en la Hoja Agrupación. Podrás observar que los valores de ambas medidas se han alterado.

Cuando se agrupan los datos se pierde información y los cálculos se alteran.

Compara también esas medidas con las que se obtienen considerando los datos aislados. Están situados debajo de los de datos agrupados. Aprovecha para comparar también la asimetría y curtosis.

 


Práctica 4  (Profundización)


Datos cuantitativos con frecuencias

Cálculo de la media y la desviación típica

Vas a crear un modelo que gestione datos cuantitativos con frecuencias. Abre un archivo nuevo de OpenOffice. Crea en él la siguiente cabecera:

Para seguir mejor la explicación puedes usar las celdas comprendidas entre B3 y E3

El exponente de x al cuadrado lo consigues de esta forma:

Escribe el texto x2*n. Selecciona la celda que has escrito y haz un doble clic sobre ella. Con ello podrás editar el texto. Selecciona el 2 y pulsa el botón derecho. Así obtendrás un menú contextual en el que podrás elegir Estilo y después Superíndice. Si no te sale no es importante.

Debajo del rótulo Valor x escribe unos ocho datos e inventa a su lado otras tantas frecuencias. Si quieres corregirte, escribe estas:

Se deberá haber rellenado el rango B4:C11

Según la fórmula de la media para datos con frecuencias (consulta la teoría)

 

necesitamos los productos de x por n. Por tanto deberás insertar la fórmula del producto debajo de x*n (=B4*C4) y arrastrar luego todo hacia abajo. En la última celda deberás escribir el producto de x al cuadrado por su frecuencia (=B4*B4*C4). Deberá darte este resultado:

Para calcular la media y la desviación típica deberás sumar las tres columnas de la derecha con la función SUMA o con el botón de Autosuma

Deberás obtener estas tres sumas:

Frecuencias 33
 X por frec. 180
 X al cuadrado por frec. 1092

Elige una celda cualquiera para la media y escribe en ella la fórmula (lo expresamos con palabras. Después lo traduces tú a celdas):

        =suma de X por Frecuancia / Suma de Frecuancias

Elige otra para la desviación típica y escribe esta otra fórmula:

        =RAIZ(Suma de x al cuadrado por frec./suma de frec. - media al cuadrado)

Obtendrás estos resultados:

Importante: Guarda el archivo en alguna de tus carpetas, que te puede servir para realizar el Ejercicio 2


Gráfico lineal

Construiremos ahora un gráfico lineal para este ejemplo.

Selecciona las columnas Valor x y Frecuencia n, con sus rótulos superiores y pide Insertar - Diagrama

Sigue los pasos del asistente y selecciona el tipo Líneas en cualquiera de sus subtipos.

Decide en los siguientes pasos si incluyes leyenda o no y los títulos que desees. Te quedará un gráfico parecido a este:

Podemos mejorar este gráfico bastante. Sólo tienes que señalar el gráfico y hacer doble clic sobre él. Después puedes recorrer despacio con el ratón sus elementos y te irán apareciendo notas tales como Superficie del diagrama, Eje Y, Plano lateral, etc. Todos ellos son una invitación a que mejores la apariencia del gráfico: líneas, fondos, etc.

Practica un poco esos cambios: Recorres una zona, y cuando aparezca una nota, pulsas con el botón derecho o bien haces un doble clic con el izquierdo. Hay tantas posibilidades que es mejor que las descubras poco a poco.

Aquí tienes un ejemplo de cómo se ha cambiado la apariencia del gráfico anterior.

Intenta algo similar. En otras sesiones seguiremos con el tema de gráficos.

 


Ejercicio 1

Dados estos dos conjuntos de datos, averigua cuál de ellos presenta mayor variabilidad. Como las magnitudes de los datos no son parecidas, deberás usar el Coeficiente de Variación. Puedes calcular la media de cada conjunto y después dividir su desviación típica entre la media. Si deseas incluirlo todo en una fórmula, escribe DESVESTP(Rango del conjunto)/PROMEDIO(el mismo rango)

Conjunto 1

1

1

1

2

3

4

4

5

5

5

6

7

7

8

Conjunto 2

20

24

25

26

28

30

33

35

35

37

40

 

 

 

 


Ejercicio 2

Usa la hoja de cálculo que has creado en la Práctica 3 para en la siguiente tabla de frecuencias

x

0

5

10

15

20

25

30

35

f

3

7

6

12

14

8

7

6

a) Calcular la media y la desviación típica.

b) Construir un gráfico de barras en el que x figure en el eje X y las frecuencias en el eje Y.

c) Cambia el formato del gráfico hasta conseguir la mayor claridad y vistosidad posibles.

 


Ejercicio 3

Halla la media del siguiente conjunto de dos formas, una mediante la función PROMEDIO y otra usando el modelo recoge1.ods.

0  0  1  1  1  1  2  2  2  2  2  2  3  3  3  4  5  5  5  5  5  5  5  6  6  6  6  6  6  6  6  7  7  7  7  7  8  8  9  9  9

 


Uso en el aula

Herramientas


Hojas de cálculo para usar en clase

recoge2.ods

Modelo similar a recoge1.ods y recoge3.ods. Calcula las frecuencias de datos cuantitativos discretos aislados y construye tablas y gráficos a partir de ellos, así como el cálculo de media, mediana y moda.

cuantita.ods

Es muy parecido al anterior, pero contiene también algunos cálculos que se verán en la sesión siguiente. Es muy simple y rápido.

pondera1.ods

La media ponderada es muy útil para valorar varios aspectos de un trabajo escolar, a los que concedemos distinta importancia. Por ejemplo, en un modelo de Hoja de Cálculo confeccionado por alumnos se puede asignar 5 puntos al funcionamiento correcto, 3 a la presentación y 2 a los textos de apoyo.

Con este modelo se pueden valorar esos aspectos, o bien trabajos distintos, mediante la asignación de un peso a cada uno de ellos, y OpenOffice calcula la media ponderada como calificación final.

pondera2.ods

Similar al anterior, adaptado al cálculo de una sola media ponderada. Está construido para poderlo usar con los alumnos. Por eso contiene Sugerencias y Ejercicios, sólo unos pocos, para que los usuarios descubran más.

confrec.ods

Herramienta para obtener las medidas estadísticas en variables cuantitativas que estén presentadas como tablas de frecuencias.

movilmed.ods

Con esta hoja de cálculo observarás visualmente cómo afectan a la media y la mediana los valores extremos.

 


Documentos para usar

cuantita.htm

Estudio de datos cuantitativos. Documento creado para que los alumnos de Bachillerato repasen conceptos estudiados en 4º de E.S.O. Como en muchos centros no da tiempo de impartir estos conocimientos en su momento, también puede servir para iniciarlos en clases prácticas.

continuo.htm

Similar al anterior, pero estudia datos continuos agrupados en intervalos. También propone ajustes a la distribución normal.

 


Para ampliar


Propiedades de la media

En la exposición teórica hemos destacado dos propiedades fundamentales de la media:

a) La suma de las desviaciones de todos los datos respecto a la media es cero.

b) La suma de esas mismas desviaciones al cuadrado es la mínima posible comparada con las desviaciones respecto a otro número

Esto lo puedes comprobar con la siguiente práctica:

Abre el modelo propmed.ods. Sigue las instrucciones y rellena la columna de Valores con diez datos (o menos). Escribe a la derecha el número de datos en su celda correspondiente.

Cambia el valor de K varias veces y lee la suma de desviaciones que está situada en la parte inferior. Ve acercando los valores a la media y observarás que la suma se acerca a cero.

Haz lo mismo con la suma de cuadrados. Cambia los valores de K alrededor de la media y se cumplirá que su valor mínimo se corresponde con la media.