![]() |
|
Portada >
Inicio temas >
Tema 3 - Medidas típicas - Índices
|
| Cuestión - Ejemplo | ¿Qué nivel verdadero tiene mi Martita? |
Carmina y Luis son dos padres angustiados por las notas de sus hijos. En la segunda evaluación, su hija Martita trae una calificación de Bien en tres asignaturas: Informática, Lengua española y Matemáticas. Sin embargo, ella confiesa que la parte de Gramática Española no se le da muy bien, y que en Matemáticas cree que va entre las mejores. Los padres se plantean: ¿En qué zona de la clase se encuentra nuestra hija? ¿Entre los diez mejores? ¿A nivel intermedio? ¿Es de las peores?
Los padres investigan el origen de las tres calificaciones de su Martita, visitando a los profesores, y descubren lo siguiente:
El profesor de Informática califica sumando puntos según los trabajos realizados. La máxima nota ha sido de 37, y a Martita, por obtener 25, le ha asignado un Bien.
El Bien de Lengua lo ha obtenido por un promedio de 3 en un rango entre 0 y 5.
Por último, en Matemáticas, obtuvo un 6 sobre 10, que también se interpretó como bien.
Los padres comparan la nota de su hija entre el máximo y obtienen esta proporción:
Informática 25/37 67,6% Lengua española 3/5 60% Matemáticas 6/10 60%
La cosa parece justa, pero ¿por qué su hija insiste en que le cuesta la Lengua más que las Matemáticas?
Vuelven a hablar con los profesores, insisten y obtienen estas tres preciadas tablas:
| Informática - 15 equipos - Notas aisladas | 17 | 30 | 22 | 15 | 35 | 28 | |||
| 30 | 37 | 20 | 25 | 20 | 15 | 28 | 32 | 28 | |
Lengua Española - 2ª Evaluación Distribución de notas 0 2 1 1 2 3 3 5 4 12 5 7
Matemáticas Frec. Calificaciones y equivalencias INS 4 12 SUF 5 10 BIEN 6 5 NOT 7,5 2 SOB 9 1
Así comprenden mejor las cosas, el de Mates es un hueso y ha suspendido a casi todos, luego el Bien de su Martita es muy valioso, sin embargo, en Lengua es de las peores. ¿Cómo podríamos expresar esto estadísticamente?
| En el resumen teórico puedes consultar todas las clases de medidas derivadas que se pueden usar en Estadística |
Medidas tipificadas
Medidas directas
La primera información que se obtiene de un estudio estadístico son las medidas directas, las que se derivan del proceso primitivo de medida. Martita sacó 17 en Informática, 3 en Lengua y 6 en Matemáticas. Esas son sus medidas directas, que no nos informan del verdadero nivel de la niña en su grupo.
Medidas diferenciales
Llamaremos medida diferencial correspondiente a una medida directa X a su diferencia con la media, es decir
x=X-M
Esta medida sitúa a los individuos según su distancia al centro de su grupo. Consulta el modelo martita.ods (primera hoja Tipificación), en el que se han trasladado los datos en forma aislada, sin frecuencias, para que veas qué funciones usa OpenOffice. En este caso sólo PROMEDIO y DESVESTP, que ya conoces. Se han nombrado a las medias med1, med2 y med3 respectivamente, y a las desviaciones típicas desv1, desv2 y desv3. Repasa en la Guía de OpenOffice la forma de insertar nombres en las celdas.
Las celdas correspondientes a las medidas diferenciales están en blanco rellénalas tú: resta a la nota de Martita en Informática (celda D6) la media del grupo. Así =D6-med1. Te deberá resultar -0,47. Encuentra igualmente sus medidas en las otras dos tablas.
Observarás que las medidas diferenciales que obtiene la niña son:
| Informática | -0,47 | Lengua | -0,5 | Matemáticas | 0,93 |
Aquí la información es más precisa: En Informática y Lengua está medio punto por debajo de la media, y en Matemáticas, casi un punto por encima. La niña tiene razón, las Matemáticas se le dan mejor.
Pero ¿tiene la misma importancia el medio punto en ambas asignaturas?
Medidas típicas (o tipificadas)
Para poder comparar las tres asignaturas, las medidas diferenciales se deben dividir entre la desviación típica, para compensar la distinta variabilidad de cada colectivo. Es como comparar la distancia de las notas de Martita a la media con la que se considera estándar: Medida 1 significa una distancia estándar (la desviación típica), medida 2, dos distancias, etc. e igual con las negativas. Para ello usaremos las medidas típicas z =(X-M)/s (consulta la teoría)
Rellena las celdas correspondientes dividiendo cada medida diferencial entre su desviación típica (desv1, desv2,...)
Ahora, en medidas Z, Martita obtiene:
| Informática | -0,07 | Lengua | -0,36 | Matemáticas | 0,76 |
Compruébalo.
La situación se aclara más todavía:
El medio punto en Informática corresponde a -0,07 respecto a s, es decir, que prácticamente Martita está en la media del curso.
El otro medio punto en Lengua es más importante: -0,36 respecto a s. Está un poco más baja en Lengua que en Informática.
En Matemáticas tiene una distancia de 0,76, casi una s, luego está bastante bien. En otro grupo hubiera sacado Notable, quizás.
|
|
La puntuación Z la puedes encontrar hoy en día en muchos boletines escolares, en análisis clínicos, estudios psicológicos y sociológicos, etc.
Se suelen considerar medidas dentro de la normalidad las comprendidas entre -1 y 1, extraordinarias las que pasen de 2 (o -2 por la parte inferior) y raras las que se acerquen o pasen de 3 y -3.
Índices de posición
Cuantiles
En la vida diaria los porcentajes suelen constituir una herramienta muy descriptiva. Si los padres de Martita descubren que sólo un 12% de sus compañeros saben más Matemáticas que ella quedarán perfectamente informados del nivel de su hija, y muy satisfechos al descubrir que ella supera al 88% de su clase. Por eso se usan los cuantiles o Índices de posición en Estadística Descriptiva, porque señalan el porcentaje de datos inferiores a uno dado, lo que lo sitúa muy bien dentro del colectivo.
| En el resumen teórico puedes consultar todos los índices de posición, que te ayudan a situar los individuos dentro de sus grupos. |
Así que otra forma de situar a un individuo en su grupo es a través de los cuantiles y de sus inversos los rangos-percentiles. El programa OpenOffice contiene casi todas las funciones para calcularlos:
Cuartiles: Si has leído la teoría, sabrás que se definen tres cuartiles en cualquier distribución de datos: Q1, que sólo tiene inferior a él el 25% de los datos, Q2, que coincide con la medina (50% de datos) y Q3, que supera al 75%.
OpenOffice usa la función CUARTIL(RANGO;NÚMERO) para calcularlos. En esa fórmula RANGO corresponde al de datos y NÚMERO debe ser 1, 2 o 3, según el cuartil. Lee las fórmulas en martita.ods
Por ejemplo, el cuartil Q1 de informática se ha calculado mediante =CUARTIL(Inform, 1), porque al rango de notas de Informática le hemos llamado inform.
Trata de calcular la Mediana y el tercer cuartil de lengua, que están en blanco. A las notas de Lengua se les ha asignado el nombre de lengua. Te debe dar en ambos el valor 4. Coinciden porque su diferencia es menor que la unidad.
Compara las notas de Martita con los distintos cuartiles y saca consecuencias.
Deciles: OpenOffice no calcula deciles o quintiles. Debemos sustituirlos por Percentiles, cambiando el número. Por ejemplo, el Decil 3 D3 se calcula como percentil del 30%.
Calcula el noveno decil de Lengua, que también está en blanco. Debe resultarte 5.
Percentiles: Se calculan con la función PERCENTIL(RANGO;TANTO POR UNO). Hay que observar que no se puede usar el tanto por ciento, sino el tanto por 1 (dividiendo entre 100). Así, el percentil 99, P99, ha de calcularse como PERCENTIL(RANGO;0,99).
| Recuerda que si declaras una celda con formato de porcentaje, aunque escribas el tanto por ciento, su verdadero valor es el de tanto por uno. Si en pantalla se lee 99%, es que vale 0,99. |
Rango percentil:
El Rango-percentil se define mediante la operación inversa de la del percentil. Si en este el dato es el porcentaje, y el percentil es el dato que supera a ese porcentaje, en el rango percentil se parte del valor del dato y se calcula qué porcentaje presenta de valores inferiores a él. Si Matita estuviera en el rango percentil 82 se interpretaría como que las puntuaciones inferiores a ella constituirían el 82% de los datos.
En OpenOffice se usa la función RANGO.PERCENTIL(RANGO;VALOR) Como en apartados anteriores, RANGO corresponde a los datos, y VALOR a la medida concreta cuyo percentil se desea conocer.
En el caso de Martita, estos cálculos (ver hoja cuantiles de martita.ods) descubren mucho mejor que las medidas tipificadas la verdadera situación de la alumna:
| Informática | P43 | Lengua | P21 | Matemáticas | P76 |
En Informática tiene al 43% de los compañeros con peor rendimiento que ella, en Lengua sólo al 21% (ella está muy baja), y, sin embargo, en Matemáticas supera al 76%.
Abre la hoja Gráficos y comprobarás en ella el distinto nivel que una calificación de Bien puede representar según el grupo de alumnos y la nota numérica de la que proceda. En las tablas auxiliares de la derecha puedes descubrir cómo se han creado los gráficos.
Cálculo de cuantiles en datos agrupados
La Hoja de Cálculo OpenOffice sólo calcula de forma automática los cuantiles si los datos están aislados. En el caso de agrupados deberemos calcularlo nosotros, o construir un modelo especial para ello. Practicaremos estas posibilidades. Procederemos a calcular los cuantiles en este caso, en primer lugar de forma manual, como un ejercicio para alumnos, y después en forma automática.
Abre el modelo cuantiles.ods. En su primera parte te ayuda a encontrar cuantiles en datos agrupados y más abajo en datos aislados. Esta última parte es muy sencilla y no practicaremos con ella.
Intentaremos calcular algunos percentiles sobre la siguiente tabla:
| X | n |
| 50 | 20 |
| 53 | 30 |
| 56 | 40 |
| 59 | 50 |
| 62 | 24 |
| 65 | 22 |
| 68 | 14 |
Cópiala en el modelo cuantiles.ods. Lo puedes hacer de forma manual o bien con Copiar y Pegar. En este caso se puede alterar la presentación, pero no importa. Borra los datos sobrantes con la tecla Supr. Por último, escribe como amplitud 3, pues esa es la distancia que existe entre cada dato y el siguiente.
Deberá quedar así:

En la figura observarás el cálculo del percentil P60. Si quieres reproducir los cálculos que ha efectuado OpenOffice, recuerda la fórmula para los percentiles:

Intenta calcularlo tú desde los datos que te da el programa: Lím. inferior 57,5, N = 200, ...y quedaría así:
=57,5+(200*60/100-90)/50*3
Copia esta fórmula en una celda cualquiera de OpenOffice y comprobarás que te resulta 59,3.
Inténtalo de nuevo. Calcula el percentil 70 de esta tabla.
| X | n |
| 6 - 20 | 3 |
| 21-35 | 5 |
| 36-50 | 7 |
| 51-65 | 2 |
| 66-80 | 3 |
Para ello deberás sustituir cada intervalo por su punto medio o marca de clase: en lugar de 6-20, su media 13, en lugar de 21-35, 28, etc. y copiar los datos en OpenOffice. Quedará así:

Calcula P70 y comprueba si te resulta 48,357.
¿Qué datos entran dentro de la normalidad?
En todas las disciplinas que usan la Estadística se plantea el tema de qué datos se consideran anormales dentro de la experiencia o de la teoría. Muchos investigadores rechazan el 5% de los datos excesivamente grandes o pequeños. Otros se quedan con el 85% de los valores centrales. Como veremos en otro tema, las puntuaciones Z están relacionadas con esos porcentajes cuando los datos siguen de forma aproximada las distribuciones teóricas.
En esta práctica visualizaremos los límites de "normalidad" de los datos, expresados mediante la puntuación Z.
Abre el modelo grafiz.ods. En su primera hoja se admiten los datos aislados que desees estudiar, así como la puntuación Z que consideres límite de la normalidad de la medida. Un valor de 2 suele ser bastante representativo, pues deja fuera un 4% aproximado de los datos (en distribuciones aproximadamente normales)
Por ejemplo, en los datos
| 4 | 6 | 5 | 3 | 6 | 5 | 7 | 6 |
| 5 | 2 | 4 | 6 | 8 | 9 | 2 | 2 |
¿Qué datos quedan fuera de las puntuaciones Z=-2 y Z=2?
Escribe esos datos en columna en la zona amarilla de la hoja Datos. Fija como puntuación Z el 2.
Consulta la hoja Gráfico. Se ve perfectamente que sólo el dato 9 está en el límite de la normalidad (tal como la hemos entendido)

Dado el conjunto de datos que figura en las celdas de color naranja, complétalo en una hoja de cálculo para calcular las medidas típicas contenidas en las celdas de color amarillo, y especialmente, comprueba que la media de estas últimas es 0 y su desviación típica 1.
Para ello puedes capturar los dato de color naranja en este mismo documento.
|
|
Datos |
|
|
|
Medidas típicas |
|
|
|
|
|
|
|
|
|
| 3 | 7 | 7 |
|
-0,89 | 1,31 | 1,31 |
| 4 | 6 | 9 |
|
-0,34 | 0,76 | 2,42 |
| 4 | 5 | 2 |
|
-0,34 | 0,21 | -1,45 |
| 5 | 6 | 3 |
|
0,21 | 0,76 | -0,89 |
| 4 | 5 | 5 |
|
-0,34 | 0,21 | 0,21 |
| 5 | 4 | 1 |
|
0,21 | -0,34 | -2 |
| 6 | 3 | 3 |
|
0,76 | -0,89 | -0,89 |
|
|
|
|
|
|
|
|
| Media |
|
4,62 |
|
Media |
|
0 |
|
|
|
|
|
|
|
|
| Desviación típica |
|
1,81 |
|
Desviación típica |
|
1 |
Ejercicio 2
Dada la siguiente distribución de notas, se pide:
(a) Sustituir cada intervalo por su media (1,3,5...) y mediante la hoja de cálculo rangoper.ods asigna a cada una de esas medias el rango percentil correspondiente. (Solución: 9, 35, 71, 90, 98 - El cálculo de este último puede producir un error. Para evitarlo puedes añadir a la tabla el dato 11 con frecuencia 0)
| Intervalos | Frecuencias |
| De 0 a 2 | 5 |
| De 2 a 4 | 12 |
| De 4 a 6 | 17 |
| De 6 a 8 | 9 |
| De 8 a 10 | 4 |
(b) Encuentra, mediante la hoja de cálculo cuantiles.ods la mediana y los cuartiles de la distribución anterior.
Solución: Mediana 4,675. Primer cuartil 3,125. Segundo cuartil 6,278
Ejercicio 3
Dada la esta tabla de datos de carácter temporal
| Año | 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | 2005 | 2006 |
| Producción en T | 870 | 921 | 950 | 1200 | 1350 | 1480 | 1520 | 1700 |
Se desea transformarla en otra con índices de base el año 2000. Encuentra en el apartado de herramientas la que más te convenga para lograrlo.
Solución:
| 94 | 100 | 103 | 130 | 147 | 161 | 165 | 185 |
Ahora cambia la base al año 2003
Solución:
| 64 | 68 | 70 | 89 | 100 | 110 | 113 | 126 |
¿Por qué constante hay que multiplicar cualquier índice de esta tabla segunda para que resulte el correspondiente índice en la primera?
Solución:
Aproximadamente por 1,47 (índice relativo 146,6)
Hoja de cálculo diseñada para calcular el índice de concentración de una distribución (ver Para ampliar)
Herramienta para calcular los cuantiles en distribuciones con frecuencias
En muchas aplicaciones es conveniente visualizar los datos relacionados con el valor de la desviación típica: m-2s, m-s, m+s, m+2s,...
Modelo que gestiona los números índices que se pueden definir en una serie (ver la sección Para ampliar)
Los cuantiles representan muy bien las distintas zonas de un grupo, para después poder encajar entre ellos el dato concreto que nos interese. Se puede orientar el estudio en sentido opuesto: dada una puntuación, ¿qué percentil se le puede asignar? Según el resumen teórico, el rango percentil posee una fórmula sencilla para el cálculo manual. Con este modelo puedes obtenerlo de forma automática.
Calcula las puntuaciones típicas de una distribución de datos agrupados.
Lee en la teoría el apartado de Números índices.
Aunque estos índices se usan sobre todo en Economía, para observar el progreso de los alumnos o la evolución de algunas medidas en los centros (matriculación en el último decenio, progreso de un alumno en las distintas evaluaciones, etc.) pueden ser muy útiles.
Veremos simplemente un ejemplo:
Un profesor de Informática asigna tres puntuaciones a sus equipos de trabajo en cada mes. Con ellas desea evaluar los conocimientos (de 0 a 10), la corrección de los trabajos (0 a 15) y su estética (0 a 3) respectivamente. Desea resumir el progreso de uno de esos grupos a lo largo de varios meses.
Abre el modelo indices.ods. En él figuran los datos del profesor en la siguiente tabla ( la cuarta serie queda en blanco):
| Mes | Conocimientos | Corrección | Estética |
| Octubre | 5 | 3 | 2 |
| Noviembre | 5 | 3 | 3 |
| Diciembre | 6 | 2 | 3 |
| Enero | 6 | 4 | 2 |
| Febrero | 5 | 6 | 1 |
| Marzo | 6 | 8 | 2 |
| Abril | 7 | 12 | 2 |
| Mayo | 7 | 10 | 3 |
| Junio | 7 | 14 | 3 |
Si ya has leído la teoría, sabrás que para obtener números índices hay que declarar una base. Si ese profesor cree que los dos primeros meses son "de despiste" y quiere estudiar el progreso a partir de Diciembre, declararía como base para los conocimientos el 6, en la segunda columna el 2 y en la tercera el 3. Esto lo escribiría en la fila rotulada como Bases. Observa los resultados que da OpenOffice:

En la tercera columna no se observa apenas progreso, pero en la segunda, salvo un bache en Diciembre, va subiendo hasta un 700% respecto a Diciembre.
Cambia las bases a tu gusto y observarás como cambian los índices.
Si el profesor desea estudiar las tres calificaciones globalmente, les asignará un peso a cada una. En el modelo hemos fijado esos pesos en 10, 15 y 3, que es la importancia que el profesor les dio. Quedaría así un índice compuesto. Antes debes escribir un 3 en la base de ese índice, para que se use Diciembre, que es el tercer mes.
Ahora se ve que, en conjunto, el progreso ha sido más equilibrado, no llega al 300%.
Prueba con tus alumnos a estudiar con este modelo la subida del coste de vida, o el nivel de renta español, etc.
En la parte derecha de la tabla están situados los índices en cadena. Con ellos puedes calcular, mediante producto, los índices parciales entre dos elementos.
Para comprobar esa propiedad abre la hoja Índice entre dos elementos y encuentra el índice existente entre el valor 6 de la segunda serie en Febrero y el de 10 en Mayo. Escribe los dos datos y obtendrás como índice entre ambos 166,66%.
Observa en la tabla de índices en cadena que los incluidos en la segunda serie, entre el 6 y el 10 son: Celda M15: 133, celda M16: 150 y celda M17: 83. Busca una celda cualquiera en blanco y escribe
=PRODUCTO(M15:M17)
Estudia lo que obtienes y si demuestra o no la propiedad del producto de índices en cadena.
Cuando una serie de datos representa una magnitud acumulable (dinero, producción, etc.) nos podemos plantear si esa magnitud está bien repartida o no. Casos típicos son el reparto de salarios en una empresa, la producción industrial de los países o el reparto de la riqueza en el mundo. La mayor o menor equidad en el reparto viene representada por la concentración. Esta es una magnitud convencional que se mide por el índice de Gini. No vamos a profundizar en este concepto, pero es bueno incluirlo en este curso simplemente para que se conozca su existencia y facilitar la profundización en el tema a quien lo desee.
Para estudiar la concentración o equidad debemos definir dos índices P y Q.
P representa las frecuencias relativas acumuladas de la tabla que estemos estudiando.
Q equivale a la acumulación relativa de los productos de cada dato X por su frecuencia. Si P es el número de individuos, Q es la acumulación de la magnitud entre todos los individuos. Por ejemplo:
Dos profesores de un colegio presentan las siguientes distribuciones de notas, si se traducen INS,SUF,BIEN, etc por 1,2,3,4,5
| Calificación | Profesora A | Profesor B |
| 1 | 5 | 10 |
| 2 | 15 | 5 |
| 3 | 17 | 5 |
| 4 | 12 | 5 |
| 5 | 1 | 25 |
¿Cuál de los dos profesores ha repartido sus calificaciones de manera más uniforme?
En la profesora A las P y Q tienen los valores
| Profesora A | P (individuos) | Q (indiv. por notas) |
| 5 | 0,10 | 0,04 |
| 15 | 0,40 | 0,25 |
| 17 | 0,74 | 0,62 |
| 12 | 0,98 | 0,96 |
| 1 | 1 | 1 |
y en el profesor B
| Profesor B | P (individuos) | Q (indiv. por notas) |
| 10 | 0,20 | 0,06 |
| 5 | 0,30 | 0,11 |
| 5 | 0,40 | 0,19 |
| 5 | 0,50 | 0,31 |
| 25 | 1 | 1 |
Se ve que en el profesor B la masa de notas Q crece muy poco a poco, mucho menos que en A. Además, en esta profesora las P y Q se parecen más. Parece que ella reparte mejor las calificaciones, con más equidad. En el profesor B los sobresalientes son demasiados.
Estadísticamente esta propiedad de concentración se mide con el índice de Gini, definido por

Este índice está comprendido entre 0 (distribución equitativa) y 1 (distribución totalmente desequilibrada).
Abre el modelo concentra.ods y rellena las dos primeras columnas con las frecuencias de la profesora A: 5, 15, 17... y borra lo sobrante por abajo con la tecla Supr. Pasa a la segunda hoja de Resultados y leerás el índice de Gini para ella, que será de 0,157, bastante bajo. Si observas la curva de Lorenz de esa hoja, observarás que compara P y Q. La P viene representada por la línea recta y la Q por la curva. No hay demasiadas diferencias entre ellas.

Cambia ahora las frecuencias por las del profesor B.
Ahora el índice es mucho mayor: 0,524 y la curva de Lorenz más curvada.

Luego el profesor reparte sus calificaciones de una forma menos equitativa que la profesora.