Conocer
elementos de la estadística descriptiva: mediadas de tendencia central, correlación
entre variables, pruebas de diferencias entre medidas: t de student y análisis
de varianza. Interpretación de los datos.
LAS MEDIDAS DE TENDENCIA CENTRAL
Las medidas de
tendencia central son puntos en una distribución, los valores medios o
centrales de esta, y nos ayudan a ubicarla dentro de la escala de medición.
Las principales medidas
de tendencia central son tres: moda, mediana y media.
La moda es la categoría o puntuación que ocurre con
mayor frecuencia. En la tabla 10.7, la moda es “1” (si se ha obtenido la cooperación).
Se utiliza con cualquier nivel de medición.
La mediana es el valor que divide la distribución por la mitad.
Esto es, la mitad de
los casos caen por debajo de la mediana y la otra mitad se ubica por encima de
la mediana. La mediana refleja la posición intermedia de la distribución. Por
ejemplo, si los datos obtenidos fueran:
24 31 35 35 38 43 45 50 57
La mediana es 38,
porque deja cuatro casos por encima (43, 45, 50 y 57) y cuatro casos por debajo
(35, 35, 31 y 24). Parte a la distribución en dos mitades. En general, para
descubrir el caso o la puntuación que constituye la mediana de una distribución,
simplemente se aplica la fórmula: (N+1) / 2.
Si tenemos nueve casos,
(9 + 1) / 2 entonces buscamos el quinto valor y este es la mediana.
Note que la mediana es
el valor observado que se localiza a la mitad de la distribución, no el valor
de cinco. La fórmula no nos proporciona directamente el valor de la mediana,
sino el número de caso en donde está la mediana.
La mediana es una
medida de tendencia central propia de los niveles de medición ordinal, por intervalos
y de razón. No tiene sentido con variables nominales, porque en este nivel no
hay jerarquías ni noción de encima o debajo. Asimismo, la mediana es
particularmente útil cuando hay valores extremos en la distribución. No es
sensible a estos. Si tuviéramos los siguientes datos:
24 31 35 35 38 43 45 50 248
la mediana seguiría
siendo 38.
Para la interpretación
de la media y la mediana, se incluye un artículo al respecto en el siguiente Ejemplo.
La media
es la medida de tendencia central más utilizada y puede definirse como el
promedio aritmético de una distribución. Se simboliza como
, y es la suma de todos los valores
dividida entre el número de casos. Es una medida solamente aplicable a mediciones
por intervalos o de razón. Carece de sentido para variables medidas en un nivel
nominal u ordinal. Su fórmula es:
Por ejemplo, si tuviéramos las
siguientes puntuaciones:
8 7 6 4 3 2 6
La media sería igual a:
La fórmula simplificada de la media es:
El símbolo “
” indica que debe efectuarse una sumatoria, X es el símbolo de una puntuación y N es el número total de casos o puntuaciones.
” indica que debe efectuarse una sumatoria, X es el símbolo de una puntuación y N es el número total de casos o puntuaciones.
La media si es sensible a valores
extremos. Si tuvieramos las siguientes puntuaciones:
8 7 6 4 3 2 6 9 20
Correlación entre dos variables
Determina la relación o dependencia que existe
entre las dos variables que intervienen en una distribución bidimensional.
Es decir, determinar si los cambios en una de
las variables influyen en los cambios de la otra. En caso de que suceda,
diremos que las variables están correlacionadas o que hay correlación entre
ellas.
Propiedades
1. El coeficiente de correlación no varía al
hacerlo la escala de medición.
Es decir, si expresamos la altura en metros o
en centímetros el coeficiente de correlación no varía.
2. El signo del coeficiente de correlación es
el mismo que el de la covarianza.
Si la covarianza es positiva, la correlación es
directa.
Si la covarianza es negativa, la correlación es
inversa.
Pruebas de
diferencias entre medidas:
t de student y
análisis de varianza.
T student
Prueba
t
Es una prueba
estadística para evaluar si dos grupos difieren entre sí de manera
significativa respecto a sus medias en una variable. Se simboliza: t.
Hipótesis:
de diferencia entre dos grupos. La hipótesis de investigación propone que los
grupos difieren entre sí de manera significativa y la hipótesis nula plantea
que los grupos no difieren significativamente. Ejemplo: dos escuelas
contrastadas en los resultados a un examen.
Variables:
la comparación se realiza sobre una variable (regularmente y de manera teórica:
dependiente). Si hay diferentes variables, se efectuarán varias pruebas t.
Nivel de medición de
la variable de comparación: intervalos o razón.
Cálculo e
interpretación: el valor t es calculado por el
programa estadístico. Por ejemplo SPSS, arrojan una tabla con varios
resultados.
La prueba t se basa
en una distribución muestral o poblacional de diferencia de medias conocida
como la distribución t de Student que se identifica por los grados de libertad,
los cuales constituyen el número de maneras en que los datos pueden variar
libremente. Son determinantes, ya que nos indican qué valor debemos esperar de
t, dependiendo del tamaño de los grupos que se comparan.