Análisis conjunto de dos variables
Asociación entre dos variables cualitativas
Los valores positivos indican una relación entre ambas variables. Los negativos indican una relación negativa entre ambas variables.
Chi cuadrado: uno de los inconvenientes es su difícil interpretación puesto que desconocemos su límite superior. Sólo sabemos que tiene valor cero, cuando no hay relación entre las dos variables.
Para resolver este problema, de acuerdo al valor obtenido de X2, se ha definido el índice o Coeficiente de Contingencia, C. Esté índice toma los valores 0<C<1
Características del coeficiente de contingencia, C :
puede asumir valores mayores o iguales a cero y menores que 1.
El valor 0 lo alcanza cuando X2 = 0 -> indica que las dos variables no tienen relación y, además, las frecuencias empíricas coinciden con las teóricas
El valor 1 sólo lo consigue si n = 0, lo que implica que no hay observaciones
Cuanto mayor es el valor de C, mayor es la relación
Otro aspecto más complejo de fundamentar es la causalidad en un C. Cuando existe un valor elevado en nuestro coeficiente de contingencia, no se puede afirmar que una de las variables es causa de la otra.
Se puede estimar, en casos en que la tabla de contingencia tenga igual número de filas que de columnas, un valor máximo que puede alcanzar C.
Correlación entre dos variables cuantitativas
Covarianza: hace referencia a la variación conjunta de dos variables y nos permite estudiar la posible relación entre X e Y. El signo positivo o negativo indica si la relación lineal entre ambas es directa o inversa:
Relación lineal directa: a mayores valores de una variable, mayores de la otra
Relación lineal inversa: a mayores valores de una variable, menores de la otra Inconvenientes: desconocemos el rango de la covarianza. Para evitar este problema disponemos del Coeficiente de Correlación de Pearson, rxy.
Propiedades de la correlación de Pearson:
Toma valores comprendidos entre –1 y 1.
Vale 0 cuando no existe relación lineal entre ambas variables
rxy = ± 1 si una variable es la transformación lineal de la otra.
Para interpretar los resultados hay que tener en cuenta en primer lugar el valor absoluto, cuanto mayor es nos indica que la relación lineal es más fuerte. En segundo lugar, el signo: si es positivo es relación directa, si es negativo, inversa.
El coeficiente de correlación lineal sólo detecta relaciones lineales entre dos variables.
Por tanto, un coeficiente de correlación lineal cercano a cero, indica que no existe relación lineal entre las variables, pero no excluye la posibilidad de que las variables tengan otras relaciones entre sí de carácter no lineal.
Cuando tenemos un valor intermedio como por ejemplo 0, 55 es difícil afirmar si la correlación es alta o baja. Un número grande de sujetos en la muesta pueden tender a bajar el valor de los coeficientes que se obtienen. El coeficiente de correlación evaluado por nosotros será bajo, si los coeficientes de correlación que obtienen otros investigadores en circunstancias similares, son mucho más altos.
Cuando existe un Coeficiente de correlación elevado entre dos variables, no se puede afirmar que una de las variables es causa de la otra. Hay que ser muy cuidadoso en este aspecto.
Regresión lineal
Cuando existe una relación lineal podemos usar la denominada recta de regresión.
Yi’ = a + bXi
Donde b es la pendiente y a es la ordenada de origen