Cómo calcular una matriz de correlación

Por peter flom
Cómo calcular una matriz de correlación.
Jupiterimages/Pixland/Getty Images

La correlación (r) es una medida de la relación lineal entre dos variables. Por ejemplo, la longitud de una pierna y del torso están altamente correlacionadas; la altura y el peso están menos correlacionados, y los valores de la altura y la longitud de un nombre (en letras) no están correlacionados.

Una correlación positiva perfecta: r = 1 (cuando uno sube el otro sube). Una correlación negativa perfecta: r = -1 (cuando uno sube, el otro baja). Sin correlación: r = 0 (no existe relación lineal).

Una matriz de correlación es una matriz de muchas correlaciones.

Cómo calcular una matriz de correlación con R

Paso 1

Obtén los datos. Si tus datos están en Excel el método más sencillo es guardarlos como un archivo .csv. En Excel 7 haz clic en "Archivo", luego en "Guardar como", después en "Otros formatos", a continuación en "Guardar como tipo" y desplázate hasta CSV (comma separated values, o valores separados por comas). Cada fila debe tener datos de un tema y cada columna debe ser una variable.

Paso 2

Lee los datos en R usando read.csv. Por ejemplo, si tus datos están en "c:\mydisk\mydir\data.csv" introduce mydata <- read.csv ("c:/mydisk/mydir/data.csv").

Paso 3

Calcula la matriz de correlación usando cor(). Por ejemplo: cor(mydata). O puedes almacenar la matriz de correlación como un objeto para su uso posterior usando: cormat <- cor(mydata).

Cómo calcular una matriz de correlación con SAS

Paso 1

Obtén los datos. SAS puede leer datos en muchos formatos. Si almacenas tu información en Excel coloca un tema en cada fila y una variable en cada columna.

Paso 2

Lee los datos en SAS. Puedes usar el asistente IMPORT para obtener tu información. Haz clic en "Archivo", luego en "Importar datos", a continuación elige un tipo de datos usando el menú desplegable. Haz clic en "Siguiente" y navega a tu información, y después haz clic en "Finalizar".

Paso 3

Calcula la matriz de correlación. Si tus datos se guardan en SAS como mydata, con las variables VAR1, VAR2 y VAR3, escribe: PROC CORR data = mydata; VAR var1 var2 var3; RUN;