Cómo calcular la regresión lineal utilizando Excel (En 6 Pasos)
La regresión lineal es un concepto matemático que los estadísticos utilizan frecuentemente para estimar la ecuación de una línea entre un conjunto de puntos de datos que se cree están linealmente relacionados. Calcular la regresión lineal en Excel es un proceso de múltiples pasos que requiere varias celdas, debido al número de factores necesarios para calcular la ecuación lineal. Entendiendo al menos algunos de los conceptos y las matemáticas involucradas en la regresión lineal se puede promover una mayor apreciación y aptitud para la matemática estadística.
Paso 1
Escribe estos pares de datos a partir de la celda C3. Para este y el resto de los pasos, pulsa la tecla "Tab", donde se muestra una coma. Estos números son pares de datos recogidos de un experimento científico hipotético. En este experimento, se supone que existe la posibilidad de una relación lineal entre la primera columna de números "x" y la segunda columna "y".
X, Y 1, 5,2 2, 7,8 3, 10,7 4, 13,9 5, 16,5
Paso 2
Escribe estas otras tres columnas, comenzando con la primera celda a la derecha de la que contiene "y". Estas columnas son factores en los cálculos de la pendiente, intersección y valores R de ecuaciones lineales de la forma y = mx + b. La letra "m" es la pendiente, "b" es la ordenada en el origen y la "R" es una medida de precisión de qué tan cerca la línea calculada coincide con los puntos reales de datos. Cuanto "R" esté más cerca de 1,0, más cerca están los puntos de datos de la formación de una línea real cuyo "m" y "b" son los valores que estás calculando.
xy, x^2, y^2 c4d4, c4c4, d4*d4
Paso 3
Selecciona la segunda fila que acabas de escribir, haz clic en la esquina inferior derecha de la celda situada más a la derecha. Arrastra hacia abajo hasta que la selección sea de cinco filas de alto. Esta acción se extiende a todas las fórmulas de los pares de datos XY.
Paso 4
Escribe estas otras seis células empezando en la celda B11. Estas células contienen sumas de las columnas que has ingresado en el paso anterior.
n, sum of x, sum of y, sum of (xy), sum of (x^2), sum of (y^2) count(c4:c9), sum(c4:c9), sum (d4:d9), sum (e4:e9), sum (f4:f9), sum(g4:g9)
Paso 5
Escribe las fórmulas empezando en la celda C14. Estos son dos de los cuadrados de los cálculos de sumatoria que ingresaste en el paso anterior.
(sum of x)^2, (sum of y)^2 c12^2, d12^2
Paso 6
Escribe estas etiquetas y cálculos a partir de la celda C17. Estos son la pendiente, intersección "y" y valores "R" de la línea estimada, como se describe en el paso 2. Después de introducir estos cálculos finales, busca primero en el valor "R", 0,9994. Este número está cercano a 1,0, lo que significa que la línea que calculaste es cercana a ajustar los puntos de datos. A continuación, compara qué tan cerca la pendiente 2,87, está con el valor de 3,0, que es la pendiente de la línea que se usa para crear los puntos de datos para este artículo. Por último, relaciona el valor de ordenada en el origen 2,21, el valor 2,0, que es el punto de intersección de la ecuación lineal utilizado para crear puntos de datos para este artículo.
pendiente, (B12E12-C12D12)/(B12F12-C15) y-intercept, (D12-D17C12)/B12 R, (B12E12-C12D12)/SQRT((B12F12-C15)(B12*G12-D15))