Regresion Lineal Multiple Ejercicios Resueltos A Mano -
Para resolver un ejercicio de regresión lineal múltiple a mano, generalmente se utiliza el método de mínimos cuadrados ordinarios para encontrar los coeficientes que mejor ajustan un modelo del tipo .
A continuación, se detalla un ejercicio resuelto paso a paso para un modelo con dos variables independientes ( ). Ejercicio de ejemplo Datos iniciales ( ): (Respuesta) X1cap X sub 1 X2cap X sub 2 1. Calcular productos y cuadrados
El primer paso es obtener las sumatorias necesarias para construir el sistema de ecuaciones. 2. Plantear el sistema de ecuaciones normales Para encontrar a mano, resolvemos el siguiente sistema: Sustituyendo nuestros valores: 3. Resolver el sistema Podemos usar el método de eliminación o matrices. De la ec. (1): Sustituyendo β0beta sub 0 en (2): Sustituyendo β0beta sub 0 en (3): Resolviendo las dos ecuaciones restantes: (multiplicamos por -2) Sumamos: Sustituimos: Calculamos β0beta sub 0 : Ecuación Final ✅
La ecuación de regresión estimada para este conjunto de datos es:
Ŷ=5+5X1+0X2cap Y hat equals 5 plus 5 cap X sub 1 plus 0 cap X sub 2 Esto indica que, por cada unidad que aumenta X1cap X sub 1 , aumenta 5 unidades (manteniendo X2cap X sub 2 constante), mientras que X2cap X sub 2
no tiene un efecto lineal directo en este modelo simplificado.
¿Te gustaría que resolvamos otro ejercicio con datos diferentes o que profundicemos en el método matricial? Multiple linear regression with matrices and by hand
Para dominar la regresión lineal múltiple a mano, imagina que eres el dueño de un pequeño negocio de jugos. Quieres predecir tus ventas diarias ( ) basándote en dos factores: la inversión en publicidad ( X1cap X sub 1 ) y la temperatura ambiente ( X2cap X sub 2 ).
Aquí tienes la "historia" de cómo resolverías este problema paso a paso. 1. El Escenario: Tus Datos
Recolectas datos de 5 días para ver cómo afectan tus variables a las ventas ( Publicidad ( X1cap X sub 1 X2cap X sub 2 El objetivo es hallar la ecuación: 2. El Nudo: El Proceso Matemático
Resolver esto "a mano" implica seguir un orden riguroso para no perderse en los números. Paso 1: Cálculos Básicos
Primero, debes crear una tabla extendida calculando los cuadrados y productos cruzados de cada fila: X12cap X sub 1 squared X22cap X sub 2 squared Paso 2: Sumatorias de Regresión
Suma cada columna de tu tabla. Luego, usa las fórmulas de desviación para simplificar el sistema (esto ayuda a que los números sean más pequeños y manejables): (Repite para todas las combinaciones posibles). Paso 3: Resolver los Coeficientes (
Utiliza las fórmulas específicas para un modelo de dos variables: :
(∑x22)(∑x1y)−(∑x1x2)(∑x2y)(∑x12)(∑x22)−(∑x1x2)2the fraction with numerator open paren sum of x sub 2 squared close paren open paren sum of x sub 1 y close paren minus open paren sum of x sub 1 x sub 2 close paren open paren sum of x sub 2 y close paren and denominator open paren sum of x sub 1 squared close paren open paren sum of x sub 2 squared close paren minus open paren sum of x sub 1 x sub 2 close paren squared end-fraction :
(∑x12)(∑x2y)−(∑x1x2)(∑x1y)(∑x12)(∑x22)−(∑x1x2)2the fraction with numerator open paren sum of x sub 1 squared close paren open paren sum of x sub 2 y close paren minus open paren sum of x sub 1 x sub 2 close paren open paren sum of x sub 1 y close paren and denominator open paren sum of x sub 1 squared close paren open paren sum of x sub 2 squared close paren minus open paren sum of x sub 1 x sub 2 close paren squared end-fraction Paso 4: El Intercepto (
Una vez tienes las pendientes, el punto de partida es fácil: 3. El Desenlace: Interpretación de Resultados Supongamos que tras tus cálculos obtienes:
: Si no inviertes nada en publicidad y hace 0 grados, venderías 20 jugos (teóricamente).
: Por cada peso extra en publicidad, tus ventas suben 15 unidades, manteniendo la temperatura constante. regresion lineal multiple ejercicios resueltos a mano
: Por cada grado que sube la temperatura, vendes 4 jugos más, manteniendo la publicidad constante. Herramientas de Apoyo
Si los cálculos matriciales se vuelven muy complejos para hacerlos totalmente a mano, puedes consultar guías paso a paso en sitios como Statology o ver ejemplos prácticos en YouTube.
¿Te gustaría que apliquemos estos pasos a un conjunto de números específicos para ver cómo queda la tabla de sumatorias? Regresión Lineal Múltiple Paso a Paso | PDF - Scribd
La regresión lineal múltiple (RLM) es un método estadístico para modelar la relación entre una variable dependiente ( ) y dos o más variables independientes (
). Resolver estos ejercicios a mano generalmente implica el uso de álgebra matricial o sistemas de ecuaciones normales para encontrar los coeficientes ) que minimizan el error. Ejemplo Resuelto: Modelo con dos variables independientes Supongamos que queremos predecir la Recaudación ( ) basándonos en el gasto en Publicidad TV ( ) y Volantes ( ). La ecuación estimada es:
ŷ=β0+β1x1+β2x2y hat equals beta sub 0 plus beta sub 1 x sub 1 plus beta sub 2 x sub 2 1. Preparar las sumatorias básicas
Para resolver el sistema sin matrices complejas, primero debes calcular las sumatorias de cada variable y sus productos cruzados: 2. Calcular las sumas de cuadrados corregidas
Se utilizan las desviaciones respecto a la media para simplificar el cálculo de los coeficientes 3. Resolver para los coeficientes de pendiente (
Utiliza las siguientes fórmulas derivadas de las ecuaciones normales:
b1=(SSx2)(SPx1y)−(SPx1x2)(SPx2y)(SSx1)(SSx2)−(SPx1x2)2b sub 1 equals the fraction with numerator open paren cap S cap S sub x sub 2 close paren open paren cap S cap P sub x sub 1 y end-sub close paren minus open paren cap S cap P sub x sub 1 x sub 2 end-sub close paren open paren cap S cap P sub x sub 2 y end-sub close paren and denominator open paren cap S cap S sub x sub 1 close paren open paren cap S cap S sub x sub 2 close paren minus open paren cap S cap P sub x sub 1 x sub 2 end-sub close paren squared end-fraction
b2=(SSx1)(SPx2y)−(SPx1x2)(SPx1y)(SSx1)(SSx2)−(SPx1x2)2b sub 2 equals the fraction with numerator open paren cap S cap S sub x sub 1 close paren open paren cap S cap P sub x sub 2 y end-sub close paren minus open paren cap S cap P sub x sub 1 x sub 2 end-sub close paren open paren cap S cap P sub x sub 1 y end-sub close paren and denominator open paren cap S cap S sub x sub 1 close paren open paren cap S cap S sub x sub 2 close paren minus open paren cap S cap P sub x sub 1 x sub 2 end-sub close paren squared end-fraction 4. Calcular el intercepto ( Una vez obtenidos
, el intercepto se calcula usando las medias de las variables (
b0=ȳ−b1x̄1−b2x̄2b sub 0 equals y bar minus b sub 1 x bar sub 1 minus b sub 2 x bar sub 2 5. Formular la ecuación final e interpretar Sustituye los valores en la ecuación Ejemplo de interpretación: Si , por cada unidad que aumenta el gasto en TV ( ), la recaudación (
) aumenta en 3.15 unidades, manteniendo constante el gasto en volantes ( Recursos para práctica adicional
Ejercicios de RLM (Academia.edu): Incluye casos prácticos con datos reales de recaudación municipal.
Guía paso a paso en PDF (Scribd): Tutorial detallado para realizar el cálculo manual sin software.
Manual de Econometría (Jaime de Pablo): Un manual completo de ejercicios resueltos paso a paso.
¿Te gustaría que desarrollemos un ejercicio con datos numéricos específicos para ver cómo se aplican estas fórmulas paso a paso? Multiple linear regression with matrices and by hand Para resolver un ejercicio de regresión lineal múltiple
Introducción
La regresión lineal múltiple es una de las técnicas más poderosas y utilizadas en la estadística predictiva y la econometría. A diferencia de la regresión simple, que modela la relación entre una variable dependiente ((Y)) y una sola independiente ((X)), la regresión múltiple incorpora dos o más variables predictoras.
El modelo teórico se expresa como:
[ Y_i = \beta_0 + \beta_1 X_1i + \beta_2 X_2i + \dots + \beta_k X_ki + \varepsilon_i ]
Donde:
- (Y_i) es la variable dependiente (respuesta).
- (X_1i, X_2i, \dots, X_ki) son las variables independientes (predictoras).
- (\beta_0) es el intercepto (valor de Y cuando todas las X son cero).
- (\beta_1, \beta_2, \dots, \beta_k) son los coeficientes parciales de regresión.
- (\varepsilon_i) es el error aleatorio.
Resolver un modelo de regresión lineal múltiple "a mano" implica calcular los estimadores (\hat\beta_0, \hat\beta_1, \hat\beta_2) utilizando álgebra matricial o sistemas de ecuaciones normales. Aunque hoy día el software estadístico lo hace en segundos, hacerlo manualmente proporciona una comprensión profunda de la geometría y la lógica subyacente.
En este artículo, resolveremos dos ejercicios completos paso a paso, utilizando el método de ecuaciones normales y el método matricial.
Paso 2: Calcular todas las sumatorias
Construimos una tabla auxiliar:
| (Y) | (X_1) | (X_2) | (X_1^2) | (X_2^2) | (X_1 X_2) | (X_1 Y) | (X_2 Y) | |-------|---------|---------|------------|------------|-------------|-----------|-----------| | 23 | 2 | 3 | 4 | 9 | 6 | 46 | 69 | | 26 | 3 | 4 | 9 | 16 | 12 | 78 | 104 | | 30 | 5 | 5 | 25 | 25 | 25 | 150 | 150 | | 34 | 6 | 6 | 36 | 36 | 36 | 204 | 204 | | 37 | 8 | 7 | 64 | 49 | 56 | 296 | 259 | | Suma | | | | | | | | | (\sum Y = 150) | (\sum X_1 = 24) | (\sum X_2 = 25) | (\sum X_1^2 = 138) | (\sum X_2^2 = 135) | (\sum X_1 X_2 = 135) | (\sum X_1 Y = 774) | (\sum X_2 Y = 786) |
Además (n=5), (\sum Y = 150), (\sum X_1 = 24), (\sum X_2 = 25).
Paso 2: Estimar por Mínimos Cuadrados Ordinarios
La solución es: [ \hat\boldsymbol\beta = (\mathbfX'\mathbfX)^-1 \mathbfX'\mathbfY ]
Paso 5: Ecuación final
Ŷ = -15.12 + 1.534 X₁ + 0.807 X₂
Interpretación:
- Por cada m² adicional, el precio aumenta ~1.534 miles de $ (manteniendo antigüedad constante).
- Por cada año adicional de antigüedad, el precio aumenta ~0.807 miles de $ (manteniendo m² constante).
- Intercepto negativo: no tiene sentido práctico (fuera del rango de datos), pero matemáticamente ajusta.
Paso 4: Invertir la matriz (X'X) – Método de adjunta (a mano)
Invertir matriz 3x3 manualmente es tedioso pero posible. Usaremos la fórmula A^-1 = (1/det(A)) * adj(A).
Sea A = X'X.
4.1 Calcular determinante de A:
det(A) = 5 * det([102, 146; 146, 210]) - 22 * det([22, 146; 32, 210]) + 32 * det([22, 102; 32, 146])
Primer menor: (102210 - 146146) = 21420 - 21316 = 104
Segundo menor: (22210 - 14632) = 4620 - 4672 = -52
Tercer menor: (22146 - 10232) = 3212 - 3264 = -52
Entonces:
det = 5*(104) - 22*(-52) + 32*(-52) = 520 + 1144 - 1664 = 0
¡Det = 0? Eso indicaría multicolinealidad perfecta. Revisemos datos. Observamos: en las observaciones 1 y 5 X₁=4, X₂=6. Pero veamos: X₂ = X₁ + 2? 4+2=6, 5+2=7, 3+2=5, 6+2=8. ¡Es exacto! X₂ = X₁ + 2. Por lo tanto, hay relación lineal exacta. No podemos estimar β₁ y β₂ únicos. Esto es un excelente hallazgo didáctico: la regresión múltiple a mano falla si hay multicolinealidad perfecta. Introducción La regresión lineal múltiple es una de
Conclusión didáctica: Para resolver a mano, necesitamos variables no linealmente dependientes. Cambiemos ligeramente los datos del ejercicio 1 para que sea resoluble.
Paso 5: Resolver (\mathbfX'\mathbfX \hat\boldsymbol\beta = \mathbfX'\mathbfY)
El sistema es:
[ \begincases 4\beta_0 + 10\beta_1 + 7\beta_2 + 10\beta_3 = 55 \ 10\beta_0 + 30\beta_1 + 21\beta_2 + 30\beta_3 = 151 \ 7\beta_0 + 21\beta_1 + 18\beta_2 + 21\beta_3 = 113 \ 10\beta_0 + 30\beta_1 + 21\beta_2 + 30\beta_3 = 151 \endcases ]
Vemos que las ecuaciones 2 y 4 son iguales, por lo que tenemos infinitas soluciones (multicolinealidad). Elegimos una solución particular: hacemos (\beta_3 = 0).
Con (\beta_3=0), el sistema se reduce a:
(1) (4\beta_0 + 10\beta_1 + 7\beta_2 = 55)
(2) (10\beta_0 + 30\beta_1 + 21\beta_2 = 151)
(3) (7\beta_0 + 21\beta_1 + 18\beta_2 = 113)
Resolvemos:
Multiplicamos (1) por 2.5: (10\beta_0 + 25\beta_1 + 17.5\beta_2 = 137.5)
Restamos de (2): ((10-10)\beta_0 + (30-25)\beta_1 + (21-17.5)\beta_2 = 151 - 137.5) ⇒ (5\beta_1 + 3.5\beta_2 = 13.5) (I)
Multiplicamos (1) por 1.75: (7\beta_0 + 17.5\beta_1 + 12.25\beta_2 = 96.25)
Restamos de (3): ((7-7)\beta_0 + (21-17.5)\beta_1 + (18-12.25)\beta_2 = 113 - 96.25) ⇒ (3.5\beta_1 + 5.75\beta_2 = 16.75) (II)
Resolvemos (I) y (II):
(I) × 3.5: (17.5\beta_1 + 12.25\beta_2 = 47.25)
(II) × 5: (17.5\beta_1 + 28.75\beta_2 = 83.75)
Restamos: ((28.75-12.25)\beta_2 = 83.75 - 47.25) ⇒ (16.5\beta_2 = 36.5) ⇒ (\beta_2 = 2.2121)
Luego (5\beta_1 + 3.5(2.2121)=13.5) ⇒ (5\beta_1 = 13.5 - 7.7424 = 5.7576) ⇒ (\beta_1 = 1.1515)
De (1): (4\beta_0 + 10(1.1515) + 7(2.2121) = 55)
(4\beta_0 + 11.515 + 15.4847 = 55) ⇒ (4\beta_0 + 27 = 55) ⇒ (4\beta_0 = 28) ⇒ (\beta_0 = 7)
Modelo elegido (con (\beta_3=0)): [ \hatY = 7 + 1.1515 X_1 + 2.2121 X_2 ]
Nota: La multicolinealidad revela que (X_3) no aporta información adicional si ya tenemos (X_1) y (X_4)(??)… En este caso, (X_3) es combinación lineal.
Solved Exercise 2: Predicting Sales
Problem: A company wants to predict sales ((Y) in $1000) based on advertising spend ((X_1) in $1000) and number of salespeople ((X_2)). Data for 4 weeks:
| Week | (X_1) | (X_2) | (Y) | |------|---------|---------|-------| | 1 | 1 | 2 | 5 | | 2 | 2 | 3 | 8 | | 3 | 3 | 4 | 11 | | 4 | 4 | 5 | 14 |