class: front <!--- Para correr en ATOM - open terminal, abrir R (simplemente, R y enter) - rmarkdown::render('static/docpres/07_interacciones/7interacciones.Rmd', 'xaringan::moon_reader') About macros.js: permite escalar las imágenes como [scale 50%](path to image), hay si que grabar ese archivo js en el directorio. ---> .pull-left[ # Estadística Multivariada ## Juan Carlos Castillo ## Sociología FACSO - UChile ## 1er Sem 2022 ## [.yellow[multivariada.netlify.com]](https://multivariada.netlify.com) ] .pull-right[ .right[ <br> ## Sesión 6: .yellow[Regresión múltiple (2) & predictores categóricos] ![:scale 70%](https://multivariada.netlify.com/img/hex_multiva.png) ] ] --- layout: true class: animated, fadeIn --- class: inverse, bottom, animated, slideInRight .pull-left-narrow[ ## .red[Contenidos] ] .pull-right-wide[ ### 1. Repaso de sesión anterior ### 2. Bases de control y parcialización ### 3. Demostración parcialización ### 4. Predictores categóricos ] --- class: roja, middle, right # 1. Repaso sesión anterior --- .pull-left-narrow[ ## Base: Modelo de regresión (simple) <br> `$$\widehat{Y}=b_{0} +b_{1}X$$` .center[ ![:scale 100%](../images/regmod.png)] ] .pull-right-wide[ - Se estima mediante el método de mínimos cuadrados ordinarios (OLS) - Permite estimar el valor de una variable ( `\(\widehat{Y}\)` ) a partir del valor conocido de otra variable ( `\(X\)` ) - La estimación se expresa en el coeficiente de regresión `\(b_{1}\)`, también llamado "beta" o pendiente - Este coeficiente se interpreta de la siguiente manera: Por cada unidad que aumenta X, Y aumenta en `\(b_{1}\)` unidades ] --- # Regresión múltiple .pull-left[ <br> ### - Más de un predictor (x) ### - Modelo sumativo ] .pull-right[ .center[ ![](../05-regmul1/regmod4.png) ] ] `$$\widehat{Y}=\beta_{0} +\beta_{1}X_{1} + \beta_{2}X_{2}+ \beta_{3}X_{3}+...+\beta_{k}X_{k}$$` --- # Regresión múltiple y predictores correlacionados .center[ ![:scale 80%](corr-pred.png) ] --- .pull-left-wide[ ## Control estadístico - ¿Qué efecto posee el nivel educacional en ingreso, _controlando por_ inteligencia? ] .pull-right-narrow[ ![](../05-regmul1/ingresoeducexp.png) ] **Conceptualmente:** .small[ - aislar el efecto de educación en ingreso, manteniendo la inteligencia _constante_. - estimar el efecto de educación en ingreso independiente del efecto de la inteligencia - estimación del efecto de educación en ingreso _ceteris paribus_ (manteniendo el efecto del resto de los predictores constante) ] --- class: inverse ### RESUMEN - Los coeficientes de regresión (X) no alteran su valor en los modelos en ausencia de correlación entre ellos -- - Si hay correlación entre predictores, el valor de los coeficientes de regresión será distinto en modelos simples y en modelos múltiples -- - Por ello, en regresión múltiple se habla de coeficientes de regresión **parciales** --- class: roja, middle, center # 2. Bases de control y parcialización --- # Ejemplo (mínimo): Datos .medium[ ``` ## ID ingr educ intelig ## 1 1 100000 2 1 ## 2 2 200000 1 3 ## 3 3 200000 3 3 ## 4 4 300000 3 1 ## 5 5 300000 4 2 ## 6 6 500000 6 2 ## 7 7 650000 5 3 ## 8 8 800000 4 2 ## 9 9 900000 5 3 ## 10 10 1000000 6 3 ``` ] --- # Ejemplo: Descriptivos <br> .medium[ <table style="text-align:center"><tr><td colspan="8" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left">Statistic</td><td>N</td><td>Mean</td><td>St. Dev.</td><td>Min</td><td>Pctl(25)</td><td>Pctl(75)</td><td>Max</td></tr> <tr><td colspan="8" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left">ingr</td><td>10</td><td>495,000</td><td>323,565</td><td>100,000</td><td>225,000</td><td>762,500</td><td>1,000,000</td></tr> <tr><td style="text-align:left">educ</td><td>10</td><td>4</td><td>2</td><td>1</td><td>3</td><td>5</td><td>6</td></tr> <tr><td style="text-align:left">intelig</td><td>10</td><td>2</td><td>1</td><td>1</td><td>2</td><td>3</td><td>3</td></tr> <tr><td colspan="8" style="border-bottom: 1px solid black"></td></tr></table> ] --- # Ejemplo: correlaciones .pull-left[.medium[ ``` ## ingr educ intelig ## ingr 1.00 0.77 0.44 ## educ 0.77 1.00 0.27 ## intelig 0.44 0.27 1.00 ``` ] ] -- .pull-right[ ![](6_regmul2_files/figure-html/unnamed-chunk-6-1.png)<!-- --> ] --- .pull-left[ **Ingreso <- educación ( `\(X_1\)` )** ![](6_regmul2_files/figure-html/unnamed-chunk-7-1.png)<!-- --> ] .pull-right[ **Ingreso <- intelig ( `\(X_2\)` )** ![](6_regmul2_files/figure-html/unnamed-chunk-8-1.png)<!-- --> ] --- # Ejemplo: scatter X1 X2 .pull-left[ ![](6_regmul2_files/figure-html/unnamed-chunk-9-1.png)<!-- --> ] .pull-right[ .medium[ - presencia de correlación entre predictores - idea de control estadístico: ¿Cuál es la influencia de educación en ingreso, independiente de la inteligencia? - **controlando por** inteligencia ]] --- # Regresión .small[ ] .small[ <table class="texreg" style="margin: 10px auto;border-collapse: collapse;border-spacing: 0px;caption-side: bottom;color: #000000;border-top: 2px solid #000000;"> <caption> </caption> <thead> <tr> <th style="padding-left: 5px;padding-right: 5px;"> </th> <th style="padding-left: 5px;padding-right: 5px;">Model 1</th> <th style="padding-left: 5px;padding-right: 5px;">Model 2</th> <th style="padding-left: 5px;padding-right: 5px;">Model 3</th> </tr> </thead> <tbody> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">(Intercept)</td> <td style="padding-left: 5px;padding-right: 5px;">-91566.27</td> <td style="padding-left: 5px;padding-right: 5px;">93442.62</td> <td style="padding-left: 5px;padding-right: 5px;">-270638.30</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(183509.80)</td> <td style="padding-left: 5px;padding-right: 5px;">(302389.31)</td> <td style="padding-left: 5px;padding-right: 5px;">(241882.27)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">educ</td> <td style="padding-left: 5px;padding-right: 5px;">150401.61<sup>**</sup></td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">137092.20<sup>*</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(43618.69)</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(44602.35)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">intelig</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">174590.16</td> <td style="padding-left: 5px;padding-right: 5px;">100425.53</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(124491.71)</td> <td style="padding-left: 5px;padding-right: 5px;">(90114.05)</td> </tr> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.60</td> <td style="padding-left: 5px;padding-right: 5px;">0.20</td> <td style="padding-left: 5px;padding-right: 5px;">0.66</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Adj. R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.55</td> <td style="padding-left: 5px;padding-right: 5px;">0.10</td> <td style="padding-left: 5px;padding-right: 5px;">0.56</td> </tr> <tr style="border-bottom: 2px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">Num. obs.</td> <td style="padding-left: 5px;padding-right: 5px;">10</td> <td style="padding-left: 5px;padding-right: 5px;">10</td> <td style="padding-left: 5px;padding-right: 5px;">10</td> </tr> </tbody> <tfoot> <tr> <td style="font-size: 0.8em;" colspan="4"><sup>***</sup>p < 0.001; <sup>**</sup>p < 0.01; <sup>*</sup>p < 0.05</td> </tr> </tfoot> </table> ] --- class: inverse ## RESUMEN - Regresión múltiple: más de un predictor - No es equivalente a realizar regresiones múltiples por separado con cada predictor y luego simplemente "sumarlas" - Predictores correlacionados: requiere consideración, ya que de otra manera se estaría sobreestimando el efecto de `\(X\)` en `\(Y\)` --- class: inverse ## RESUMEN (2) - Además de ser una corrección estadística, el control se relaciona con preguntas sustantivas basadas en teoría - El output de regresión múltiple realiza automáticamente el control estadístico vía parcialización de coeficientes. - ¿Cuál es el cálculo detrás de la parcialización / control estadístico? ... a continuación. --- class: roja, center, middle # 3. Demostración parcialización --- # Antecedentes - la **parcialización** que permite el control estadístico es un calculo de mediana complejidad - su complejidad aumenta a medida que aumenta el número de predictores - por ello, los softwares lo realizan de manera automática, no es necesario realizarlo por cuenta propia - **PERO** ... vale la pena demostrarlo, para entender de qué se trata --- # Parcialización 1 _¿Cómo se despeja la regresión de `\(Y\)` en `\(X_1\)` del efecto de `\(X_2\)`?_ .pull-left[ .center[![:scale 65%](../05-regmul1/ingresoeducexp.png)] ] -- .pull-right[ .center[![:scale 65%](ingeduc_parint.png)] ] --- class: center middle # Implica despejar `\(X_1\)` de su correlación con `\(X_2\)`, o **parcializar** `\(X_1\)` de `\(X_2\)` --- .pull-left[ # Parcialización 3 .medium[ ¿Como obtenemos una variable `\(X_1\)` parcializada de `\(X_2\)`? ] .center[ ![:scale 100%](../images/partial2.png)] ] -- .pull-right[ <br> <br> .medium[ - Pensemos en que `\(X_1\)` parcializada (de `\(X_2\)` ) es todo lo de `\(X_1\)` (varianza) que no tiene que ver con `\(X_2\)` - En otras palabras, en un modelo donde `\(X_1\)` es la variable dependiente y `\(X_2\)` la independiente, `\(X_1\)` parcializada equivale al **residuo** de esta regresión ] ] --- # Parcialización 4 Por lo tanto, para **demostrar** el concepto de parcialización en el ejemplo, los pasos son: 1. Regresión entre predictores 2. Obtención del residuo de la regresión 3. Regresión de `\(Y\)` en el residuo (=la variable parcializada) --- # Parcialización 5 .pull-left[ **1.Regresión entre predictores ** ```r reg_x1_x2=lm(educ ~ intelig, data=datos) coef(reg_x1_x2) ``` ``` ## (Intercept) intelig ## 2.6557377 0.5409836 ``` ] .pull-right[ .medium[ Por lo tanto, tenemos que nuestro modelo de regresión entre predictores, con educación como dependiente es: `$$\widehat{educacion}=2.66+0.541_{inteligencia}$$`]] --- class: center, middle `$$\widehat{educacion}=2.66+0.541_{inteligencia}$$` ![](6_regmul2_files/figure-html/unnamed-chunk-13-1.png)<!-- --> --- # Parcialización 6 **2.Obtención de residuo (valor estimado - observado)** .small[ ``` ## ID ingr educ intelig x1_fit_x2 resx1_2 ## 1 1 100000 2 1 3.196721 -1.1967213 ## 2 2 200000 1 3 4.278689 -3.2786885 ## 3 3 200000 3 3 4.278689 -1.2786885 ## 4 4 300000 3 1 3.196721 -0.1967213 ## 5 5 300000 4 2 3.737705 0.2622951 ## 6 6 500000 6 2 3.737705 2.2622951 ## 7 7 650000 5 3 4.278689 0.7213115 ## 8 8 800000 4 2 3.737705 0.2622951 ## 9 9 900000 5 3 4.278689 0.7213115 ## 10 10 1000000 6 3 4.278689 1.7213115 ``` ] --- Ejemplo caso 1: inteligencia=1 Estimando valor predicho según nuestro modelo: `$$\widehat{educacion}=2.66+0.541*1=3.196$$` - **3.196** es el valor predicho de educación para una persona de inteligencia = 1 - sabemos que el valor observado de educación para el caso 1 es igual a **2** - por lo tanto, el residuo para este caso (valor observado - valor estimado `\(=2-3.196=-1.196\)` --- ### Parcialización 7: Regresión de Y en variable `\(X_1\)` parcializada = `\(X_{1.2}\)` .small[ <table class="texreg" style="margin: 10px auto;border-collapse: collapse;border-spacing: 0px;caption-side: bottom;color: #000000;border-top: 2px solid #000000;"> <caption> </caption> <thead> <tr> <th style="padding-left: 5px;padding-right: 5px;"> </th> <th style="padding-left: 5px;padding-right: 5px;">Model 1</th> <th style="padding-left: 5px;padding-right: 5px;">Model 2</th> <th style="padding-left: 5px;padding-right: 5px;">Model 3</th> <th style="padding-left: 5px;padding-right: 5px;">Model 4</th> </tr> </thead> <tbody> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">(Intercept)</td> <td style="padding-left: 5px;padding-right: 5px;">-91566.27</td> <td style="padding-left: 5px;padding-right: 5px;">93442.62</td> <td style="padding-left: 5px;padding-right: 5px;">-270638.30</td> <td style="padding-left: 5px;padding-right: 5px;">495000.00<sup>***</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(183509.80)</td> <td style="padding-left: 5px;padding-right: 5px;">(302389.31)</td> <td style="padding-left: 5px;padding-right: 5px;">(241882.27)</td> <td style="padding-left: 5px;padding-right: 5px;">(79673.16)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">educ</td> <td style="padding-left: 5px;padding-right: 5px;">150401.61<sup>**</sup></td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">137092.20<sup>*</sup></td> <td style="padding-left: 5px;padding-right: 5px;"> </td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(43618.69)</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(44602.35)</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">intelig</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">174590.16</td> <td style="padding-left: 5px;padding-right: 5px;">100425.53</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(124491.71)</td> <td style="padding-left: 5px;padding-right: 5px;">(90114.05)</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">resx1_2</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">137092.20<sup>*</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(52404.36)</td> </tr> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.60</td> <td style="padding-left: 5px;padding-right: 5px;">0.20</td> <td style="padding-left: 5px;padding-right: 5px;">0.66</td> <td style="padding-left: 5px;padding-right: 5px;">0.46</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Adj. R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.55</td> <td style="padding-left: 5px;padding-right: 5px;">0.10</td> <td style="padding-left: 5px;padding-right: 5px;">0.56</td> <td style="padding-left: 5px;padding-right: 5px;">0.39</td> </tr> <tr style="border-bottom: 2px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">Num. obs.</td> <td style="padding-left: 5px;padding-right: 5px;">10</td> <td style="padding-left: 5px;padding-right: 5px;">10</td> <td style="padding-left: 5px;padding-right: 5px;">10</td> <td style="padding-left: 5px;padding-right: 5px;">10</td> </tr> </tbody> <tfoot> <tr> <td style="font-size: 0.8em;" colspan="5"><sup>***</sup>p < 0.001; <sup>**</sup>p < 0.01; <sup>*</sup>p < 0.05</td> </tr> </tfoot> </table> ] --- # Parcialización 8 Ahora, lo mismo pero parcializando inteligencia ( `\(X_2\)` ) de educación ( `\(X_1\)` ) **1.Regresión de `\(X_2\)` (inteligencia) en `\(X_1\)` (educación)** **2. Obtención del residuo de la regresión (inteligencia parcializada de educación)** **3. Regresión de `\(Y\)` (ingreso) en la variable parcializada `\(X_{2.1}\)`** --- ### Comparación final modelos .small[ <table class="texreg" style="margin: 10px auto;border-collapse: collapse;border-spacing: 0px;caption-side: bottom;color: #000000;border-top: 2px solid #000000;"> <caption> </caption> <thead> <tr> <th style="padding-left: 5px;padding-right: 5px;"> </th> <th style="padding-left: 5px;padding-right: 5px;">Model 1</th> <th style="padding-left: 5px;padding-right: 5px;">Model 2</th> <th style="padding-left: 5px;padding-right: 5px;">Model 3</th> <th style="padding-left: 5px;padding-right: 5px;">Model 4</th> <th style="padding-left: 5px;padding-right: 5px;">Model 5</th> </tr> </thead> <tbody> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">(Intercept)</td> <td style="padding-left: 5px;padding-right: 5px;">-91566.27</td> <td style="padding-left: 5px;padding-right: 5px;">93442.62</td> <td style="padding-left: 5px;padding-right: 5px;">-270638.30</td> <td style="padding-left: 5px;padding-right: 5px;">495000.00<sup>***</sup></td> <td style="padding-left: 5px;padding-right: 5px;">495000.00<sup>**</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(183509.80)</td> <td style="padding-left: 5px;padding-right: 5px;">(302389.31)</td> <td style="padding-left: 5px;padding-right: 5px;">(241882.27)</td> <td style="padding-left: 5px;padding-right: 5px;">(79673.16)</td> <td style="padding-left: 5px;padding-right: 5px;">(105186.77)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">educ</td> <td style="padding-left: 5px;padding-right: 5px;">150401.61<sup>**</sup></td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">137092.20<sup>*</sup></td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(43618.69)</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(44602.35)</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">intelig</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">174590.16</td> <td style="padding-left: 5px;padding-right: 5px;">100425.53</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(124491.71)</td> <td style="padding-left: 5px;padding-right: 5px;">(90114.05)</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">resx1_2</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">137092.20<sup>*</sup></td> <td style="padding-left: 5px;padding-right: 5px;"> </td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(52404.36)</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">resx2_1</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">100425.53</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(139782.00)</td> </tr> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.60</td> <td style="padding-left: 5px;padding-right: 5px;">0.20</td> <td style="padding-left: 5px;padding-right: 5px;">0.66</td> <td style="padding-left: 5px;padding-right: 5px;">0.46</td> <td style="padding-left: 5px;padding-right: 5px;">0.06</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Adj. R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.55</td> <td style="padding-left: 5px;padding-right: 5px;">0.10</td> <td style="padding-left: 5px;padding-right: 5px;">0.56</td> <td style="padding-left: 5px;padding-right: 5px;">0.39</td> <td style="padding-left: 5px;padding-right: 5px;">-0.06</td> </tr> <tr style="border-bottom: 2px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">Num. obs.</td> <td style="padding-left: 5px;padding-right: 5px;">10</td> <td style="padding-left: 5px;padding-right: 5px;">10</td> <td style="padding-left: 5px;padding-right: 5px;">10</td> <td style="padding-left: 5px;padding-right: 5px;">10</td> <td style="padding-left: 5px;padding-right: 5px;">10</td> </tr> </tbody> <tfoot> <tr> <td style="font-size: 0.8em;" colspan="6"><sup>***</sup>p < 0.001; <sup>**</sup>p < 0.01; <sup>*</sup>p < 0.05</td> </tr> </tfoot> </table> ] --- # Comparando pendientes .pull-left[ **Ingreso <- educ `\(X_1\)`** ![](6_regmul2_files/figure-html/unnamed-chunk-21-1.png)<!-- --> ] .pull-right[ **Ingreso <- educ.parcial `\(X_{1.2}\)`** ![](6_regmul2_files/figure-html/unnamed-chunk-22-1.png)<!-- --> ] --- ## Matriz de correlaciones con variables parcializadas .center[ ![](6_regmul2_files/figure-html/unnamed-chunk-24-1.png)<!-- --> ] --- # Fórmulas directas de regresores parciales: `$$b_1=\biggl(\frac{s_y}{s_1}\biggr)\biggl(\frac{r_{y1}-r_{y2}r_{12}}{1-r^2_{12}}\biggr)$$` `$$b_2=\biggl(\frac{s_y}{s_2}\biggr)\biggl(\frac{r_{y2}-r_{y1}r_{12}}{1-r^2_{12}}\biggr)$$` --- class: roja ## RESUMEN - El control estadístico es central en regresión múltiple -- - Pregunta: ¿Es la relación entre _X_ e _Y_ _realmente_ debida a _X_, o hay otras variables que podrían dar cuenta de esta relación? -- - El control se implementa agregando predictores en el modelo que por razones teóricas se presume pueden afectar la relación del regresor principal en _Y_ --- class: roja ## RESUMEN (2) - En términos técnicos, el control estadístico opera mediante *parcialización*: los predictores se parcializan mutuamente, generando coeficientes de regresión parciales. -- - El regresor parcial entonces es un regresor ajustado por la presencia de otro(s) regresore(s) -- - Por lo tanto, ahora los betas de regresión se pueden sumar apropiadamente, sin distorsionar la predicción --- class: roja, middle, right, slideInRight # 4. Predictores Categóricos --- .pull-left[ ## Variables categóricas - Hasta el momento sólo hemos considerado variables como **continuas/intervalares**. - A menudo, las variables explicativas son de naturaleza **categórica**. ] -- .pull-right[ ###Variables binarias / dicotómicas - Hombre, Mujer - Vivo, Muerto - Votó, No Votó. ###Variables politómicas: - Básica, Medía, Técnica, Universitaria - Frente Amplio, Nueva Mayoría, Chile Vamos, No interesado. ] --- .pull-left[ ## Predictores categóricos - Ej, Y=ingreso, X= sexo `$$X=1(Mujer)$$` `$$X=0(Hombre)$$` - Las variables 1/0 usualmente son llamadas variables **dummy** ] -- <br> <br> .pull-right[ Para las mujeres: `\(Y=\alpha +\beta X= \alpha+\beta\)` Para los hombres: `\(Y=\alpha +\beta X= \alpha\)` ### El coeficiente `\(\beta\)` es la **diferencia** esperada de `\(Y\)` (ingreso) entre hombres y mujeres. ] --- ## Variables categóricas: Ejemplo (ELSOC) ### Variable dependiente .medium[ *En nuestra sociedad, hay grupos que tienden a ubicarse en los niveles más altos y grupos que tienden a ubicarse en los niveles más bajos de la sociedad. ¿Dónde se ubicaría usted en la sociedad chilena?* -Likert de 0 a 10 donde 0 "El nivel más bajo" y 10 "El nivel más alto" ### Variables independientes - Ingreso - Edad - Sexo (Hombre=0; Mujer=1) ] --- .pull-left-narrow[ # Sexo / estatus subjetivo ] .pull-right-wide[ .small[ <table style="border-collapse:collapse; border:none;"> <tr> <th style="border-top:double; text-align:center; font-style:italic; font-weight:normal; border-bottom:1px solid;" rowspan="2">Estatus Social<br>Subjetivo</th> <th style="border-top:double; text-align:center; font-style:italic; font-weight:normal;" colspan="2">Sexo (1=Mujer)</th> <th style="border-top:double; text-align:center; font-style:italic; font-weight:normal; font-weight:bolder; font-style:italic; border-bottom:1px solid; " rowspan="2">Total</th> </tr> <tr> <td style="border-bottom:1px solid; text-align:center; padding:0.2cm;">Hombre</td> <td style="border-bottom:1px solid; text-align:center; padding:0.2cm;">Mujer</td> </tr> <tr> <td style="padding:0.2cm; text-align:left; vertical-align:middle;">0 El nivel mas bajo</td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">46</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">32</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">78</span></td> </tr> <tr> <td style="padding:0.2cm; text-align:left; vertical-align:middle;">1</td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">80</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">31</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">111</span></td> </tr> <tr> <td style="padding:0.2cm; text-align:left; vertical-align:middle;">2</td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">137</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">88</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">225</span></td> </tr> <tr> <td style="padding:0.2cm; text-align:left; vertical-align:middle;">3</td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">289</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">181</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">470</span></td> </tr> <tr> <td style="padding:0.2cm; text-align:left; vertical-align:middle;">4</td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">491</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">291</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">782</span></td> </tr> <tr> <td style="padding:0.2cm; text-align:left; vertical-align:middle;">5</td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">909</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">537</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">1446</span></td> </tr> <tr> <td style="padding:0.2cm; text-align:left; vertical-align:middle;">6</td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">203</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">156</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">359</span></td> </tr> <tr> <td style="padding:0.2cm; text-align:left; vertical-align:middle;">7</td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">79</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">67</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">146</span></td> </tr> <tr> <td style="padding:0.2cm; text-align:left; vertical-align:middle;">8</td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">23</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">26</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">49</span></td> </tr> <tr> <td style="padding:0.2cm; text-align:left; vertical-align:middle;">9</td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">6</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">6</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">12</span></td> </tr> <tr> <td style="padding:0.2cm; text-align:left; vertical-align:middle;">10 El nivel mas alto</td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">14</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">11</span></td> <td style="padding:0.2cm; text-align:center; "><span style="color:black;">25</span></td> </tr> <tr> <td style="padding:0.2cm; border-bottom:double; font-weight:bolder; font-style:italic; text-align:left; vertical-align:middle;">Total</td> <td style="padding:0.2cm; text-align:center; border-bottom:double;"><span style="color:black;">2277</span></td> <td style="padding:0.2cm; text-align:center; border-bottom:double;"><span style="color:black;">1426</span></td> <td style="padding:0.2cm; text-align:center; border-bottom:double;"><span style="color:black;">3703</span></td> </tr> <td style="text-align:right; font-size:0.9em; font-style:italic; padding:0.2cm;" colspan="4">χ<sup>2</sup>=19.632 · df=10 · Cramer's V=0.073 · p=0.033</td> </tr> </table> ] ] --- # Promedio de estatus subjetivo según sexo ```r elsoc_18 %>% group_by(as_label(sexo)) %>% summarise(mean_ess=mean(ess,na.rm = T)) ``` ``` ## # A tibble: 2 x 2 ## `as_label(sexo)` mean_ess ## <fct> <dbl> ## 1 Hombre 4.34 ## 2 Mujer 4.47 ``` --- ## Ejemplo estimación .small[ .pull-left[ ```r reg1<- lm(ess ~ sexo, data=elsoc_18) ``` <table style="border-collapse:collapse; border:none;"> <tr> <th style="border-top: double; text-align:center; font-style:normal; font-weight:bold; padding:0.2cm; text-align:left; "> </th> <th colspan="1" style="border-top: double; text-align:center; font-style:normal; font-weight:bold; padding:0.2cm; ">Modelo 1</th> </tr> <tr> <td style=" text-align:center; border-bottom:1px solid; font-style:italic; font-weight:normal; text-align:left; ">Predictores</td> <td style=" text-align:center; border-bottom:1px solid; font-style:italic; font-weight:normal; ">β</td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">(Intercept)</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">4.339 <sup>***</sup></td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">Sexo(1=Mujer)</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">0.133 <sup>*</sup></td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; padding-top:0.1cm; padding-bottom:0.1cm; border-top:1px solid;">Observations</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left; border-top:1px solid;" colspan="1">3703</td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; padding-top:0.1cm; padding-bottom:0.1cm;">R<sup>2</sup> / R<sup>2</sup> adjusted</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left;" colspan="1">0.002 / 0.001</td> </tr> <tr> <td colspan="2" style="font-style:italic; border-top:double black; text-align:right;">* p<0.05 ** p<0.01 *** p<0.001</td> </tr> </table> ] ] -- .pull-right[ Las mujeres (sexo=1) obtienen en promedio 0.133 puntos más **en relación** a los hombres (sexo=0) en la variable de estatus social subjetivo. ] --- # Predicción Para el caso de los **hombres** tenemos: `$$\widehat{Y}_\text{estatus} = 4.339 + 0.133 \times 0 = 4.339$$` <br> En cambio, para las **mujeres** tenemos: `$$\widehat{Y}_\text{estatus} = 4.339 + 0.133 \times 1 = 4.472$$` --- # Más de dos categorías (politómicas) - ¿Qué sucede cuando quiero predecir el estatus social subjetivo en base una variable catégorica con **más de dos valores**? (ej. Educación, Clase Social, Posición política). - La solución estándar es convertir esta variable en un conjunto de variables binarias 1/0 o variables **dummy**. - El conjunto de éstas variables dummy representan a la variable categórica completa. --- ## Especificando el conjunto de variables dummy Educación. <br> .medium[ | | `\(X_{básica}\)` | `\(X_{media}\)` | `\(X_{tecnica}\)` | `\(X_{universitaria}\)` | |------------------|---------|------------|-----------------| | Básica |1 | 0 | 0 | 0 | | Media |0 |1 | 0 | 0 | | Técnica Superior |0| 0 | 1 | 0 | | Universitaria | 0|0 | 0 | 1 | ] -- `$$Y_{ingreso} = \beta_{0}+\beta_{1}X_{media}+\beta_{2}X_{tecnica}+\beta_{3}X_{universitaria}$$` --- ## Politómicas como predictores - Se ingresan **todas las categorías menos una** al modelo -- - La categoría ausente en el modelo es la **categoría de referencia** para la intepretación -- - El *coeficiente* de la variable dummy corresponde a su **diferencia** respecto de la categoría de referencia (en relación a la variable dependiente `\(Y\)`) -- - La decisión de qué categoría es la referencia obedece a la mejor **interpretación**, pero por defecto es la categoría con el valor más bajo --- # Variable educación en ELSOC .small[ ``` ## ## Educación (x) <numeric> ## # total N=3703 valid N=3703 mean=3.21 sd=1.21 ## ## Value | Label | N | Raw % | Valid % | Cum. % ## -------------------------------------------------------------------- ## 1 | Primaria incompleta menos | 442 | 11.94 | 11.94 | 11.94 ## 2 | Primaria y secundaria baja | 365 | 9.86 | 9.86 | 21.79 ## 3 | Secundaria alta | 1589 | 42.91 | 42.91 | 64.70 ## 4 | Terciaria ciclo corto | 592 | 15.99 | 15.99 | 80.69 ## 5 | Terciaria y Postgrado | 715 | 19.31 | 19.31 | 100.00 ## <NA> | <NA> | 0 | 0.00 | <NA> | <NA> ``` ] --- .pull-left[ # Ejemplo <br> .small[ <table style="border-collapse:collapse; border:none;"> <tr> <th style="border-top: double; text-align:center; font-style:normal; font-weight:bold; padding:0.2cm; text-align:left; "> </th> <th colspan="1" style="border-top: double; text-align:center; font-style:normal; font-weight:bold; padding:0.2cm; ">Modelo 1</th> <th colspan="1" style="border-top: double; text-align:center; font-style:normal; font-weight:bold; padding:0.2cm; ">Modelo 2</th> </tr> <tr> <td style=" text-align:center; border-bottom:1px solid; font-style:italic; font-weight:normal; text-align:left; ">Predictores</td> <td style=" text-align:center; border-bottom:1px solid; font-style:italic; font-weight:normal; ">β</td> <td style=" text-align:center; border-bottom:1px solid; font-style:italic; font-weight:normal; ">β</td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">(Intercept)</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">4.339 <sup>***</sup></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">3.308 <sup>***</sup></td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">Sexo(1=Mujer)</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">0.133 <sup>*</sup></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">0.071 <sup></sup></td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">Educación</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; "></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">0.328 <sup>***</sup></td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; padding-top:0.1cm; padding-bottom:0.1cm; border-top:1px solid;">Observations</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left; border-top:1px solid;" colspan="1">3703</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left; border-top:1px solid;" colspan="1">3703</td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; padding-top:0.1cm; padding-bottom:0.1cm;">R<sup>2</sup> / R<sup>2</sup> adjusted</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left;" colspan="1">0.002 / 0.001</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left;" colspan="1">0.065 / 0.064</td> </tr> <tr> <td colspan="3" style="font-style:italic; border-top:double black; text-align:right;">* p<0.05 ** p<0.01 *** p<0.001</td> </tr> </table> ] ] .pull-right[ - **¿Qué sucedió?** el predictor educación se tomó como continuo, y nos dice que hay un aumento de **0.331 puntos** en la escala de estatus social subjetivo por cada aumento de nivel educacional. - Para poder trabajar correctamente los predictores categóricos en la regresión, en R la manera más simple es definirlos como un **factor**. ] --- # Factores en R - en R la información de las variables (vectores) se puede almacenar de distintas maneras -- - las variables **numéricas** son aquellas que permiten realizar operaciones como promedios, sumas, etc. -- - las variables se pueden también definir como categóricas (nominales/ordinales), bajo la denominación de **factor** --- # Factores y regresión en R - si una variable está definida como **factor** en un modelo de regresión, entonces R automáticamente ingresa al modelo **todos los niveles de la variable menos uno** - el nivel que no aparece en el modelo sirve como **categoría de referencia** - para transformar a factor se utiliza la función general `as.factor`, pero se recomienda mejor **`as_factor`** de la librería **`sjlabelled`** que conserva mejor las etiquetas --- # Factores y regresión en R - crear variable educación como factor (**`edcine_fac`**)y luego ingresarla al modelo de regresión: ```r library(sjlabelled) elsoc_18$edcine_fac <- as_factor(elsoc_18$edcine) reg3<-lm(ess ~ sexo + edcine_fac, data=elsoc_18) ``` --- .small[ <table style="border-collapse:collapse; border:none;"> <tr> <th style="border-top: double; text-align:center; font-style:normal; font-weight:bold; padding:0.2cm; text-align:left; "> </th> <th colspan="1" style="border-top: double; text-align:center; font-style:normal; font-weight:bold; padding:0.2cm; ">Modelo 1</th> <th colspan="1" style="border-top: double; text-align:center; font-style:normal; font-weight:bold; padding:0.2cm; ">Modelo 2</th> <th colspan="1" style="border-top: double; text-align:center; font-style:normal; font-weight:bold; padding:0.2cm; ">Modelo 3</th> </tr> <tr> <td style=" text-align:center; border-bottom:1px solid; font-style:italic; font-weight:normal; text-align:left; ">Predictores</td> <td style=" text-align:center; border-bottom:1px solid; font-style:italic; font-weight:normal; ">β</td> <td style=" text-align:center; border-bottom:1px solid; font-style:italic; font-weight:normal; ">β</td> <td style=" text-align:center; border-bottom:1px solid; font-style:italic; font-weight:normal; ">β</td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">(Intercept)</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">4.339 <sup>***</sup></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">3.308 <sup>***</sup></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">3.771 <sup>***</sup></td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">Sexo(1=Mujer)</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">0.133 <sup>*</sup></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">0.071 <sup></sup></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">0.070 <sup></sup></td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">Educación</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; "></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">0.328 <sup>***</sup></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; "></td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">Educación: Educación:<br>Primaria y secundaria<br>baja</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; "></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; "></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">0.150 <sup></sup></td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">Educación: Educación:<br>Secundaria alta</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; "></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; "></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">0.472 <sup>***</sup></td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">Educación: Educación:<br>Terciaria ciclo corto</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; "></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; "></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">0.805 <sup>***</sup></td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">Educación: Educación:<br>Terciaria y Postgrado</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; "></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; "></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">1.270 <sup>***</sup></td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; padding-top:0.1cm; padding-bottom:0.1cm; border-top:1px solid;">Observations</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left; border-top:1px solid;" colspan="1">3703</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left; border-top:1px solid;" colspan="1">3703</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left; border-top:1px solid;" colspan="1">3703</td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; padding-top:0.1cm; padding-bottom:0.1cm;">R<sup>2</sup> / R<sup>2</sup> adjusted</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left;" colspan="1">0.002 / 0.001</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left;" colspan="1">0.065 / 0.064</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left;" colspan="1">0.067 / 0.066</td> </tr> <tr> <td colspan="4" style="font-style:italic; border-top:double black; text-align:right;">* p<0.05 ** p<0.01 *** p<0.001</td> </tr> </table> ] --- # Interpretación - `\(\beta\)` de nivel educacional secundaria alta: 0.472 - las personas con nivel secundario alto tienen en promedio un nivel de estatus subjetivo 0.472 puntos mayor que aquellos con educación primaria incompleta (categoría de referencia) --- class: inverse ## Resumen predictores categóricos - Predictores categóricos se especifican como variables dicotoḿicas o dummy (valores 1/0, presencia/ausencia del atributo) -- - La variable que no ingresa al modelo es la **categoría de referencia** -- - El *coeficiente* de la variable dummy corresponde a su **diferencia** respecto de la categoría de referencia (en relación a la variable dependiente `\(Y\)`) --- class: inverse, middle, center ## PROXIMA CLASE: # INFERENCIA EN REGRESIÓN --- class: front .pull-left[ # Estadística Multivariada ## Juan Carlos Castillo ## Sociología FACSO - UChile ## 1er Sem 2022 ## [multivariada.netlify.com](https://multivariada.netlify.com) ] .pull-right[ .right[ <br> ![:scale 80%](https://multivariada.netlify.com/img/hex_multiva.png) ] ]