El curso tendrá tres instancias de evaluación (fechas en pestaña de planificación):
La nota ponderada de las evaluaciones equivaldrá al 60% de la nota del curso y el examen final al 40% restante.
Aplicar los contenidos del curso a una temática de interés en formato de artículo de investigación breve.
De modo de lograr una mayor colaboración desde el equipo docente a sus trabajos, sugerimos desarrollar los siguientes temas:
Los datos a utilizar corresponden a bases de datos secundarias que coincidan con los temas de interés del grupo. Algunas sugeridas son:
Este trabajo posee dos entregas, tal como se señala en el programa del curso
Entrega 1 (avance): se presenta un avance de la temática general a abordar así como también datos y variables en la sección de métodos, análisis descriptivos y estimación con regresión . El énfasis en esta primera entrega se encuentra en el planteamiento de las hipótesis y el modelo de regresión asociado. Incluye estimar el modelo de regresión múltiple y su interpretación (total máximo 2000 palabras)
Entrega 2 (final): Su formato es de artículo/ reporte breve de investigación. En esta entrega se corrigen aspectos de la Entrega 1. Aquellos grupos que trabajen con una variable dependiente continua deberán realizar además al menos una estimación de regresión logística (y su correspondiente interpretación) con la variable dependiente dicotomizada (total máximo 3.000 palabras). Se debe incluir al menos un predictor categórico.
Título: Breve, lo principal es hacer alusión al objeto central de estudio (variable dependiente) (0,5 pto)
Resumen/Abstract (250 palabras), incluye: problema/pregunta, objetivo, datos (y N), resultado principal. (0,5 pto)
En este apartado es importante considerar:
Relevancia del problema de investigación: además de que el “tema” pueda ser relevante (ej: aumento de desigualdad económica, disminución de niveles de participación), la relevancia del problema se refiere al aporte distintivo desde una perspectiva académica y disciplinar (sociología) (ej: “existe evidencia que los bajos niveles de participación se ven afectados por el nivel educacional (Pérez, 1999”).
Precisar el concepto central que se va a investigar: Ejemplo “vamos a estudiar participación informal, entendiendo por ello la frecuencia de participación en actividades como marchas, boycotts y en redes sociales”.
Precisar argumento / hipótesis central, que tiene que ver con el predictor principal: “proponemos que a medida que aumenta el nivel de contactos con identificación política de izquierda, aumenta la participación política informal”
Antecedentes conceptuales y empíricos (2p)
Una primera sub-sección corresponde al objeto central de estudio o explanandum (variable dependiente), donde se profundiza en su origen y definición, y se revisan las principales investigaciones que se asocian a este concepto. (+/- 4 referencias). Ej: “2.1 Participación política informal”
El segundo apartado corresponde a los conceptos que intentan explicar las variaciones en el objeto de estudio o explanans (variables independientes, al menos 3), y en los cuales se basan las hipótesis (Ej: “2.2 Factores asociados a la participación política informal”). Se revisan en orden de relevancia, comenzando por el que está en el argumento central, y luego se van agregando conceptos secundarios y sus hipótesis correspondientes (al menos dos referencias por cada concepto explicativo). Ejemplo de argumento(s) secundario(s) asociados a otros conceptos relevantes: “Además se considerará en qué medida el nivel educacional se asocia a la participación política informal”. Y también añadir argumentos de control: “Dado que el nivel educacional se podría asociar positivamente con el nivel de contactos, el efecto de los contactos en participación política informal disminuirá al controlar por nivel educacional”
Objetivos / hipótesis (un objetivo e hipótesis por cada variable independiente) (250 palabras). Ej: “a medida que aumenta el nivel educacional, aumenta la participación política informal” (1 punto)
Metodología (3 puntos, uno por cada subsección):
4.1 Datos (no olvidar número de casos)
4.2 Variables: Esta sección también incluye una tabla de descriptivos básicos, y una descripción detallada de la operacionalización y medición de las variables.
Sobre la operacionalización de la variable dependiente: por definición la variable dependiente en regresión múltiple OLS es continua. Escalas tipo likert pueden ser utilizadas en casos justificados y también teniendo en cuenta su variabilidad (si muchos casos se acumulan en pocas categorías la varianza va a ser pequeña, menos posibilidades de covarianza, y por tanto baja probabilidad de encontrar efectos significativos).
ATENCION - SOBRE RECODIFICACIÓN DE VARIABLES: es importante que las variables sean recodificadas en el sentido del atributo que se está midiendo de menos a más, es decir, que el mayor valor exprese la mayor presencia del atributo.
Ejemplo 1: si lo que se está midiendo es apoyo al aborto libre en una escala donde 5 es totalmente en desacuerdo y 1 totalmente de acuerdo, se deben recodificar los valores para que un mayor puntaje exprese mayor apoyo al aborto libre. En concreto: 1=5, 2=4, 4=2, 5=1.
Ejemplo 2: variable dicotómica 0: si vota, 1: no vota, debe ser recodificada a 1: si vota, 0: no vota.
4.3 Métodos: descripción breve del método de regresión a utilizar y lógica de presentación de los modelos
Análisis (1500 palabras) (4 puntos entrega 1, 8 puntos entrega 2)
5.1 Análisis descriptivo: tablas o gráficos bivariados según sea más pertinente, al menos uno por cada variable independiente (1 punto)
5.2 Modelos de regresión: presentación de tabla(s) y descripción de cada modelo y sus coeficientes principales, interpretando en términos de tamaño como así también significación estadística y ajuste global del modelo (R2). Hacer referencia a cada hipótesis al momento de analizar los coeficientes. (2 puntos, 4 puntos entrega final)
se deben adjuntar además las hojas de código de preparación (0,5p), análisis (0,5p) y la base de datos.
Bibliografía
Las siguientes secciones se evaluarán solo en la entrega 2
en Análisis: regresión logística (2p)
Formato Tradicional: archivo .pdf en tamaño carta o A4, letra Times New Roman, tamaño 12, interlineado 1,5, márgenes normales (2,5 cm superior e inferior, 3 cm derecho e izquierdo).
(R)Markdown: se recomienda su uso pues facilita la integración y reproducibilidad de los análisis en R.
Referencias: APA 6ta Edición o ASA
Tablas de calidad: orientarse por formato APA (líneas horizontales y señalando fuente).
En la sección de tareas de UCursos. Se debe adjuntar un archivo comprimido con los siguientes elementos:
Base de datos original y procesada
Código de preparación y de análisis (en formato R)
Documento del trabajo (que puede ser un archivo RMarkdown o Word)
El documento del trabajo debe ser ingresado además por Turnitin, se enviará link en la fecha de entrega para esto.
Una idea por párrafo
Uso de “oración principal” (topic sentence): usualmente es la oración al principio del párrafo, que resume el sentido del párrafo completo y que conecta con el párrafo anterior.
el foco de este enforme es la aplicación de regresión múltiple como herramienta de análisis multivariado a un problema sustantivo de investigación. Por lo tanto, en el análisis se debe enfatizar qué sucede con los predictores en presencia de otros predictores, y en la argumentación esto se relaciona con qué sucede con mi factor explicativo central en presencia de otros factores explicativos
en relación con lo anterior, se sugiere argumentar en base a una tesis central (ejemplo: influencia de educación en ingreso), luego agregar otros posibles factores explicativos que podrían estar afectando esta relación. No se recomienda presentar un “paquete” de factores explicativos (ej: cómo influye sexo, educación y edad en ingreso), sino jerarquizarlos.
los conceptos centrales deben estar en las hipótesis y también luego operacionalizarse en variables. No presentar variables que no se relacionen con los conceptos centrales de la argumentación (a menos que solo sean variables de control).
recordar que el control estadístico es algo que se aplica a todos los predictores del modelo, es decir, vía parcialización al ser una regresión múltiple. No confundir con “variables de control”, que son variables que se pueden sumar al modelo sin necesidad de hipótesis sustantivas y por lo tanto sin un énfasis relevante en la interpretación.
recordar que la tabla de univariados corresponde a sección de variables, no de análisis
en la sección de metodología se debe presentar un apartado de métodos, donde se describa el método de estimación (ej: regresión múltiple por mínimos cuadrados ordinarios) así como la lógica de presentación de modelos
si hay muchos casos perdidos (mas de un tercio de datos originales), explicar claramente a qué se debe esta pérdida. Existe la posiblidad de recuperar casos perdidos de predictores categóricos (o recodificados a categóricos) agregando una categoría adicional de perdidos. Esto se explica en la guía de índices y transformación de variables.
interpretación de hipótesis e inferencia: las hipótesis nunca se comprueban o se descartan, solo se puede hablar de que existe o no existe evidencia a favor de la hipótesis planteada. Recordar: la ausencia de evidencia no es evidencia de ausencia.
evitar términos técnicos estadísticos (ej: correlación ) antes de la sección de metodología
existen algunas dificultades en el tratamiento de algunas variables como la de ingreso.
mantener coherencia entre factores explicativos, hipótesis, descripción de variables, incorporación en el modelo, discusión, ojalá siempre en el mismo orden
Con regresión simple
[Cereceda-Marambio, K., & Torres-Solís, A. (2017). Satisfacción con la democracia en Chile: De lo normativo a lo valorativo. Revista de Sociología, (32), pp. 32-49. doi:10.5354/0719-529X.2017.47884] (https://revistadesociologia.uchile.cl/index.php/RDS/article/view/47884/50543)
Con regresión logística