Estadísticas Avanzadas - Gadgets De Análisis - Panel Visual - Guía De Usuario - Apoyo - Epi Info ™

Tabla de contenido:

Estadísticas Avanzadas - Gadgets De Análisis - Panel Visual - Guía De Usuario - Apoyo - Epi Info ™
Estadísticas Avanzadas - Gadgets De Análisis - Panel Visual - Guía De Usuario - Apoyo - Epi Info ™

Vídeo: Estadísticas Avanzadas - Gadgets De Análisis - Panel Visual - Guía De Usuario - Apoyo - Epi Info ™

Vídeo: Estadísticas Avanzadas - Gadgets De Análisis - Panel Visual - Guía De Usuario - Apoyo - Epi Info ™
Vídeo: Análisis de datos Epiinfo 2023, Septiembre
Anonim

Gadgets de análisis

Estadísticas avanzadas

  • Regresión lineal
  • Propiedades de regresión lineal
  • Regresión logística
  • Propiedades de regresión logística
  • Muestras complejas de FTM
  • Frecuencias de muestra compiladas
  • Muestra compleja significa
  • Tablas de muestra complejas

Regresión lineal

La regresión lineal es una herramienta de análisis que identifica una relación entre una variable continua y una o más variables independientes. Se puede utilizar para la regresión lineal simple (solo una variable independiente), para la regresión lineal múltiple (más de una variable independiente) y para cuantificar la relación entre dos variables continuas (correlación). Puede usar la regresión lineal cuando desee determinar la relación entre una variable dependiente con una o más variables independientes.

En el siguiente ejemplo, la regresión lineal se utiliza para determinar si la presión arterial sistólica se puede predecir en función del peso y la edad al nacer de un bebé. La variable dependiente es la presión arterial sistólica, y las variables independientes son el peso al nacer en onzas y la edad en días.

  1. Establezca la Fuente de datos en el proyecto Sample. PRJ. Abra el formulario BabyBloodPressure desde el menú del Explorador de origen de datos.
  2. Haz clic en Aceptar.
  3. Haga clic derecho en el lienzo y seleccione Agregar gadget de análisis> Estadísticas avanzadas> Regresión lineal. La ventana de configuración del gadget Propiedades de regresión se abre en el panel de propiedades Variables. (Consulte la siguiente sección de Propiedades de regresión lineal para ver una captura de pantalla del gadget).
  4. En la lista desplegable Variable de resultado, seleccione Sangre sistólica.
  5. En la lista desplegable Variables independientes, seleccione AgeInDays y Birthweight.
  6. Haz clic en Aceptar. Los resultados de la regresión lineal aparecen en el lienzo del Tablero visual.

    Linear Regression results
    Linear Regression results

    Figura 8.52: Resultados de la regresión lineal

Los coeficientes para ambas variables independientes son positivos, y el estadístico F asociado con cada variable independiente es altamente significativo (valor p menor que 0.01). Estos resultados sugieren que cada variable (AgeInDays y Birthweight) es un predictor de presión arterial sistólica más alta.

Propiedades de regresión lineal

Linear Regression gadget
Linear Regression gadget

Figura 8.53: gadget de regresión lineal

  • La variable Resultado es la variable dependiente para la regresión. La variable de resultado debe ser numérica o un campo Sí / No.
  • Se puede seleccionar una variable de peso para usar en análisis ponderados.
  • La opción Límites de confianza especifica el nivel de probabilidad en el que Epi Info calcula los límites de confianza.
  • Si el usuario marca la casilla Sin intercepción, la regresión se realiza sin un término constante, lo que fuerza la línea de regresión a través del origen.
  • La lista desplegable Campos contiene las variables predictoras (independientes).
  • Cuando se selecciona, las variables predictoras aparecerán en el cuadro de lista debajo del menú desplegable Campos. Haga doble clic en una variable para eliminarla del cuadro de lista.
  • Haga clic en una variable desde el cuadro de lista Campos para activar el botón Hacer Dummy. Si hace clic en Convertir en ficticio, la variable seleccionada aparecerá en el cuadro de lista Variable ficticia. Haga doble clic en una variable para eliminarla del cuadro de lista.
  • Los términos de interacción se definen con el botón Hacer interacción. El botón Hacer Dummy se convierte en Hacer Interacción cuando se seleccionan dos o más variables al mismo tiempo desde el cuadro de lista Campos (mantenga presionada la tecla CTRL para seleccionar más de una variable en esta lista). Si hace clic en Hacer interacción, la relación llena el cuadro de lista Términos de interacción. Make Interaction agrega todas las combinaciones posibles de las variables seleccionadas a la regresión como términos de interacción.

Regresión logística

En Epi Info ™ 7, se puede usar la tabla M x N / 2 x 2 o la Regresión logística cuando la variable de resultado es dicotómica (por ejemplo, Ill – Yes / Ill – No). Sin embargo, un análisis M x N / 2 x 2 es útil solo cuando hay un "factor de riesgo" o variable explicativa. La regresión logística es útil cuando el número de variables explicativas ("factores de riesgo") es más de uno. La regresión logística muestra la relación entre una variable de resultado con dos valores y variables explicativas que pueden ser categóricas o continuas. Para usar la regresión logística, la variable dependiente (resultado) debe ser dicotómica (puede dividirse en solo dos partes) Sí / No o numérico 0/1. Las independientes (otras variables) pueden ser numéricas, categóricas o Sí / No variables.

Los registros con valores faltantes se excluyen de los análisis de regresión logística. Si la opción Incluir falta se usa con valores faltantes y campos Sí / No, las variables ficticias se generarán automáticamente, contribuyendo Sí vs. Falta y No vs. Falta. Las variables independientes de tipo de texto se convierten automáticamente en variables ficticias, que comparan cada valor en relación con el valor más bajo en el orden de clasificación. Las variables independientes de tipo numérico o de fecha se tratan como variables continuas a menos que se establezcan como variables ficticias, que comparan cada valor en relación con el valor más bajo.

El siguiente ejemplo utiliza la regresión logística para determinar la razón de posibilidades de seis alimentos que podrían ser la causa de una hipotética enfermedad transmitida por alimentos. La variable dependiente es Ill, y las variables independientes son pan integral, repollo, agua, leche, chocolate y vainilla.

  1. Establezca la Fuente de datos en el proyecto Sample. PRJ. Abra el formulario Oswego desde el menú Explorador de origen de datos.
  2. Haz clic en Aceptar.
  3. Haga clic derecho en el lienzo y seleccione Agregar gadget de análisis> Estadísticas avanzadas> Regresión logística. La ventana de configuración del gadget Regresión logística se abre en el panel de propiedades Variables. (Consulte la siguiente sección de Propiedades de regresión logística para ver una captura de pantalla del gadget).
  4. En la lista desplegable Resultado, seleccione ILL.
  5. En la lista desplegable Variables independientes, seleccione BROWNBREAD, CABBAGESAL, WATER, MILK, CHOCOLATE y VANILLA.
  6. Haz clic en Aceptar. Los resultados aparecen en el lienzo del Tablero visual.

    Logistic Regression results
    Logistic Regression results

    Figura 8.54: Resultados de la regresión logística

Los resultados muestran que la vainilla tiene un Odds Ratio y un Intervalo de confianza significativamente mayor que uno. Esto indica que el consumo de vainilla probablemente fue la causa de enfermedades transmitidas por los alimentos.

Propiedades de regresión logística

Logistic Regression gadget
Logistic Regression gadget

Figura 8.55: gadget de regresión logística

  • La variable Resultado es la variable dependiente para la regresión. La variable de resultado debe ser numérica o un campo Sí / No.
  • Se puede seleccionar una variable de peso para usar en análisis ponderados.
  • La variable de coincidencia identifica la variable que indica la pertenencia al grupo de cada registro.
  • La opción Límites de confianza especifica el nivel de probabilidad en el que Epi Info calcula los límites de confianza.
  • Si el usuario marca la casilla Sin intercepción, la regresión se realiza sin un término constante.
  • La configuración Incluir valores perdidos controla variables independientes. Si se incluyen Incluir valores perdidos con valores perdidos y verdadero / falso, las variables ficticias se crearán automáticamente. Esto contribuirá con Sí vs. Falta y No vs. Falta. Las variables independientes de tipo de texto se convierten automáticamente en variables ficticias que comparan cada valor en relación con el valor más bajo en el orden de clasificación. Fecha o tipo numérico Las variables independientes se tratan como variables continuas a menos que se designen como valores ficticios utilizando el botón Convertir ficticio. Si eso ocurre, se convierten automáticamente en variables ficticias, que comparan cada valor en relación con el valor más bajo.
  • La lista desplegable Variables independientes contiene las variables predictoras (independientes).
  • Cuando se selecciona, las variables predictoras aparecerán en el cuadro de lista debajo del menú desplegable Variables independientes. Haga doble clic en una variable para eliminarla del cuadro de lista Otras variables. Seleccione una variable del cuadro de lista Variables independientes para activar el botón Convertir en ficticio. Si hace clic en Convertir ficticio, la variable seleccionada aparecerá en el cuadro de lista Variables ficticias. Haga doble clic en una variable para eliminarla del cuadro de lista Variables ficticias.
  • Los términos de interacción se definen con el botón Hacer interacción. El botón Crear dummy se convierte en Hacer interacción cuando se seleccionan dos o más variables al mismo tiempo desde el cuadro de lista Campos (mantenga presionada la tecla CTRL para seleccionar más de una variable en esta lista). Si hace clic en Hacer interacción, la relación llena el cuadro de lista Términos de interacción. Hacer interacción agrega todas las combinaciones posibles de las variables seleccionadas a la regresión como términos de interacción. Haga doble clic en una variable para eliminarla del cuadro de lista Términos de interacción.
  • El botón Borrar términos borra todas las variables de los cuadros de lista Variables ficticias y Términos de interacción.

Muestras complejas de frecuencias, tablas y medias

Las opciones de Frecuencia, Tabla y Medias en Epi Info ™ 7 realizan cálculos estadísticos asumiendo que los datos fueron recolectados usando un muestreo aleatorio simple o un muestreo sistemático imparcial. Muchas encuestas también hacen uso de estrategias de muestreo más complejas, como la estratificación, el muestreo por conglomerados y el uso de fracciones de muestreo desiguales. Visual Dashboard ofrece tres opciones para analizar datos de muestra complejos: frecuencias de muestra complejas, medias de muestra complejas y tablas de muestra complejas.

En general, en el análisis de muestras complejas, hay una variable para la unidad de muestreo primaria (PSU) o el Clúster del que se seleccionó un sujeto de muestra. Si se eligieron las UPM de diferentes estratos (p. Ej., Estados o condados), puede haber una variable de estratificación (Estratificar por). El concepto de estratificación de muestras en el diseño de muestras complejas difiere del concepto de estratificación durante el análisis epidemiológico utilizando el comando TABLAS, ya que los estratos se eligen en el proceso de muestreo antes del análisis. Además, se usa una variable de peso (Peso) cuando las estrategias de muestreo resultan en probabilidades de selección desiguales. Los comandos de muestra complejos en Epi Info ™ 7 pueden calcular proporciones o medias con errores estándar y límites de confianza. Si se solicita una tabla 2 × 2, se proporcionan la razón de probabilidades, la razón de riesgo y la diferencia de riesgo.

Frecuencias de muestra complejas

La opción de frecuencias de Muestras complejas produce tablas de frecuencias para las variables seleccionadas. El proyecto de muestra contiene una encuesta grupal del Programa Ampliado de Inmunización (EPI). Utilizando el método EPI, un equipo seleccionó 30 comunidades (es decir, grupos) del área geográfica elegida y visitó cada una de las 30 comunidades. En cada uno, seleccionaron a siete niños en un rango de edad apropiado y determinaron el estado de inmunización de cada niño (VAC). El siguiente ejemplo determinará la frecuencia de las vacunas usando frecuencias de muestra complejas.

  1. Establezca el origen de datos en el proyecto Sample.prj.
  2. Seleccione el formulario Epi1 del menú Explorador de origen de datos.
  3. Haga clic derecho en el lienzo y seleccione Agregar gadget de análisis> Estadísticas avanzadas> Frecuencias de muestra complejas.
  4. La ventana de configuración de Frecuencias de muestra complejas se abre en el panel de propiedades Variables.

    Complex Sample Frequencies gadget
    Complex Sample Frequencies gadget

    Figura 8.56: gadget de frecuencias de muestra complejas

    Las opciones de frecuencias de muestra complejas son:

    • La frecuencia de identifica las variables cuya frecuencia se calcula.
    • Se selecciona una variable de peso para su uso en análisis ponderados.
    • Estratificar por identifica la variable que se utilizará para estratificar o agrupar los datos de frecuencia.
    • La fuente de alimentación identifica la unidad de muestreo primaria.
  5. En la lista desplegable Frecuencia de, seleccione VAC (la cantidad de vacunas recibidas). Esto calculará la frecuencia de las vacunas en el conjunto de datos.
  6. De la lista desplegable de la PSU, seleccione CLUSTER (el grupo de población para cada caso).
  7. Haz clic en Aceptar.
  8. Las frecuencias de muestra complejas aparecen en el lienzo.

    Complex Sample Frequencies results
    Complex Sample Frequencies results

    Figura 8.57: Resultados de frecuencias de muestra complejas

La información proporcionada en el resultado incluye:

  • Row%: el porcentaje de la fila; la frecuencia siempre será del 100% porque el número total de casos siempre será del 100%.
  • Col%: el porcentaje de la columna. Este número representa el cálculo de frecuencia; en este caso, los niños con 1 vacuna representan el 73.810% y los niños con 2 vacunas representan el 26.190% del total de 210 casos.
  • SE%: el error estándar, que tiene en cuenta el diseño de muestra complejo.
  • LCL% - Límite inferior de confianza.
  • UCL% - Límite superior de confianza.
  • Total: número total de personas / elementos encuestados.

Los resultados indican que el 73.8% de los 210 niños encuestados están vacunados, con un intervalo de confianza del 95% entre 64.4% y 83.2%.

El siguiente ejemplo es similar al anterior, excepto que se trata de una encuesta de conglomerados estratificada con una encuesta separada de 30 conglomerados completada en cada uno de los 10 estratos. Para analizar este conjunto de datos correctamente, tendremos en cuenta dónde vive cada niño (UBICACIÓN). También usaremos una variable de peso para tener en cuenta las diferencias en el tamaño de la población entre las diferentes ubicaciones.

  1. Establezca el origen de datos en el proyecto Sample.prj.
  2. Seleccione el formulario Epi10 del menú Explorador de origen de datos.
  3. Haga clic derecho en el lienzo y seleccione Agregar gadget de análisis> Estadísticas avanzadas> Frecuencias de muestra complejas.
  4. La ventana de configuración de Frecuencias de muestra complejas se abre en el panel de propiedades Variables.
  5. En la lista desplegable Frecuencia de, seleccione VAC.
  6. En la lista desplegable Peso, seleccione POPW (el porcentaje de la población total en cada grupo).
  7. En la lista desplegable Estratificar por, seleccione UBICACIÓN.
  8. De la lista desplegable de PSU, seleccione CLUSTER.
  9. Haz clic en Aceptar.
  10. Los resultados de las frecuencias de muestra complejas aparecen en el lienzo.

    Complex Sample Frequencies stratified and weighted results
    Complex Sample Frequencies stratified and weighted results

    Figura 8.58: Frecuencias de muestra complejas, resultados estratificados y ponderados

Los resultados indican que el 55.3% de los 2, 152 niños encuestados están vacunados, con un intervalo de confianza del 95% del 50.1% al 60.4%.

Muestra compleja significa

El comando Medias de muestra complejas se puede usar cuando la variable de resultado es continua, como la edad, el nivel de colesterol, etc. Puede calcular una media general con sus medidas de variación o comparar medias en una variable de agrupación. Como ejemplo de cálculo de medios con una variable de agrupación, use los datos del formulario Smoke ubicado en la carpeta del proyecto de ejemplo. En este ejemplo, el investigador está interesado en determinar si, entre los fumadores, existe una diferencia en el número promedio de cigarrillos fumados entre hombres y mujeres. En estos datos, la variable SEX se codifica como 1 = masculino y 2 = femenino.

  1. Establezca el origen de datos en el proyecto Sample.prj.
  2. Seleccione el formulario Humo en el menú Explorador de origen de datos.
  3. Haga clic derecho en el lienzo y seleccione Agregar gadget de análisis> Estadísticas avanzadas> Medios de muestra complejos.
  4. La ventana de configuración Medios de muestra complejos se abre en el panel de propiedades Variables.

    Complex Sample Means gadget
    Complex Sample Means gadget

    Figura 8.59: gadget de medios de muestra compleja

    Opciones de medias de muestra complejas:

    • Medios de identifica la variable para la que se calcula la media.
    • Se selecciona una variable de peso para su uso en análisis ponderados.
    • Estratificar por identifica la variable que se utilizará para estratificar o agrupar los datos de frecuencia.
    • La tabulación cruzada identifica la variable que se utilizará para tabular la variable principal.
    • La fuente de alimentación identifica la unidad de muestreo primaria.
  5. En la lista desplegable Medios de, seleccione NUMCIGAR (número de cigarrillos fumados).
  6. En la lista desplegable Peso, seleccione SAMPW (calculado en función del tamaño de la muestra y el tamaño de la población).
  7. En la lista desplegable Estratificar por, seleccione Estratos.
  8. En la lista desplegable Tabulación cruzada por, seleccione Sexo.
  9. En la lista desplegable PSU, seleccione PSUID.
  10. Haz clic en Aceptar.
  11. Los resultados de Medios de muestra complejos aparecen en el lienzo.

    Complex Sample Means results
    Complex Sample Means results

    Figura 8.60: Muestra compleja significa resultados

Los resultados indican que entre las 82 personas que fumaron cigarrillos, el número promedio de cigarrillos fumados por día (NUMCIGAR) para los hombres fue de 18.7 y 16.1 para las mujeres, con un intervalo de confianza del 95% de 15.6 a 21.8 para los hombres y de 13.7 a 18.4 para mujeres. Tenga en cuenta que el archivo Smoke tiene 337 individuos (este valor se muestra en la esquina superior derecha del lienzo). Sin embargo, la cantidad de cigarrillos fumados por día tiene datos solo para los 82 fumadores. Para los no fumadores, esta variable se dejó en blanco y, por lo tanto, se trata como datos faltantes y se excluye del análisis.

Tablas de muestra complejas

La opción Tablas de muestra complejas en Visual Dashboard le permite especificar una Variable de exposición y una Variable de resultado. El siguiente ejemplo utiliza tablas de muestra complejas para mostrar si la madre que recibe atención prenatal (PRENATAL) tiene un efecto en el estado de vacunación del niño. Si la madre había recibido atención prenatal, PRENATAL = 1, de lo contrario PRENATAL = 2.

  1. Establezca el origen de datos en el proyecto Sample.prj.
  2. Seleccione el formulario Epi10 del menú Explorador de origen de datos.
  3. Haga clic derecho en el lienzo y seleccione Agregar gadget de análisis> Estadísticas avanzadas> Tablas de muestra complejas.
  4. La ventana de configuración de Tablas de muestra complejas se abre en el panel de propiedades Variables.

    Complex Sample Tables gadget
    Complex Sample Tables gadget

    Figura 8.61: gadget de tablas de muestra complejas

    Opciones de tablas de muestra complejas:

    • Exposición identifica la variable que aparecerá en el eje horizontal de la tabla. Se considera el factor de riesgo.
    • Variable de resultado identifica la variable que aparecerá en el eje vertical de la tabla.
    • Se selecciona una variable de peso para su uso en análisis ponderados.
    • Estratificar por identifica la variable que se utilizará para estratificar o agrupar los datos de frecuencia.
    • La fuente de alimentación identifica la unidad de muestreo primaria.
  5. En la lista desplegable Exposición, seleccione PRENATAL.
  6. En la lista desplegable Resultado, seleccione VAC.
  7. En la lista desplegable Peso, seleccione POPW (el porcentaje de la población total en cada grupo).
  8. En la lista desplegable Estratificar por, seleccione Ubicación.
  9. En la lista desplegable de PSU, seleccione Cluster.
  10. Haz clic en Aceptar.
  11. Los resultados de las Tablas de muestra complejas aparecen en el lienzo. Es posible que deba desplazarse hacia abajo para ver los resultados completos.

    Complex Sample Tables results
    Complex Sample Tables results

    Figura 8.62: Resultados de tablas de muestra complejas

Los resultados muestran que el 60.7% de los niños cuyas madres recibieron atención prenatal fueron vacunados, en comparación con el 42.6% de aquellos niños cuyas madres no recibieron atención prenatal.

Los datos de 2 x 2 muestran que la razón de probabilidades en los datos fue 2.088, la razón de riesgo fue 1.427 y esta diferencia de riesgo es 18.2%. La razón de prevalencia (riesgo) indica que se vacunó 1.427 veces más hijos de mujeres que recibieron atención prenatal (60.734% dividido por 42.560% = 1.427), en comparación con los niños nacidos de mujeres que no habían recibido atención prenatal, una diferencia del 40%.

Recomendado:

La Elección Del Editor

Erradicación De La Malaria: Regreso Al Futuro - Grandes Rondas De Salud Pública

Cuide Sus Riesgos℠ Y Actúe RÁPIDO Para Prevenir Y Tratar Los Derrames Cerebrales - Grandes Rondas De Salud Pública

Tuberculosis Resistente A Múltiples Fármacos: Herramientas Para Abordar Una Nueva Cara De Un Viejo Enemigo - Grandes Rondas De Salud Pública

Es Ruidoso: La Salud Auditiva En Toda La Vida - Grandes Rondas De Salud Pública

Registro Nacional De Esclerosis Lateral Amiotrófica (ELA): Impacto, Desafíos Y Direcciones Futuras - Grandes Rondas De Salud Pública

Nuevas Fronteras En La Salud Laboral - Grandes Rondas De Salud Pública

Superar Las Barreras A La Adherencia A La Medicación Para Las Enfermedades Crónicas - Grandes Rondas De Salud Pública

Evaluación Del Recién Nacido: Mejora De Los Resultados - Grandes Rondas De Salud Pública

Sobredosis De Medicamentos Recetados: Una Epidemia Estadounidense - Grandes Rondas De Salud Pública

Prevención De Efectos Adversos Para La Salud De La Nanotecnología - Grandes Rondas De Salud Pública

Prevención Del Consumo Excesivo De Alcohol: Lo Que Puede Hacer La Salud Pública - Grandes Rondas De Salud Pública

Prevención De 1 Millón De Ataques Cardíacos Y Accidentes Cerebrovasculares Para 2017: La Iniciativa Million Hearts ™ - Grandes Rondas De Salud Pública

Erradicación De La Poliomielitis En La India - Grandes Rondas De Salud Pública

Prevención De Un Millón De Ataques Cardíacos Y Accidentes Cerebrovasculares: Un Punto De Inflexión Para El Impacto - Grandes Rondas De Salud Pública

Prevención Del Suicidio: Un Enfoque Integral De Salud Pública - Grandes Rondas De Salud Pública