Análisis De Varianza Y Regresión

para su fácil enamblaje.

Análisis de Varianza y Regresión: Una Clase Práctica

El Análisis de Varianza y Regresión son dos técnicas de análisis estadístico ampliamente utilizadas para determinar las relaciones entre dos o más variables. Estas técnicas permiten predecir cómo los cambios en una variable pueden impactar el valor de otra. Estudiaremos la teoría y ejemplos prácticos detallados paso a paso.

¿Qué es el Análisis de Varianza (ANOVA)?

El análisis de varianza (ANOVA) es una herramienta estadística utilizada para determinar si hay diferencias significativas entre dos o más grupos. Esta técnica se utiliza para proporcionar una prueba estadística sobre ciertos grupos. Se pueden usar para comparar la media de dos grupos (ANOVA bidireccional) u otros grupos más complejos (ANOVA con múltiples grupos). El ANOVA ayuda a determinar si dos o más grupos experimentan las mismas condiciones o si existen diferencias importantes entre los grupos.

Ejemplo 1: Prueba de Análisis de Varianza Bidireccional

Supongamos que un agricultor está interesado en determinar si hay alguna diferencia en la producción de fruta entre dos variedades de árboles. El agricultor cría varios grupos de árboles frutales, con unas variedades, y mide la producción de fruta de cada árbol durante el año. El agricultor puede realizar una prueba de análisis de varianza bidireccional para averiguar si hay alguna diferencia significativa en la producción de fruta entre ambas variedades.

Matemáticamente, el análisis de varianza bifactorial se realiza siguiendo los pasos a continuación:

  • Calcular el valor medio de todos los grupos.
  • Calcular la varianza dentro de los grupos.
  • Calcular la varianza entre los grupos.
  • Calcular el estadístico de la prueba y comparar con el nivel de signifcación deseado.

Supongamos que hemos recopilado los siguientes datos:

Grupo Valor
Variedad 1 57.4, 45.2, 52.8, 70.2, 38.2, 43.8, 52.8, 57.0
Variedad 2 52.6, 42.4, 52.6, 70.6, 52.6, 48.6, 52.6, 60.6

El valor medio de la Variedad 1 es 52.1 y el valor medio de la Variedad 2 es 52.9. Entonces,

Varianza dentro de los grupos

Primero tenemos que calcular la varianza dentro de cada grupo:

Variedad 1:

Varianza = $\frac{\sum_{i=1}^{n} (x_i – \bar{x})^2}{n-1}$

Variedad 1: Varianza = $\frac{(57.4- 52.1)^2 + (45.2- 52.1)^2 +(52.8- 52.1)^2 +(70.2- 52.1)^2 +(38.2- 52.1)^2 +(43.8- 52.1)^2 +(52.8- 52.1)^2 +(57.0- 52.1)^2}{8-1}$

Variedad 1: Varianza = 43.8

Variedad 2:

Varianza = $\frac{(52.6- 52.9)^2 + (42.4- 52.9)^2 +(52.6- 52.9)^2 +(70.6- 52.9)^2 +(52.6- 52.9)^2 +(48.6- 52.9)^2 +(52.6- 52.9)^2 +(60.6- 52.9)^2}{8-1}$

Variedad 2: Varianza = 28.1

Varianza entre los grupos

Ahora tenemos que calcular la varianza entre los grupos:

Varianza entre los grupos = $\frac{(52.1- 52.9)^2 + (42.1- 52.9)^2 +(45.8- 52.9)^2 +(70.2- 52.9)^2 +(38.2- 52.9)^2 +(43.8- 52.9)^2 +(52.8- 52.9)^2 +(57.0- 52.9)^2}{2-1}$

Varianza entre los grupos = 11.4

Estadístico de la prueba y nivel de significación

Ahora tenemos que calcular el estadístico de la prueba:

Estadístico de la prueba = $\frac{Varianza entre los grupos}{Varianza dentro de los grupos}$

Estadístico de la prueba = $\frac{11.4}{43.8 + 28.1}$

Estadístico de la prueba = 0.11

Ahora podemos comparar el valor estadístico de la prueba con el nivel de significación deseado para determinar si hay diferencias significativas entre los grupos. En este caso, una prueba de significación de 0,05 es suficiente para determinar una diferencia significativa entre los grupos. Al ser el valor estadístico 0.11, no hay diferencia significativa entre los grupos.

Ejemplo 2: Prueba de Análisis de Varianza de Múltiples Grupos

Supongamos que un investigador está interesado en determinar si hay alguna diferencia significativa en el rendimiento académico de estudiantes de diferentes niveles educativos. El investigador recoge los resultados de una prueba de matemáticas de los estudiantes de primer, segundo y tercer grado, y quiere saber si hay alguna diferencia significativa entre los grupos. El investigador puede utilizar el ANOVA de múltiples grupos para ver si los resultados difieren significativamente entre los grupos.

Matemáticamente, el análisis de varianza de múltiples grupos se realiza siguiendo los pasos a continuación:

  • Calcular el valor medio de todos los grupos.
  • Calcular la varianza dentro de los grupos.
  • Calcular la varianza entre los grupos.
  • Calcular el estadístico de la prueba y comparar con el nivel de significación deseado.

Supongamos que hemos recopilado los siguientes datos:

Grupo Valor
Grado 1 83, 84, 91, 60, 85, 74, 94, 68, 91, 93
Grado 2 86, 73, 81, 91, 82, 90, 65, 75, 76, 91
Grado 3 95, 96, 96, 95, 90, 86, 92, 95, 93, 94

El valor medio de la Grado 1 es 80.6, el valor medio de Grado 2 es 80.9 y el valor medio de Grado 3 es 93.4. Entonces,

Varianza dentro de los grupos

Primero tenemos que calcular la varianza dentro de los grupos:

Grado 1:

Varianza = $\frac{\sum_{i=1}^{n} (x_i – \bar{x})^2}{n-1}$

Grado 1: Varianza = $\frac{(83- 80.6)^2 + (84- 80.6)^2 +(91- 80.6)^2 +(60- 80.6)^2 +(85-80.6)^2 + (74- 80.6)^2 + (94- 80.6)^2 + (68- 80.6)^2
+ (91- 80.6)^2 + (93- 80.6)^2}{10-1}$

Grado 1: Varianza = 61.09

Grado 2:

Varianza = $\frac{(86- 80.9)^2 + (73- 80.9)^2 +(81- 80.9)^2 +(91- 80.9)^2 + (82- 80.9)^2 + (90- 80.9)^2 + (65- 80.9)^2 + (75- 80.9)^2 + (76- 80.9)^2 + (91- 80.9)^2}{10-1}$

Grado 2: Varianza = 46.16

Grado 3:

Varianza = $\frac{(95- 93.4)^2 + (96- 93.4)^2 + (96- 93.4)^2 + (95- 93.4)^2 + (90- 93.4)^2 + (86- 93.4)^2 + (92- 93.4)^2 + (95- 93.4)^2
+ (93- 93.4)^2 + (94- 93.4)^2}{10-1}$

Grado 3: Varianza = 12.16

Varianza entre los grupos

Ahora tenemos que calcular la varianza entre los grupos:

Varianza entre los grupos = $\frac{(80.6- 80.9)^2 + (80.6- 93.43)^2 +(80.9- 93.4)^2}{3-1}$

Varianza entre los grupos = 158.15

Estadístico de la prueba y nivel de significación

Ahora tenemos que calcular el estadístico de la prueba:

Estadístico de la prueba = $\frac{Varianza entre los grupos}{Varianza dentro de los grupos}$

Estadístico de la prueba = $\frac{158.15}{61.09 + 46.16 + 12.16}$

Estadístico de la prueba = 10.21

Ahora podemos comparar el valor estadístico de la prueba con el nivel de significación deseado para determinar si hay diferencias significativas entre los grupos. En este caso, una prueba de significación de 0,05 es suficiente para determinar una diferencia significativa entre los grupos. Al ser el valor estadístico 10.21, hay diferencias significativas entre los grupos.

Ejemplo 3: Regresión Lineal Simple

Supongamos que un neurólogo está interesado en estudiar la relación entre el peso y la longitud de los adultos estadounidenses. El neurólogo recoge los datos de longitud y peso de un grupo de adultos estadounidenses y toma nota de los dos valores. El neurólogo quiere averiguar si hay una relación significativa entre la longitud y el peso.

Matemáticamente, la regresión lineal se realiza siguiendo los pasos a continuación:

  • Calcular la media de cada variable.
  • Calcular la varianza de cada variable.
  • Calcular la covarianza entre las variables.
  • Calcular la relación entre las variables.
  • Calcular el coeficiente de correlación.
  • Calcular el estadístico de la prueba y comparar con el nivel de significación deseado.

Supongamos que hemos recopilado los siguientes datos:

Deja un comentario

Esta web utiliza cookies propias para su correcto funcionamiento. Contiene enlaces a sitios web de terceros con políticas de privacidad ajenas que podrás aceptar o no cuando accedas a ellos. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Más información
Privacidad
Longitud (cm) Peso (lbs)
172 130
153 100
168 88
175 150