bloques

  En un diseño aleatorizado por bloques completos se consideran tres fuentes de variabilidad: el factor de tratamientos, el factor de bloques y el error aleatorio. La palabra completo se debe a que en cada bloque se prueban todos los tratamientos, es decir, que los bloques están completos. La aleatorización se hace dentro de cada bloque; no se realiza de manera total como en el diseño completamente al azar. 
  Además del diseño completamente aleatorizado por bloques, existen otros diseños interesantes que explotan la idea de la formación de bloques, por ejemplo: el diseño de bloques incompletos balanceados. 
  
  El análisis por bloques permite controlar sistemáticamente fuentes de variabilidad externas que intervienen o actuan en la observación de la variable respuesta. Puesto que en estos casos, la componente aleatoria de error o error experimental asociada a cada observación refleja tanto el error aleatorio como la variabilidad debida a los elementos físicos que intervienen en la realización del experimento. Por tanto, se considerara no sólo el diseño de factores internos sino también la actuación de las fuentes de variabilidad externas que se reflejan en el diseño de los bloques o variación entre bloques.

  • Diseño por bloques aleatorizados completos
    • Adecuación del modelo
    • Estimación mínimo cuadrática de los parámetros y contrastes de significación
  • Diseño por bloques aleatorizados incompletos
    • balanceado
    • Estimación mínimo cuadrática de los parámetros
    • Información inter-bloque en el diseño balanceado

  •    Contrastes de comparación múltiple en el caso del diseño aleatorizado por bloques completos considerando efectos fijos de los tratamientos y bloques.
Si en un diseño aleatorizado por bloques los tratamientos son fijos y el análisis de varianza indica que existe una diferencia significativa entre las medias de tratamiento, el investigador estará interesado en realizar comparaciones adicionales en grupos de medias de tratamiento, para determinar cuáles son las medias que difieren. Con algunas variantes, cualquier método estudiado en el diseño unifactorial puede ser utilizado para este fin. Para llevar a cabo las comparaciones entre grupos de tratamiento para un diseño aleatorizado por bloques se debe sustituir el número de réplicas o repeticiones (n) por el número de bloques (b) en las fórmulas utilizadas en cada uno de los métodos estudiados en los diseños unifactoriales y además se debe utilizar los grados de libertad del error que están definidos por (a-1)(b-1) para un diseño aleatorizado por bloques. A continuación se presentarán los métodos descritos para el diseño unifactorial, expresando solamente las variantes que se deben incorporar para llevar a cabo la comparación de medias de tratamiento para un diseño aleatorizado por bloques. Las hipótesis a probar, el procedimiento y conclusiones se harán de igual manera que para el diseño unifactorial.
  1.   Comparación de Parejas de Medias de Tratamientos.
    1. Método de la Mínima Diferencia Significativa (LSD). El LSD estará dado de la siguiente manera: LSD= t_alfa/2(a-1)(b-1)*sqrt(2MS_e/b)
    2. Prueba de Intervalos Múltiples de Duncan. El error estándar de cada promedio se calcula de la siguiente forma: S_Yi· = sqrt(MS_e/b) . Para encontrar los intervalos significativos r_alfa(p,f), para p=2,3,...,a, a sigue siendo .... el nivel de significancia y f el número de grados de libertad del error que son (a-1)(b-1). De igual manera para  encontrar los mínimos intervalos significativos R_p = r_alfa(p,f)*S_Y·  con p=2,3,...,a, se tomará f como el número de grados de libertad del error (a-1)(b-1).
    3. Prueba de Tukey. El valor crítico de todas las comparaciones vendrá dado por: T_alfa = q_alfa (a,f)*S_Y· donde S_Y· es el error estándar de cada promedio y está dado por S_Y·=sqrt(MS_e/b) y f=(a-1)(b-1) los grados de libertad del error, alfa el nivel de significancia y a el número de tratamientos.
  2.  Comparación de Medias de Tratamientos Individuales 
  3.  Comparación de Tratamientos con un control.
  •    Eficiencia relativa del diseño aleatorizado por bloques. Relación existente entre esta fórmula y la estimación de derivada.
   El análisis o estudio de un experimento puede ser llevado a cabo a través de un diseño unifactorial (o diseño Completamente Aleatorizado) o por un diseño completamente aleatorizado por Bloques. Sin embargo, se puede dar el caso que no se obtenga la misma sensibilidad. En general al utilizar un diseño unifactorial la suma de cuadrados medios del error (MS_e) podría ser mayor que al utilizar un diseño aleatorizado por bloques; ya que el diseño aleatorizado por bloques reduce suficientemente la cantidad de ruido para lograr detectar diferencias significativas entre los tratamientos.
   En un diseño aleatorizado por bloques resulta útil estimar la eficiencia relativa, para compararlo con el diseño unifactorial. El valor que resulta de esta estimación se puede interpretar como el incremento del número de réplicas necesarias que hay que llevar a cabo en un diseño unifactorial para que pueda ser usado en lugar de un diseño aleatorizado por bloques, y así mantener la misma sensibilidad en ambos diseños.

   La forma de definir la eficiencia relativa es mediante la siguiente fórmula:
R=[(df_b+1)*(df_CS+3)*sigma2_CA ]/ [(df_b+3)*(df_CA+1)*sigma2_b]

donde sigma2_CA y sigma2_b son la varianza del error experimental del diseño unifactorial  y del diseño aleatorizado por bloques, respectivamente, y df_CA y df_b sus grados de libertad (df_CA=N-a  y df_b=(a-1)*(b-1)).  Se realiza entonces un ajuste sobre la diferencia grados de libertad entre los dos diseños mediante la razón de grados de libertad en R.
   Como puede observarse para calcular la eficiencia relativa, se deben llevar a cabo estimaciones para sigma2_CA y sigma2_b, las cuales es posible estimarlas de la siguiente forma: sigma2_b ~ MS_e del diseño aleatorizado por bloques, y sigma2_CA=[ (b-1)*MS_bloques + b*(a-1)*MS_e ]/(ab-1), es un estimador insesgado de la varianza del error de un diseño unifactorial, con MS_bloques la suma de cuadrados medios del efecto de los bloques.

  •    Describir cómo es la formulación iterativa de la estimación de un dato faltante en el caso de dos datos faltantes.
   Algunas de las observaciones en uno de los bloques puede hacer falta, cuando se utiliza un Diseño Aleatorizado por Bloques Completos; esto puede suceder debido a algún descuido o error, o por razones fuera de control del experimentador, como la pérdida de alguna unidad experimental. Una observación faltante genera un problema en su análisis, ya que hace que el Diseño este desbalanceado, y se dice que los tratamientos y los bloques no son ortogonales, porque todos los tratamientos no ocurren en todos los bloques. Existen varias formas de solucionar este problema, una de ellas es realizar un análisis aproximado en el que se estima la observación faltante y luego se lleva a cabo el Análisis de Varianza tomando la observación estimada como si fuera un dato real. Este análisis aproximado consiste en hacer estimaciones de los valores faltantes, de manera que se minimice la media de cuadrados del error.
   Supóngase que falta la observación Y_ij que corresponde al tratamiento i y al bloque j; y se representa por x.
   El procedimiento que se lleva a cabo para estimar Y_ij, es el siguiente:
  1. Se calcula el gran total con la observación faltante y se representa por Y`_·· .
  2. Se obtienen los totales del tratamiento y del bloque con el dato faltante que se representa por Y`_i· y Y`_·j respectivamente.
  3. Se calcula el estimador de la observación faltante de la siguiente forma: Y_ij = [ aY`_i· + bY`_·j - Y_·· ] /[(a-1)(b-1)]
   Para más detalles (Ver Douglas C. Montgomery, 1991, Pág 133 y 134)

   Puede suceder que falte más de una observación en el experimento. Existen dos formas para encontrar estas observaciones:
  1. Utilizar el procedimiento descrito anteriormente iterativamente. Por ejemplo, supóngase que hacen falta dos observaciones, la forma de llevar a cabo la estimación de las dos observaciones, es estimando arbitrariamente el primer valor faltante y se usa este valor como un dato real para estimar el segundo. Luego se hace una segunda estimación para el primer dato faltante utilizando la estimación del segundo; con la estimación encontrada para el primero se vuelve a estimar el segundo. Este procedimiento continúa hasta obtener la convergencia en los valores estimados; es decir, hasta que resulten valores parecidos en cada iteración.
  2. Escribir la suma de cuadrados del error en función de los datos faltes, derivar con respecto a cada uno, igualar a cero y resolver las ecuaciones que resultan. 
   En general, para cualquier problema que falten datos, el número de los grados de libertad del error se debe reducir en uno por cada dato que es estimado.

   Además del diseño completamente aleatorizado por bloques, existen otros diseños interesantes que se introducen brevemente a continuación y que explotan la idea de la formación de bloques, por ejemplo: el diseño de bloques incompletos balanceados.


  •   Diseños por bloques incompletos balanceados
   Puede darse el caso que en algunos experimentos que usan Diseños Aleatorizados por Bloques no se puedan llevar a cabo los ensayos de todas las combinaciones de tratamientos dentro de cada bloque; ya sea por la escasez de los recursos del experimento, por la situación económica, o por el tamaño físico de los bloques. Para analizar estos tipos de experimentos se usa el Diseño Aleatorizado por Bloques en los que cada tratamiento no está presente en cada bloque; y a este tipo de Diseño se conocen como Diseño Aleatorizado por Bloques Incompletos.
   Un Diseño particular de ellos son los Diseños por Bloques Incompletos Balanceados; el cual consiste en un Diseño por Bloques Incompleto en el que cualquier par de tratamientos ocurren juntos el mismo número de veces. Si se tienen tratamientos a y se pueden probar k (k tratamientos en cada bloque entonces un Diseño Balanceado por Bloques Incompletos puede ser construido tomando (a k) combinaciones de bloques y asignándose una combinación de tratamientos diferentes a cada bloque. Sin embargo frecuentemente es posible obtener un Diseño Balanceado con menos de (a k) combinaciones de bloques.
  • REPRESENTACIÓN SIMBÓLICA DE LOS DATOS
  •  MODELO ESTADÍSTICA
  • SUMAS Y MEDIAS DE CUADRADOS
  • ANÁLISIS ESTADÍSTICA
  • ESTIMACIÓN DE LOS PARÁMETROS DEL MODELO
  • COMPARACIÓN ENTRE TRATAMIENTOS
  •   Análisis de datos-Ejemplo
DISEÑO COMPLETAMENTE ALEATORIZADO PRO BLOQUES en R
 
> Block=rep(c("P15","P20","P25","P30","P35"),c(4,4,4,4,4))
> Treat=rep(c("A","B","C","D"),5)
> Datos=c(7,12,14,19,7,17,18,25,15,12,18,22,11,18,19,19,18,19,23,11)
> Data=cbind(Datos,Treat,Block)
> par(mfrow=c(1,2),cex=.8)
> interaction.plot(Treat,Block,Datos,type="b",legend=FALSE)
> interaction.plot(Block,Treat,Datos,type="b",legend=FALSE)
> M<-matrix(Datos,nrow=4,ncol=5)
> dimnames(M)=NULL
> rownames(M)=c("A","B","C","D");colnames(M)=c("P15","P20","P25","P30","P35")
> M
  P15 P20 P25 P30 P35
A   7   7  15  11  18
B  12  17  12  18  19
C  14  18  18  19  23
D  19  25  22  19  11

> library(lattice)
> B=stripplot(Block~Datos|Treat,layout=c(4,1))
> A=stripplot(Treat~Datos|Block,layout=c(5,1))
> print(A,plit=c(1,1,1,2),more=T)
> print(B,plit=c(1,2,1,2),more=F)

> Data=as.data.frame(Data)
> Da=as.list(Data)
> plot.design(Datos~Da$Treat+Da$Block)
> mod.aov=aov(Datos~Da$Treat+Da$Block)
> summary(mod.aov)

> library(PASWR)
> checking.plots(mod.aov)
> CI=TukeyHSD(mod.aov,which="Da$Treat")
> Media=NULL;for(j in 1:4){Med=mean(M[j,]);Media=c(Media,Med)}
> barplot(Media,ylim=c(0,30))
> library(psych)
> error.bars(t(M),add=T)
> par(mfrow=c(2,2))
> plot(mod.aov,pch=20)

> Mm=NULL;for(i in 1:4){S=mean(M[i,]);Mm=c(Mm,S)}
> Mn=NULL;for(i in 1:5){S=mean(M[,i]);Mn=c(Mn,S)}
> m=cbind(M,Mm)
> m=rbind(m,c(Mn,mean(Mm)))
> SSblock=4*sum((m[5,1:5]-mean(Datos))^2)
> SStrat=5*sum((m[1:4,6]-mean(Datos))^2)
> SS=NULL;for(j in 1:4){S=sum(((M[j,]-mean(M)))^2);SS=c(SS,S)}
> SStot=sum(SS)
> SSerror=SStot-SStrat-SSblock

    Comentarios