Trabajo Experimentos Preliminar

58
Universidad de Costa Rica Escuela de Estadística XS-3510 Principios de Diseños Experimentales “Agentes microbiológicos, patógenos y contaminantes químicos en el agua superficial de la Microcuenca del Río Purires, Cartago” Solicitado por: Prof. Álvaro Castro Elaborado por: Oscar Mario Carmona Arguedas B01345 Sergio Cubero Soto B02035 Melissa Valverde Hernández A86571

Transcript of Trabajo Experimentos Preliminar

Page 1: Trabajo Experimentos Preliminar

Universidad de Costa Rica

Escuela de Estadística

XS-3510 Principios de Diseños Experimentales

“Agentes microbiológicos, patógenos y contaminantes químicos en el agua superficial de

la Microcuenca del Río Purires, Cartago”

Solicitado por:

Prof. Álvaro Castro

Elaborado por:

Oscar Mario Carmona Arguedas   B01345

Sergio Cubero Soto                        B02035

Melissa Valverde Hernández           A86571

Ciudad Universitaria Rodrigo Facio

Martes 3 de julio de 2012

Page 2: Trabajo Experimentos Preliminar

Introducción

En el presente proyecto “Agentes microbiológicos, patógenos y contaminantes

químicos en el agua superficial de la Microcuenca del Río Purires, Cartago”. Se investigará,

bajo el análisis estadístico, los diferentes organismos microbiológicos y fisicoquímicos que se

encuentran presentes en la cuenca del Río Purires, en los diferentes puntos o zonas donde se

tomaron las muestras respectivas para efectuar el estudio; y evidenciar si hay diferencias entre

ellos para detectar la contaminación en el agua superficial de la Microcuenca del Río Purires.

Para la realización de este proyecto, se trabajó conjuntamente con el Instituto de

Investigaciones en Salud (INISA). El INISA de la Universidad de Costa Rica, es una unidad

académica multidisciplinaria dedicada a la investigación en el campo de la salud humana y de

las ciencias afines.

Además, es importante mencionar que los investigadores del INISA realizan los

análisis microbiológicos en el Laboratorio de Microbiología de Alimentos y Aguas del INISA,

y se basan en la edición 20 (Año 1999) del Standard Methods for the Examination of Water

and Wastewater de la APHA. Además, los análisis fisicoquímicos se realizarán en el

Laboratorio de Calidad de Aguas del CICA siguiendo los Métodos de Análisis Químico

Ambientales (MAQA), acreditados por la norma INTE ISO IEC 17025:2005. Los MAQA

están basados en la edición 21 (Año 2005) del Standard Methods for the Examination of

Water and Wastewater de la APHA.

Para el muestreo, se realizó de acuerdo con los protocolos con los que cuenta el CICA

y que están dentro del alcance de la acreditación de los ensayos bajo la norma INTE ISO IEC

17025:2005.

Además, en el proyecto se explicará diferentes pruebas estadísticas para cuando se

presenta la heterocedasticidad en las variables donde se proceda realizar algún análisis

experimental. Finalmente, se expondrá las pruebas no paramétricas para comparaciones

múltiples como la prueba de Dunn y prueba de Suma Rangos de Wilcoxon.

Page 3: Trabajo Experimentos Preliminar

Objetivos

I. Determinar las diferencias entre los puntos de toma de las muestras de la Microcuenca

del río Purires, mediante análisis de microrganismos específicamente como los

Coliformes fecales, la Escherichia coli, los Enterococcus fecalis, y de los elementos

físico químicos como el pH, la demanda bioquímica de oxígeno y el nitrato.

II. Analizar los aspectos de las diferentes pruebas paramétricas y no paramétricas

utilizadas en caso de heterocedasticidad de las variables en diseños experimentales

balanceados y desbalanceados; así como las pruebas de comparación múltiples no

paramétricas.

Justificación del proyecto

Actualmente, las actividades humanas producen un impacto directo al medio ambiente,

de tal manera que se hace necesario realizar investigaciones y estudios que nos den a conocer

las consecuencias de estas acciones humanas en los recursos naturales.

En el medio ambiente se encuentran recursos naturales sumamente importantes para la

vida, un recurso esencial en la vida biológica es el agua.  El agua es uno de los recursos más

vulnerables ante la contaminación ambiental. Como es un recurso necesario para los seres

vivientes, en particular para los seres humanos, inevitablemente la salud pública de las

personas se encuentra afectada.

Por tanto es importante analizar y determinar las variables microbiológicas (presencia

de microrganismos patógenos) y químicas (contaminantes tóxicos), que explican la calidad del

agua. Además, es pertinente conocer las correlaciones de estas variables con respecto a las

actividades que se desarrollen en una zona específica.

Este proyecto de investigación se estudiará un área importante para la detección de

contaminación microbiológica y química,  lo constituye precisamente la microcuenca del Río

Purires, ubicada en la provincia de Cartago. Esta microcuenca pertenece a la cuenca del Río

Reventazón-Parismina que drena a la Vertiente Atlántica, que en conjunto con la cuenca del

Page 4: Trabajo Experimentos Preliminar

Río Tárcoles, constituyen las dos principales cuencas del país, donde se ubica el 70% de la

población y reciben las aguas residuales sin tratar provenientes del Gran Área Metropolitana.

Se han realizado algunos estudios que han demostrado que el agua de la microcuenca

en su parte alta, tiene una calidad de buena a regular, el principal aporte de contaminantes son

los sedimentos, provenientes del efecto de erosión sobre los suelos. El segundo aporte de

contaminación es la materia fecal y las aguas jabonosas provenientes de la población

localizada en su parte alta. No obstante, el agua fluye con características de calidad inolora,

incolora y con baja turbiedad.

Es por eso que en el estudio como se mencionó anteriormente, se localizaron tres

puntos o zonas de la microcuenca del Río Purires, en donde se  tomaron tres muestras

mensuales en cada una de las tres zonas de la Microcuenca. Estas zonas fueron determinadas

de la siguiente manera, una primera zona donde se encuentra la parte alta de la micro cuenca,

una segunda zona donde se presenta un uso agrícola y una tercera zona donde se realiza una

actividad urbana y un uso industrial. Es por eso que en el proyecto es importante observar que

microrganismos y que factores fisicoquímicos se encuentran presentes en el agua con respecto

a cada zona.

Definición de Variables:

Variables Respuesta:

Los datos de los diferentes agentes microbiológicos así como los elementos químicos

encontrados en el agua sustraída de la microcuenca, serán utilizadas como variables respuesta

para el análisis estadístico del proyecto.

Las variables microbiológicas son las siguientes:

Coliformes totales y coliformes fecales:

El grupo de coliformes ha sido definido basado en relaciones bioquímicas y no

genéticas. Los géneros Citrobacter, Enterobacter, Klebsiella y Escherinchia son los

denominados coliformes totales, y solamente el género Escherinchia es denominado el grupo

coliformes fecales. Estos grupos se utilizan como índices de contaminación fecal debido a que

Page 5: Trabajo Experimentos Preliminar

son muy frecuentes en heces, son fáciles de detectar en el laboratorio, además en algún

aspecto pueden relacionarse a patógenos causantes de enfermedad en el ser humano. Es

importante resaltar que los coliformes fecales tienen significado sanitario, por lo que son los

que más interesan en el análisis microbiológico de alimentos (Arias, et al. 2008; Pascual, et al.

2000).

La técnica utilizada para el análisis de coliformes totales y fecales en agua es la de

Número más probable (NMP). Esta es una técnica estadística indirecta que da un estimado de

la población y no identifica una especie en particular, y el número de microrganismos

obtenidos se reporta en NMP/mL (Arias, et al. 2008).

Escherinchia coli (E. coli):

Escherinchia coli pertenece a la familia Enterobacteriaceae, el cual es parte de la flora

normal del tracto gastrointestinal del ser humano y de otros animales. Aunque la mayoría de

E. coli no causan enfermedad gastrointestinal, algunos grupos pueden causar diarrea y

secuelas severas o discapacidad (Meng, et al. 2001). La técnica utilizada para determinar esta

bacteria en agua es NMP.

Enterococcus faecalis (E. faecalis):

La gran importancia de los enterococcus radica en que compartir con otras bacterias

sus genes de patogenicidad. Además esta bacteria es cada vez más estudiada con mayor interés

debido a que son una importante causa de infecciones intrahospitalarias y son de muy difícil

tratamiento por su amplia resistencia a antibióticos (Forbes, et al. 2009). La técnica utilizada

para determinar esta bacteria en agua es NMP.

Para la detención de esta bacteria se desarrolla una prueba presuntiva y una

confirmatoria. La presuntiva se realizará para determinar crecimiento microbiano en medios

selectivos, incubados a 35ºC por 24 horas, y la confirmatoria, permitirá detectar la presencia

específica del microrganismo de interés.

Las variables fisicoquímicas son las siguientes:

Page 6: Trabajo Experimentos Preliminar

El pH :

Se puede definirse como una medida que expresa el grado de acidez o basicidad de una

solución en una escala que varía entre 0 y 14 . Además, la acidez aumenta cuando el pH

disminuye. Una solución con un pH menor a 7 se dice que es ácida, mientras que si es mayor a

7 se clasifica como básica. Una solución con pH 7 será neutra. También los cambios en la

acidez o el pH pueden ser causados por la actividad propia de los organismos, deposición

atmosférica (lluvia ácida), características geológicas de la cuenca y descargas de aguas de

desecho (Goyenola, 2007).

El instrumento de medición del pH es un con potenciómetro calibrado, además como

unidad de medida se tendrá el pH a una temperatura 20,0 ºC.

Detección bioquímica de oxígeno:  

La demanda o detección bioquímica de oxígeno se puede definir como la “medida de la

cantidad de oxígeno requerido para degradar la materia orgánica de una muestra de agua, por

medio de una población microbiana heterogénea. La información obtenida en la prueba

corresponde a la materia orgánica biodegradable.” (León, C. 2009). Esta se mide en

miligramos de oxígeno diatómico por litro (mgO2/l).

Esta prueba es, generalmente utilizada para el estudio de contaminación en aguas

residuales, municipales e industriales. Es importante realizar esta medición ya que permite

calcular los efectos de las descargas de desechos domésticos e industriales sobre la calidad de

las aguas. Los datos de esta prueba son utilizados para el diseño de plantas de tratamiento de

aguas residuales.

Para la medición de la detección bioquímica de oxígeno, se realiza el método por

incubación a 20,0ºC durante 5 días; se mide la concentración de oxígeno al inicio y al final del

período, con un electrodo selectivo.

Nitrato:  

Se define como la sal formada por la combinación del ácido nítrico con una base que

puede ser amonio, potasio, sodio, de Chile. (RAE, 2012).

Page 7: Trabajo Experimentos Preliminar

La concentración de nitratos de origen natural en las aguas es de unos pocos

miligramos por litro. El aumento de concentraciones de este elemento químico tiene la causa

directa en determinadas prácticas agrícolas, ya que los agricultores vierten grandes cantidades

de abonos nitrogenados en los campos para poder mantener una producción adecuada e

incrementar las cosechas, la mayoría de los cuales no son absorbidos por las plantas ni por los

árboles, sino que se depositan en el suelo y, o bien van filtrándose hacia capas

progresivamente más profundas hasta que se concentran en las capas freáticas, es decir,

aquellas capas más superficiales de los acuíferos que son susceptibles de ser explotadas

mediante pozos, o bien por escorrentía llegan hasta las aguas superficiales (Blancas, C 2001).

Al ser captadas estas fuentes hídricas y ser trasladadas para consumo de los seres

vivos, la presencia de este nitrato puede dar como resultado diferentes enfermedades

peligrosas y mortales especialmente para la salud humana. La unidad de medida del nitrato es

mg NO3-/L.

Factor tratamiento:

Como factor tratamiento se analizará los diferentes puntos donde se tomaron las

muestras de la Microcuenca del Río Purires. Estos datos se recolectaron de acuerdo a los

protocolos con los que cuenta el CICA y que están dentro del alcance de la acreditación de los

ensayos bajo la norma INTE ISO IEC 17025:2005. En estos tres diferentes puntos, se tomaron

tres muestras de cada punto mensualmente durante la época lluviosa y seca.

Estos son tres puntos diferentes son:

Zona alta: ubicada en la zona alta de Cartago cerca de la naciente del río. Esta abastece

el Acueducto Rural de El Guarco, de modo que esta zona es susceptible a la contaminación

microbiológica y química.

Zona de uso agrícola: en esta zona se localizan la mayoría de las producciones

agrícolas de la zona, siendo las más importantes las plantaciones de plantas ornamentales

(como flores o helechos para exportación) cultivados bajo invernaderos. Estas plantaciones se

ubican en las zonas bajas de la micro cuenca. También se presenta en la zona, principalmente

en las partes bajas de Tablón, Tobosi, Barrancas y Guatuso las plantaciones de caña,

Page 8: Trabajo Experimentos Preliminar

legumbres y hortalizas. Además se realizan concesiones mineras alrededor de Coris, Bermejo

y Guatuso. El área total de esta zona agrícola y minera es de 11,9%.

Zona de uso urbano: El uso urbano ocupa 5 949 km2 del lugar. Estos se ubican cerca

de la zona industrial y la mayor concentración de población en la zona. Estos asentamientos

generan múltiples descargas de desechos y la contaminación de la microcuenca.

Cabe destacar que la mayoría de la zona (el 67.5% de la superficie de la micro-cuenca)

está cubierta por pastos y sectores reforestados. Además los bosques así como la Zona

Protectora de la Carpintera se ubican en las zonas altas, especialmente en las nacientes de los

ríos.

Aspectos importantes

En el presente proyecto, para la decisión de rechazo o aceptación  de las pruebas se

utilizará un alfa de 0,05. Se utilizarán los programas estadísticos R Cran.

Elección del diseño experimental

En las investigación se desarrolló un diseño experimental el cual consiste en un análisis

de un solo factor, para cada de las variables de respuesta, explicada por los tres puntos.

Tratando de determinar la cantidad de microrganismos microbiológicos y fisicoquímicos que

se encontraba en cada punto, para luego realizar una comparación entre ellos.

Se ajusta al problema pues se tiene un solo factor para determinar la cantidad de cada

una de las variables estudiadas, en este caso es el punto de muestreo.

Análisis Estadístico

Para la investigación de la cuenta de del Río Purires,  se procedió a analizar los datos

de las diferentes muestras. Para ello los investigadores del INISA tomaron mensualmente tres

muestras en cada uno de los tres puntos de la Microcuenca, durante la época seca y lluviosa, a

partir del 2010. Finalmente, se lograron tomar 108 muestras.

Page 9: Trabajo Experimentos Preliminar

Para cada muestra se analizó un perfil microbiológico como la presencia de agentes

virales como los colifagos, patógenos bacterianos como coliformes totales ,coliformes fecales,

Escherichia coli, Eneterococcus fecalis, Enterococcus sp., Pseudomonas aeruginosa,

Staphylococcus aureus, Colifagos somáticos y Colifagos f+, y un perfil fisicoquímico

completo como demanda biológica de oxígeno o DBO, demanda química de oxígeno o DQO,

sólidos en suspensión, amonio, ph, demanda de oxigeno;  metales como cadmio, plomo,

níquel, zinc, cromo, arsénico y un no metales como fósforo y nitrato. Y algunos físicos como

la conductividad y temperatura.

Inicialmente, se tiene ocho microbiológicos y dieciséis fisicoquímicos. Pero se realizó

una selección microbiológicos como coliformes fecales, Eneterococos fecalis y Escherichia

coli; y tres fisicoquímicos como demanda biológica de oxígeno, pH y nitrato.

Para la investigación se optó realizar un análisis de varianza por cada variable de

respuesta con respecto a cada punto de muestreo. Primeramente, se realizó la verificación de

supuestos de las variables, además es importante mencionar que las muestras en cada punto

son independientes.

Análisis de cada variable de respuesta

Primeramente se realizó una investigación preliminar en cada una de las variables, en

la cual se realizaron gráficos. En consecuencia de ese análisis preliminar, en las diferentes

variables tanto microbiológicas como los fisicoquímicos se encontraron valores extremos, en

este caso se le comunicó a los investigadores del proyecto, donde ellos tomaron las decisiones

pertinentes para seguir con el análisis de las variables.

Finalmente, para cada variable se tomaron diferentes medidas remediales para

minimizar los diferentes problemas que se presentaban en las variables, en donde no se

cumplieron los supuestos para realización del análisis de variancia (ANDEVA).

Page 10: Trabajo Experimentos Preliminar

Gráfico 1. Matriz de gráficos de caja por cada variable vrs punto

1 2 3

0e+0

01e

+05

2e+0

53e

+05

4e+0

55e

+05

Coliformes Fecales vrs Punto

Puntos de Muestreo

Col

iform

es F

ecal

es

1 2 3

050

000

1000

0015

0000

E Coli vrs Punto

Puntos de Muestreo

E C

oli

1 2 3

050

000

1000

0015

0000

Enterococcus Fecales vrs Punto

Puntos de Muestreo

Ent

eroc

occu

s F

ecal

es

1. Microbiológicos .

Para cada variable se realizo un análisis de inspección grafica para identificar los

posibles problemas que podía tener, así como de la distribución de las variables por cada

punto, a continuación se muestra un grafico de cajas por cada variable.

Fuente: INISA

En el figura 1 se observa que las tres variables presenta problemas de valores

extremos, además también se logra distinguir problemas de heterocedasticidad (varianza

desigual de los residuos) esto debido a que conforme se pasa del punto 1 al 2 y del 2 al 3

aumenta la variabilidad de dichas variables, para poder confirmar dichos problemas se acudió

a los gráficos de los residuales para evaluar los supuestos de la prueba de analisis de varianza,

los supuestos para que este analisis tenga validez son los siguientes: los residuos se distribuyen

normal, además tienen varianza igual (homocedasticidad), por otro lado se sabe de ante mano

que se cumple el supuesto de que las observaciones son independientes. (Ver anexos Figuras

1,2 y 3)

En los gráficos de evaluación de supuestos se observa que en el gráficos de residuales

contra valores predichos que no existe igualdad de varianza de los residuos debido que se

Page 11: Trabajo Experimentos Preliminar

observan patrones en forma de megáfono, dado esto concluimos que no se cumplen el

supuesto de homocedasticidad en ninguna de las variables microbiológicas. Por otro lado en

los gráficos de probabilidad normal se observan gran cantidad de valores extremos en toda las

variables, estos valores causan el no cumplimiento del supuesto de normalidad, así mismo se

confirma que estos tienen influencia sobre el analisis de varianza por lo tanto pueden

concluirse que son valores atípicos los cuales se deben corregir puesto que estos pueden ser

los causantes de la heterocedasticidad y de la violación del supuesto de normalidad.

Se realizaron diversas medidas remediales como transformaciones pero no se logro

corrección algún, debido a estos hubo diversas reuniones con el encargado de la investigación

para saber que decisión tomaban ellos para tratar este tipo de valores, se llego a la conclusión

de que se eliminaran las 18 primeras observaciones referentes a los meses de setiembre y

octubre del año 2011, esto debido a que en estos meses se presento un problemas en el

laboratorio con el analisis de las muestras tomadas en el rio. También se decidió como medida

remedial obtener un promedio de cada punto sin los valores extremos, y sustituir los valores

extremos de cada punto por su promedio correspondiente. Luego realizar todas estas acciones

se volvió a realizar la evaluación de supuestos para ver si se habían corregido.

Ante esto se analizara cada variable respuesta por separa debido a que a cada una de

ellas se realizo una medida remedial particular.

Coliformes Fecales

Como se menciono antes se realizo un procedimiento el cual fue sustituir los valores

extremos por el promedio del punto de muestra sin dichos valores, después de esto se procedió

a realizar la inspección grafica del cumplimiento de los supuesto.

Page 12: Trabajo Experimentos Preliminar

Gráfico 2. Matriz de gráficos de evaluación de supuestos con la corrección de valores extremos

Fuente: INISAComo se visualiza en el Gráfico 2, los problemas heterocedasticidad, falta de

normalidad no se corrigen y por el contrario con la corrección de los valores extremos lo que

sucede es que aparecen nuevos valores extremos por lo tanto se vuelve a realizar de nuevo la

corrección de valores extremos saldrán nuevos valores lo cual presenta un problema el cual no

tendría fin. Dado esto se decide volver a probar con una trasformación. La transformación que

surge efecto según el método de box cox es el logaritmo natural. A continuación se mostrara

la evolución de supuestos con dicha transformación.

Page 13: Trabajo Experimentos Preliminar

Gráfico 3. Matriz de gráficos de evaluación de supuestos con la corrección de valores extremos y la transformación

ln

Fuente: INISA

Con la transformación se ve claramente en el grafico de residuales contra valores

predichos que corrige el problema de heterocedasticidad, así como los problemas de valores

atípicos puesto que todos los valores se encuentran entre -3 y 3 desviaciones estándar. (Ver

grafico de residuos estandarizados contra los puntos de muestra). Uno de los supuestos donde

no hay completa seguridad de afirmar que se cumpla por medio del analisis grafico es el de

normalidad, por lo tanto se recurre la prueba formal de normalidad de Shapiro-Wilk, dicha

prueba nos confirma que los residuos se distribuyen normal. (P-value 0,112>0,05)

Salida 1. Prueba de normalidad Shapiro Wilk Shapiro-Wilk normality test

Data: modln$residuals

W = 0.9771, p-value = 0.112

Page 14: Trabajo Experimentos Preliminar

Dado que ahora se tiene plena seguridad que la variable transformada cumple los

supuestos para la realización del analisis de varianza se procedió a realizar dicho analisis el

cual se muestra en la siguiente tabla.

Tabla 1. Analisis de varianza, variable coliformes fecales

gl SC CM F Valor pPunto 2 205.32 102.66 154.3 <2e-16 ***

Residuos 87 57.88 0.67Total 89 263.20 2.96Fuente: INISA

De acuerdo con el analisis de varianza anterior se puede concluir con una confianza del

95% que hay suficiente evidencia estadística para rechazar que los puntos de muestra son

iguales, esto pues el valor p es menor al nivel de significancia (p-value 2e-16<0,05).

Partiendo de que hay diferencias entre los puntos es importante realizar comparaciones

múltiples entre los puntos para saber cual(es) punto(s) son los diferentes, para identificar estas

diferencias se opto por utilizar la prueba de comparaciones múltiples de medias de Tukey la

cual se muestra a continuación.

Salida 2. Prueba de comparación múltiple de medias de TukeyTukey multiple comparisons of means

95% family-wise confidence level

Fit: aov(formula = lncolifeca ~ pmuestra)

Diferencia

Inferior Superior p adj

2-1 2.390473 1.8883055 2.89264 0.00E+003-1 3.640708 3.1385408 4.142876 0.00E+003-2 1.250235 0.7480679 1.752403 2.00E-07

Con lo observado en la salida 2 podemos concluir que con un nivel de confianza del

95% que existen diferencias en la cantidad media de coliformes fecales en los tres puntos de la

toma de muestra.

Page 15: Trabajo Experimentos Preliminar

En conclusión y con lo visto en los gráficos iniciales se puede afirmar que conforme se

desciende por la cuenca del rio Purires se encuentra mayor cantidad de coliformes fecales y

que la diferencia de un punto a otro es estadísticamente significativa. Una explicación a este

fenómeno es que el punto uno es una zona de poca actividad humana y por lo tanto los valores

de coliformes fecales son menores, en comparación con el punto dos donde se encuentra un

asentamiento urbano. Por otro lado punto tres es el que presenta valores altos de coliformes

fecales puesto que es el último punto rio abajo, en esta zona se encuentra un grupo de

industrias y además es el punto donde vienen a dar todos los residuos de las demás zonas del

rio.

Escherichia coli

Igualmente con los coliformes fecales se encontraba una violación a los supuestos (Ver

anexos Figura 2), se sustituyó los valores extremos por el promedio del punto de muestra sin

dichos valores, luego se procedió a efectuar los gráficos para el cumplimiento de los

supuestos.

Grafico 4. Matriz de gráficos de evaluación de supuestos con la corrección de valores extremos.

Fuente: INISA

Page 16: Trabajo Experimentos Preliminar

Como se observa en el grafico 4, existe incumplimiento de homocedasticidad y falta de

normalidad, al igual que en coliformes fecales, no se corrige y se sigue el problema con la

corrección de los valores extremos, se descubren nuevos valores extremos. Lo cual se procede

a realizar una trasformación a la variable. Según el método de box cox la transformación

apropiada es logaritmo natural. Seguidamente se analizaran los supuestos, con la

transformación que se le realizó a la variable.

Grafico 5. Evaluación de supuestos con transformación

Fuente: INISA

Se ve en el grafico Normal Q-Q , que con la transformación logarítmica se corrige el

problema de normalidad, por lo tanto se recurre la prueba formal de normalidad de Shapiro-

Wilk, para la confirmación de dicho supuesto. Además, los valores atípicos se encuentran en

el intervalo deseado entre -3 y 3, lo cual indica que no hay problema con esos valores (Ver

Page 17: Trabajo Experimentos Preliminar

grafico de residuos estandarizados contra los puntos de muestra). Con respecto a la

homocedasticidad, en el gráfico de residuales contra valores predichos se observa que

levemente le supuesto se cumple, como no hay una completa seguridad observacional en el

gráfico, se realiza la prueba formal Bartlett, ya que se cumple la normalidad de la variable.

Salida 3. Prueba de normalidad Shapiro WilkShapiro-Wilk normality test

data: modln2$residuals

W = 0.9814, p-value = 0.2243Salida 4. Prueba de homocedasticidad Bartlett

Bartlett test of homogeneity of variancesdata: lnecoli by pmuestra

Bartlett's K-squared = 3.6341, df = 2, p-value = 0.1625

Ejecutando las pruebas formales, con la prueba Shapiro-Wilk se confirma el

cumplimiento de normalidad de la variable E. coli (p-value 0,2243>0,05). Además, se realiza

la prueba Bartlett para la igualdad de variancias, dando como resultado la aprobación del

supuesto de homocedasticidad (p-value 0,1625>0,05).

Por tanto, se tiene el cumplimiento de ambos supuestos. Ahora, se procede a ejecutar el

análisis de variancia de la variable. A continuación se presenta el resultado:

Tabla 2. Análisis de variancia, variable E. Coli

F.V. gil SC CM F Valor P

Punto 2 201.63 100.82 141.9<2e-16

***Residuos 87 61.82 0.71

Fuente: INISA

De acuerdo con el análisis de varianza descrito anteriormente, con un 95% de

confianza que hay suficiente evidencia estadística para rechazar que los puntos de muestra son

iguales, (p-value 2e-16<0,05). Como hay diferencias de la variable E. Coli entre los puntos

de muestreo, es importante ejecutar las comparaciones múltiples entre los puntos, para conocer

Page 18: Trabajo Experimentos Preliminar

estas diferencias se procedió a utilizar la prueba no paramétrica de comparación de medias de

Tukey la cual se muestra a continuación.

Salida 5. Prueba de comparación múltiple de medias de Tukey

Tukey multiple comparisons of means95% family-wise confidence level

Fit: aov(formula = lnecoli ~ pmuestra)Diferenci

a Inferior Superior p adj2-1 2.403941 1.8849719 2.92291 0.00E+003-1 3.59936 3.0803906 4.118329 0.00E+003-2 1.195419 0.6764496 1.714388 1.20E-06

Se concluye con un nivel de confianza del 95% que existen diferencias en la cantidad

media de E. Coli en los tres puntos de la toma de muestra. Al igual que los coliformes fecales,

se afirma que conforme se desciende por la cuenca del rio Purires se presenta un aumento en

la cantidad de E. Coli. Además, es evidente que la diferencia de un punto a otro es

significativa.

Enterococcus Fecales

Al igual que las demás variables del área microbiológica se sustituyeron los valores

extremos por el promedio del punto de muestra sin dichos valores, para después hacer el

análisis de los residuos con el fin de observar si cumplen todos los supuestos para la

realización del ANOVA.

Como se visualiza (Ver Anexos Figura 3), se presentan problemas heterocedasticidad,

de no normalidad. Además es importante destacar que con la corrección de los valores

extremos lo que sucede es que aparecen nuevos valores extremos, este problema es el mismo

que han presentado las variables anteriores, por lo tanto se toma la decisión de realizar una

transformación, la mas adecuada para el comportamiento de los datos es el logaritmo natural,

además esta transformación se confirmo por medio de método de box cox. A continuación se

mostrara el efecto de la transformación y como esta ayuda con el problema de

heterocedasticidad.

Page 19: Trabajo Experimentos Preliminar

Grafico 6. Enteroccocus fecalis, Evaluación de supuestos con la transformación

Fuente: INISA

En el grafico de residuales contra valores predichos se observa como el logaritmo

natural corrige el problema de heterocedasticidad, sin embargo la violación al supuesto de

normalidad esta latente, debido a que en el grafico de probabilidad los residuos no se ajustan a

la línea normal. Debido a la violación del supuesto normalidad se procede a realizar la prueba

no paramétrica de Kruskal Wallis la cual es la homologa del ANOVA cunado no se cumplen

el supuesto de normalidad, esta prueba se muestra en la salida 6.

Salida 6. Prueba de Suma de Rangos de Kruskal Wallis

Kruskal-Wallis rank sum testdata: lnenetefeca by pmuestra

Kruskal-Wallis chi-squared = 54.9483, df = 2, p-value = 1.17e-12

De acuerdo con esta prueba se puede concluir con una confianza del 95% que hay

suficiente evidencia estadística para rechazar que los puntos de muestra son iguales, esto pues

el valor p es menor al nivel de significancia (p-value 1.17e-12<0,05). Partiendo de que hay

Page 20: Trabajo Experimentos Preliminar

diferencias entre los puntos es importante realizar comparaciones múltiples entre los puntos

para saber cual(es) punto(s) son los diferentes. Dado que se utilizo una prueba no paramétrica

se tienen que usar prueba que se concordante con la utilizada, para nuestro caso se utilizaron

dos pruebas las cuales son: la Prueba de Dunn y la Prueba de Comparaciones Múltiples de

Sumas de Rangos de Wilcoxon. Estas pruebas serán explicadas de forma breve mas adelante.

Para ambas pruebas se utilizo un nivel de significancia de 0.0166, este se obtuvo

dividendo el alfa de 0.05 entre el número de comparaciones (para nuestro caso es 3). En los

tabla 3 y 4 se muestran dichas pruebas.

Tabla 3. Prueba de Comparaciones Múltiples

Comparaciones

W P-Value

1-2 88 7.07e-08

1-3 28 3.466e-10

2-3 167.5 2.926e-05

Fuente: INISA

Tabla 4. Prueba de comparaciones múltiples de Dunn

Diferencia de los Rangos Medios

Estadístico de Prueba

-28.73 -10.79505

-20.93 -10.79505

-49.66 -10.79505

Fuente: INISA

Con lo observado en ambos cuadros con un nivel de confianza del 98.33% se puede

concluir que existen diferencias la presencia de Enterococcus fecales en los tres puntos del rio.

Este resultado ha sido una constante a lo largo de todo el análisis de las variables

microbiológicas, pues como se había explicado en las coliformes fecales esto se debe que el

Page 21: Trabajo Experimentos Preliminar

punto uno es una zona de poca actividad humana en comparación con el punto dos donde se

encuentra un asentamiento urbano, y además en punto tres es el último punto rio abajo, y

sumado a esto en la zona se encuentra un grupo de industrias.

1. Fisicoquímicos

Como se mencionó anteriormente se encontraron valores extremos, al igual que las

variables microbiológicas se procedió calcular un promedio de cada punto sin los valores

extremos, y sustituir los valores extremos de cada punto por su promedio correspondiente. Al

igual que las variables microbiológicas, se volvió a efectuar la evaluación de los supuestos

para cada variable para la verificación de normalidad y homocedasticidad, y observar si los

problemas se habían corregido.

Es importante mencionar que como las variables fisicoquímicas son más estables con

respecto a las variables microbiológicas, y además no hubo ningún problema con las muestras

como sucedió en las variables microbiológicas, es por eso que en estas variables se decidió no

excluir los datos referentes a los meses de setiembre y octubre del año 2011.

Para cada variable se realizo un análisis de inspección grafica para identificar los

posibles problemas que podía tener, así como de la distribución de las variables por cada

punto, a continuación se muestra un grafico de cajas por cada variable.

Gráfico 7. Matriz de gráficos de caja por cada variable vrs punto

Page 22: Trabajo Experimentos Preliminar

Fuente: INISA

Para estas variables, primeramente se realizó  un análisis preliminar con los gráficos de

cajas con respecto a cada punto, esto con el fin de observar valores extremos y conocer la

variabilidad de la demanda bioquímica de oxígeno, pH y nitrato en cada punto.

En las variables fisicoquímicas, la demanda bioquímica de oxigeno y nitrato, se

observa que el supuesto de homocedasticidad se incumple, ya que la amplitud de las caja es

diferente en cada punto de muestreo. Además en la demanda bioquímica de oxigeno se notan

valores extremos, siendo posiblemente atípicos. Por el contrario en la variable nitrato, no se

hayan valores extremos en cada punto.

Específicamente en la variable pH se observa un valor extremo el punto 1, note que la

tamaño de las cajas es similar en cada uno de los punto, por lo tanto puede ser que no hay

problemas de heterocedasticidad.

Demanda bioquímica de oxigeno

Como se indicó se realizó un análisis preliminar de la variable, por tanto se utilizó el análisis

gráfico. En el gráfico de residuales contra predichos, se observa una forma de cono conforme

aumentan los predichos aumenta la variabilidad de los residuales; es decir el supuesto de

homocedasticidad se rechaza. Con el gráfico Normal Q-Q, se observa que no hay un patrón definido en

los datos, es decir el supuesto de normalidad se incumple. Ahora, en el gráfico de residuos

Page 23: Trabajo Experimentos Preliminar

estandarizados contra los puntos, se confirma un valor atípico específicamente en el punto 3.

(Ver anexos Figura 4)

Es por ello que se realizaron medidas remediales con los valores extremos;

primeramente se calcula el promedio de los valores de demanda bioquímica de oxigeno en el

punto 3, sin el valor atípico. El valor atípico se sustituyó por el promedio anteriormente

calculado.

Gráfico 8. Matriz de gráficos de evaluación de supuestos con la corrección de valores extremos

Fuente: INISA

Luego, para corregir el problema de los supuestos de normalidad y homocesdaticidad,

se decidió utilizar la transformación de Box-Cox, el cual dió como resultado un valor de -0,74.

Page 24: Trabajo Experimentos Preliminar

Aplicando la transformación correspondiente, se evalúan nuevamente los supuestos,

realizando los siguientes gráficos:

Gráfico 9. Matriz de gráficos de evaluación de supuestos con la corrección de valores extremos y la transformación

Fuente: INISA

Note que en el gráfico de residuales contra predichos, el supuesto de homocedasticidad

se cumple, pues no se observa ningún patrón definido de los datos. Luego, con el supuesto de

normalidad se incumplen puesto que los datos no se ajustan a un patrón de la línea de

normalidad.

Salida 7. Prueba de normalidad Shapiro WilkShapiro-Wilk normality test

data: model1t$resW = 0.9215, p-value = 0.01395

Para confirmar la homocedasticidad en la demanda bioquímica de oxigeno, se realiza

la prueba de Barttlet, dando como resultado el no rechazo del supuesto. (P-value

0,1852>0,05).

Salida 8. Prueba de homocedasticidad Bartlett

Bartlett test of homogeneity of variances

Page 25: Trabajo Experimentos Preliminar

data: dbo^-0.685149 by punto

Bartlett's K-squared = 3.373, df = 2, p-value = 0.1852

Como el supuesto de normalidad se rechaza, se decide aplicar el método no

paramétrico de Kruskall - Wallis, dando como resultado que el punto de muestreo no es

significativo en la demanda bioquímica de oxigeno. (P-value 0,1316>0,05).

Salida 9. Prueba de Kruskall WallisKruskal-Wallis rank sum test

data: dbo^-0.685149 by punto

Kruskal-Wallis chi-squared = 4.0563, df = 2, p-value = 0.1316

pH

Para la variable pH, se realizó un análisis gráfico preliminar, pero como no violaba los

supuestos de una manera abrupta. No se realizó ninguna transformación y ningún cambio en

los valores extremos ya que no se ameritaba.

A continuación se muestra el análisis de supuestos:

Gráfico 10. Matriz de gráficos de evaluación de supuestos

Fuente: INISA

Page 26: Trabajo Experimentos Preliminar

Se ve que le valor extremo no es un valor atípico ya que se encuentra en el rango

aceptable de -3 a 3, en el gráfico de residuos estandarizados contra los puntos. Además, en el

gráfico de Normal Q-Q los datos no se ajusta adecuadamente a la línea de normalidad, por

tanto el supuesto se rechaza, como el gráfico no se observa muy evidente la no normalidad, se

optó por la realizar la prueba de Shapiro, dando como resultado el rechazo del supuesto.

(p-value 0,04677<0.05). Luego, el gráfico de residuales contra predichos no hay un patrón

definido, confirmando así el supuesto de homocedasticidad.

Salida 10. Prueba de normalidad Shapiro WilkShapiro-Wilk normality test

data: model2$res

W = 0.9388, p-value = 0.04677

Como el supuesto de normalidad se incumple, se realiza el método no paramétrico

Kruskall- Wallis, se confirma que hay diferencias entre los puntos con respecto al pH. (p-value

0,001845 < 0,05).

Salida 11. Prueba de Kruskall WallisKruskal-Wallis rank sum test

data: ph by punto

Kruskal-Wallis chi-squared = 12.59, df = 2, p-value = 0.001845

Con ese resultado se opta por realizar comparaciones múltiples entre los puntos

mediante la prueba Tukey. Con el siguiente gráfico, donde se refleja los puntos pares contra

las diferencias en promedio con los niveles de cada punto.

Gráfico 11. Prueba de Tukey, diferencia de medias en cada par de puntos

Page 27: Trabajo Experimentos Preliminar

Fuente: INISA

Se observa que la comparación del punto 1 y el punto 2, el intervalo de la diferencia de

las medias de cada punto contempla el 0, mientras que las comparaciones entre el punto 3 y

punto 1, y además los pares punto 3 y punto 2, los intervalos se excluye el 0, es decir la

cantidad de pH en el punto 3 es significativa comparada con los demás puntos.

Nitrato

Igualmente se ejecutó un análisis gráfico preliminar de la variable, se no visualizaron

problemas en la normalidad, pues los valores se ajustaban a la línea de normalidad. Con

respecto a la homocedasticidad, esta se incumple, ya que se visualiza un patrón de cono en el

gráfico de residuales contra valores predichos. Además, no se observan valores extremos. (Ver

Anexos)

Como medida remedial, igual se realizó una transformación para mejorar los

problemas de heterocedasticidad con el método box cox el cual indicó un valor de 0,3979.

A continuación el análisis de supuestos después de ejecutar las medida remedial:

Gráfico 12. Matriz de gráficos de evaluación de supuestos con la transformación

Page 28: Trabajo Experimentos Preliminar

Fuente: INISA

Se puede contemplar, que en gráfico de residuales contra predichos presenta una forma

de cono, por tanto se rechaza homocedasticidad. En gráfico Normal Q-Q, se observa que los

datos se encuentran en la línea de normalidad, es decir el supuesto se cumple. Finalmente, en

el gráfico de residuos estandarizados contra los puntos, no se presentan valores extremos.

Salida 12. Prueba de normalidad Shapiro WilkShapiro-Wilk normality test

data: model3t$res

W = 0.9568, p-value = 0.1711

Salida 13. Prueba de homocedasticidad BartlettBartlett test of homogeneity of variances

data: dbo^0.3979999 by punto

Bartlett's K-squared = 12.7539, df = 2, p-value = 0.001700

Como el supuesto de normalidad se cumple, pero se presenta heterocedasticidad, es por

ello que se opta por realizar la prueba Welch, dando como resultado que la cantidad de nitrato

es diferente con respecto a cada punto de muestreo. (p-value 1,08e-06<0,05).

Salida 14. Prueba WelchOne-way analysis of means (not assuming equal variances)

data: nitra and punto

Page 29: Trabajo Experimentos Preliminar

F = 30.6538, num df = 2.000, denom df = 19.128, p-value = 1.082e-06

Para la comparación múltiple entre los puntos, se realiza Tukey, y se confirma con un

95% de confianza que el punto 3 difiere en la cantidad de nitrato con respecto a cada punto.

Gráfico 13. Prueba de Tukey, diferencia de medias en cada par de puntos

Fuente: INISA

Al igual que la variable pH, se observa que la comparación del punto 1 y el punto 2, el

intervalo de la diferencia de las medias de cada punto contempla el 0, mientras que las

comparaciones entre el punto 3 y punto 1, y además los pares punto 3 y punto 2, los intervalos

se excluye el 0, es decir la cantidad de nitrato en el punto 3 es significativa comparada con los

demás puntos.

Análisis en caso de la presencia de heterocedasticidad: Pruebas no paramétricas y otros

medios

Basados en el artículo de Karl Moder, se realizó un análisis de algunos métodos que se

utilizan en el campo experimental cuando se da la presencia de la desigualdad de varianzas.

Page 30: Trabajo Experimentos Preliminar

La heterocedasticidad se ha considerado un serio problema a la hora de realizar un

análisis de variancia, especialmente en diseños desequilibrados. Cuando no se cumple la

homocedasticidad, la prueba t y la F tienen a no rechazar la hipótesis de igualdad de

variancias, es decir superan el valor nominal de alfa; dependiendo de si el diseño es

balanceado o no, el número de observaciones y el número de niveles de cada factor. Se han

recomendado diferentes soluciones como:

i. Mantener la tasa de error tipo I por debajo del nivel del 5% seleccionando un nuevo valor

crítico de F a un nivel de significancia más estricto. Esto no es apropiado ya que se pierde

potencia de la prueba y el nivel de alfa no se mantiene en muchas situaciones.

ii. Utilizar transformaciones como raíz cuadrada, logaritmo, arsen, para normalizar las

distribuciones. Esto no conduce a varianzas homogéneas, sino que las pruebas de

homocedasticidad no lo suficientemente potente como para encontrar significancia.

iii. Utilizar métodos robustos para el análisis. Una opción es la prueba de Welch que mantiene

la tasa de error tipo I, a pesar de la heterocedasticidad.

iv. Utilizar pruebas no paramétricas, como Kruskall-Wallis.

En el artículo se examinaron estos métodos mediante el proceso de simulación para

determinar cual es el más adecuado para cuando se presenta la desigualdad de varianzas.

Basados en esas recomendaciones escogieron siete diferentes tipos de métodos de análisis:

1. Prueba F para análisis de varianzas como método estándar.

2. Prueba de Welch para más de dos muestras. La prueba de Welch es considerada en

muchos paquetes estadísticos como la opción adecuada para cuando haya problema de

heterocedasticidad.

3. ANOVA ponderado disponible en SAS basado en la aproximación Satterthwaite en

análisis con varias repeticiones.

4. Prueba de Kruskal-Wallis.

Page 31: Trabajo Experimentos Preliminar

5. Prueba de permutaciones usando el estadístico F (implementado en paquete de R

“coin”)

6. Prueba de permutaciones basado en Kruskall-Wallis.

7. Tipo especial de la T cuadrada de Hotelling. Esta es usada en diseños balanceados con

muchas observaciones por grupo de cada nivel del factor.

Para este análisis de simulación se utilizaron 100 000 datos con distribución normal y

se desarrollaron los siete métodos en diseños balanceados y en diseños desbalanceados

excluyeron la prueba de T cuadrada de Hotelling. Los niveles de cada factor van entre 3 y 20,

de 3 a 30 observaciones y la desviación entre 1 y 3.

Gráfico 14. Significancia empírica para 5 niveles de un factor y 5 observaciones

cada uno con un rango de σ 1:σ 2:… :σ 5=3 :1: … :1(α=0,05)

Fuente: Alternatives to F-Test in One Way ANOVA in case of heterogeneity of variances (a simulation study)

En el gráfico 1 se observa el error empírico tipo I comparada con un alfa nominal de

0,05.  Se tienen 5 niveles de cada factor, 5 observaciones por muestra y las

desviaciones con una relación de 3:1:...:1. Para los métodos de Kruskall-Wallis y T

cuadrada de Hotelling, ambos mantienen el alfa nominal de 0,05. Los otros métodos

exceden este valor en más del 8,6%; teniendo el peor ajuste la prueba F de ANOVA

estándar y la prueba de permutaciones con el estadístico F.

Page 32: Trabajo Experimentos Preliminar

Welch está dentro del 20% de tolerancia, esta puede ser apropiada para esta situación

en específico.

Gráfico 15. Significancia empírica para 5 niveles de un factor y 5 observaciones

cada uno con un rango de σ 1:σ 2:… :σ 5=3 :1: … :1(α=0,10)

Fuente: Alternatives to F-Test in One Way ANOVA in case of heterogeneity of

variances (a simulation study)

En el gráfico 2 se presentan la misma situación del gráfico 1 a diferencia de que se

tomó un alfa nominal de 0,01. En este caso se observan resultados similares al gráfico 1: la

prueba de Kruskall-Wallis tiende a ser conservador y la prueba t cuadrado de Hotelling es el

único método que mantiene el alfa nominal exacto.

La prueba de t cuadrado de Hotelling puede ser usada en situaciones donde el número

de observaciones por muestra es al menos el número de niveles de factor. Esto porque no hay

programa que pueda calcular la densidad acumulada de la función t cuadrada directamente,

por lo tanto se utiliza una aproximación con la función F. Para esta prueba específica esto

restringe el número de niveles de factor al número de observaciones al máximo. Teniendo

disponibles tablas t cuadrado no se tendría esta limitación.

Aún en situaciones con estrecha relación de desviaciones estándar, la prueba F y la

prueba de permutaciones con este estadístico no mantienen el alfa nominal.

Page 33: Trabajo Experimentos Preliminar

Cuando tenemos diseños balanceados, la prueba de Welch no es apropiada en

situaciones cuando el número de factores es mayor, especialmente con tamaños de muestra

pequeña. El análisis por mínimos cuadrados ponderados no es muy apropiada en la mayoría de

situaciones. Además, la prueba de Kruskall-Wallis es muy conservadora si el tamaño de

muestra es más pequeño o igual al número de niveles de factor. Raramente esto también

ocurre en la prueba oneway-test, especialmente en diseños de bloques.

La prueba de permutaciones utilizando el estadístico de Kruskall-Wallis excede el alfa

nominal en forma tolerable. La prueba t cuadrado de Hotelling es mejor aunque parece ser

conservadora en varias situaciones, como en muestras pequeñas. Esto puede darse por utilizar

la aproximación con la función F.

La prueba de Kruskall-Wallis para niveles pequeños de factor el cálculo exacto de

probabilidad lleva a tener un error tipo I mayor al esperado. Usando pruebas de permutación

con pequeños tamaños de muestra y alto número de permutaciones es problemático porque

hay un número bastante pequeño de reorganización de los datos, la probabilidad de crear todos

los datos posibles es varias veces más alta.

En el caso de diseños desbalanceados, Box dice que la “influencia de la

heterocedasticidad es mucho mayor en diseños desbalanceados que balanceados”. En este

estudio se confirmó lo dicho.

Para pequeños número de niveles del factor ningún método mantiene un alfa nominal.

Las pruebas de Welch y ANOVA ponderado se comportan mejor en esta situación pero con

mayor número de niveles de factor,  los resultados se ponen peor.

La prueba de Kruskall-Wallis vuleve mejor para mayor número de niveles de factor

pero cuando aumenta el número de observaciones el problema se pone peor.

Para este caso, ningún método es apropiado con la presencia de heterocedasticidad,

dando como afirmación que a un tamaño de más grande de muestra no corresponde a una

mayor varianza.

Cuando hay gran diferencias entre las desviaciones estándar, con gran número de

observaciones y el número de niveles de factor es pequeño, todos los métodos trabajan bien.

Tan pronto como aumenta el nivel de los factores sólo un método es apropiado: la prueba de

Page 34: Trabajo Experimentos Preliminar

permutaciones con el estadístico Kruskall-Wallis; pero esta prueba se vuelve conservadora si

el número de observaciones aumenta.

La estrategia de probar utilizando estos métodos no es usado por la baja potencia que

presentan estas pruebas. Por tanto, ante las sospechas de heterocedasticidad, se puede aplicar

la prueba t cuadrado de Hotelling.

En el caso de diseños desbalanceados, se debe buscar el método que mejor se adapte a

cada situación específica.

Kruskal Wallis: Pruebas De Comparaciones Múltiples No Paramétricas A Posteriori

Cuando realiza la prueba de análisis de varianza no paramétrica como la prueba de

Kruskal Wallis se tiene como objetivo observar si las medianas de los grupos a comparar son

diferentes, si la prueba confirma que son diferentes surge la duda de qué prueba de

comparaciones múltiples utilizamos, este problema es muy común puesto que la mayoría

estudios los residuos no se distribuyen normal , además las medidas remediales existen no

ayudan a la solución de este tipo de problemas, por otro lado cabe resaltar que en el ámbito

académico no se presta mucho énfasis a este tipo de pruebas. Ante esta situación se realizo una

revisión bibliográfica para ver cuales pruebas de comparaciones múltiples son las más

utilizadas en el ámbito estadístico, según diversos autores (Gibbons, 1986 ; Leach, 1979;

García et al, 2007) hay dos pruebas las cuales son: la prueba de comparación múltiple de Dunn

y la prueba de Sumas de Rangos de Wilcoxon.

Prueba de Comparaciones Múltiples De Suma De Rangos De Wilcoxon.1

Es la prueba no paramétrica homologa a la prueba t para análisis paramétricos, esta

prueba es la misma que se ve en los cursos de métodos estadísticos.

La prueba de suma de rangos de Wilcoxon lo que busca es probar que la distribución

de las frecuencias de la medidas originales es la misma para los grupos considerados, o por el

contrario que no existen diferencia entre los grupos (Gutíerrez, 2010). La única diferencia con

1 Como el objetivo de este trabajo no es explicar cómo se realiza la prueba, se remite a lector al libro “Introduction to Statistics: a Nonparametric Approach for the Social Sciences” página 160 del autor John Wiley.

Page 35: Trabajo Experimentos Preliminar

la prueba de Suma de Rangos de Wilcoxon es el alfa o nivel de significancia utilizado, debido

que al hacer comparaciones múltiples este se divide entre el número de comparaciones

múltiples a realizar α

k (k−1)2

causando que la prueba se vuelva muy conservadora (la

probabilidad de cometer error tipo 1 es muy baja).

Como el objetivo de este trabajo no es explicar cómo se realiza la prueba, se remite al

lector al libro “Introduction to Statistics: a Nonparametric Approach for the Social Sciences”

página 160 de John Wiley.

Prueba de Comparaciones Múltiples De Dunn

Esta prueba es similar a la prueba Tukey para ANOVA y se utiliza para comparar los

grupos entre si cuando no se cumplen los supuestos de normalidad y heterocedasticidad. Se

dice que los grupos son diferentes si la diferencia absoluta de rangos (los mismos utilizados

en la prueba anterior) medios son mayores al estadístico de prueba, por lo tanto la región

crítica se define como (Dunn, 1964):

|Ri−R j|>Z αk (k−1)

2

√ n (n+1)12 ( 1

ni

+ 1n j

)Por lo tanto, si se cumple la condición anterior estaríamos rechazando la hipótesis nula

de igualdad de medianas de los grupos comparados. Al igual que la prueba de Suma de

Rangos de Wilcoxon, esta prueba es altamente conservadoras puesto que divide la

probabilidad de cometer error tipo I entre el total de comparaciones a realizar.

Conclusiones y Recomendaciones

Al finalizar el presente proyecto se puede realizar las siguientes conclusiones:

Las variables microbiológicas presentan valores extremos y mucha variabilidad en

cada una de ellas, debido a su naturaleza.

La presencia de coliformes fecales, Escherichia coli y Enterococcus fecales es

diferente dependiendo del punto del cauce de la cuenca hidrográfica Purires.

Page 36: Trabajo Experimentos Preliminar

En el punto más cercano a la desembocadura del cauce, se da la mayor presencia de

estos agentes microbiológicos. Esto puede deberse al alto grado de contaminación al

que es sometido durante el recorrido por la zona residencial e industrial.

En los otros puntos donde se tomaron las muestras también hay diferencia en la

presencia de estos agentes.

En el caso de los agentes químicos, la demanda bioquímica de oxígeno no depende del

punto donde se tome la muestra en el río Purires. Es decir, la presencia de este no se

debe al lugar del cauce.

La presencia de pH y nitrato es significativa al punto donde se tome la muestra de agua

del cauce Purires. Específicamente, el punto al finalizar la zona industrial presenta

mayor presencia de estas sustancias. Al igual que los agentes microbiológicos esto

puede deberse a un grado de contaminación mayor en la zona.

Se recomienda que para un futuro análisis de estos datos, se realice un trabajo mayor con

la presencia de profesionales en el área de diseños experimentales.

En el caso del análisis para cuando hay presencia de heterocedasticidad se puede concluir:

La prueba F estándar utilizada en el análisis ANOVA es inadecuada cuando se

presenta heterocedasticidad.

La prueba t cuadrado de Hotelling mantiene el alfa nominal exacto en todas las

situaciones de diseños balanceados. En algunos casos puede ser conservadora, esto

puede deberse a su aproximación mediante la función F.

La prueba Kruskall-Wallis no excede el alfa nominal en algunas situaciones pero es

muy conservadora.

Las pruebas de permutaciones no son una solución para la heterocedasticidad,

especialmente la que utiliza el estadístico F.

La prueba de Welch puede ser útil para pequeños niveles de factor pero inadecuada

para más de 2 o 3 niveles.

La prueba de SAS, ANOVA ponderado, no es recomendable.

Para la presencia de heterocedasticidad, sólo el método t cuadrado de Hotelling es el

más adecuado.

Page 37: Trabajo Experimentos Preliminar

Bibliografía

Arias, M., Antillón, F., Chaves, C., Villalobos, L. (2008). Microbiología de aguas y alimentos:

principios y prácticas de laboratorio. San José: Editorial UCR. pp 19.

Blancas, C., Hervás, M. (2001) Manuales de Salud Ambiental. Contaminación de las aguas

por nitratos y efectos sobre la salud. Consejería de Salud.Título IV. Serie WA 754. pp

25

Dunn, O. J. (Agosto de 1964). Multiple Comparisons Using Rank Sums. Technometrics,

Vol.6(No.3), 241-252.

Page 38: Trabajo Experimentos Preliminar

Forbes, B., Sahm, D., Weissfeld, A. (2009). Diagnóstico microbiológico. Buenos Aires:

Médica Panamericana. 12 ed. pp. 268.

García, S., Molina, D., Lozano, M., & Herrera, F. (2007). Un estudio experimental sobre el

uso de test no paramétricos para analizar el comportamiento de los algoritmos

evolutivos en problemas de optimizacion. Universidad de Granada.

Gibbons, J. D. (Agosto de 1986). Nonparametric Methods for Quantitative Analysis.

Technometrics, Vol. 28(No.3), 275-277.

Goyenola, G (2007), Guía para la utilización de las Valijas Viajeras, Determinación del pH.

Red de Monitoreo Ambiental Participativo de Sistemas Acuáticos, RED MAPSA.

Gutíerrez Espeleta , E. (2010). Analisis con dos variables o dos grupos de datos: Prueba de

rangos de Wilcoxon. En Métodos Estadísticos para las Ciencias Biológicas (págs. 68-

69). Heredia: Editorial Universidad Nacional.

Leach, C. (1979). Test for Several Independent Samples- Categorical Explanatory Variable:

Multiple Comparisons Using the Rank Sum Test. En Introduction to Statistics: a

Nonparametric Approach for the Social Sciences (págs. 160-166). New York: John

Wiley & Sons.

León, C. (2009). Estandarización y validación de una técnica para medición de la demanda

bioquímica de oxígeno por el método respirométrico y la demanda química de oxígeno

por el método colorimétrico. Pereira: Universidad Tecnológica de Pereira. pp 2.

Meng, J., Feng, P., Doyle, M. (2001). Pathogenic Escherinchia coli. F. Pouch y K. Ito (Eds.).

Compendium of methods for the microbiological examination of food. Washington:

APHA. pp.331-336.

Moder, K. (2010). Alternatives to F-Test in One Way ANOVA in case of heterogeneity of

variances (a simulation study). Psychological Test and Assessment Modeling. Volumen

52 (4), pp. 343-353.

Pascual, M. y Calderón, V. (2000). Microbiología alimentaria: metodología analítica para

alimentos y bebidas. Madrid: Editorial Días y Santos. pp. 17.

Page 39: Trabajo Experimentos Preliminar

Figura 1. Coliformes Fecales, Matriz de gráficos de evaluación de supuestos

Anexos

Fuente: INISA

Page 40: Trabajo Experimentos Preliminar

Figura 2. E Coli, Matriz de gráficos de evaluación de supuestos

Figura3. Enteroccocus fecalis, Matriz de gráficos de evaluación de supuestos

sssss supuestos

Fuente: INISA

Fuente: INISA

Page 41: Trabajo Experimentos Preliminar

Figura 4. Demanda Bioquímica de Oxigeno, Matriz de gráficos de evaluación de supuestos

Fuente: INISA

Figura 5. Nitrato, Matriz de gráficos de evaluación de supuestos

Fuente: INISA