Manual Resumido Uso de Centurion

37
Uso de Statgraphics Centurión XVI.1 en el procesamiento y análisis de datos para gestión de procesos RENE MALUENDA MOYA Estadístico – Matemático Especialista en Control y Gestión de la Calidad [email protected] UNIVERSIDAD DE ANTOFAGASTA CHILE

description

Uso del programa estadístico Centurion

Transcript of Manual Resumido Uso de Centurion

Page 1: Manual Resumido Uso de Centurion

 

 

 

 

Uso de Statgraphics Centurión XVI.1 en el

procesamiento y análisis de datos para gestión de

procesos 

 

 

                                 RENE MALUENDA MOYA

Estadístico – Matemático

Especialista en Control y Gestión

de la Calidad

[email protected]

UNIVERSIDAD DE ANTOFAGASTA

CHILE

 

Page 2: Manual Resumido Uso de Centurion

 

1.- Introducción:

Este apunte está orientado a desarrollar la práctica y aplicación de los conceptos teóricos de la estadística, utilizando un software especializado. Se utilizará el Software Statgraphics Centurión. Versión XVI.I

1.- Construcción de una base de datos y definición de Variables:

1.- Cualitativas:

a).-Cualitativas Nominales: El estado Civil, color de la piel, sexo

b).- Cualitativas Jerárquicas u ordinales: Diagnóstico de una lesión

Las variables cualitativas generalmente se codifican con valores numéricos, para facilitar el ingreso de los datos en la Base de Datos. Disminuir los errores de digitación.-

2.‐ Uso del software para construir una bases de datos: 

Haga doble Clic en el ícono que identifica al Software, lo cual permite un acceso directo:    

 

Obtendrá la siguiente pantalla                                          Fig 1 

 

Sobre la palabra "Col_1" coloque la " + " que aparece cuando se trabaja con el ratón y esa columna se pondrá de color cuando pique con el sector izquierdo del ratón. Seguidamente pique con el sector derecho y aparecerá una "ventana" con varias opciones. Seleccione " Modificar Columna”.

                                                                                                       Fig. 2 

 

 

  1

Page 3: Manual Resumido Uso de Centurion

Obtendrá la siguiente pantalla, donde podrá definir

a) El nombre de la variable 

b) Realizar un pequeño comentario descriptivo de su contenido o significado, como por ejemplo las unidades de medición de la variable 

 a) Definir  si  la  variable  es  un  Atributo  o  cualidad  (Carácter)  ,  una  fecha,  una  variable  numérica  decimal 

(numérico) , una variable numérica entera, fijar la cantidad  de decimales, etc.‐ Fig.3 

 

Numérica: Debe ser activada cuando la variable es variable continua

Carácter: Debe ser activada cuando la variable es un atributo o cualidad

Entera: Debe ser activada cuando la variable es variable discreta o cuando se trata de una

Variable Cualitativa (Nominal u Ordinal) donde el número entero que se ingresa representa una jerarquía, ya sea ascendente o descendente.

Fecha: Si la variable a ingresar fuese una fecha, indicando día, mes, año.

Mes: Si la variable fuese un mes dentro de un año.

Decimal Fijo: Fija el número de decimales a utilizar .Pone 2 por defecto.

Supongamos que tenemos unas " fichas " con antecedentes de muchas personas que trabajan en una empresa, con los siguientes datos. Debemos definir en base a lo dicho anteriormente, las columnas de la base de datos:

Nombre: Carácter

Sexo : Carácter (M = masculino; F = femenino)

Fecha de nacimiento: Fecha

Nivel de Escolaridad: Entera (1="básica incomp." ; 2= "básica compl." ; .............)

Oficio o Actividad: Carácter

Pertenencia de la vivienda: Carácter (Propia; Arriendo. ; Allegado ; Cedida ; Leasing ; .......)

Estatura: Numérica

Peso: Numérica

Edad: Entera

Una vez que se han ingresado todas las fichas o encuestas, cada cierto instante, es necesario guardar la información ya sea en el "Disco Duro " de su computador o en un "pendrive" .Para ello debe picar la palabra Archivo con el sector izquierdo del ratón y luego en la ventana que se despliega picar la opción " Guardar como...”

 

 

  2

Page 4: Manual Resumido Uso de Centurion

Un ejemplo de Base da datos construida para automóviles, se muestra en la siguiente pantalla

Fig. 4 

 

 

Una vez que se han ingresado todas las fichas o encuestas, cada cierto instante, es necesario guardar la información ya sea en el "Disco Duro " de su computador o en un "pendrive" .Para ello debe picar la palabra Archivo con el sector izquierdo del ratón y luego en la ventana que se despliega picar la opción " Guardar como...” y expresar la ruta donde se guardara el archivo (Mis documentos, escritorio, pendrive,etc.-).

Fig.5

 

 

3.- Recuperación de variables de la Bases de Datos para su Procesamiento

Como se vio anteriormente, los datos están almacenados en una estructura que se llama "Archivo", el cual está constituido por variables.

Entonces debemos recuperar los datos desde el lugar en donde se encuentran

• Ingrese en el ambiente de "Statgraphics" • Ubique el dispositivo de almacenamiento donde están guardados sus datos. • Pique la palabra Archivo en la barra superior de herramientas de Statgraphics y tendrá la

siguiente pantalla. Fig.6 

  3

Page 5: Manual Resumido Uso de Centurion

Fig.7

Fig.8

Usted deberá de indicar la ruta que deberá seguir para abrir el archivo de datos A modo de ejemplo, abriremos el archivo “93cars” tomando la ruta siguiente: Seleccione MI PC y luego busque el “disco C”. Luego activar “Archivos de Programa”. Buscar el archivo Statgraphics. Seguidamente seleccionar “data”. Buscar “93cars”, y tendrá desplegado todo el archivo.

Fig.9

4.- Procesamiento de variables cualitativas: Para procesar este tipo de variables, utilizando Statgraphics, se debe usar la siguiente pantalla, según el objetivo que se persigue.

Fig. 10

 

  4

Page 6: Manual Resumido Uso de Centurion

 Por ejemplo si lo que se desea es la Tabulación de la variable “Type” (tipo), debe de seleccionar la palabra Tabulación, en la pantalla anterior y llenar la pantalla siguiente.

Fig. 11

Fig. 12

Fig. 13

El gráfico de Pareto es un importante gráfico de barras para destacar aspectos más relevantes dentro de un conjunto de valores nominales. El procedimiento para llegar a producirlo es

Fig. 14

  5

Page 7: Manual Resumido Uso de Centurion

Por ejemplo podríamos ver que tipo de automóviles son más preferidos por los consumidores

Fig. 15

      

Podemos inicialmente aceptar la siguiente pantalla que será desplegada al aceptar una pantalla como la anterior.

Fig. 16

 

Los resultados son entregados en una pantalla que se despliega de forma automática donde la persona puede entrar a intervenir los gráficos, las tablas, etc. Para dejarla a gusto del usuario.

Fig. 17

 

No debemos de olvidar que los análisis, comentarios, conclusiones, etc. a los resultados que entrega Statgraphics, son de responsabilidad del investigador o especialista encargado de describir y/o analizar la situación.

 

 

  6

Page 8: Manual Resumido Uso de Centurion

5.- Guardar las tablas y gráficos entregados por Statgraphics al procesar los datos.

Statgraphics dispone de un ambiente especial donde se puede guardar todo lo que se realiza en una sesión de trabajo para luego proceder a la redacción del respectivo informe. Este ambiente se denomina “StatReport”. Es necesario en los gráficos realizar todas las modificaciones que el usuario crea necesario para tener una mejor presentación (Cambio de títulos, fuentes de letra, escalas en los ejes, colores y trama, etc.) antes de enviar los tabulados y gráficos a dicho ambiente.

Debe de pulsar primero el sector derecho del mouse y tendrá una pantalla donde aparece una barra que dice “Copiar Análisis a StatReporter”. Seguidamente con el sector izquierdo del mouse activar la ventana. De forma automática y sin que usted lo visualice, todo lo que está presente en el procedimiento estadístico, queda guardado en ese ambiente.

Fig.18

 

  Para recuperar o saber que tiene guardado en el ambiente “StatReport, usted debe ubicar la barra inferior de la pantalla del software y maximizar “StatReporter”

Fig. 19 

 

  También se puede elaborar directamente el informe en este ambiente, para luego guardarlo con el nombre y lugar que el usuario desee.

Fig. 20

 

   

Lo interesante de todo este proceso de guardar el informe, es que queda guardado como un archivo Word, el que por supuesto puede ser abierto y trabajado con este programa, y ya no necesita de Statgraphics.

  7

Page 9: Manual Resumido Uso de Centurion

6.- Procesamiento de variables cuantitativas.  

6.1.- Cuantitativas Discretas:

Discretas: Son aquellas que nos entregan un conteo y se expresan con números enteros. Ejemplo: Número de hijos en una familia; Número de pacientes en una consulta médica.

Pueden ser de poco rango: Ejemplo. Número de hijos tenidos vivos por las mujeres. Número de episodios anuales de una enfermedad, por paciente. La cantidad de cilindros de los automóviles.

Se procesan como si fuesen variables cualitativas, a efecto de obtener gráficos y tablas estadísticas.

Se pueden obtener medidas denominadas “de resumen”, tales como Promedio Aritmético. Moda o Modo.

Pueden ser de amplio rango, como es el caso cuando en los censos se consulta por la edad en años cumplidos de las personas. Podemos obtener respuestas desde cero hasta más de cien años. La cantidad de toneladas diarias producidas en cátodos de cobre en una empresa. La cantidad de viajes hechos por camiones a distintos puntos de una faena, etc.

6.2.- Cuantitativas Continuas:

Cuando el dato se genera a partir de una medición. Los valores numéricos se expresan con decimales.

El procesamiento de las variables discretas de amplio rango y las variables continuas, generan:

• Una tabla de distribución de frecuencias que se caracteriza por que los niveles de medición de la variables son intervalos numéricos.

• Además podemos obtener todas las medidas de Resumen vistas en el desarrollo teórico del curso.

• Todos los gráficos estadísticos desarrollados.

• El cálculo de percentiles en la distribución de los datos

6.2.1 Construir una tabla de Distribución de Frecuencias

Por ejemplo en el archivo “93Cars” podemos procesar la variable MPG City (rendimiento de los automóviles en la ciudad).

Fig. 21

Fig. 22

 

 

 

  8

Page 10: Manual Resumido Uso de Centurion

Fig. 23

 

Se desplegará entonces todo aquello que está activado y mostrará una pantalla general como la siguiente:

Fig. 24

 

Todo lo desplegado es factible de ser modificado o adecuado a las necesidades del usuario. Por ejemplo podemos modificar la Tabla de Frecuencias para MPG City. Para ello se debe hacer un doble click con el sector izquierdo del mouse en la ventana Tabla de Frecuencias para MPG City. Estando en este ambiente, al pulsar el lado derecho del mouse se desplegará una ventana que permite ingresar los requerimientos del usuario. Elegir Opciones de Ventana y activar la opción con un clic usando el sector derecho del mouse.

La tabla generada por el usuario tiene el siguiente aspecto.

 

  9

Page 11: Manual Resumido Uso de Centurion

Al guardar el informe en StatReport, es posible eliminar en este ambiente, la clase o intervalo inicial y también la final. La tabla entonces queda de la siguiente forma:

Tabla de Frecuencias para MPG City

Límite Límite Frecuencia Frecuencia Frecuencia Clase Inferior Superior Punto Medio Frecuencia Relativa Acumulada Rel. Acum. 1 14,0 17,4 15,7 13 0,1398 13 0,1398 2 17,4 20,8 19,1 30 0,3226 43 0,4624 3 20,8 24,2 22,5 26 0,2796 69 0,7419 4 24,2 27,6 25,9 8 0,0860 77 0,8280 5 27,6 31,0 29,3 11 0,1183 88 0,9462 6 31,0 34,4 32,7 2 0,0215 90 0,9677 7 34,4 37,8 36,1 0 0,0000 90 0,9677 8 37,8 41,2 39,5 1 0,0108 91 0,9785 9 41,2 44,6 42,9 1 0,0108 92 0,9892 10 44,6 48,0 46,3 1 0,0108 93 1,0000

Media = 22,3656 Desviación Estándar = 5,61981

A partir de esta tabla, el usuario deberá de hacer todos los análisis y redacción del informe destacando todos los aspectos que considere relevantes en el estudio.

6.2.2 Obtención de Medidas de Resumen asociadas a una variable cuantitativa.

  Estando en la pantalla principal del procedimiento que se realiza, como la Fig. 23, podemos posicionarnos con el cursor en el sector “Resumen Estadístico para MPG City” y tener las medidas de resumen analizadas teóricamente. Para ello se debe hacer un doble click con el sector izquierdo del mouse en la ventana “Resumen Estadístico para MPG City”. Estando en este ambiente, al pulsar el lado derecho del mouse se desplegará una ventana que permite ingresar los requerimientos del usuario. Elegir Opciones de Ventana y activar la opción con un click usando el sector derecho del mouse.

Los conceptos de aquellas medidas de resumen que no se explicaron en la parte teórica, pueden ser estudiadas haciendo uso del botón Ayuda.

 

 

 

 

 

  10

Page 12: Manual Resumido Uso de Centurion

6.2.3 Obtención de Medidas de Posicionamiento (Percentiles) de una variable cuantitativa.

Estando en una pantalla como la figura 23 anteriormente descrita, usted debe seleccionar la ventana percentiles.

Obtendrá inicialmente una tabla que propone el Software, la cual puede ser modificada si activa el lado derecho del mouse y selecciona en ella “opciones de ventana”. Aparece una pizarra de diálogo para ingresar los requerimientos del usuario, como la siguiente:

6.2.4 Obtención de Gráficos asociadas a una variable cuantitativa.

  Estando en la pantalla principal del procedimiento que se realiza, como la Figuras 23 y 24, podemos posicionarnos con el cursor en el sector “Gráficos” y tener aquellos que se necesitan desplegar, para su posterior análisis.  

6.2.4.1.- Gráfico de caja y bigotes.

Permite detectar valores anómalos o atípicos.

Fig. 28

6.2.4.2.- Histograma:

  11

Page 13: Manual Resumido Uso de Centurion

Teniendo desplegado solamente el histograma en la pantalla de su PC., usted puede hacer todas las modificaciones que desee, tales como: cantidad de barras (opciones de ventana), colores, tramas, texto, etc. Pulse o active el sector derecho del mouse y se desplegarán un conjuntos de acciones posibles de realizar, si se elige la opción adecuada.

Fig. 30

Por ejemplo                                                                               Fig. 31

Y obtendremos el histograma siguiente

6.2.4.3.- Polígono de Frecuencias.

Habiendo construido el histograma, debe activar el lado derecho del mouse y activar “opciones de ventana”, para que aparezca el siguiente cuadro de diálogo que usted podrá cambiarle a voluntad los campos que aparecen en la figura 31, según la figura siguiente.

  12

Page 14: Manual Resumido Uso de Centurion

Fig. 32

  Obtendrá la gráfica configurada solicitada

6.2.4.4.- Grafica de distribución de Frecuencias acumuladas

Estando dentro del gráfico Histograma, y pulsando el lado derecho del ratón, debe de configurar la opción de ventana de la siguiente manera:

La gráfica de distribución de frecuencias acumuladas permite obtener valores aproximados de valores de percentiles. Para ello debemos de haber accedido a la gráfica usando e procedimiento descrito en el párrafo anterior y activar el sector derecho del mouse para obtener una pantalla donde deberá seleccionar la opción “Localizar”. Por ejemplo, el percentil 20 es igual 18,1263 millas por galón.

Fig. 34

           

  13

Page 15: Manual Resumido Uso de Centurion

6.2.4.5.- ¿Cómo obtener los otros tipos de gráficos cuando la variable es CONTINUA?

Estando en una pantalla como la figura 23 anteriormente descrita, usted debe seleccionar en el sector de los gráficos, aquellos que desea sean desplegados.

 

7.- PROCESAMIENTO DE DOS VARIBALES:

7.1.- Ambas variables son cualitativas y están contenidas en columnas.

Se desea construir una tabla de distribución de frecuencias conjuntas.

Fig. 35

 

Tendrá acceso a la siguiente pantalla de diálogo:

Fig. 36 

 

Además de la tabla, este proceso entrega un grafico de barras agrupadas. La Tabla de Asociación la obtendrá activando la ventana “Tabla de Frecuencias”.El gráfico asociado se obtiene seleccionando “Diagrama de Barras”

Fig. 37

 

 

  14

Page 16: Manual Resumido Uso de Centurion

7.1.2.- Cuando se dispone o se tiene una tabla de asociación o de contingencia y se desea obtener la Tabla de Asociación y el gráfico para presentar la situación tabular.

En primer lugar debemos de construir una base de datos. Puede ser en Excel y desde aquí llevarla a Statgraphics o directamente en Statgraphics.

Fig. 38

Fig.39

 

   

Luego deberá llenar pantalla de diálogo, de la forma siguiente:

Fig. 40

Cuando pulse aceptar, aparece la siguiente ventana donde deberá seleccionar lo que se indica

Fig. 41

Tendrá entonces la tabla solicitada y el gráfico de barras. Ambas salidas pueden ser mejoradas a criterio del usuario, pulsando el sector derecho del mouse, cuando se está ya sea en la “Tabla de Frecuencias” o en el “Diagrama de Barras”

  15

Page 17: Manual Resumido Uso de Centurion

Fig. 42

7.2.- Ambas variables son Cuantitativas (Análisis de regresión simple)

  En primer lugar se debe disponer de dos columnas de datos, Una para cada variable. El usuario debe saber previamente a cual de ellas considerará variable independiente (X) y cual de ellas será la variable dependiente (Y). Una vez definido lo anterior, utilizar el procedimiento siguiente:

Fig.43

Fig.44

Se despliega una pantalla donde el Software trae incorporados 27 modelos que se pueden ajustar con el procedimiento Regresión Simple. El modelo lineal es el que se propone inicialmente. Además la pantalla que se despliega trae algunas alternativas de ajuste.

Fig.45

  16

Page 18: Manual Resumido Uso de Centurion

Al aceptar el procedimiento anterior tal como lo especifica la Fig.45 anterior, verá desplegadas información cuantitativa e información grafica del análisis realizado.

7.3.- ¿Qué modelo debemos elegir para ajustar a los datos?

Lo que debemos tener en cuenta para la elección del modelo que mejor interpreta a los datos, es elegir del conjunto de ecuaciones dadas, aquel modelo que en términos absolutos tenga el mayor coeficiente de correlación rxy, como también el mayor coeficiente de determinación R2. Este criterio de selección está justificado por el hecho de que al aumentar el coeficiente de correlación (en términos absolutos), disminuye el error estándar de la estimación del modelo.

Cuando pulsó el botón aceptar de la figura 45, se desplegará la siguiente pantalla, ebn la cual deberá activar la ventana Comparación de Modelos Alternativos.

Fig. 46

Se desplegarán varios procedimientos estadísticos, como los muestra la siguiente figura, en la cual con un doble clic en el sector que indica la flecha roja, secuencialmente tendrá:

Fig. 47

Fig.48

En esta pantalla el software nos indica que el modelo a utilizar, dentro de lo que el dispone, deberá ser el modelo Inversa de X, debido a que presenta los mayores indices de asociación entre las variables: Coeficiente de Correlación de 74,14% y Coeficiente de Determinación R 2 de 54,97%.

  17

Page 19: Manual Resumido Uso de Centurion

Pulsando el sector derecho del mouse y seleccionado la barra Opciones de Análisis, tendrá la ventana desplegada que le permite cambiarse de modelo.

Fig. 49

Haciendo una inspección en los gráficos que muestran los datos originales y el modelo ajustado, se puede observar claramente que el modelo Inversa de X reproduce de mejor forma la tendencia.

7.4.- ¿Cómo predecir valores para la Variable Dependiente Y, cuando se asumen ciertos valores para la variable Independiente X?

Estando en una pantalla como la figura 46, debe de activar “Pronósticos”. Para que ello ocurra, pulse el icono siguiente, según lo muestra la figura.

Fig. 50

No olvide los pronósticos los debe de hacer con el mejor modelo que ajusta a sus datos. En este caso el modelo Inversa de X. Fig.51

  18

Page 20: Manual Resumido Uso de Centurion

Usted deberá ampliar esta ventana, y dar los valores para la variable X que usted desea saber que valores para la variable Y serán posibles de obtener. Nos recuerda también cuales son los valores mínimo y máximo de la variable X. Activando el sector derecho del mouse tendrá disponible “opciones de ventana” para ingresar otros o los valores de X que usted dispone y desea conocer la respuesta probable.

Fig. 52

Fig. 53

7.4.- Modelos Polinómicos

Puede ser que el modelo lineal, como también los modelos no lineales reducibles a lineal no satisfagan al investigador. En este caso podemos ver la alternativa de probar un ajuste a los datos, utilizando un modelo polinómico. Se comienza con uno de grado 2. Utilizando “opciones de análisis” se puede ir subiendo el grado del polinomio.

Fig. 54

Fig. 55

  19

Page 21: Manual Resumido Uso de Centurion

8.- Uso de Modelos de probabilidad de variables Discretas.

Para hacer cálculos de probabilidad, gráficos, etc. relacionados con estas funciones de distribución, utilizando Satagraphics , debe de realizar el siguiente procedimiento:

Fig. 56

Fig. 57

Todas las Distribuciones que aparecen encerradas en el recuadro, son distribuciones de probabilidad de variable aleatoria discreta. El resto de las distribuciones son para variable aleatoria continua.

Si la distribución a utilizar fuese la Binomial, entonces en la pantalla que ofrece Statgraphics, debe seleccionar esta opción.

  20

Page 22: Manual Resumido Uso de Centurion

Va a desplegarse una ventana, donde deberá ingresar la probabilidad de éxito en cada evento o ensayo y la cantidad de ensayos a realizar.

Por ejemplo: La probabilidad de que cada muestra de agua esta contaminada con una cierta "sustancia rara" es de un 10%. Suponga que las muestras son independientes con respecto a la presencia de dicha sustancia. Se toman 20 muestras en oportunidades diferentes.

Fig. 58

En la ventana que será desplegada al configurar y aceptar la Fig. 58, verá desplegarse una nueva ventana. Active las siguientes ventanas y luego acepte.

Fig. 59

1.- Resumen del Análisis: Permite definir la función a utilizar y agregar otras. Para ello vaya a " opciones de ventana”.

2.- Distribución Acumulada: Permite calcular probabilidades para valores de  variable aleatoria específicos. Para ello vaya primero a “opciones de análisis " donde debe llenar los campos que solicitan los parámetros de la distribución. Seguidamente vaya a “opciones de ventana, para entregar los valores de la variable aleatoria para los cuales se desea realizar el cálculo de probabilidades.

3.- Inversa de la Función de Distribución Acumulada: Permite calcular valores de la variable aleatoria, dada una probabilidad. Para ello vaya a " opciones de ventana”.

a) Calcule la probabilidad de exactamente dos muestras estén contaminadas.

Fig.60

  21

Page 23: Manual Resumido Uso de Centurion

Fig. 61

La probabilidad que hayan exactamente dos muestras contaminadas es de 0,28518 o de manera equivalente 28, 52%.

b).- Calcule la probabilidad de que hayan entre 2 y 5 muestras inclusive, contaminadas

Entonces la probabilidad de que hayan entre 2 y 5 muestras contaminadas, de un total de 10 es igual a

0.2852 + 0.1901 + 0.0898 + 0.0319 = 0.597

c).- Calcule la probabilidad de que hayan cuatro o más muestras contaminadas. P ( X ≥ 3 ) = 0,13295

También a veces en la práctica se nos presenta el problema de que en una muestra de tamaño grande con “n” conocida y probabilidad de éxito conocida para cada evento o ensayo, cabe preguntarse ¿Cuál es la cantidad mínima y máxima de unidades que con 90% de probabilidad tendrán una cierta característica?. Por ejemplo suponga n=150; Probabilidad del Evento = 0,1.

De la Figura 59, debe de tener activada la ventana “Distribuciones Acumuladas Inversas”

Fig. 63

  22

Page 24: Manual Resumido Uso de Centurion

Fig. 64

Fig. 65

Fig. 66.

La respuesta es que en una muestra de tamaño 150, donde la probabilidad de ocurrencia de un evento determinado es de un 10%, debemos esperar que con 90% central de confiabilidad haya entre 9 como unidades y a lo más 21 unidades con la característica.

9.- Uso de Modelos de probabilidad de variables Continuas.

Para hacer cálculos de probabilidad, gráficos, etc. relacionados con estas funciones de distribución, utilizando Satagraphics, debe de realizar el procedimiento indicado en la Fig. 56 y enseguida buscar la función contínua que se desea utilizar.

Si lo que se desea es aplicar la Distribución Normal, entonces en la ventana que será desplegada al aplicar el procedimiento indicado en la Fig. 56, active la distribución normal.

Fig. 67

  23

Page 25: Manual Resumido Uso de Centurion

Se desplegará una pantalla que permite configurar hasta 5 distribuciones normales, entregando en cada ventana el promedio y la desviación estándar solicitada.

Fig. 68

Fig. 69

Resumen del Análisis El Resumen del Análisis muestra la distribución elegida y los valores de sus parámetros.

Distribución Acumulada Esta ventana muestra el valor de la función de distribución acumulada y de la función masa o de densidad de probabilidad en hasta 5 valores de X o de 5 distribuciones normales diferentes

Para calcular valores de probabilidad específicos, debe de estar en la pantalla que muestra la Distribución Acumulada y pulsando el sector derecho del mouse mostrará una ventana en la cual debe de seleccionar “opciones de ventana”, que le permitirá ingresar los valores de variable específicos.

Por ejemplo, Si se elige un cátodo al azar de una cosecha, ¿cuál es la probabilidad de que su peso esté entre 44 y 47 Kg?

  24

Page 26: Manual Resumido Uso de Centurion

P( 44 < X < 47) = P(X < 47) - P(X< 44) = 0,908789 - 0,252491 =

En la tabla Distribución Acumulada se incluyen: • Área Cola Inferior: la probabilidad de que una variable aleatoria de la distribución especificada sea menor

que el valor mostrado en la columna de más a la izquierda.

• Densidad de Probabilidad (sólo distribuciones continuas): la altura de la función de densidad de probabilidad f(X) en el valor mostrado en la columna de más a la izquierda.

• Masa de Probabilidad (sólo distribuciones discretas): la probabilidad de que X sea igual al valor mostrado en la columna de más a la izquierda.

• Área Cola Superior: la probabilidad de que una variable aleatoria de la distribución especificada sea mayor que el valor mostrado en la columna de más a la izquierda.

La ventana “Distribución Acumuladas Inversas”, que muestra la figura 69, (La FDA Inversa), calcula el valor de una variable aleatoria X en o bajo el cual hay una probabilidad específica.

Por ejemplo, sería importante saber cuales serían los pesos mínimos y máximos del peso de los cátodos que entrega este proceso en el 90% de las veces

Lo cual indica entonces que el peso de los cátodos entregado por el proceso, en el 90% central de las veces, el peso de ellos fluctúa entre 42,53 Kg. A 47,47 Kg.

En lo que respecta a gráficos, se explicarán el contenido de las ventanas que trae la Figura 69.-

Funciones Masa/de Densidad

Esta ventana grafica la función de densidad de probabilidad f(X) para distribuciones continuas (p.d.f. probability density function) o la función masa de probabilidad p(x) para distribuciones discretas (p.m.f. probability mass function).

  25

Page 27: Manual Resumido Uso de Centurion

Para una distribución continua tal como la distribución normal, el área bajo la función de densidad sobre un intervalo de valores de X es igual a la probabilidad de que X caiga dentro de ese intervalo.

Estando dentro de esta pantalla, debe activar el sector derecho del mouse y seleccionando “opciones de ventana”, puede definir lo que desea:

Fig. 70

Distribución Acumulada

Esta ventana grafica F(X) la función de distribución acumulada. Por ejemplo:

F(X) es igual a la probabilidad de que la variable aleatoria sea menor o igual a X.

Función de Supervivencia Esta ventana grafica la función de supervivencia S(X), definida por S(X) = 1 – F(X) , donde F(X) es la función de distribución acumulada. S(X) es igual a la probabilidad de que la variable aleatoria sea mayor que X. El nombre de la función deriva de situaciones donde X representa el tiempo de vida de un individuo o un producto. En ese caso, S(X) es la probabilidad de que un individuo sobreviva al menos X unidades de tiempo.

  26

Page 28: Manual Resumido Uso de Centurion

Función Log de Supervivencia Esta ventana grafica el logaritmo de la función de supervivencia S(X).

Función de Riesgo

La función de riesgo representa la distribución condicional de una variable aleatoria dado que es al menos X. Para distribuciones continuas, está definida por H(X) = f(x) / S(X) donde f(x) es la función de densidad de probabilidad y S(X) es la función de supervivencia. Para distribuciones discretas, está definida por H(X) = p(x+1) / S(X) donde p(x) es la función probabilidad de masa. En análisis de supervivencia o de sobrevivencia, la función de riesgo representa la tasa de fallo condicional, i.e., la probabilidad de fallo en el siguiente incremento pequeño de tiempo dado que un individuo ha sobrevivido hasta el tiempo X. 10.- Inferencia Estadística Paramétrica.

10.1.- Promedio de la Población

a).- Para utilizar Statgraphics en la prueba de hipótesis acerca del promedio en la población, cuando usted ha procesado los datos y dispone del promedio y de la desviación estándar, se utiliza el siguiente procedimiento:

Fig. 71

En la ventana que dice Prueba de Hipótesis, deberá ingresar en cada ventana los requerimientos necesarios. En la ventana siguiente, deberá ingresar la opción que se plantea para la hipótesis alternativa

Fig. 72

  27

Page 29: Manual Resumido Uso de Centurion

Resumiendo:

1.- En la pantalla anterior, en el campo de los “parámetros, debe activar media normal

2.- En la ventana “Hipótesis Nula “, deberá ingresar el valor de Hipótesis a probar “μ 0 “

3.- En la ventana “Media de la muestra “deberá ingresar el valor del promedio de la

Muestra.

4.- En la ventana “Des. Típica de la muestra “, deberá ingresar el valor de la desviación estándar de la muestra.

5.- En la ventana “Tamaño de la Muestra“, deberá ingresar el tamaño de la muestra.

Obtendrá con este procedimiento:

• El intervalo de confianza para la rapidez promedio de combustión del producto en el caso de que la hipótesis alternativa fuese “Distinto de”. O un limite inferior o el superior si la hipótesis alternativa “fuese mayor que”; O un limite superior en caso de que la hipótesis alternativa fuese “menor que”.

• La decisión acerca de la prueba de hipótesis • La curva de potencia de la prueba o test.

Ejemplo a desarrollar:

Los sistemas de escape de emergencia para tripulaciones de aeronaves son impulsados por un combustible sólido. Una de las características importantes de este producto es la rapidez de combustión. Las especificaciones requieren que la rapidez promedio de combustión sea de a lo menos 50 cm/ sg. Se sabe que la desviación estándar de esta rapidez es σ = 2 cm / sg. El experimentador decide especificar una probabilidad para el error tipo I (α) = 0, 05. Selecciona una muestra aleatoria de tamaño 16, y obtiene en la muestra una rapidez promedio muestral de combustión de 51,3 ¿A qué conclusiones debe llegar.

b).- Para utilizar Statgraphics en la prueba de hipótesis acerca del promedio en la población, cuando usted tiene los datos originales colectados, se utiliza el siguiente procedimiento:

Los datos deben estar configurados en una columna. Una vez ingresada la columna de datos, en la ventana desplegada, se selecciona en el sector Tablas, “Intervalos de Confianza” y “Pruebas de Hipótesis”

Fig. 74

Para ejemplificar se toma la columna MPG Highway del archivo “93Cars”. Los resultados son Intervalos de Confianza para MPG Highway :Intervalos de confianza del 95,0% para la media: 29,086 +/- 1,09806 [27,988, 30,1841] ; Intervalos de confianza del 95,0% para la desviación estándar: [4,66015, 6,23125].   28

Page 30: Manual Resumido Uso de Centurion

También se despliega en un sector de la pantalla, una sub pantalla como la siguiente:

Después de activar el sector derecho del mouse se despliega otra pantalla, donde se pueden configurar dos pruebas de hipótesis. Una para la tendencia o promedio de la población. Otra para la variabilidad o dispersión de la variable.

10.2.- Prueba de hipótesis e intervalo de confianza para la diferencia entre promedios.

a).- Para utilizar Statgraphics en la prueba de hipótesis acerca de la diferencia entre los promedios de dos poblaciones, cuando usted ha procesado los datos y dispone de los promedios y de las desviaciones estándar de cada muestra, se utiliza el siguiente procedimiento.

Fig. 75

Deberá llenar con los datos disponibles, lo solicitado en las distintas ventanas del cuadro de dialogo que dice “Pruebas de Hipótesis (Comparación)”

Ejemplo a Desarrollar:

Un diseñador de productos está intensado en reducir el tiempo de sacado de una pintura tapa poros. Se prueban dos formulaciones de pintura: la fórmula 1 tiene el contenido estándar; la fórmula 2 tiene un nuevo ingrediente secante que debe reducir el tiempo de secado. Se pintan diez unidades con la formulación 1 y 12 unidades con la formulación 2. Los datos obtenidos se dan en la siguiente tabla resumen:

  29

Page 31: Manual Resumido Uso de Centurion

Formulación Promedio Muestral Desv. Estándar Tamaño Muestral

1 121 minutos 8 minutos 10 unidades

2 112 minutos 6,5 minutos 12 unidades

¿A qué conclusiones puede llegar el diseñador del producto sobre la eficacia del nuevo ingrediente, utilizando α = 0, 05?

b).- Si usted dispone de los datos originales colectados por su sistema de medición, para dos muestras independientes, entonces deberá acceder a la siguiente pantalla, llenando los respectivos campos solicitados por el Software Stagraphics.

Fig. 76

Ejercicio a desarrollar: Se realizan pruebas de dureza en dos tipos de bolas, X e Y, que se utilizan en molinos de la gran minería. Se desea estudiar el desempeño de estas bolas en el proceso de molienda. Se toman muestras independientes de cada uno de los tipos y se encuentran los siguientes resultados.

Bola X 75 46 57 43 58 39 61 56 44 65 60 50

Bola Y 52 41 43 47 32 49 52 44 57 60 45 50 55

a).- Redacte y pruebe la hipótesis de que ambos tipos de bolas no presentan diferencias estadísticamente significativas en su resistencia promedio. Use alfa = 0,05. ¿Que recomendación daría usted, respecto de cual tipo de bola usar? Justifique su respuesta.

b).- Determine con 95% de confianza entre que valores se encuentra la resistencia promedio de cada uno de los tipos de bolas.

c).- Determine un intervalo de confianza del 90% para la desviación estándar de la dureza del tipo de bola Y

Nota: En este caso lo que primero que debe hacer es colocar los datos en dos columnas, generando cada una de ellas una variable. Luego ingrese las variables en la pantalla que le presenta el software.

  30

Page 32: Manual Resumido Uso de Centurion

c).- Si usted dispone de los datos originales colectados por su sistema de medición, para dos muestras dependientes o pareadas, entonces deberá colocar sus datos en dos columnas generando dos variables y acceder a la siguiente pantalla, llenando los respectivos campos solicitados por el Software Stagraphics.

Ejercicio a Desarrollar: Quince hombres adultos cuyas edades fluctúan entre 35 y 50 años, participan en un estudio para evaluar el efecto de la dieta y el ejercicio sobre los niveles de colesterol en la sangre. El colesterol total fue medido al inicio en cada persona y tres meses después de participar en un programa de acondicionamiento físico y de haber cambiado una dieta baja en grasas.

Se asegura que el tratamiento deberá bajar en a lo menos 10 puntos el nivel de colesterol total en la sangre. Los datos son los siguientes:

Persona 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Antes 265 240 258 295 251 245 287 314 260 279 283 240 238 225 247

Después 229 231 227 240 238 241 234 256 247 289 246 218 219 226 233

a) Redacte las hipótesis para probar la efectividad del tratamiento. Use un nivel α = 0,05 y obtenga las conclusiones respectivas

b) Construya un intervalo de confianza para la diferencia promedio entre ambas situaciones

  31

Page 33: Manual Resumido Uso de Centurion

10.3.- Prueba de hipótesis e intervalo de confianza acerca una proporción " p”.

• En la pantalla anterior ,en el campo de los “parámetros, debe seleccionar “ Proporción Binomial”.

• En la ventana “Hipótesis Nula “ deberá ingresar el valor de Hipótesis a probar “ p 0 “

• En la ventana “proporción muestral“deberá ingresar el valor de la proporción en la muestra. • En la ventana “ Tamaño de la Muestra “, deberá ingresar el tamaño de la muestra • Luego pulse Aceptar

Verá aparecer una pantalla que dice “Opciones Prueba de Hipótesis”, desde donde podrá definir la hipótesis alternativa H 1 y el error tipo I (α): Luego aplique Aceptar

Obtendrá:

• El intervalo de confianza para la verdadera proporción poblacional. • La decisión acerca de la prueba de hipótesis • La curva de potencia de la prueba o test

Ejemplo a desarrollar:

Un fabricante de semiconductores produce controladores que se emplean en aplicaciones de motores de automóviles. El cliente requiere que la fabricación de controladores defectuosos este por debajo del 4%. Y que el fabricante demuestre esta característica del proceso de fabricación con este nivel de calidad. El fabricante de semiconductores toma una muestra aleatoria de 200 dispositivos y encuentra que cuatro de ellos son defectuosos. ¿Puede el fabricante demostrar al cliente que su proceso está dentro de los requerimientos?. Use α = 0,05.

  32

Page 34: Manual Resumido Uso de Centurion

10.4.- Pruebe de hipótesis e intervalo de confianza para la diferencia entre las proporciones

Para utilizar Statgraphics en la prueba de hipótesis acerca de la diferencia entre las proporciones de dos poblaciones, cuando usted ha procesado los datos y dispone de las proporciones de cada muestra, se utiliza el siguiente procedimiento:

En la ventana que dice “Prueba de Hipótesis (Comparación)”, deberá ingresar en cada ventana los requerimientos necesarios. En la ventana siguiente, deberá ingresar la opción que se plantea para la hipótesis alternativa

10.5.- Prueba de hipótesis e intervalos de confianza para la varianza de una sola población.

a).- Cuando se ha calculado previamente la desviación estándar de la muestra.

Resumiendo:

1.- En la pantalla anterior, en la ventana “Prueba de Hipótesis”, debe activar Sigma Normal

2.- En la ventana “Hipótesis Nula “, deberá ingresar el valor de Hipótesis a probar “ 0σ “

3.- En la ventana “Sigma Muestral“ deberá ingresar el valor de la desviación estándar de la

muestra S

4.- En la ventana “Tamaño de la Muestra“, deberá ingresar el tamaño de la muestra.

Obtendrá con este procedimiento:

• El intervalo de confianza para la desviación estándar de la población en el caso de que la hipótesis alternativa fuese “Distinto de”. O un limite inferior o el superior si la hipótesis alternativa “fuese mayor que”; O un limite superior en caso de que la hipótesis alternativa fuese “menor que”.

• La decisión acerca de la prueba de hipótesis • La curva de potencia de la prueba o test.

  33

Page 35: Manual Resumido Uso de Centurion

Observación

Debemos tener en consideración que en la mayoría de las veces la preocupación fundamental está centrada en conocer el comportamiento de la desviación estándar, como medida de variabilidad. Por eso es que Statgraphics dedica esta ventana a tal medida de variabilidad.

b).- Cuando se dispone de los datos colectados o mediciones de las muestras

En este caso se procede según como lo indican las figuras 73 y 74 del presente apunte

Ejemplo a desarrollar:

La desviación estándar de cierto proceso de producción es de 2 pulgadas. Se sospecha que la varianza se ha hecho demasiado grande (ha aumentado). Se toma una muestra de 9 partes producidas en dicho proceso y sus medidas son:

50 , 57 , 52 , 54 , 58 , 59 , 58 , 56 , 55

La prueba de hipótesis, de forma simbólica, tiene la siguiente estructura:

H0: 2σ  =  4     v / s   H1:    >  4   a un nivel de significancia α = 0,05 2σ

Cree una variable y disponga los datos en una columna y luego proceda según las figuras 73 y 74. Activando el lado derecho del mouse se desplegarán las ventanas siguientes

10.6.- Prueba de Independencia o de Asociación entre dos variables cualitativas

a).- Cuando se cuenta con dos columnas de datos que pertenecen a variables cualitativas o atributos, al realizar el procedimiento “Tabulación Cruzada”, tenemos una pantalla que contempla esta opción de análisis.

  34

Page 36: Manual Resumido Uso de Centurion

b).- Cuando se cuenta con una tabla de asociación.

Este procedimiento ya está descrito en las Figuras 38, 39, 40 y 41, del presente apunte. También va a desplegarse una pantalla como lo muestra la Figura 86. Aquí deberá de seleccionar la opción “pruebas de Independencia”.

10.7.- Prueba de la Bondad de Ajuste.

Por ejemplo, podría un Ingeniero estar interesado en saber que modelo de distribución estadístico interpretaría adecuadamente el comportamiento de la variable. Debe entonces de seguir el siguiente procedimiento.

¿Qué modelo estadístico puede ajustar bien a la variable Horsepower del archivo 93cars?

Fig. 88

Fig. 89

  35

Page 37: Manual Resumido Uso de Centurion

En la pantalla anterior usted deberá ir probando el modelo y decidir cual es el más adecuado.

Por ejemplo, si ajustamos a los datos el modelo “Logística” y el modelo “Normal”, tendremos:

Y hay dos tabulados muy importantes, que son los siguientes.

Las dos distribuciones pueden ajustar a los datos puesto que el “Valor-P”, para ambas, supera 0,05.

Entre la distribución Logistica y la Normal el “Valor-P” mayor está dado para la curva Logistica y por lo tanto sería este modelo el más adecuado entre las dos distribuciones ajustadas a los datos. Esto también lo corrobora el grafico.

  36