Jonathanharo

186
Universidad Politécnica Estatal del Carchi Comercio Internacional, Integración, Administración y Economía Empresarial. Escuela: Comercio Exterior y Negociación Comercial Internacional “Estadística Inferencial” MODULO DEL ESTUDIANTEMsc. Jorge Pozo Autor: Jonathan Haro Nivel: sexto Paralelo: “A” Marzo-Agosto 2012 Tulcán-Ecuador

Transcript of Jonathanharo

Page 1: Jonathanharo

Universidad Politécnica Estatal del Carchi

Comercio Internacional, Integración, Administración y Economía Empresarial.

Escuela: Comercio Exterior y Negociación Comercial Internacional

“Estadística Inferencial”

“MODULO DEL ESTUDIANTE”

Msc. Jorge Pozo

Autor:

Jonathan Haro

Nivel: sexto Paralelo: “A”

Marzo-Agosto 2012

Tulcán-Ecuador

Page 2: Jonathanharo

Contenido Modulo De Estadistica ...........................................................................................................8

CAPITULO I ...............................................................................................................................8

1.1Introducción ......................................................................................................................8

1.2 Definición De Estadística ...............................................................................................9

1.3 Clasificación De La Estadística ................................................................................... 10

Estdistica Descriptiva .......................................................................................................... 10

Frecuencia: ........................................................................................................................... 10

1.1 Distribución De Frecuencias Absolutas Y Relativas ........................................... 10

1.2 Tabla De Frecuencias: ............................................................................................ 11

1.3 Frecuencia Absoluta ................................................................................................ 11

1.4 Frecuencia Relativa: ................................................................................................ 12

1.5 Forma De Cálculo .................................................................................................... 13

1.6 Frecuencia Acumulada ........................................................................................... 13

1.7 Gráficas ..................................................................................................................... 15

1.8 Histograma ............................................................................................................... 15

1.9 Histograma Y Polígono De Frecuencias. ............................................................. 16

1.10 Para Trazar El Histograma, La Secuencia De Operaciones Es: ....................... 16

1.11 Medidas De Tendencia Central ............................................................................. 19

Definiciones ........................................................................................................................ 19

Las Medidas De Tendencia Central Más Comunes Son: ......................................... 19

Media Aritmética O Promedio.................................................................................. 20

Definición: ........................................................................................................................... 20

Características De La Media Aritmética: ..................................................................... 20

1.12 Formula ..................................................................................................................... 21

1.13 Mediana (Med) ........................................................................................................ 23

1.14 Definición: ................................................................................................................. 23

1.15 Características De La Mediana.............................................................................. 23

1.16 Formas De Cálculo .................................................................................................. 24

1.17 Mediana Para Datos No Agrupados: .................................................................... 24

1.18 Mediana Para Datos Agrupados: .......................................................................... 25

1.19 Ejemplo 2: ................................................................................................................. 26

2 Moda ................................................................................................................................. 30

2.1 Características De La Moda. .................................................................................. 30

2.2 Formas De Cálculo: ................................................................................................. 30

Page 3: Jonathanharo

2.3 Datos Agrupados: .................................................................................................... 31

2.4 Cuartiles .................................................................................................................... 32

2.5 Cálculo De Los Cuartiles ........................................................................................ 32

2.6 Cálculo De Los Cuartiles Para Datos Agrupados ............................................... 33

2.7 Ejercicios De Cuartiles ............................................................................................ 33

Deciles ................................................................................................................................. 34

Cálculo De Los Deciles .................................................................................................... 34

Ejercicio De Deciles .......................................................................................................... 35

Percentiles .......................................................................................................................... 37

Cálculo De Los Percentiles ............................................................................................ 37

Organizador Grafico De Las Medidas De Tendencia Central ........................................... 39

CAPITULO II ............................................................................................................................ 43

Medidas De Dispersión ....................................................................................................... 43

2.8 Rango, Amplitud Total O Recorrido ...................................................................... 43

2.9 Definicion .................................................................................................................. 43

2.10 Caracterìsticas ......................................................................................................... 44

2.11 Características Del Rango ...................................................................................... 44

2.12 Formula ..................................................................................................................... 44

2.13 Formas De Cálculo. ................................................................................................. 44

3 La Varianza ...................................................................................................................... 45

3.1 Definicion .................................................................................................................. 45

3.2 Forma De Cálculo .................................................................................................... 46

3.3 Desviación Media .................................................................................................... 47

3.4 Definición .................................................................................................................. 47

3.5 Desviación Típica .................................................................................................... 49

3.6 Cálculo De La Desviación Típica Para Datos No Agrupados En Clases ......... 50

3.7 Cálculo De La Desviación Típica Para Datos Agrupados En Clases Y

Agrupados Por Frecuencias............................................................................................... 50

4 ................................................................................................................................................. 51

5 Pasos Para Descargar E Instalar El Spss .................................................................... 52

5.1 Pasos Para Resolver El Caso En Spss: ............................................................... 55

6 ................................................................................................................................................. 62

7 Organizador Grafico De Las Medidas De Dispersión ................................................. 63

8 CAPITULO III ................................................................................................................... 65

8.1 Tema: Muestreo ....................................................................................................... 65

Definicion ............................................................................................................................ 65

Page 4: Jonathanharo

8.2 Muestreo Probabilístico: ......................................................................................... 66

8.3 Sistemático ............................................................................................................... 67

8.4 Estratégico ................................................................................................................ 67

8.5 Muestreo No Probabilístico: ................................................................................... 68

8.6 Casual. ...................................................................................................................... 68

8.7 Intencional ................................................................................................................ 68

8.8 Cuotas. ...................................................................................................................... 68

8.9 Determinar El Tamaño De La Muestra ................................................................. 69

8.10 Ejemplos: .................................................................................................................. 70

8.11 Población Finita........................................................................................................ 72

9 Campana De Gaus .......................................................................................................... 74

9.1 Ejemplos De La Campana De Gaus: .................................................................... 74

9.2 1.) Calcular La Probabilidad Del Evento ............................................................... 74

9.3 2.) Calcular La Probabilidad Del Evento ............................................................... 75

9.4 Desarrollo.................................................................................................................. 76

10 Variables ....................................................................................................................... 78

10.1 Definición De Variable ............................................................................................. 78

10.2 Ejemplo De Variables: ............................................................................................. 79

10.3 Clasificación De Las Variables: ............................................................................. 79

10.4 Variable Dependiente: ............................................................................................. 79

10.5 Variable Independiente: .......................................................................................... 80

11 CAPITULO IV............................................................................................................... 83

11.1 1.3.2. Tema: Estadística Inferencial ...................................................................... 83

11.2 Correlación ............................................................................................................... 83

11.3 Coeficiente De Correlación.. .................................................................................. 83

11.4 Relación Lineal......................................................................................................... 84

11.5 Coeficiente De Correlación De Pearson ............................................................... 86

11.6 Interpretación.. ......................................................................................................... 87

11.7 Calcular El R De Pearson. ...................................................................................... 87

12 Coeficiente De Correlación De Rangos De Sperman............................................. 87

12.1 Coeficiente Intelectual ............................................................................................. 88

12.2 Coeficiente R De Pearson ...................................................................................... 89

14 Regresión Lineal .......................................................................................................... 89

14.1 Definición De Correlación Lineal ........................................................................... 90

14.2 El Coeficiente De Correlación Lineal De Pearson R ........................................... 96

14.3 Definición Y Características Del Concepto De Regresión Lineal ...................... 98

Page 5: Jonathanharo

14.4 Organizador Grafico De Correlacion Y Regrecion Lineal ............................... 104

14.5 Ejercicios De Correlacion Y Regrecion Lineal .................................................. 105

15 Características De Las Hipótesis ............................................................................ 111

15.1 Ejemplo: El Contrabando En Ecuador Es Menor Que El Contrabando En

Colombia ............................................................................................................................. 111

15.2 Clasificación De Las Hipótesis ............................................................................. 112

15.3 Hipótesis De Investigacion ................................................................................... 112

15.4 Hipotesis Nula ........................................................................................................ 112

15.5 Hipotesis Alternativa .............................................................................................. 112

15.6 Hipotesis Estadistica ............................................................................................. 112

15.7 Ejemplo De Hipótesis: ........................................................................................... 112

15.8 Hipótesis De Un Valor O Dato Pronósticado: ................................................... 113

15.9 Hipótesis Correlacionadas:................................................................................... 113

15.10 Hipótesis De Diferencia Entre Grupos: ............................................................... 114

15.11 Hipótesis Causales: ............................................................................................... 114

15.12 Hipótesis Nula (Ho): ............................................................................................. 114

15.13 Hipótesis Alternativa (Ha): ................................................................................... 115

15.14 Hipótesis Estadística: ........................................................................................... 116

15.15 Hipótesis Estadísticas De Estimación:............................................................... 116

15.16 Hipótesis Estadísticas De Correlación: .............................................................. 116

15.17 Hipótesis Estadisticas De La Diferencia De Medias U Otros Valores: .......... 116

15.18 Ejemplos De Hipotesis: ........................................................................................ 116

15.19 Hipótesis Descriptiva ............................................................................................ 116

15.20 Pasos Para La Prueba De Hipotesis................................................................. 118

15.21 Prueba De Diferencias De Medias ..................................................................... 121

16 “T“De Student ............................................................................................................. 127

16.1 Características ....................................................................................................... 127

16.2 Grado De Libertad: ................................................................................................ 127

16.4 Formulacion De Hipotesis .................................................................................... 128

17 Prueba De Ji- Cuadrado O ............................................................................. 133

17.1 Propiedades De Las Distribuciones Ji-Cuadrado .............................................. 133

17.2 Frecuencias Observadas ...................................................................................... 138

17.3 Frecuencias Esperadas (De Ho) ......................................................................... 138

18 Conclusiónes .............................................................................................................. 142

19 Recomendaciones ..................................................................................................... 143

20 10. Financieros Y Técnicos. ..................................................................................... 144

Page 6: Jonathanharo

21 9. Cronograma De Tareas ........................................................................................ 144

22 Anexos ........................................................................................................................ 146

22.1 Organizador Grafico De La Estadistica Descriptiva E Inferencial ................... 147

22.2 Tema: Proyecto De Aplicación Al Comercio Exterior Aplicando Correlación,

Regresión Lineal Simple Aplicando, Prueba De Hipótesis, T-Student Y Chi2 Con

Ayuda Del Programa Spss. .............................................................................................. 151

22.3 1.2 Problema .......................................................................................................... 151

22.4 1.3 Objetivos........................................................................................................... 151

22.5 Objetivo General .................................................................................................... 151

22.6 Objetivos Específicos ............................................................................................ 151

22.7 3. Justificación ........................................................................................................ 152

1.5 Marco Teórico ....................................................................................................... 153

22.8 El Spss .................................................................................................................... 153

22.9 Correlación Lineal .................................................................................................. 154

22.10 Técnicas De Correlación................................................................................... 155

22.11 Relaciones Lineales Entre Variables .............................................................. 155

22.12 Diagrama De Dispersión ................................................................................... 157

22.13 Coeficiente De Correlación Rectilínea De Pearson ...................................... 157

22.14 Correlación ......................................................................................................... 157

22.15 Desarrollo ............................................................................................................ 158

22.16 Regresión Lineal ................................................................................................ 160

22.17 Fases Del Modelo De Regresión Lineal ......................................................... 160

22.18 El Modelo De Regresión Lineal ....................................................................... 160

22.19 Relación Lineal ................................................................................................... 161

22.20 Desarrollo ............................................................................................................ 163

22.21 Encontrar La Ecuación ...................................................................................... 165

22.22 Prueba De Hipótesis.......................................................................................... 168

22.23 Hipótesis Nula Y Alternativa ............................................................................. 168

22.24 Selección Del Nivel De Significancia .............................................................. 169

22.25 Error Tipo I Y Error Tipo Ii................................................................................. 170

22.26 Pasos De Una Prueba De Hipótesis ............................................................... 170

22.27 Formular La Hipótesis Alternativa Ha .............................................................. 170

22.28 T De Student ...................................................................................................... 171

22.29 Propiedades: ...................................................................................................... 171

22.30 Chi- Cuadrado .................................................................................................... 174

22.31 Pruebas Paramétricas ....................................................................................... 174

Page 7: Jonathanharo

22.32 Pruebas No Paramétricas................................................................................. 174

22.33 Varianza .............................................................................................................. 179

22.34 Variable Dependiente O Variable Respuesta. ............................................... 180

22.35 Nivel O Tratamiento Del Factor:. ..................................................................... 180

22.36 Unidad Experimental ......................................................................................... 180

22.37 Error Experimental ............................................................................................. 180

22.38 Aleatorización:. ................................................................................................... 180

22.39 Abstract ............................................................................................................... 182

22.40 Evaluaciones De Estadistica Inferencial ........... ¡Error! Marcador no definido.

Page 8: Jonathanharo

MODULO DE ESTADISTICA

CAPITULO I

1.1 INTRODUCCIÓN

Los profesionales de la educación, como parte de su quehacer profesional,

realizan investigación científica: evaluación de la calidad de la educación,

someten a prueba diferentes métodos de comprensión lectora, estudian

problemas del aprendizaje, entre otros. Es así, que contamos con Internet,

como fuente general de información, que permite disponer de información

educativa, por ejemplo, sobre evaluaciones muéstrales, que realiza el

Ministerio de Educación y que está disponible en la página web.

Una vez que conoce tanto la forma de recoger información como la forma de

presentar a la misma, sea en forma de tablas o con el tratamiento realizado

para elaborar una tabla de frecuencias, ahora es conveniente seguir con las

características que permiten describir a un conjunto de datos que se recogen

de un problema a investigarse.

La Estadística es una disciplina que utiliza recursos matemáticos para

organizar y resumir una gran cantidad de datos obtenidos de la realidad, e

inferir conclusiones respecto de ellos. Por ejemplo, la estadística interviene

cuando se quiere conocer el estado sanitario de un país, a través de ciertos

parámetros como la tasa de morbilidad o mortalidad de la población.

En este caso la estadística describe la muestra en términos de datos

organizados y resumidos, y luego infiere conclusiones respecto de la población.

Aplicada a la investigación científica, también infiere cuando provee los medios

matemáticos para establecer si una hipótesis debe o no ser rechazada. La

estadística puede aplicarse a cualquier ámbito de la realidad, y por ello es

utilizada en física, química, biología, medicina, astronomía, psicología,

sociología, lingüística, demografía, etc.

Page 9: Jonathanharo

1.2 DEFINICIÓN DE ESTADÍSTICA

La estadística es la ciencia formada por un conjunto de teorías y técnicas

cuantitativas, que tiene por objeto la organización, presentación, descripción,

resumen y comparación de conjuntos de datos numéricos, obtenidos de

poblaciones en su conjunto de individuos o fenómenos o bien de muestras que

representan las poblaciones estudiadas, así como el estudio de su variación,

propiedades, relaciones, comportamiento probabilístico de dichos datos y la

estimación, inferencia o generalización de los resultados obtenidos de

muestras, respecto a las poblaciones que aquéllas representan. La estadística

en la investigación científica, dada la necesidad de manejar y tratar en ellas

grandes cantidades, progresivamente crecientes, de datos”.

(http://www.AulaFacil.com)

Irma Nocedo de León et al (2001), anotan que “la estadística es la ciencia

encargada de suministrar las diferentes técnicas y procedimientos que permiten

desde organizar la recolección de datos hasta su elaboración, análisis e

interpretación. Abarca dos campos fundamentales la estadística descriptiva y la

estadística inferencial. (http://www.Wikipedia: Estadísticas.)

Page 10: Jonathanharo

1.3 CLASIFICACIÓN DE LA ESTADÍSTICA

Dependiendo de cómo se analizan los datos, la Estadística se clasifica como:

ESTDISTICA DESCRIPTIVA

Estadística Descriptiva.- Rama de la estadística que trata sobre la

descripción y análisis estadístico de una población, que resume y presenta

datos obtenidos de la población o de una muestra, mediante métodos

adecuados. Tiene como objetivo caracterizar los datos, de manera gráfica o

analítica, para resaltar las propiedades de los elementos bajo estudio.

(http://www.Wikipedia: Estadísticas.)

FRECUENCIA:

Es el número de veces que se repite un dato.

Es el número de repeticiones que presenta una observación. Se

representa por ni. http://www.mitecnologico.com

Es el número de veces que aparece cualquier valor de la variable. Se

representa por fi. En algunos libros de texto nos la encontraremos

representada por ni. http://www.quequieredecir.com.

1.1 DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS Y RELATIVAS

Las primeras tareas de la Estadística descriptiva son ordenar, clasificar y

resumir los datos obtenidos en la investigación de campo, para ello se

concentran en tablas de frecuencia y éstas pueden ser:

a) Absoluta.

b) Relativa.

c) Acumulada.

Con el análisis de las frecuencias podemos determinar la tendencia de la

variable en estudio que como ya se dijo, ésta puede ser nominal, ordinal o

cuantitativa y sus respectivas escalas de medición: nominal, ordinal o por

intervalos, respectivamente.

Page 11: Jonathanharo

EJEMPLO: La maestra de orientación del Plantel 11 dio una conferencia al

grupo 603 sobre las características y bondades de las carreras de Ingeniería,

Química Metalúrgica y Actuaría. Al final de la conferencia pidió que llenaran un

cuestionario donde especificaron además de los datos personales, la carrera

de preferencia. Se obtuvieron los siguientes resultados: I, A, M, Q, Q, M,

A, I, M, Q, A, Q, I, Q, M,

Q, M, M, A, Q, I, Q, M, I, I, Q, M, M, A, I,

M, A, A, Q, I, M, Q, Q, A, M, A, Q, M, A, Q,

1.2 Tabla De Frecuencias:

Carrera que prefieren los alumnos del grupo 603 del Plantel 11 del Colegio de

Bachilleres.

Encuesta realizada por la maestra de orientación del Plantel 11, el 12 de

septiembre de 1993.

El número de columnas de una tabla es variable y depende de la

información que se quiera registrar.

En nuestro ejemplo podemos suprimir la columna 2 que representa el

conteo de la variable el cual se puede realizar en otras hojas de trabajo.

En la tercera columna se registra la frecuencia.

1.3 FRECUENCIA ABSOLUTA

En una muestra estadística, número de veces que aparece un determinado

carácter. http://nuestrosalud.com/ frecuencia-absoluta.html

Page 12: Jonathanharo

El número de los miembros de una serie estadística, que es al intervalo

determinado de los significados de la cantidad variable dada casual; en

particular, el número de los casos con dado o los valores dados del elemento

durante todo el tiempo de las observaciones. http://www.quequieredecir.org.

1.4 FRECUENCIA RELATIVA:

Cociente entre la frecuencia absoluta y el número de casos de una

muestra. http://www.quequieredecir.org/frecuencia/

La frecuencia relativa es el cociente entre la frecuencia absoluta de un

determinado valor y el número total de datos.

http://www.mitecnologico.com

FRECUENCIAS ABSOLUTAS

Simple (Ni) Acumulada (Ni)

Ni Ni

n2 ni+n2

n3 ni+n2+n3

.

. . .

Nn n

FRECUENCIA RELATIVA

Simple Acumulada

hi=n1|n h1

h2=n2|n h1+h2

.

. . .

hn= nn/n h

Page 13: Jonathanharo

1.5 FORMA DE CÁLCULO

EJEMPLO

La puntuación obtenida en un examen que se aplicó a 100 obreros de la fábrica

de vidrio el Fanal, es la que se muestra en la siguiente tabla de frecuencias: 46

Resultados del examen aplicado a 100 obreros de la fábrica de vidrio el

Fanal.

Investigación realizada por el jefe del departamento de capacitación de la

fábrica de vidrio el Fanal, el 5 de septiembre de 1993.

1.6 FRECUENCIA ACUMULADA

La frecuencia acumulada (Fi) es otra característica de la muestra que nos

permitirá determinar la posición de un caso particular que nos interese en

comparación con el total de los elementos. ((Levin Richard & Rubin David))

DEFINICIÓN:

Su definición matemática es:

Page 14: Jonathanharo

Al calcular la frecuencia acumulada (F1) podemos determinar su frecuencia

relativa acumulada (Fr) en la forma ya explicada mediante la ecuación (1), esto

es: n

Regresemos al problema (11) de las llamadas telefónicas y calculemos la

frecuencia acumulada (f1) y la frecuencia relativa acumulada (Fr). Frecuencia

acumulada (Fi) de una clase es la que se obtiene sumando las frecuencias de

las clases anteriores con la frecuencia de ésta.

La frecuencia acumulada para la 4ta. Clase es F = 45; de este valor se infiere

que hasta esta clase corresponden 45 de las 60 observaciones realizadas.

También se infiere que a esta clase corresponden un número menor o igual a

43 llamadas telefónicas. La frecuencia relativa de esta clase es F = 0.75. Este

valor significa que hasta esta clase corresponde el 75% de todas las llamadas.

Page 15: Jonathanharo

1.7 GRÁFICAS

Al representar en una gráfica la información concentrada en la tabla de

frecuencias, ésta es un recurso visual que nos permite tener una idea clara,

precisa, global y rápida acerca de las observaciones de una muestra o

población. Existen muchos tipos de gráficas en las que se pueden representar

la frecuencia absoluta (fi), relativa (fr) y acumulada (Fi) y con ellas podemos

estimar algunos valores con la simple observación.

1.8 HISTOGRAMA

Es uno de los medios expresada en % con mayor frecuencia, es una

representación gráfica de la distribución de frecuencias.

Se utilizan para representar tablas de frecuencias con datos agrupados en

intervalos. Si los intervalos son todos iguales, cada uno de ellos es la base de

un rectángulo cuya altura es proporcional a la frecuencia correspondiente.

http://www.monografias.com/ conceptos-de-estadistica.shtml

En estadística, un histograma es una representación gráfica de una variable en

forma de barras, donde la superficie de cada barra es proporcional a la

Page 16: Jonathanharo

frecuencia de los valores representados. En el eje vertical se representan las

frecuencias, y en el eje horizontal los valores de las variables, normalmente

señalando las marcas de clase. http://es.wikipedia.org/wiki/Histograma

1.9 HISTOGRAMA Y POLÍGONO DE FRECUENCIAS.

El histograma es la forma más usual para analizar las características

observables de una variable continua (http://www.monografias.shtml)

Histograma es la representación gráfica en el plano coordenado de las

características concentradas en la tabla de frecuencias de una variable

continua. (http://www.monografia.com/estadistica)

1.10 Para trazar el histograma, la secuencia de operaciones es:

1. En los ejes coordenados del plano cartesiano representamos los datos de la

siguiente forma:

a) En el eje de las abscisas (horizontal) se representan las clases con

sus límites reales de clase y las marcas de clase (Mi) de cada intervalo.

b) En el eje de las ordenadas (vertical) representamos las frecuencias

absolutas en que ocurre la variable.

Analicemos El Siguiente Problema:

Al gerente general de la empresa “Conductores Monterrey” le interesa conocer

la antigüedad de sus trabajadores, por lo que le indica al gerente de personal

que realice un análisis del problema.

El gerente de personal recabó de los expedientes la siguiente información

sobre los años de antigüedad:

Page 17: Jonathanharo

13, 19, 22, 14, 13, 16, 19, 21

23, 11, 27, 25, 17, 17, 13, 20

23, 17, 26, 20, 24, 15, 20, 21

23, 17, 29, 17, 19, 14, 20, 20

10, 22, 18, 25, 16, 23, 19, 20

21, 17, 18, 24, 21, 20, 19, 26

Con esta información decidió representarlos en una gráfica (histograma).

Recuerda la secuencia de operaciones que establecimos:

1. Ordenamos los datos en sentido creciente:

10, 11, 13, 13, 13, 14, 14, 15, 16, 16, 17, 17, 17, 17, 17, 17, 18,

18, 19, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21,

22, 22, 23, 23, 23, 23, 24, 24, 25, 25, 26, 26, 27, 29.

2. Calculamos el rango R, para ello determinamos los valores mayor y

menor de las puntuaciones.

X n = 29

Xi = 10

3. Calculamos R = X n – X1 = 29 – 10 = 19

R = 19

4. Calculamos el número de clases (K), para ello determinamos (n)

N = 48; K = 1 + 3.322 log48 = 1 + 3.322 (1.68) = 1 + 5.58 = 6.58 K = 7

5. Determinamos la amplitud de cada clase (A)

R = 19 = 2.7K 7

Se han redondeado los valores de K y A porque el número de clases y la

amplitud de la clase nunca serán fraccionarios.

Page 18: Jonathanharo

6. Determinamos cada intervalo de clase y para ello calculamos los límites de

clase y los registramos en la primera columna de la tabla.

7. Trazamos los ejes del plano coordenado, fijamos una escala para cada eje y

representamos en el vertical las frecuencias y en el eje horizontal las clases.

La mayor frecuencia es f4 = 16 por lo que con la escala establecida en cm.

Marcamos 16 divisiones en el eje vertical. En el eje horizontal no es necesario

iniciar por el cero, en nuestro ejemplo podemos iniciar a partir de 9, indicando

que se trunca una parte del eje horizontal.

Page 19: Jonathanharo

1.11 MEDIDAS DE TENDENCIA CENTRAL

DEFINICIONES

También se conocen como medidas de ubicación. Para que entienda

estos conceptos remítase al texto en la parte introductoria del capítulo (Levin

Richard & Rubin David).

Las medidas de tendencia central (media, mediana y moda) sirven como

puntos de referencia para interpretar las calificaciones que se obtienen en una

prueba. ((Kazmier & Díaz Mata, 1993:)

1. Sirve como un método para comparar o interpretar cualquier puntaje

en relación con el puntaje central o típico.

2. Mostrar en qué lugar se ubica la persona promedio o típica del grupo.

3. Sirve como un método para comparar el puntaje obtenido por una

misma persona en dos diferentes ocasiones.

4. Sirve como un método para comparar los resultados medios

obtenidos por dos o más grupos.

LAS MEDIDAS DE TENDENCIA CENTRAL MÁS COMUNES SON:

La media aritmética: comúnmente conocida como media o promedio.

Se representa por medio de una letra M o por una X con una línea en la

parte superior.

La mediana: la cual es el puntaje que se ubica en el centro de una

distribución. Se representa como Md.

La moda: que es el puntaje que se presenta con mayor frecuencia en

una distribución. Se representa Mo.

Page 20: Jonathanharo

De estas tres medidas de tendencia central, la media es reconocida como la

mejor y más útil. Sin embargo, cuando en una distribución se presentan casos

cuyos puntajes son muy bajos o muy altos respecto al resto del grupo, es

recomendable utilizar la mediana o la moda. (Porque dadas las características

de la media, esta es afectada por los valores extremos). La media aritmética es

considerada como la mejor medida de tendencia central, por las siguientes

razones: Los puntajes contribuyen de manera proporcional al hacer el cómputo

de la media. Es la medida de tendencia central más conocida y utilizada.

MEDIA ARITMÉTICA O PROMEDIO

DEFINICIÓN:

Es aquella medida que se obtiene al dividir la suma de todos los valores

de una variable por la frecuencia total. En palabras más simples,

corresponde a la suma de un conjunto de datos dividida por el número

total de dichos datos. (Kazmier & Díaz Mata)

Es el valor resultante que se obtiene al dividir la sumatoria de un

conjunto de datos sobre el número total de datos. Solo es aplicable para

el tratamiento de datos cuantitativos. ((Levin Richard & Rubin David)).

CARACTERÍSTICAS DE LA MEDIA ARITMÉTICA:

1. Es una medida totalmente numérica o sea sólo puede calcularse en

datos de características cuantitativas.

2. En su cálculo se toman en cuenta todos los valores de la variable.

3. Es lógica desde el punto de vista algebraico.

4. La media aritmética es altamente afectada por valores extremos.

Page 21: Jonathanharo

5. No puede ser calculada en distribuciones de frecuencia que tengan

clases abiertas.

6. La media aritmética es única, o sea, un conjunto de datos numéricos

tiene una y solo una media aritmética.

1.12 FORMULA

Dónde:

n= Media Aritmética Muestral

Xi = Valor Típico Especifico

N = Tamaño De La Muestra

Σ = sumatoria.

FORMAS DE CÁLCULO:

Page 22: Jonathanharo

Ejemplo 1:

En matemáticas, un alumno tiene las siguientes notas:

4, 7, 7, 2, 5, 3 n = 6 (número total de datos)

La media aritmética de las notas de esa asignatura es 4,8. Este número

representa el promedio.

Ejemplo 2: Cuando se tienen muchos datos es más conveniente agruparlos en

una tabla de frecuencias y luego calcular la media aritmética. El siguiente

cuadro con las medidas de 63 varas de pino lo ilustra.

Largo (en m) Frecuencia absoluta Largo por Frecuencia absoluta

5 10 5 . 10 = 50

6 15 6 . 15 = 90

7 20 7 . 20 = 140

8 12 8 . 12 = 96

9 6 9 . 6 = 54

Frecuencia total = 63 430

Se debe recordar que la frecuencia absoluta indica cuántas veces se repite

cada valor, por lo tanto, la tabla es una manera más corta de anotar los datos

(si la frecuencia absoluta es 10, significa que el valor a que corresponde se

repite 10 veces).

Page 23: Jonathanharo

1.13 MEDIANA (MED)

1.14 DEFINICIÓN:

La mediana solamente establece el valor que se encuentra utilizando la

posición central dentro del conjunto. (file:/A|/tendencentral.htm)

Es el valor central de un conjunto de valores ordenados en forma

creciente o decreciente. Dicho en otras palabras, la Mediana

corresponde al valor que deja igual número de valores antes y después

de él en un conjunto de datos agrupados. Según el número de valores

que se tengan se pueden presentar dos casos: ((Webster).

Si el número de valores es impar, la Mediana corresponderá al valor central de

dicho conjunto de datos.

Si el número de valores es par, la Mediana corresponderá al promedio de los

dos valores centrales (los valores centrales se suman y se dividen por 2).

1.15 CARACTERÍSTICAS DE LA MEDIANA

1. En su cálculo no se incluyen todos los valores de la variable.

2. La Mediana no es afectada por valores extremos.

3. Puede ser calculada en distribuciones de frecuencia con clases abiertas.

4. No es lógica desde el punto de vista algebraico.

FORMULA:

Me= Li+ n/2 –FA

ni (i)

Page 24: Jonathanharo

1.16 FORMAS DE CÁLCULO

La forma más general de calcular la mediana es la siguiente:

1.17 Mediana Para Datos No Agrupados:

Los datos no agrupados son aquellos que no tienen una ordenación previa para

presentarlos; por ello, se debe realizar lo siguiente:

a. Con los datos recogidos se procede a ordenarlos de manera ascendente

o descendente

b. Establece el dato que ocupa la posición central

c. Identificar el valor del dato que ocupa la posición central que vendría a

ser el valor mediano.

En este caso para encontrar el dato que ocupa la posición central debemos

identificar si se trata de un número de datos par o impar. Si se trata de datos

pares, haremos lo siguiente: Me=10/2

Con cuyo resultado contaremos la posición desde el valor menor y desde el

valor mayor, por ejemplo, si tenemos los siguientes datos: 6, 9, 3, 7, 4, 8, 6, 9,

1, 2

Procedemos a ordenarlos: 1, 2, 3, 4, 6, 6, 7, 8, 9, 9, luego identificamos la

posición que ocupa el valor central: M=5

Significa que desde el valor menor ubicamos el dato número 5, que para el

caso es el valor 6, luego hacemos lo mismo desde el valor mayor y en este

caso la posición 5 está ocupada por el valor 6. Posteriormente establecemos el

promedio entre los valores encontrados y estamos encontrando el valor

mediano: Me=6+6/2 M=6

Page 25: Jonathanharo

Por tanto 6 es el valor que se encuentra ocupando la posición central o el valor

que divide en dos partes iguales al conjunto.

Si se trata de datos impares, entonces encontramos la posición, haciendo lo

siguiente: Me= n+1/ 2

Supongamos los siguientes datos: 5, 8, 3, 9, 1, 5, 7, 3, 8, 6, 4.

Procedemos a ordenar los datos: 1, 3, 3, 4, 5, 5, 6, 7, 8, 8, 9

Ahora establecemos el dato que ocupa la posición central Me= n+1/ 2

Me=11+1/2 M=6

Identificamos el sexto valor, aquí no hay problema empezar por el menor o por

el mayor puesto que será un solo valor: 1, 3, 3, 4, 5, 5, 6, 7, 8, 8, 9.

Por simple observación llegamos a determinar que el valor mediano es:

Me= n+1/ 2 M=5

1.18 Mediana Para Datos Agrupados:

Para datos agrupados en una tabla de distribución de frecuencias, vamos a

llevar el siguiente procedimiento:

a. Con la tabla de distribución de frecuencias, encontramos la frecuencia

acumulada.

b. Establecemos el dato que se encuentra ocupando la posición central.

Para ello utilizamos la siguiente fórmula:

c. Identificamos el intervalo mediano a través de la frecuencia acumulada y

la posición encontrada.

d. Aplicamos la fórmula de la mediana que es la siguiente:

Me= Li+ n/2 – fa(i)

Ni

Page 26: Jonathanharo

Dónde:

Li = límite real inferior del intervalo mediano.

n= número total de observaciones.

FA= frecuencia acumulada anterior al intervalo mediano.

ni = frecuencia absoluta simple del intervalo mediano.

i = tamaño o anchura del intervalo de clase.

Ejemplo 1

Realicemos el cálculo de la mediana en el siguiente ejercicio:

Me= 241+1/2

Me=121

Aplicamos la fórmula para encontrar el valor mediano:

Me= Li+ n/2 – fa (i) / ni

Me= 43.5

Page 27: Jonathanharo

1.19 Ejemplo 2:

El siguiente conjunto de datos está ordenado en forma decreciente, de mayor a

menor, y corresponde a un conjunto de valores pares, por lo tanto, la Mediana

será el promedio de los valores centrales.

21, 19, 18, 15, 13, 11, 10, 9, 5, 3

Ejemplo 3:

Lo cual significa que la mediana se ubica en la posición intermedia entre los

alumnos 25 y 26 (cuyo promedio es 25,5), lo cual vemos en el siguiente cuadro:

TABLA:

PUNTAJE ALUMNOS

62 1

62 2

62 3

62 4

62 5

67 6

67 7

67 8

67 9

Page 28: Jonathanharo

67 10

72 11

72 12

72 13

72 14

72 15

72 16

72 17

72 18

77 19

77 20

77 21

77 22

77 23

77 24

77 25

77 26

77 27

77 28

77 29

77 30

82 31

82 32

Page 29: Jonathanharo

82 33

82 34

82 35

82 36

82 37

82 38

82 39

82 40

82 41

82 42

82 43

82 44

82 45

82 46

87 47

87 48

87 49

87 50

El alumno 25 obtuvo puntaje de 77

El alumno 26 obtuvo puntaje de 77

Entonces, como el total de alumnos es par debemos promediar esos puntajes:

Mediana= 77+77/2 = 144/2 =77

Page 30: Jonathanharo

La mediana es 77, lo cual significa que 25 alumnos obtuvieron puntaje desde

77 hacia abajo (alumnos 25 hasta el 1 en el cuadro) y 25 alumnos obtuvieron

puntaje de 77 hacia arriba (alumnos 26 hasta el 50 en el cuadro).

2 MODA

DEFINICIÓN.- Es la medida que indica cual dato tiene la mayor frecuencia en

un conjunto de datos; o sea, cual se repite más. Es el valor que se presenta

con mayor frecuencia en un conjunto de datos. A una distribución que tiene una

sola moda se le denomina un modal. Para un conjunto de datos poco

numerosos, en los que no se repite ningún valor, no existe moda. Cuando dos

valores no adyacentes tienen frecuencias máximas similares, se dice que la

distribución es bimodal. A las distribuciones de mediciones que tienen varias

modas se le denomina multimodales. ((Kazmier & Díaz Mata))

El valor que más a menudo se repite en un conjunto de datos. Está

representado por el punto más alto de la curva de distribución de un conjunto

de datos”. ((Levin Richard & Rubin David, 1996:p.140).)

2.1 CARACTERÍSTICAS DE LA MODA.

1. En su cálculo no se incluyen todos los valores de la variable.

2. El valor de la moda puede ser afectado grandemente por el método de

designación de los intervalos de clases.

3. No está definida algebraicamente.

4. Puede ser calculada en distribuciones de frecuencia que tengan clases

abiertas.

5. No es afectada por valores extremos.

2.2 FORMAS DE CÁLCULO:

Para datos no agrupados, por simple observación se puede determinar el valor

o los valores de la moda, si es que existieran.

Si tenemos los siguientes valores: 4, 5, 7, 5, 8, 1, 3, 5, 6, 8, 5

Page 31: Jonathanharo

Procedemos a ordenarlos para mayor facilidad de observación: 1, 3, 4, 5, 5, 5,

5, 6, 7, 8, 8.

En este caso el valor modal es 5 porque es el que se repite el mayor número

de veces en este grupo. Para el caso de datos agrupados en una serie

ordenada de frecuencias, se considera únicamente la mayor frecuencia y el

valor de la variable será el valor modal.

a) Cuando trabajamos con datos agrupados en una tabla de distribución de

frecuencias, deberemos considerar los siguientes pasos:

b) Considerar el intervalo que mantiene la frecuencia absoluta simple más

alta, lo que sería intervalo modal.

c) Determinar la diferencia entre la frecuencia del intervalo modal y del pre

modal.

d) Determinar la diferencia entre la frecuencia del intervalo modal y del post

moda

2.3 DATOS AGRUPADOS:

1= Es el exceso de frecuencia de la clase modal con respecto a la clase

contigua anterior a ella.

2= Posterior a ella.

INTERVALO fi

28-38 2

38-48 7

48-58 7

58-68 14

68-78 15

78-88 8

88-98 3

Page 32: Jonathanharo

2.4 CUARTILES

Los cuartiles son los tres valores de la variable que dividen a un conjunto de

datos ordenados en cuatro partes iguales.

Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75%

de los datos.

Q2 Coincide con la mediana.

2.5 CÁLCULO DE LOS CUARTILES

1. Ordenamos los datos de menor a mayor.

2. Buscamos el lugar que ocupa cada cuartil mediante la expresión

. K*N/ 4, K=1, 2,3

Número impar de datos

2, (Q1)

5, (Q2)

3, (Q3)…. 6, 7, 4, 9

Page 33: Jonathanharo

Número par de datos

2, 5,3, 4, 6, 7,1, 9

2.6 CÁLCULO DE LOS CUARTILES PARA DATOS AGRUPADOS

En primer lugar buscamos la clase donde se encuentra,

en la tabla de las frecuencias acumuladas.

2.7 EJERCICIOS DE CUARTILES

Calcular los cuartiles de la distribución de la tabla:

DATOS fi Fi

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

TOTAL 65

Page 34: Jonathanharo

1. Cálculo del primer cuartil

2. Cálculo del segundo cuartil

3. Cálculo del tercer cuartil

DECILES

Los deciles son los nueve valores que dividen la serie de datos en diez

partes iguales. ((Kazmier & Díaz Mata, 1993:)

Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de

los datos D5 coincide con la mediana. (((Masson /Lind /Marchal))

CÁLCULO DE LOS DECILES

En primer lugar buscamos la clase donde se encuentra, en la tabla de las

frecuencias acumuladas.

Page 35: Jonathanharo

EJERCICIO DE DECILES

Calcular los deciles de la distribución de la tabla:

DATOS fi Fi

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

TOTAL 65

1. Cálculo del primer decil

2. Cálculo del segundo decil

3. Cálculo del tercer decil

Page 36: Jonathanharo

4. Cálculo del cuarto decil

5. Cálculo del quinto decil

6. Cálculo del sexto decil.

7. Cálculo del séptimo decil

Page 37: Jonathanharo

8. Cálculo del octavo decil

9. Cálculo del noveno decil

PERCENTILES

Los percentiles son los 99 valores que dividen la serie de datos en 100

partes iguales. (http://www.monografia.com/estadistica).

Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de

los datos. (http://www.monografias.shtml)

P50 coincide con la mediana.

Cálculo de los percentiles

En primer lugar buscamos la clase donde se encuentra, en la tabla de las

frecuencias acumuladas.

Page 38: Jonathanharo

EJERCICIO DE PERCENTILES

Calcular el percentil 35 y 60 de la distribución de la tabla:

DATOS fi Fi

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

TOTAL 65

1. Percentil 35

2. Percentil 60

Page 39: Jonathanharo

ORGANIZADOR GRAFICO DE LAS MEDIDAS DE TENDENCIA CENTRAL

Medios de Tendencia Central

Es el número que más se repite

en 1 distribución de frecuencias

C

Valor promedio

Central

Moda

Valor promedio

Central

Media Aritmética Mediana

Son los valores centrales de

una serie de datos que se

desea investigar.

Page 40: Jonathanharo
Page 41: Jonathanharo

NIVELES DE LOGRO ACTIVIDADES

MEDIADO AUTÓNOMO

TEÓRICO BÁSICO Análisis de las medidas de tendencia central en el Aula

Lectura comprensiva de frecuencias y de las medidas de tendencias Central

consulta de las medidas de tendencia central mediante la aplicación de las TIC´S

lectura comprensiva de los conceptos de las medidas de tendencia central

TEÓRICO SUPERIOR Análisis de la realización de las tablas de frecuencias con datos agrupados y datos no agrupados

Toma de decisiones para realizar los ejercicios con la aplicación de las Medidas de tendencia central

Aplicación de los ejercicios propuestos

Realización de consultas de todos los conceptos básicos

TEÓRICO PRÁCTICO

ACEPTABLE

Aplicación en ejercicios de la teoría analizada

Formulación de alternativas de solución

Realización de ejercicios

Elaboración de mente factos y lectura comprensiva

TEÓRICO PRÁCTICO

AVANZADO

Análisis de los problemas que suceden en la

sociedad.

Aplicación de ejercicios con datos reales del Banco Central

del Ecuador.

Page 42: Jonathanharo
Page 43: Jonathanharo

CAPITULO II

MEDIDAS DE DISPERSIÓN

Es la diferencia entre dos valores seleccionados del conjunto de datos

Comprendemos pues, a la vista de estos ejemplos, la necesidad de

conocer otras medidas, aparte de los valores de centralización, que nos

indiquen la mayor o menor desviación de cada observación respecto de

aquellos valores. Las medidas de desviación, variación o dispersión son:

Rango o amplitud, desviación media y desviación típica. ((Webster)

También conocidas como medidas de variabilidad. En contraste, estas

medidas se encargan de describir la variabilidad entre los valores”

((Kazmier & Díaz Mata,)

2.8 RANGO, AMPLITUD TOTAL O RECORRIDO

2.9 DEFINICION

Diferencia entre el valor observado más alto y el más pequeño. ((Masson

/Lind /Marchal, 2000: p.106).)

El rango se suele definir como la diferencia entre los dos valores

extremos que toma la variable. Es la medida de dispersión más sencilla y

también, por tanto, la que proporciona menos información. Además, esta

información puede ser errónea, pues el hecho de que no influyan más de

dos valores del total de la serie puede provocar una deformación de la

realidad. La amplitud total o rango se define como la diferencia entre el

valor máximo y el valor mínimo de un conjunto de datos. Cuando la

variable sea continua, para el cálculo deben utilizarse los límites exactos.

(http://www.monografia.com/estadistica)

Page 44: Jonathanharo

2.10 CARACTERÌSTICAS

2.11 Características del Rango

1. Es fácil de calcular.

2. Es comúnmente usado como una medida eficaz de variabilidad.

3. Es comprensible para cualquier persona, aún cuando no conozca de

estadística.

2.12 FORMULA

Dónde:

X máx = Valor máximo

X mín = Valor mínimo

r = rango

2.13 FORMAS DE CÁLCULO.

Comparemos, por ejemplo, estas dos series:

Serie 1: 1 5 7 7 8 9 9 10 17

Serie 2: 2 4 6 8 10 12 14 16 18

Ambas series tienen rango 16, pero están desigualmente agrupadas, pues

mientras la primera tiene una mayor concentración en el centro, la segunda

se distribuye uniformemente a lo largo de todo el recorrido.

El uso de esta medida de dispersión, será pues, bastante restringido.

Page 45: Jonathanharo

3 LA VARIANZA

3.1 DEFINICION

El valor de la varianza, desde el punto de vista práctico, es un poco

complicado de entender, porque las unidades asignadas a ellas son

cuadradas, tales como metros cuadrados. Para convertir esta medida de

variabilidad en unidades originales, podemos tomar la raíz cuadrada de la

varianza (S2), obteniendo la desviación estándar de una muestra. La

desviación estándar sirve como medida básica de variabilidad.

“La varianza es la media aritmética de los cuadrados de las desviaciones de

las observaciones respecto de su media aritmética. Es una medida

importante de dispersión”. ((Webster) ((Webster, 2000: p. 72).)

La varianza es similar a la desviación media, porque se basa en la diferencia

entre cada uno de los valores del conjunto de datos y la media del grupo. La

diferencia consiste en que, antes de sumarlas se eleva al cuadrado cada una

de las diferencias. Para una población, se presenta la varianza mediante v

(x) o, en forma más típica mediante la letra σ² (que se lee “sigma cuadrado”).

((Kazmier & Díaz Mata, 1993:)

FORMULA:

POBLACIÓN

Dónde:

N= total de observaciones de la población

Xi= variable

μ = media poblacional

σ ²= varianza

Page 46: Jonathanharo

MUESTRA

Dónde:

n= tamaño de la muestra

Xi= valores de la muestra

= media muestral

S2 = varianza

3.2 FORMA DE CÁLCULO

El número de días necesarios por 10 equipos de trabajadores para terminar

10 instalaciones de iguales características han sido: 21, 32, 15, 59, 60, 61,

64, 60, 71, y80 días. Calcular la varianza.

Solución: Se suman todos los valores de una variable dividida entre el

número total de datos de los que se dispone:

Luego, se toman todos los valores dados y la media obtenida, se sustituye

en la fórmula de la varianza.

σ ²= 427,61

Page 47: Jonathanharo

3.3 DESVIACIÓN MEDIA

3.4 DEFINICIÓN

Es la medida de dispersión más importante, ya que se emplea como una

medida para comparar la dispersión en dos o más conjuntos de

observaciones”. ((Masson /Lind /Marchal, 2000: p.106).)

La desviación típica de un conjunto de datos es una medida de cuánto se

desvían los datos de su media. Esta medida es más estable que el recorrido

y toma en consideración el valor de cada dato. También se puede decir que

es la raíz cuadrada de la varianza. (((Masson /Lind /Marchal))

Puede definirse como la media aritmética de las desviaciones de cada uno

de los valores con respecto a la media aritmética de la distribución, y de

indica así:

N

xxDM

Nótese que se toman las desviaciones en valor absoluto, es decir, que la

fórmula no distingue si la diferencia de cada valor de la variable con la media

es en más o en menos. Ya se habrá advertido que esta expresión sirve para

calcular la desviación media en el caso de datos sin agrupar. Se tiene los

valores 2, 2, 4, 4, 5, 6, 7, 8, 8. Averiguar la desviación media de estos

valores.

X xx x

2 -3 3

2 3 3

4 -1 1

4 -1 1

4 -1 1

5 0 0

6 1 1

7 2 2

8 3 3

8 3 3

Page 48: Jonathanharo

DM = 1,8 Veamos ahora cómo se calcula la desviación media en el caso de

datos agrupados en intervalos.

N

xnDM

i

Donde observamos que ahora las desviaciones van multiplicadas por las

frecuencias de los intervalos correspondientes. Además, las desviaciones

son de cada centro, o marca de clase, a la media aritmética. Es decir,

N

xxnDM

mi )(

Ejemplo: Para hallar la desviación media de la siguiente tabla referida a las

edades de los 100 empleados de una cierta empresa:

Clase ni

16-20 2

20-24 8

24-28 8

28-32 18

32-36 20

36-40 18

40-44 15

44-48 8

48-52 3

Page 49: Jonathanharo

Veamos cómo se procede:

Marca de

Clase

ni xm ni xm xx ni xx

16-20 2 18 36 16,72 33,44

20-24 8 22 176

24-28 8

28-32 18

32-36 20

36-40 18

40-44 18

44-48 8

48-52 3

100

DM = 6,09

La desviación media viene a indicar el grado de concentración o de

dispersión de los valores de la variable. Si es muy alta, indica gran

dispersión; si es muy baja refleja un buen agrupamiento y que los valores

son parecidos entre sí.

3.5 DESVIACIÓN TÍPICA

Es sin duda la medida de dispersión más importante, ya que además sirve

como medida previa al cálculo de otros valores estadísticos.

La desviación típica se define como la raíz cuadrada de la media de los

cuadrados de las desviaciones con respecto a la media de la distribución.

Es decir,

Page 50: Jonathanharo

N

xxS

2

Para datos sin agrupar, o bien:

N

xxS

2

3.6 CÁLCULO DE LA DESVIACIÓN TÍPICA PARA DATOS NO

AGRUPADOS EN CLASES

Veamos la fórmula anterior aplicada a un caso concreto.

Hallar la desviación típica de la serie: 5, 8, 10, 12, 16.

X xx xx2

5 -5,2 27,04

8 -2,2 4,84

10 -0,2 0,04

12 1,8 3,24

16 5,8 33,64

Primero hallamos x = 10,2

Luego S = 71,376,13

3.7 CÁLCULO DE LA DESVIACIÓN TÍPICA PARA DATOS

AGRUPADOS EN CLASES Y AGRUPADOS POR FRECUENCIAS

a) Método largo: Se aplica la siguiente fórmula

N

fxS

2

Donde xxx m y f es la frecuencia absoluta de cada intervalo.

Page 51: Jonathanharo

b) Método abreviado o corto: La fórmula a utilizar es:

22

N

fd

N

fdIS

Dónde:

I : amplitud de la clase

D: distancia en clases desde cada una en concreto a la clase que contiene a

la media supuesta A.

Ejemplo: Las alturas en cm de un grupo de 103 personas se distribuyen así:

Clases f

150 – 155

155 – 160

160 – 165

165 – 170

170 – 175

175 – 180

180 – 185

185 – 190

190 – 195

195 – 200

3

6

12

18

25

17

10

7

4

1

103

Respuesta: S = 9,56

Page 52: Jonathanharo

4 PASOS PARA DESCARGAR E INSTALAR EL SPSS

1. Prender el computador

2. Descargar el programa SPSS

3. Entrar en la página 4 shared

4. Clic en archivos y poner el nombre del programa y buscar

5. Clic en descargar SPSS

6. Clic en descargar archivo esperar algunos segundo

7. Clic en descargar archivo

8. Asegurarse de no estar conectado a internet: durante la instalación el

programa

Para desconectar el acceso a la red hacer clic en Inicio

9. Panel de control

10. Conexiones de red.

11. Luego hacer clic con el botón secundario del mouse en el ícono de la

placa de red y hacer clic en "Desactivar".

Page 53: Jonathanharo

12. ) Ir a la carpeta donde se ubica el archivo "SPSS 17 Setup.exe" y

hacer doble clic en el mismo.

13. Se abrirá una ventana que muestra el progreso de la instalación.

14. Se abre otra ventana. Seleccionar "Licencia de usuario individual" y

hacer clic en "Siguiente >". En la siguiente ventana hacer clic en

"Acepto los términos del contrato de licencia" y hacer clic en

"Siguiente >". En la ventana de "Información de última hora" hacer clic

en "Siguiente >".

15. Se abre una nueva ventana

a) Completar los campos "Nombre de usuario" y "Organización" con

los datos que se desee.

b) Ir a la carpeta donde se ubica el archivo "keygen.exe" y hacer

doble clic en el mismo.

c) Atención: antes de continuar, tener en cuenta que los códigos

mostrados aquí pueden diferir de los que muestra el programa en

su computadora (se recomienda utilizar solamente los códigos

mostrados en el programa que se utiliza al instalar y no los

mostrados aquí

16. Se abre una ventana para ingresar licencia y registro de SPSS. Hacer

clic en "Aceptar".

17. Se abre una nueva ventana. Seleccionar "Conseguir una licencia para

mi producto ahora".

18. Clic en siguiente

19. Introducir el código de autorización que está debajo del botón

"Generate" del keygen mencionado en 5b. Hacer clic en "Siguiente >".

Page 54: Jonathanharo

Aparece una ventana que indica un error en la conexión a internet.

Hacer clic en "Siguiente >".

20. Clic en siguiente para que se instale el programa

21. Luego clic en inicio programas spss Aparece una ventana que indica

las licencias de las que se dispone. Hacer clic en "Siguiente >".

22. Se abre una nueva ventana. Seleccionar "Conseguir una licencia

para mi producto ahora".

23. Luego se introduce la licencia del producto

24. Clic en siguiente

25. Para pasar el idioma del programa a español

26. Abrir un archivo .sav o alguno de la carpeta Samples.

En el menú "Edit" hacer clic en el botón "Options..." En la pestaña

"General", en el área "Output", en la sección "Language" hacer clic la lista

desplegable (el triángulo que apunta hacia abajo) y hacer clic en

"Spanish".

Repetir el paso 19 en la sección "User Interface" y hacer clic en "OK".

27. Para reconectar el acceso a la red hacer clic en Inicio / Panel de

control / Conexiones de red. Luego hacer clic con el botón secundario

del mouse en el ícono de la placa de red y hacer clic en "Activar".

Page 55: Jonathanharo

4.1 PASOS PARA RESOLVER EL CASO EN SPSS:

1. Inicio/Programs/SPSS 17 for Windows/SPSS Para Windows.

2. Hacemos clic en la opción “Introducir datos” de la ventana de Bienvenida y

aceptamos.

Page 56: Jonathanharo

3. Seleccionamos en la parte inferior de la ventana la opción “Vista de

Variables”, y procedemos a crear una variable

4. En la parte inferior de la ventana seleccionamos la opción “Vista de

datos”, en la columna donde vemos el nombre de la variable procedemos a

ingresar los datos al azar.

Page 57: Jonathanharo

5. Para ordenar los datos ya sea en forma ascendente o descendente:

Datos/Ordenar casos.

6. En esta ventana seleccionamos la variable y la trasladamos haciendo clic

en la flecha de color negro.

7. Una vez que hemos trasladado la variable, seleccionamos el Orden de

clasificación (en este caso Descendente) y aceptamos.

Page 58: Jonathanharo

8. En la ventana principal de SPSS, observamos que los datos se

encuentran ordenados de tal forma (de mayor a menor).

9. Para la obtención de Intervalos: Transformar/Recodificar/En distintas

variables…

10. En la ventana “Recodificar en distintas variables”, trasladamos la variable

“Exportaciones de Girasol” haciendo clic en la flecha de color negro.

11. En la opción “Variable de resultado” debemos colocar distintos nombres

en las casillas de Nombre y Etiqueta.

12. Hacemos clic en la opción “Cambiar” y posteriormente en la opción

“Valores antiguos y nuevos…”.

Page 59: Jonathanharo

13. Dentro de la ventana “Recodificar en distintas variables: Valores antiguos

y nuevos”, escogemos la opción “Rango:” iremos ingresando los intervalos,

además hemos de marcar la opción “Las variables de resultados son

cadenas” y colocamos una cantidad (20), en la opción “Valor nuevo”

volveremos a ingresar los intervalos y los iremos añadiendo (opc. Añadir)

hasta terminar.

14. Aquí nos presentan ya los datos de los intervalos ingresados en su

totalidad.

15. Hacemos clic en la opción “Continuar” y tendremos en la Ventana

principal de SPSS los datos en forma de intervalo.

Page 60: Jonathanharo

16. Para desarrollar las distintas actividades estadísticas:

Analizar/Estadísticos descriptivos/Frecuencias…

17. Dentro de la ventana “Frecuencias”, seleccionamos la Variable

“Exportaciones de Girasol” y la trasladamos haciendo clic en la flecha de

color negro.

18. Posteriormente hacemos clic en la opción “Estadísticos”.

Page 61: Jonathanharo

19. Ya en la ventana “Frecuencias: Estadísticos”, marcamos todas las

operaciones estadísticas que necesitemos y hacemos clic en “Continuar”.

20. De retorno en la ventana “Frecuencias”, hacemos clic en la opción

“Gráficos”, seleccionamos la mejor gráfica y Hacemos clic en la opción

“Continuar”.

Gráficos histogramas.

21. Nuevamente en la ventana “Frecuencias”, hacemos clic en la opción

“Aceptar” y podremos visualizar los resultados finales.

Page 62: Jonathanharo
Page 63: Jonathanharo

5 ORGANIZADOR GRAFICO DE LAS MEDIDAS DE DISPERSIÓN

Medidas de Dispersión

Son aquellas medidas que se

encuentran alejadas del centro de

una distribución de frecuencias.

Rango Desviación

Media

Desviación

Típica

Varianza

Page 64: Jonathanharo

NIVELES DE LOGRO ACTIVIDADES

MEDIADO AUTÓNOMO

TEÓRICO BÁSICO Análisis de las medidas dispersión.

Lectura comprensiva de las medidas de dispersión

consulta de las medidas de dispersión mediante la aplicación de las TIC´S

Lectura comprensiva de los conceptos de las medidas de dispersión

TEÓRICO SUPERIOR Análisis de la realización de las medidas de dispersión con datos agrupados y datos no agrupados

Toma de decisiones para realizar los ejercicios con la aplicación de las Medidas de dispersión

Aplicación de los ejercicios propuestos

Realización de consultas de todos los conceptos básicos

TEÓRICO PRÁCTICO ACEPTABLE Aplicación en ejercicios de la teoría analizada y conocimiento del programa spss para la aplicación de las medidas de tendencia central.

Formulación de alternativas de solución.

Realización de ejercicios a través del programa SPSS

Elaboración de mente factos y lectura comprensiva

TEÓRICO PRÁCTICO AVANZADO Análisis de los problemas que suceden en la sociedad.

Aplicación de ejercicios con datos reales de la Banco central del Ecuador

Page 65: Jonathanharo

CAPITULO III

5.1 TEMA: MUESTREO

Existen estudios en el que queremos conocer ciertas características de un

grupo de personas o autos a los que llamaremos población de manera que no

se los puede estudiar a todos porque son numerosos o porque su naturaleza se

vuelve inaccesible, existe otro recurso que es estudiar una parte que se llama

MUESTRA, generalmente cuando el n>100 se lo llama población pero si n<100

a toda la población se la puede llamar muestra.

Se puede estudiar el muestreo estadístico y el muestreo no estadístico en que

el primero se lo escoge completamente al azar sin ninguna instrucción

predeterminada en cambio el segundo tiene una instrucción al seleccionar los

elementos de la muestra.

MUESTRA

DEFINICION

Una muestra es un conjunto de medidas u observaciones tomadas a partir de

una población dada; es un subconjunto de la población. Desde luego, el

número de observaciones en una muestra es menor que el número de posibles

observaciones en la población, de otra forma, la muestra será la población

misma. Las muestras se toman debido a que no es factible desde el punto de

vista económico usar a toda la población. En algunos casos es imposible

recolectar todas las posibles observaciones en la población.

http://www.vitutor.com/estadistica/descriptiva/a_1.html

Una muestra es un conjunto de medidas u observaciones tomadas a partir de

una población dada; es un subconjunto de la población. Desde luego, el

número de observaciones en una muestra es menor que el número de posibles

observaciones en la población, de otra forma, la muestra será la población

misma. Las muestras se toman debido a que no es factible desde el punto de

vista económico usar a toda la población. En algunos casos es imposible

Page 66: Jonathanharo

recolectar todas las posibles observaciones en la población.

http://www.vitutor.com/estadistica/descriptiva/a_1.html

EJEMPLO

Si se desea estimar el gasto promedio anual de los estudiantes del

C.B., se extraería una muestra formada por cierto número de

estudiantes, se determinaría el gasto anual correspondiente a cada

uno de ellos y después se obtendría el promedio. Se utiliza una

muestra debido a que simplemente no se tiene el tiempo ni el recurso

para establecer el contacto con todos los estudiantes del C.B., aun

cuando es posible hacerlo.

5.2 MUESTREO PROBABILÍSTICO:

Aleatorio: Asigna un número a cada uno, selecciona la muestra a través de

números aleatorios.

El procedimiento empleado es el siguiente: 1) se asigna un número a cada

individuo de la población y 2) a través de algún medio mecánico (bolas dentro

de una bolsa, tablas de números aleatorios, números aleatorios generados con

una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario

para completar el tamaño de muestra requerido. Este procedimiento, atractivo

por su simpleza, tiene poca o nula utilidad práctica cuando la población que

estamos manejando es muy grande. ((Kazmier & Díaz Mata,)

Muestreo en el que todas las muestras tienen la misma probabilidad de ser

seleccionadas y en el que las unidades obtenidas a lo largo del muestreo se

devuelven a la población. 2) Muestreo en el que la muestra aleatoria está

formada por variables aleatorias independientes e idénticamente distribuidas a

la variable aleatoria poblacional. Sinónimo de Muestreo aleatorio con

reemplazamiento. http://www.mitecnologico.com/

Page 67: Jonathanharo

5.3 Sistemático: Lista completa del universo selecciona cada individuo cada

10 individuos.

Se practica cuando se dispone de una lista de todas las unidades

Muéstrales, en un orden independiente de la variable que se desea

medir. http://www.jorgegalbiati.cl/ejercicios_4/ConceptosBasicos.pdf

Se elige un individuo al azar y a partir de él, a intervalos constantes, se

eligen los demás hasta completar la muestra.

http://www.vitutor.com/estadistica/inferencia/inferenciaContenidos.html

5.4 Estratégico: Son tamaños de la muestra de cada extracto depende de

los necesidades.

Muestreo en el que la población se divide previamente en un número de

subpoblaciones o estratos, prefijado de antemano. Dentro de cada estrato se

realiza un muestreo aleatorio simple. (http://www.AulaFacil.com,

http://www.AulaFacil.com)

Este muestreo considera categorías típicas diferentes entre sí (estratos) que

poseen gran homogeneidad respecto a alguna característica (se puede

estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo,

el estado civil, etc.). Lo que se pretende con este tipo de muestreo es

asegurarse de que todos los estratos de interés estarán representados

adecuadamente en la muestra. Cada estrato funciona independientemente,

pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el

estratificado para elegir los elementos concretos que formarán parte de la

muestra. En ocasiones las dificultades que plantean son demasiado grandes,

pues exige un conocimiento detallado de la población. (Tamaño geográfico,

sexos, edades, etc. (muestra. http:// www.wikipedia.)

Page 68: Jonathanharo

5.5 MUESTREO NO PROBABILÍSTICO:

5.6 Casual: Entrevista a los individuos en forma casual (Ejemplo: lo que

pasan por la calle).

Se trata de un proceso en el que el investigador selecciona directa e

intencionadamente los individuos de la población.

http://maxsilva.bligoo.com

Se usa en los casos en no es posible seleccionar los elementos, y deben

sacarse conclusiones con los elementos que estén disponibles

http://sitios.ingenieria-usac.edu/teoria.html

5.7 Intencional: Selecciona al individuo según el criterio de un experto

(Ejemplo: dueños a un restaurante).

Es muy frecuente su utilización en sondeos preelectorales de zonas que

en anteriores votaciones han marcado tendencias de voto.

http://maxsilva.bligoo.com/Metodos-de-Muestreos-no-Probabilist.html

Muestreo en el que la persona que selecciona la muestra procura que

esta sea representativa; por consiguiente, la representatividad depende

de su intención u opinión, y la evaluación de la representatividad es

subjetiva. No tiene fundamento probabilístico. http://sitios.ingenieria-.html

5.8 Cuotas: Cada entrevistado debe estar dentro de cada categoría (Ejemplo:

hombres y mujeres).

También denominado en ocasiones "accidental". Se asienta

generalmente sobre la base de un buen conocimiento de los estratos de

la población y/o de los individuos más "representativos" o "adecuados"

para los fines de la investigación. http://www.psico.uniovi.es/Dptg.html

Page 69: Jonathanharo

En este tipo de muestreo se fijan unas "cuotas" que consisten en un

número de individuos que reúnen unas determinadas condiciones, por

ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes

en Gijón. (http://www.monografias.shtml)

5.9 Determinar El Tamaño De La Muestra

Hay que tener mucho cuidado en determinar la muestra si es demasiado

grande la investigación puede existir un desperdicio de recursos si es

demasiado pequeña no lleva a tener resultados sin uso práctico.

Para determinar el tamaño de la muestra se debe tener en cuenta lo siguiente.

1. Que el objeto y objetivo de la investigación sea interesante.

2. El nivel de confiablidad con el que trabaja se recomienda el 95% ^ 99%,

significa que de 100 casos, se espera que el 95 de ellos se hallan dentro del

intervalo construido y que 5 se hallan fuera del intervalo sea a la derecha o

izquierda.

3. Las probabilidades reales de ciertas características estén presentes en la

investigación que debe variar entre (0-1) P+Q=1 Ejemplo.

P=0.5; -> Q=0.5

P=0.3; -> Q=0.7

4. El error de muestreo puede ser según el investigador que puede ser entre el

1% ^ 9% máximo es recomendable entre el 1% ^ 9% máximo es

recomendable entre el 1% ^5%.

5. Aplicar las fórmulas adecuadas para poblaciones finitas e infinitas.

Si el nivel de coeficiente es 95%.

Page 70: Jonathanharo

Si el nivel de confianza es 99%.

5.10 EJEMPLOS:

1.- Se desea calcular e tamaño de la muestra que será aplicado a productos de

papas existen 4528 productores, el error o límite aceptable es del 5%.

Page 71: Jonathanharo

2.-Cuando Exista La Probabilidad De Ocurrencia

P^O= probabilidad de ocurrencia.

Una empresa dedicada a la venta de artículos y accesorios para vehículos

desea conocer el grado de aceptación de sus productos entre los propietarios

de vehículos de la ciudad por lo cual se estabilicen las siguientes condiciones.

a) Nivel de confianza 95%

b) N= 46720

c) E= 4%

3.- según un departamento de una empresa consecuencia de un trauma de

coberturas desea conocer los km recorridos durante una semana.

a) El error muestra máximo no debe pasar a 20km

b) Nivel de confianza 95,44% Z=2,05

c) S= 195 km

Page 72: Jonathanharo

5.11 POBLACIÓN FINITA

Es aquella que indica que es posible alcanzarse o sobrepasarse al contar.

http://www.gestiopolis.com/recursos/expertpagans/eco/44/estadistica.htm

Es aquella que posee o incluye un número limitado de medidas y

observaciones.

http://www.gestiopolis.com/recursos/experto//pagans/eco/44/estadistica.htm

1.-Suponga que el cantón de Guamote está empeñado en recibir un proyecto

para que sus habitantes tengan acceso a la salud, con las siguientes

condiciones:

X= 95%; z= 1,96

S= Varianza (0,4)2

E =5%

n= (0,4)

n = (1,96)2(0,4)2

(0,05)2

n = 246 viviendas

2.-El gerente de una estación de televisión quiere calcular el porcentaje de

personas que hay en un determinado programa se pide una muestra que le

somete a una encuesta con las siguientes condiciones;

a) E= 3%

b) = 99%

Page 73: Jonathanharo

c) La proporción de personas que presume que miran el programa se

estima en el 65%

n = 1683

3.-El cantón Espejo tiene 15614 habitantes se dedica a investigar sobre la

aceptación para la ordenanza municipal. Para dicha investigación se encarga la

UPEC aplicando una encuesta. A pedido del Alcalde de la localidad, el error

máximo es de 2,5%

n = 1451

Page 74: Jonathanharo

6 CAMPANA DE GAUS

6.1 Ejemplos de la campana de GAUS:

6.2 1.) Calcular La Probabilidad Del Evento

P (-2.8 Z 0)

P= 0.4974

P= 49.74%

Page 75: Jonathanharo

DESARROLLO

a) P (-3.6 Z 0) Z = -3.6

P= 0.4998

P= 49.98%

b)P (-2.02 Z 0) Z = -2.02

P= 0.4783

P= 43.83%

C) P (-1.4 Z 0) Z = -1.4

P= 0.4192

P= 41.92%

6.3 2.) Calcular La Probabilidad Del Evento

P (1.02 Z 2.97)

1.02 y 2.96= A (0^2.97)- A (0^1.02)

= 0.4985 – 0.3461

= 0.1524

=15.24%

Page 76: Jonathanharo

6.4 DESARROLLO

a) P (0.5 Z 1.09)

0.5 y 1.09 = A (0^1.09)- A

(0^0.5)

= 0.3621- 0.1915

= 0.1706

=17.06%

b) P (2.04 Z 3.16)

0.5 y 3.16 = A (0^3.16)- A

(0^0.5)

= 0.4992-0.4793

= 0.0199

=01.99%

c) P (1.84 Z 1.96)

1.84 y 1.96= A(0^1.96)- A

(0^1.84)

= 0.4750– 0.4671

= 0.1524

=00.79%

3.) Calcular La Probabilidad Del Evento

P (-3.5 Z -3.08)

A (-3.5 ^ - 3.08)= A (-3.5^0) - A (-3.08 ^0)

= 0.4998-0.4990

= 0.0008= 00.08%

DESARROLLO

a) P (--2.36 Z -1.43)

A (-2.36 ^ - 1.43)= A (-2.36 ^0) - A (--1.43

^0)

= 0.4909-0.4236

= 0.0673 = 06.73%

b) P (-1.75 Z -0.45)

A (-1.75 ^ - 0.45)= A (-1.75 ^0) - A (-0.45^0)

= 0.4599 -0.1736

= 0.2863= 28.63%

Page 77: Jonathanharo

4) Calcular la probabilidad del evento

P (-1.03 A 2.94)

P (-1.03 Z 2.94)

A (-1.03 ^ 2.94)= A (-1.03 ^ 0) + A (0 ^ 2.94)

= 0.3485 + 0.4984

= 0.8469=84.69%

DESARROLLO

a) P (-0.5 Z 12.76)

A (-0.5 ^ 16.76)= A (-0.5 ^ 0) + A (0 ^ 12.76)

= 0.1915+0.4971

= 0.6886 =68.86%

a) P (-0.2 Z 1.01)

A (-0.2 ^ 1.01)= A (-0.2 ^ 0) + A (0 ^ 1.01)

= 0.0793 + 0.3438 +0.3438

= 0.4231=42.31%

5.) Calcular La Probabilidad Del Evento

P (Z > 2.03)

A=0.5-área entre

A=0.5-0.47=0.0212

A=2.12%

Page 78: Jonathanharo

DESARROLLO

a) P (Z >1.96)

A=0.5-área entre 1.96

A=0.5-0.4750=0.025

A=2.5%

a) P (Z >2.58)

A=5-área entre 2.58

A=5-0.4950=4.505

A=450.5%

a) P (Z >2.33)

A=0.5-área entre 2.33

A=1-0.4901 = 0.5099

A=50.99%

7) Calcular la probabilidad del evento.

DESARROLLO

a) P (Z < -1.96) P=0.5-0.4750 P=0.025 p=2.5%

b) P (Z < -2.58) P=0.5-0.4750 P=0.05 P=5%

7 VARIABLES

7.1 DEFINICIÓN DE VARIABLE

Una variable estadística es cada una de las características o cualidades

que poseen los individuos de una población.

Page 79: Jonathanharo

Son aquellas cualidades o características que tiene un individuo o

población y puede ser medido tanto cuantitativa como cualitativamente.

http://www.e-torredebabel.com/Psicologia/Vocabulario/Variable.htm

7.2 EJEMPLO DE VARIABLES:

1. Edad de las personas

2. Nacionalidad

3. Nivel de ingresos

4. Sexo motivación

5. Color de piel

6. Nivel de ansiedad

7. Número de nacimientos

8. Estado civil

9. Peso

10. Estatura

11. Religión

7.3 CLASIFICACIÓN DE LAS VARIABLES:

a) Variable independiente

b) Variable dependiente

7.4 VARIABLE DEPENDIENTE:

En investigación, se denomina variable independiente a aquélla que es

manipulada por el investigador en un experimento con el objeto de estudiar

cómo incide sobre la expresión de la variable dependiente. A la variable

independiente también se la conoce como variable explicativa, y mientras que a

la variable dependiente se la conoce como variable explicada. Esto significa

Page 80: Jonathanharo

que las variaciones en la variable independiente repercutirán en variaciones en

la variable dependiente.http://www.cx/ /var_dependientes_independientes.htm

7.5 VARIABLE INDEPENDIENTE:

Es aquella cuyo valor no depende de otra variable. Se podría decir que son

características controladas por el investigador. Los cambios en los valores de

este tipo de variables determinan cambios en los valores de otra (variable

dependiente).http://grupos.emagister.comvariables.com

EJEMPLOS:

VARIABLE INDEPENDIENTE VARIABLE DEPENDIENTE

Consumo Excesivo De Cigarrillo * Causa Enfermedades Graves

En El Ser Humano.

Mayor Demanda De Un Producto * Genera Más Producción.

Mayores Exportaciones * Generan Más Ingresos Al

País.

Menor Control En La Frontera * Causa Mayor Contrabando.

a. Variable independiente

Es aquella característica o propiedad que supone ser la causa del fenómeno

estudiado. Además es la variable que el investigador manipula.

Ejemplo:

El uso de dentífrico.

Años estudiados.

b. Variable dependiente

Es el factor que es observado y medido para determinar el efecto de la variable

independiente.

Page 81: Jonathanharo

Ejemplo:

El uso de un dentífrico (v. independiente), quita o no caries (v.

dependiente).

El consumo excesivo de chocolates (v. independiente), produce caries

(v. dependiente).

Los años de estudio (v. independiente), aumenta el salario (v.

dependiente).

Page 82: Jonathanharo

NIVELES DE LOGRO ACTIVIDADES

MEDIADO AUTÓNOMO

TEÓRICO BÁSICO Lectura comprensiva del muestreo y de la

determinación del tamaño de la muestra

Análisis de la Campana de Gauss

Organizador gráfico del muestreo

Consulta y lectura comprensiva de los

conceptos de muestreo

TEÓRICO SUPERIOR Análisis de la realización de las gráficas de la campana

de Gauss.

Toma de decisiones para realizar los ejercicios con la

aplicación del muestreo

Análisis de los conceptos investigados

Comprensión de lectura.

TEÓRICO PRÁCTICO

ACEPTABLE

Aplicación en ejercicios de la teoría analizada

Formulación de alternativas de solución

Aplicación de los ejercicios propuestos del

muestreo

Realización de ejercicios de la campana de

gauss

TEÓRICO PRÁCTICO

AVANZADO

Análisis de los problemas que suceden en la sociedad.

Análisis de las variables dependientes e independientes

de la sociedad.

Aplicación de ejercicios con datos reales

planteados por el docente

Investigación de ejemplos de las variables.

Page 83: Jonathanharo

CAPITULO IV

7.6 TEMA: ESTADÍSTICA INFERENCIAL

Rama de la estadística que estudia el comportamiento y propiedades de las

muestras, y la posibilidad y límites de la generalización de los resultados

obtenidos a partir de aquellas a las poblaciones que representan. Esta

generalización de tipo inductivo, se basa en la probabilidad. También se le

llama también estadística matemática, por su complejidad matemática en

relación a la estadística descriptiva. (muestra. http:// www.wikipedia.)

Tiene como objetivo generalizar las propiedades de la población bajo

estudio, basado en los resultados de una muestra representativa de la

población.

Es una parte de la Estadística que comprende los métodos y procedimientos

estadísticos en los que interviene la aplicación de modelos de probabilidad y

mediante los cuales se realiza alguna afirmación sobre poblaciones con base

en la información producida por muestras para deducir propiedades (hacer

inferencias) de una población, a partir de una pequeña parte de la misma

(muestra). (http://www.Wikipedia: Estadísticas.)

7.7 CORRELACIÓN

La correlación indica la fuerza y la dirección de una relación lineal entre dos

variables aleatorias. Se considera que dos variables cuantitativas están

correlacionadas cuando los valores de una de ellas varían sistemáticamente

con respecto a los valores homónimos de la otra: si tenemos dos variables (A y

B) existe correlación si al aumentar los valores de A lo hacen también los de B

y viceversa. La correlación entre dos variables no implica, por sí misma,

ninguna relación de causalidad (http://es.correlacion-estadistica.org)

7.8 Coeficiente de correlación.- se expresa de una manera cuantitativa la

magnitud y división de una relación se la designa con la letra x puede

variar entre +1 a -1 el signo nos dice si la relación es positiva o negativa.

Page 84: Jonathanharo

Como +1 es el mejor número posibles este representa una relación perfecta de

una relación positiva.

Si el coeficiente es menor a 1 que la relación es perfecta y la relación es

negativa.

Cuando la correlación es cero (0) no existe una relación entre X y Y significa

que X y no crece y dúrese la recta es horizontal.

7.9 Relación lineal.- Entre dos variables es aquella que puede

representarse en un plano cartesiano con una mayor exactitud mediante

una línea recta por la ecuación Y= bx + a

Existen diversos coeficientes que miden el grado de correlación, adaptados a la

naturaleza de los datos. El más conocido es el coeficiente de correlación de

Pearson, que se obtiene dividiendo la covarianza de dos variables por el

producto de sus desviaciones estándar.

EJEMPLOS

La tabla muestra un salario mensual que perciben 5 agentes de ventas, el valor

de dólares.

Agente

Variable

X mercancía

vendida $

Variable

salario $

X

Y

1 0 500 0 500

2 1000 900 1000 900

3 2000 1300 2000 1300

4 3000 1700 3000 1700

5 4000 2100 4000 2100

Page 85: Jonathanharo

La ecuación nos indica la relación entre el salario y la

mercadería vendida, esto nos indica que Y se incrementa 0,40 por cada

unitario de X, con esta relación podemos predecir cualquier valor de Y si solo

se conoce el valor de x

Así un agente vende $ 1500 de mercancía y su salario igual a $1100

Page 86: Jonathanharo

7.10 COEFICIENTE DE CORRELACIÓN DE PEARSON

Todo coeficiente de correlación que no sea cero indica cierto grado de relación

entre 2 variables, lo que el grado de intensidad es fuerte o débil de una

interpretación matemática pura, el hecha de que 2 variables tienden o

aumentan o disminuir sobre cada uno de ellos.

Matemáticamente entre dos variables r lo interpreta como

Interpretación.- que tan dorado es el coeficiente de orientación desde de r=0

indica cierto grado de relación entre 2 variables que grado.

Intensidad de relación se puede considerar si la relación es fuerte o débil.

EJEMPLO

ESTUDIANTES PRUEBA DE

HONORABILIDAD

MENTAL

EXAMEN DE AUDICIÓN

María

Olga

Susana

Aldo

Juan

18

15

12

9

3

82

68

60

32

18

Page 87: Jonathanharo

7.11 Interpretación.- Que tan elevado es el coeficiente de correlación dado,

todo r ≠0 indica cierto grado de relación entre 2 variables que grado de

intensidad de relación se puede considerar si la relación es fuerte o débil.

7.12 Calcular el r de Pearson.

ESTUDIANTE COEFICIENTE INTELECTUAL

PUNTAJE

1 2 3 4 5 6 7 8 9 10 11 12

110 112 118 119 122 125 127 130 132 134 136 138

1 1.6 1.2 2.1 1.8 2.6 2

3.2 2.6 3

3.6

19 100-140 (1-4)

COEFICIENTE DE CORRELACIÓN DE RANGOS DE SPERMAN

Cuando una o más variables son solo de escala ordinal su fórmula matemática

es:

N= números de parejas de rango

María

Olga

Susana

Aldo

Juan

18

15

12

9

3

18

32

60

68

82

María

Olga

Susana

Aldo

Juan

18

15

12

9

3

18

82

68

60

32

Page 88: Jonathanharo

Sujeto Orden dado

el psicólogo

A(Rxi)

Orden dado

por el

psicólogo

B(Ryi)

DI

R( xi) - (yi)

Di ²

1

2

3

4

5

6

7

8

9

10

12

6

5

7

10

2.5

2.5

9

1

11

4

8

12

5

3

4

8

1

6

10

2

9

7

11

12

1

2

3

2

1.5

3.5

1

1

2

3

3

0

1

4

9

02.25

12.25

1

4

4

9

9

0

7.13 COEFICIENTE INTELECTUAL

1

2

3

4

5

6

7

8

9

10

11

12

110

112

118

119

122

125

127

130

132

134

136

138

1

1.6

1.2

2.1

1.8

2.6

2

3.2

2.6

3

3.6

19 100-140 (1-4)

Page 89: Jonathanharo

7.14 COEFICIENTE R DE PEARSON

X Y X2 Y2 Xy

María

Olga

Susana

Aldo

Juan

18

15

12

9

3

82

68

60

32

18

324

225

144

81

9

1476

1020

7200

288

54

Ex 157 Ey= 260 Ex= 783 Ey= 16296 Exy= 3558

R= 0.98

REGRESIÓN LINEAL

La relación y la correlación están íntimamente ligadas, ambos implican la

relación entre 2 variables y utilizan el mismo conjunto de los datos básicos.

La relación se encuentra el uso de la relación para determinar una

PREDICCION, cuando la relación es perfecta, esto es cuando todos los puntos

están sobre la recta y se utilizaría para señalar la predicción, la situación se

hace más compleja cuando la relación es imperfecta.

Esta es la recta es la línea de la regresión por los mínimos cuadrados la

distancia vertical en cada punto y la recta representa el error de la producción

Page 90: Jonathanharo

parecía el error total de la suma de la producción para que una el error total

seria la suma equilibrada y _ y´

El error total de producción presentado esta dado por ecuación

de regresión lineal para reproducir el lado x

Y´=valor reproducido

By = pendiente

Ay= ordenada al origen

Ecuación por calcular los constantes de regresión

7.15 DEFINICIÓN DE CORRELACIÓN LINEAL

En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación

entre dos variables aleatorias. Así, por ejemplo, podemos preguntarnos si hay

alguna relación entre las notas de la asignatura Estadística I y las de

Matemáticas I. Una primera aproximación al problema consistiría en dibujar en

el plano R2 un punto por cada alumno: la primera coordenada de cada punto

sería su nota en estadística, mientras que la segunda sería su nota en

matemáticas. Así, obtendríamos una nube de puntos la cual podría indicarnos

visualmente la existencia o no de algún tipo de relación (lineal, parabólica,

exponencial, etc.) entre ambas notas.

Page 91: Jonathanharo

Otro ejemplo, consistiría en analizar la facturación de una empresa en un

periodo de tiempo dado y de cómo influyen los gastos de promoción y

publicidad en dicha facturación. Si consideramos un periodo de tiempo de 10

años, una posible representación sería situar un punto por cada año de forma

que la primera coordenada de cada punto sería la cantidad en euros invertidos

en publicidad, mientras que la segunda sería la cantidad en euros obtenidos de

su facturación. De esta manera, obtendríamos una nube de puntos que nos

indicaría el tipo de relación existente entre ambas variables.

En particular, nos interesa cuantificar la intensidad de la relación lineal entre

dos variables.

EJEMPLOS

La ecuación por los mínimos cuadrados esta dado por la ecuaciónde regresión

lineal para predecir Y lado X.

Y´=valor reproducido

by = pendiente

ay= ordenada al origen

Ecuación para calcular la constante de regresión

Page 92: Jonathanharo

Ejemplo de aprovechamiento

Estudiante

numero

X Promedio de Y

calificaciones

XY X2

1

2

3

4

5

6

7

8

9

10

11

12

110

112

118

119

122

125

127

130

132

134

136

138

1

1.6

1.2

2.1

2.6

1.8

2.6

2

3.2

2.6

3

3.6

110

179.2

141.6

249.9

317.2

225

330.2

260

422.4

384.4

408

496.8

12100

12544

13424

14161

14384

15625

16129

16900

17421

17456

18496

19044

X

4

3

2

1

110 120 130 140

Page 93: Jonathanharo

Una psicóloga del desarrollo está interesada si es posible utiliza alturas de los

jóvenes para producir en un posible estatura en la edad adulta y ella reúne las

siguientes datos de la tabla.

a) Trace la grafica

b) Obtener la línea de regresión por mínimo cuadrados

c) En base a estos datos aquí esta estatura podría producir para una

persona de 20 años si a los 3 años de edad tiene una altura de 42

pulgadas.

Individuo Altura la edad de

3 años pulgadas

Altura a la edad

de 20 años y

pulgada

Xy

X2

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

30

30

32

33

34

35

36

38

40

41

41

43

45

45

47

48

59

63

62

67

65

61

69

66

68

65

73

68

71

74

71

75

1770

1890

1984

2211

2210

2135

2484

2508

2720

2665

2993

2924

3195

2924

3195

3330

3337

3600

900

900

1024

1059

1156

1225

1296

1444

1600

1681

1681

1849

2025

2025

2209

2304

618 1077 41956 24408

Page 94: Jonathanharo

x

5 10 15 20 25 30 35 40 45 50 55 60

50

40

30

20

10

Page 95: Jonathanharo

Una neuróloga sospecha que su vela de exótica es una región del cerebro, se

asociación el comportamiento agresivo del individuo con neurotransmisor

cerebral los datos aparecen en una tabla de nutrición los datos promedios de 6

meses.

Menos sujetos Tabla de nivel

exótica(Y)

Numero de

egresos

XY Y2

1

2

3

4

5

6

7

8

9

0.32

0.35

0.38

0.41

0.43

0.51

0.53

0.60

0.63

6

3.8

3

5.1

3

2.8

2.4

3.5

2.2

1.92

1.33

1.140

2.091

1.290

1.938

1.272

2.100

14.467

0.1024

0.1225

0.1444

.1681

0.1849

0.2601

.2809

0.3600

0.3969

Page 96: Jonathanharo

x

8

6

4

2

y

a) Hoja de grafica

b) Ecuación de regresión lineal

c) Cuál es el número de actos agresivos que podría producir y éxito

numérico de menos que todo un nivel de exótica 0.46 min gramos

7.16 EL COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON R

Cuyo valor oscila entre –1 y +1:

0.4 0.7 0.6 0.5 0.3

Page 97: Jonathanharo

Correlación tiende a ser lineal directa (mayores valores de X significan mayores

valores de Y), y se aproxima a –1 cuando la correlación tiende a ser lineal

inversa.

Es importante notar que la existencia de correlación entre variables no implica

causalidad.

NOTA: si no hay correlación de ningún tipo entre dos v. a., entonces tampoco

habrá correlación lineal, por lo que r = 0. Sin embargo, el que ocurra r = 0 sólo

nos dice que no hay correlación lineal, pero puede que la haya de otro tipo.

El siguiente diagrama resume el análisis del coeficiente de correlación entre

dos variable

Page 98: Jonathanharo

7.17 Definición y características del concepto de Regresión Lineal

En aquellos casos en que el coeficiente de regresión lineal sea “cercano” a +1

o a –1, tiene sentido considerar la ecuación de la recta que “mejor se ajuste” a

la nube de puntos (recta de mínimos cuadrados). Uno de los principales usos

de dicha recta será el de predecir o estimar los valores de Y que obtendríamos

para distintos valores de X. Estos conceptos quedarán representados en lo que

llamamos diagrama de dispersión:

La ecuación de la recta de mínimos cuadrados (en forma punto-pendiente) es

la siguiente

Si queremos estudiar la relación existente entre ambas variables, siguiendo con

el ejemplo anterior referente a la relación entre las ventas de una empresa ( ) t

V y sus gastos en publicidad ( ) t GP, lo que podemos hacer es representar

Page 99: Jonathanharo

gráficamente el modelo matemático lineal que podemos considerar para

analizar dicha relación.

EJEMPLO

Estudiante

numero

IQ

X

Promedio de

Y

calificaciones

XY X2

1

2

3

4

5

6

7

8

9

10

11

12

110

112

118

119

122

125

127

130

132

134

136

138

1

1.6

1.2

2.1

2.6

1.8

2.6

2

3.2

2.6

3

3.6

110

179.2

141.6

249.9

317.2

225

330.2

260

422.4

384.4

408

496.8

12100

12544

13424

14161

14384

15625

16129

16900

17421

17456

18496

19044

110 120 130 140

4

3

2

1

Page 100: Jonathanharo

O una psicóloga del desarrollo está interesada si es posible utiliza alturas de

los jóvenes para producir en un posible estatura en la edad adulta y ella reúne

las siguientes datos de la tabla.

d) Trace la grafica

e) Obtener la línea de regresión por mínimo cuadrados

f) En base a estos datos aquí esta estatura podría producir para una

persona de 20 años si a los 3 años de edad tiene una altura de 42

pulgadas.

Individuo Altura la edad

de 3 años

pulgadas

Altura a la

edad de 20

años y

pulgada

xy

X2

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

30

30

32

33

34

35

36

38

40

41

41

43

45

45

47

48

59

63

62

67

65

61

69

66

68

65

73

68

71

74

71

75

1770

1890

1984

2211

2210

2135

2484

2508

2720

2665

2993

2924

3195

2924

3195

3330

3337

3600

900

900

1024

1059

1156

1225

1296

1444

1600

1681

1681

1849

2025

2025

2209

2304

618 1077 41956 24408

Page 101: Jonathanharo

5 10 15 20 25 30 35 40 45 50 55 60

Una neuróloga sospecha que su vela de exótica es una región del cerebro,

se asocia con el comportamiento agresivo del individuo con neurotransmisor

cerebral los datos aparecen en una tabla de nutrición los datos promedios

de 6 meses.

40

30

20

10

50

Page 102: Jonathanharo

Menos

sujetos

Tabla de nivel

exótica(Y)

Numero de

egresos

XY Y2

1

2

3

4

5

6

7

8

9

0.32

0.35

0.38

0.41

0.43

0.51

0.53

0.60

0.63

6

3.8

3

5.1

3

2.8

2.4

3.5

2.2

1.92

1.33

1.140

2.091

1.290

1.938

1.272

2.100

14.467

0.1024

0.1225

0.1444

.1681

0.1849

0.2601

.2809

0.3600

0.3969

4.16 32.8 14.467 2.0202

8

6

4

2

0.3 0.4 0.5 0.6 0.7

Y

X

Page 103: Jonathanharo

d) Hoja de grafica

e) Ecuación de regresión lineal

f) Cuál es el número de actos agresivos que podría producir y éxito

numérico de menos que todo un nivel de exótica 0.46 min gramos

Page 104: Jonathanharo

7.18 ORGANIZADOR GRAFICO DE CORRELACION Y REGRECION LINEAL

CORRELACIÓ

N

Expresa de una manera cuantitativa la magnitud y

dirección de una relación entre 2 variables. Se lo designa

con la letra ry puede variar entre +1 a -1 el signo significa

si la relación es negativa o positiva.

CARACTERÍST

ICAS

Relación perfecta (+ o -)

Relación Imperfecta (+ o -)

Relación Lineal

COEFICIENT

E DE

PEARSON

COEFICIENT

E DE

SPERMAN

CLASIFICACI

ÓN

Page 105: Jonathanharo

7.19 EJERCICIOS DE CORRELACION Y REGRECION LINEAL

El número de españoles (en millones) ocupados en la agricultura, para los años

que se indican, era:

Año 1980 1982 1984 1986 1988 1990 1992 1994

Ocupados 2,1 2,04 1,96 1,74 1,69 1,49 1,25 1,16

a) ¿Podría explicarse su evolución mediante una recta de regresión?

b) ¿Qué limitaciones tendrían las estimaciones hechas por esa recta?

[sol] a) Si; b) No vale para hacer estimaciones alejadas de los años

considerados.

2. Asocia las rectas de regresión y = –x +16, y = 2x – 12, y = 0,5x + 5 a las

nubes de puntos siguientes:

3. Asigna los coeficientes de correlación lineal r = 0,4, r = –0,85 y r = 0,7, a las

nubes del problema anterior.

a) Respectivamente: (c), (b), (a). b) Respectivamente: (a), (b), (c)

Tipo II. Cálculo de la correlación y regresión

[a) Calcula la recta de regresión de Y sobre X en la distribución siguiente

realizando todos los cálculos intermedios.

X 10 7 5 3 0

Y 2 4 6 8 10

Page 106: Jonathanharo

b) ¿Cuál es el valor que correspondería según dicha recta a X = 7?

a) y = –0,8276x +10,138; b) 4,3448.

5. El número de bacterias por unidad de volumen, presentes en un cultivo

después de un cierto número de horas, viene expresado en la siguiente tabla:

X: Nº de horas 0 1 2 3 4 5

Y: Nº de bacterias 12 19 23 34 56 62

Calcula:

a) Las medias y desviaciones típicas de las variables, número de horas y

número de bacterias.

b) La covarianza de la variable bidimensional.

c) El coeficiente de correlación e interpretación.

d) La recta de regresión de Y sobre X.

6. La tabla siguiente muestra las notas obtenidas por 8 alumnos en un examen,

las horas de estudio dedicadas a su preparación y las horas que vieron la

televisión los días previos al examen.

Nota 5 6 7 3 5 8 4 9

Horas de estudio 7 10 9 4 8 10 5 14

Horas de TV 7 6 2 11 9 3 9 5

a) Representa gráficamente los diagramas correspondientes a nota-estudio y

nota-TV.

b) ¿Se observa correlación entre las variables estudiadas? ¿De qué tipo? ¿En

qué caso estimas que es más fuerte?

b) Sí. Directa; inversa.

Page 107: Jonathanharo

7. Con los datos del problema anterior, halla el coeficiente de correlación de

nota-estudio y nota-TV. ¿Qué puede deducirse con más precisión conociendo

la nota que obtuvo una persona en el examen: el tiempo que dedicó al estudio

o el que dedicó a ver la televisión?

0,943382 y (0,846283. El tiempo que dedicó al estudio.

8. Con los mismos datos, halla las rectas de regresión correspondientes y

estima para un alumno que sacó un 2 en el examen:

a) Las horas que estudió.

b) Las horas que vio la TV.

a) Esta = (0,246753 + 1,46753 otra; 2,7 h. b) TV = 14,1299 (1,2987 otra;

11,5 h.

Tipo III. Estimación a partir del a recta de regresión

9. La altura, en cm, de 8 padres y del mayor de sus hijos varones, son:

Padre 170 173 178 167 171 169 184 175

Hijo 172 177 175 170 178 169 180 187

a) Calcula la recta de regresión que permita estimar la altura de los hijos

dependiendo de la del padre; y la del padre conociendo la del hijo.

b) ¿Qué altura cabría esperar para un hijo si su padre mide 174? ¿Y para un

padre, si su hijo mide 190 cm?

a) H = 68,1853 + 0,621859 ; P = 77,4406 + 0,545082 . b) 176,4 cm; 181 cm.

Page 108: Jonathanharo
Page 109: Jonathanharo

NIVELES DE LOGRO ACTIVIDADES

MEDIADO AUTÓNOMO

TEÓRICO BÁSICO

Lectura comprensiva de correlación y

regresión lineal

Análisis de la Campana de Gauss

Organizador gráfico de regresión lineal

Consulta y lectura comprensiva de los

conceptos de muestreo

TEÓRICO SUPERIOR Análisis de la realización de las gráficas de la

campana de Gauss.

Toma de decisiones para realizar los

ejercicios con la aplicación del muestreo

Análisis de los conceptos investigados

Comprensión de lectura.

TEÓRICO PRÁCTICO ACEPTABLE Aplicación en ejercicios de la teoría

analizada

Formulación de alternativas de solución

Aplicación de los ejercicios propuestos del

muestreo

Realización de ejercicios de la campana

de gauss

TEÓRICO PRÁCTICO AVANZADO Análisis de los problemas que suceden en la sociedad.

Análisis de las variables dependientes e independientes de la sociedad.

Aplicación de ejercicios con datos reales planteados por el docente

Investigación de ejemplos de las variables.

Page 110: Jonathanharo
Page 111: Jonathanharo

8 CARACTERÍSTICAS DE LAS HIPÓTESIS

Deben basarse en una situación real, es decir deben someterse a

prueba en un universo y contexto bien definido.

8.1 Ejemplo: El contrabando en Ecuador es menor que el contrabando en

Colombia

Dentro de la hipótesis las variables deben ser claras, comprensibles y

concretas, no se debe usar términos confusos.

Ejemplo: Situación económica del Carchi Crisis económica

La relación ente variables de una hipótesis deben ser lógicas.

Las variables de la hipótesis deben ser observables y medibles (esto

significa que deben tener referentes en la realidad); no se deben incluir

aspectos morales porque no podríamos medirlos en la realidad.

Las hipótesis deben estar relacionadas con técnicas disponibles para

probarlas y verificarlas.

Las hipótesis deben referirse a una situación real.

Los términos (variables) de la hipótesis tienen que ser compatibles,

precisos y lo más concretos posibles.

La relación entre variables propuestas por una hipótesis debe ser clara y

verosímil (lógica).

Los términos de la hipótesis y la relación planteada entre ellos, deben

poder ser observados y medidos, o sea tener referentes en la realidad.

Las hipótesis deben estar relacionadas con técnicas disponibles para

probarlas.http://www.antropologiasocial.org/contenidos/tutoriales/tym/Do

cumentos/Hipotesis.pdf

Page 112: Jonathanharo

CLASIFICACIÓN DE LAS HIPÓTESIS

HIPÓTESIS DE INVESTIGACION

a. Hipótesis Descriptiva

b. Hipótesis de Correlación

c. Hipótesis de Diferencial de Grupos

d. Hipótesis de Relaciones de Casualidad

e. Hipótesis Casuales Bivariables

f. Hipótesis Casuales Multivariables

8.2 HIPOTESIS NULA

8.3 HIPOTESIS ALTERNATIVA

8.4 HIPOTESIS ESTADISTICA

a. Hipótesis estadísticas de Estimación

b. Hipótesis estadísticas de Correlación

c. Hipótesis estadísticas de Diferencial de medios o otras Variables

8.5 EJEMPLO DE HIPÓTESIS:

A mayor cantidad de vehículos en una ciudad; mayor congestión

vehicular.

A mayor variedad en el trabajo; habrá mayor motivación individual

hacia él.

A mayor demanda de un producto; mayor producción del mismo.

Page 113: Jonathanharo

1. HIPÓTESIS DE INVESTIGACIÓN (Hi):

Son propuestas de experimentos acerca de las posibles relaciones entre dos

o más variables.1http://iealidia.blogdiario.com/tags/hipotesis/

Se las simboliza como Hi; H1, H2, H3 (cuando son varias)

Las hipótesis de investigación a su vez pueden ser:

Hipótesis descriptivas de un valor o dato pronosticado.

Hipótesis correlaciónales.

Hipótesis de diferencia de grupos.

Hipótesis causales.

8.6 HIPÓTESIS DE UN VALOR O DATO PRONÓSTICADO:

Esta hipótesis trata de predecir un dato o valor en una o más variables que se

van a medir u observar. No es sencillo realizar estimaciones con precisión con

respecto a ciertos fenómenos.

8.7 HIPÓTESIS CORRELACIONADAS:

Especifican las relaciones entre dos o más variables y corresponden a los

estudios correlaciónales.

Ejemplos:

“Los altos impuestos a pagar en la CAE están relacionados con el

Contrabando en Tulcán”

Las hipótesis correlacionadas no solo pueden establecer que dos o

más variables se encuentren vinculadas, sino también como están

asociadas.

Page 114: Jonathanharo

Ejemplos:

A mayor inflación de Precios, habrá menor consumo. (Aquí la hipótesis

indica que cuando una variable aumenta, la otra disminuye, o

viceversa).

8.8 HIPÓTESIS DE DIFERENCIA ENTRE GRUPOS:

Su finalidad es comparar grupos:

Por Ejemplo;

Los niños tiene más cariño por sus padres que por sus tíos.

Viajar vía aérea de Tulcán a Quito implica menos tiempo que viajar vía

terrestre de Tulcán a Quito.

8.9 HIPÓTESIS CAUSALES:

Este tipo de hipótesis no solamente afirma la o las relaciones entre dos o más

variables y la manera en que se manifiesta, sino que además propone un

“sentido de entendimiento” de las relaciones. Tal sentido puede ser más o

menos completo, esto depende del número de variables que se incluya, pero

todas estas hipótesis establecen relaciones de causa -efecto.

Las hipótesis causales pueden simbolizarse como.

HIPÓTESIS NULA (Ho):

La hipótesis nula es en cierto modo, el reverso de las hipótesis de

investigación. También constituyen proposiciones acerca de la relación entre

variables, solo que sirven para negar lo que afirma la hipótesis de

investigación. 1 http://personal.us.es/vmanzano/docencia/analisis/guias/FichaP

SHN.pdf

Page 115: Jonathanharo

La hipótesis nula se simboliza Ho.

Ejemplo:

Hi: la inseguridad crece en el Ecuador por falta de trabajo

Ho: la inseguridad no crece en el Ecuador por falta de trabajo

Hi: El contrabando disminuirá en un 20% en el mes de diciembre porque

se ha intensificado el control en la frontera.

Ho: El contrabando no disminuirá en un 20% en el mes de diciembre;

porque falta control en la frontera y por el aumento de los pasos ilegales.

HIPÓTESIS ALTERNATIVA (Ha):

Son posibilidades alternas ante las hipótesis de investigación y nula; ya que

nos presentan otra descripción explicación distintas a las que proporcionan

estos tipos de hipótesis.

Al responder a un problema es necesario hallar diferentes hipótesis como

respuesta y elegir entre ellas.

La hipótesis alternativa se simboliza Ha y solo puede formularse cuando hay

otras posibilidades.1http://www.mitecnologico.com/Main/HisConceptos.

Ejemplos:

Hi: La empresa Nestlé es grande gracias a su producción y su buen

producto.

Ho: La empresa Nestlé no es grande

Ha: La empresa Nestlé es pequeña, mediana

Page 116: Jonathanharo

HIPÓTESIS ESTADÍSTICA:

Representa la transformación de las hipótesis de investigación, nulas y

alternativas en símbolos estadísticos. Se pueden formular solo cuando los

datos del estudio son cuantitativos (números, porcentajes,

promedios).1http://www.monografias.com/trabajos17/pruebas-de-hipot.shtml

Hay tres tipos de hipótesis estadísticas:

1. De estimación.

2. De correlación.

3. De diferencia de medias.

8.10 HIPÓTESIS ESTADÍSTICAS DE ESTIMACIÓN:

Sirve para evaluar la suposición de un investigador respecto del valor de

alguna característica en una muestra de individuos, otros seres vivos,

sucesos u objetos y en una población.

8.11 HIPÓTESIS ESTADÍSTICAS DE CORRELACIÓN:

Tiene por objetivo traducir en términos estadísticos una correlación entre dos

o más variables. El símbolo de una correlación entre dos variables es “r”, y

entre dos o más variables “R”.

8.12 HIPÓTESIS ESTADISTICAS DE LA DIFERENCIA DE MEDIAS U

OTROS VALORES:

En estas hipótesis se compara una estadística entre dos o más grupos.

8.13 EJEMPLOS DE HIPOTESIS:

8.14 Hipótesis descriptiva

1. Es día martes se realizaron 40 trámites de exportación a Colombia.

2. El mes de diciembre las importaciones subirán en un 30 %.

Page 117: Jonathanharo

3. En el 2011 las exportaciones aumentara en un 10 %.

4. En el 2011 el contrabando bajara en un 2 %.

5. En diciembre la producción del banano aumentara porque existe

mayor demanda.

Hipótesis nula

1. Los bajos aranceles en las exportaciones de camarón provoca

mayores exportaciones a Canadá

Los altos aranceles en las exportaciones de camarón provoca menores

exportaciones a Canadá

2. Las exportaciones de petróleo aumentaran en 2011, por la mayor

producción en la refinería Sacha.

Las exportaciones de petróleo disminuirán en 2011, por la menor

producción en la refinería Sacha.

3. El tipo de aforo de mercancías agilita el pronto despacho, saliendo las

mercancías de las zonas primarias en menor tiempo

El tipo de aforo de mercancías entorpece el pronto despacho, saliendo

las mercancías de las zonas primarias en mayor tiempo

Hipótesis Alternativa

1.- El tratado de Libre Comercio firmado por Ecuador mejora las

exportaciones con Colombia, Venezuela, Perú.

2.- Los ingresos percibidos del Petróleo en Ecuador se invierten en salud,

educación, vivienda.

Page 118: Jonathanharo

PRUEBA DE HIPÓTESIS

Se la llama ensayo de hipótesis. Son procedimientos que se unen para

determinar si es razonable o correcto la formulación en Ho, como resultado

aceptamos o rechazamos Ho.

8.15 PASOS PARA LA PRUEBA DE HIPOTESIS

1) Formular la hipótesis nula (Ho) y la hipótesis alternativa (H1).

2) Determinar si la prueba es unilateral y bilateral.

3) Asumir el nivel de significación = 5%, = 1%, =10%

4) Determinar la distribución muestral que utiliza la prueba.

N= 50 > 30 se puede utilizar la prueba de hipótesis.

5) Elaborar un esquema de prueba.

6) Calculo estadístico :

Page 119: Jonathanharo

7) TOMA DE DESICIONES:

Aceptación o rechazo del Ho.

Ṕ = proporción de la muestra %

P= proporción de la población=

EJEMPLO 1:

Para evaluar el nivel mental de los ingresantes de la Universidad se

estandarizo la habilidad mental encontrándose un C.I. (coeficiente intelectual)

promedio de 101,2 con una desviación estándar de 13,8. Aplicada de la

prueba a una muestra de 60 ingresantes de esta universidad se calculó que el

C.I. promedio es de 106,4 con una desviación estándar de 16,4. ¿El nivel

mental de los ingresantes es superior al término medio?

Variable de estudio: La habilidad mental de los X estudiantes.

µ = rendimiento mental promedio de los ingresantes.

X = rendimiento promedio de la muestra.

Solución:

1) Ho: µ= 101,2

Ha: µ > 101,2

2) Prueba unilateral de acuerdo a Ha.

3) Realizar la prueba de los niveles de significación de 5% y 1%.

4) Se admite que la variable aleatoria de la prueba es la media de los

coeficientes de inteligencia Xi.

5) Como n > 30 podemos usar una distribución normal de probabilidades

para calcular los valores críticos y elaborar el esquema grafico de la

prueba 99%.

Page 120: Jonathanharo

6) Calculo estadístico de la prueba.

7) Toma de decisiones:

A los niveles de significancia de 0,05 ^ 0,01 observamos que el estadístico Z=

2,92 se ubica en la zona de rechazo, esta significancia que la prueba es muy

significativa luego rechazamos la Ho: µ= 101,2 y no rechazamos que el nivel

mental de los ingresantes es superior al término medio.

EJEMPLO 2:

Un político supone que menos del 60% de los votos de su territorio le son

favorables. Con el fin de verificar su conjetura. Selecciona una muestra

representativa compuesta por 200 votantes y aplica una encuesta, obteniendo

100 respuestas a su favor. Probar que los resultados confirman la creencia

del político, es decir, que los votos favorables de su territorio son menores del

60%.

Page 121: Jonathanharo

8.16 PRUEBA DE DIFERENCIAS DE MEDIAS

Cuando existen dos grupos de investigación en una `población.

Matemáticamente se puede expresar de la siguiente manera

POBLACIÓN

Cuando n₁, n₂> 30

MUESTRA

EJEMPLO 3

Un grupo de investigadores ha diseñado un cuestionario sobre la tensión,

consistente en 15 sucesos. Ellos están interesados en determinar si existe

una coincidencia entre dos culturas acerca de la cantidad relativa de ajustes

que acarrea cada suceso. El cuestionario se aplica a 300 estadounidenses y

300 italianos. Cada individuo debe utilizar el evento “matrimonio” como

estándar y juzgar los demás eventos en relación con el ajuste necesario para

el matrimonio. El matrimonio recibe un valor arbitrario de 50 puntos. Si se

considera que un evento requiere de más ajustes que el matrimonio, el evento

debe recibir más de 50 puntos. El número de puntos excedentes depende de

la cantidad de ajustes requeridos. Después de que cada sujeto de cada

cultura ha asignado puntos a todos los eventos, se promedian los puntos de

cada evento. Los resultados aparecen en la siguiente tabla:

Page 122: Jonathanharo

EVENTOS ESTADOUNIDENSES ITALIANOS

Muerte de la esposa

Divorcio

Separación de la pareja

Temporada en prisión

Lesiones personales

Matrimonio

Despedido del trabajo

Jubilación

Embarazo

Dificultades sexuales

Reajustes económicos

Problemas con la

familia política

Problemas con el jefe

Vacaciones

Navidad

100

73

65

63

53

50

47

45

40

39

39

29

23

13

12

80

95

85

52

72

50

40

30

28

42

36

41

35

16

10

a. Suponga que los datos tienen al menos una escala de intervalo

y calcule la correlación entre los datos estadounidenses y la de

los italianos.

b. Suponga que los datos sólo tienen una escala ordinal y calcule

la correlación entre los datos de ambas culturas.

0

20

40

60

80

100

0 50 100 150

Series1

Page 123: Jonathanharo

0,8519

La r es alta y positiva es decir que los comportamiento de las dos

nacionalidades son bastante similares

EJEMPLO 4

Una muestra de 80 alambres de acero producidos por la fábrica A de una

resistencia media de rotura de 1230 lbs. y S= 120 lbs.; otra muestra de 100 de

alambres de aceros producidos por la fábrica B de una resistencia media de

1190 lbs. Con una S = 90 lbs. ¿Hay una diferencia real en resistencia media

de las dos marcas de alambre de acero si ?

Solución:

1) H₀=U₁=U₂

Hₐ = U₁<U₂; U₁>U₂

2) Es una campana bilateral

3) El nivel de significación es

4) Se utiliza una diferencias de medias n₁=80>30; n₂ 100>30

Page 124: Jonathanharo

5) Gráfico

6) Calculo estadístico

7) Toma de decisiones

El esquema estadístico cae en la zona de rechazo por lo tanto rechazamos

la hipótesis nula y se puede deducir que existe una diferencia real de la

resistencia media de las dos marca de acero de cada una de las fábricas.

EJEMPLO 5

Un aditivo servirá más millas por galón. La compañía ha reutilizado un gran

número de mediciones recorridas en la gasolina sin aditivo, bajo condiciones

controladas rigurosamente, los resultados muestra una media de 2,47 millas

por galón y un S= 4,8. Se realizan pruebas con una muestra de 75 autos que

utilizan la gasolina con aditivos, la media de la muestra es de 26,5 millas/

galón

Page 125: Jonathanharo

Solución:

1) H₀= 26,5

U 24,7

Hₐ : El nuevo aditivo incrementas el número de millas por galón por lo

tanto X=26,5 en donde U>24,7

2) La prueba es unilateral a la derecha

3) El nivel de significación

4) N>30 por lo tanto se utiliza la prueba de hipótesis

5) Grafico

6) Calculo estadístico

7) Toma de decisiones

Rechazamos la hipótesis nula y aceptamos la hipótesis alternativa

Page 126: Jonathanharo

NIVELES DE

LOGRO

ACTIVIDADES

MEDIADO AUTÓNOMO

TEÓRICO

BÁSICO

Lectura comprensiva de la prueba de hipótesis,

Análisis de la prueba de hipótesis,

Análisis y comprensión de la prueba de hipótesis atravesó de

las tic’s

Consulta y lectura comprensiva de la prueba de hipótesis

TEÓRICO

SUPERIOR

Análisis de la realización de ejercicios de la prueba de

hipótesis.

Toma de decisiones para realizar los ejercicios con la

aplicación de la prueba de hipótesis mediante la

aplicación de los 7 pasos

Análisis de los conceptos investigados sobre la prueba de

hipótesis.

Comparación de los diferentes conceptos investigados sobre la

prueba de hipótesis,

TEÓRICO

PRÁCTICO

ACEPTABLE

Aplicación en ejercicios de la teoría analizada acerca

de la prueba de hipótesis,

Formulación de alternativas de solución

Aplicación de los ejercicios propuestos de la prueba de

hipótesis,

Realización de ejercicios de la prueba de hipótesis,

TEÓRICO

PRÁCTICO

AVANZADO

Análisis de los problemas que suceden en la sociedad.

Análisis de ejercicios propuestos por diversos autores

Aplicación de ejercicios con datos a través de la elaboración de

un proyecto

Investigación de ejemplos de Hipótesis

Page 127: Jonathanharo

“T“DE STUDENT

En probabilidad y estadística, la distribución t (de Student) es una

distribución de probabilidad que surge del problema de estimar la media de una

población normalmente distribuida cuando el tamaño de la muestra es

pequeño.

Aparece de manera natural al realizar la prueba t de Student para la

determinación de las diferencias entre dos medias muéstrales y para la

construcción del intervalo de confianza para la diferencia entre las medias de

dos poblaciones cuando se desconoce la desviación típica de una población y

ésta debe ser estimada a partir de los datos de una muestra

8.17 CARACTERÍSTICAS

El tamaño de la muestra es menor a 30

La población de donde se obtiene los datos está distribuida

normalmente

Se desconoce la desviación estándar de la población, entonces

haremos uso de la distribución de student

8.18 Grado de libertad:

(n-1) cuando se ha estimado un parámetro

Cuando se estiman dos parámetros (gl= n₁+n₂-2)

Page 128: Jonathanharo

gl =n-k hay que mirar en la tabla de T de student con el coeficiente de

estimación de ;

Solución u= rendimiento mental medio en la estandarización.

u = 101

= Rendimiento mental medio de la muestra

= 105,4

8.19 FORMULACION DE HIPOTESIS

Ho: u = 101 No existe diferencias significativas en el rendimiento

mental de la muestra y de la población.

H1: u ˃ 101

1) Prueba unilateral de cola derecha de acuerdo con H1

2) Nivel de significación asumido: α = 0,01 = 1%

3) Se debe utilizar una distribución muestral de medias n < 30 (muestra

pequeña) se distancia Q ( desviación estándar de la población )

4) α=0,01

Los grados de libertad son:

n - 1 = 15-1 = 14

14; α=0,01 prueba 1 cola 2,624

5) Calculo estadístico

= 105,4 ; u = 101 ; S = 5,3 ; n = 15

Page 129: Jonathanharo

t =

t = 3,11

6) Toma de decisiones :

Si t = 3,11 se halla en la zona de rechazo por lo tanto se descarta que u = 101

y se acepta la alternativa u es decir el grupo de los 15 alumnos tiene

rendimiento mental mayor que el promedio de estandarización.

EJERCICIO:

En un laboratorio farmacéutico se produce comprimidos de un cierto

medicamento, con un peso promedio de 2 gr. promedio por cada comprimido,

para determinar si la maquina sigue en iguales condiciones de producir se toma

una muestra de 10 tabletas: 2,04 ; 1,96 ; 2,00 ; 1,98 ; 2,02 ; 2,01 ; 1,97 ; 1,94 ;

2,03 ; 2,01 ; asimilando α=0,01 ; verificar si la maquina está en buenas

condiciones.

Solución: U2= promedio de tabletas producidas por la máquina.

1) Formulación de Hipótesis:

Ho: U = 2 La máquina se halla en buenas condiciones.

H1: U ≠ 2 La máquina no se halla en buenas condiciones.

2) Prueba bilateral:

H1: Hay dos probabilidades

U ˃ 2 y U < 2

3) α = 0,01

4) U=2g siendo una muestra pequeña n=10

No aplica a la distribución normal y se aplica la t de student.

5) α = 0,01 Prueba bilateral

Page 130: Jonathanharo

gl = n-1 = 10-1 = 9 gl t = 3,25

6) Cálculo estadístico

t =

t = -0,39

7) Toma de decisiones:

Si t = - 0,39 entonces u se encontraría en la zona de aceptación es decir se

acepta la Ho es decir la maquina se encuentra en buenas condiciones.

Zona de Aceptación Zona de Rechazo

Page 131: Jonathanharo

NIVELES DE

LOGRO

ACTIVIDADES

MEDIADO AUTÓNOMO

TEÓRICO

BÁSICO

Lectura comprensiva de la T-de student,

Análisis de la T-de student,,

Análisis y comprensión de la T-de student,atraves de las tics

Consulta y lectura comprensiva de la T-de student,

TEÓRICO

SUPERIOR

Análisis de la realización de ejercicios de la T-de

student

Toma de decisiones para realizar los ejercicios

con la aplicación de la

Análisis de los conceptos investigados sobre la T-de student,

Comparación de los diferentes conceptos investigados sobre

la T-de student,

TEÓRICO

PRÁCTICO

ACEPTABLE

Aplicación en ejercicios de la teoría analizada

acerca de la T-de student,

Formulación de alternativas de solución a través

de la T-de student,

Aplicación de los ejercicios propuestos de la T-de student,

Realización de ejercicios de la T-de student,

TEÓRICO

PRÁCTICO

AVANZADO

Análisis de los problemas que suceden en la

sociedad.

Análisis de ejercicios propuestos por diversos

autores

Aplicación de ejercicios con datos a través de la elaboración

de un proyecto

Investigación de ejemplos sobre la T-de student,

Page 132: Jonathanharo
Page 133: Jonathanharo

PRUEBA DE Ji- CUADRADO O

Distribución Ji-cuadrado, también denominada Ji-cuadrado de Pearson, es una

distribución de probabilidad continua con un parámetro k que representa los

grados de libertad de la variable aleatoria. Se suele usar la denominada prueba

Ji-cuadrado como test de independencia y como test de bondad de ajuste.

En realidad la distribución Ji-cuadrado es una distribución muestral, es decir

que si se extraen todas las muestras posibles de una población normal y a

cada muestra se le calcula su varianza, se obtendrá la distribución muestral de

varianzas. Para estimar la varianza poblacional o la desviación estándar, se

necesita conocer el estadístico X². Si se elige una muestra de tamaño (n) de

una población normal con varianza, el estadístico:

Donde n es el tamaño de la muestra, S² la varianza muestral y la varianza de la

población de donde se extrajo la muestra.

8.20 Propiedades de las distribuciones Ji-cuadrado

1. Los valores de X2 son mayores o iguales que 0.

2. La forma de una distribución X2 depende del gl=n-1. En consecuencia, hay

un número infinito de distribuciones X2.

3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.

4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se

extienden a la derecha; esto es, están sesgadas a la derecha.

5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-1).

6. El valor modal de una distribución X2 se da en el valor (n-3).

Page 134: Jonathanharo

Chi 2

Otro de los modelos estadísticos para comprobar si las hipótesis de un

problema son verdaderas o falsas se sigue los siguientes pasos

1) la CHI 2 es utilizada para variables cuantitativas y cualitativas Ej. Cualidades

sí o no, verdadero falso y las cuantitativas son a través de números que se los

obtiene en una población, que se deben sacar diferentes muestras por

extractos que generalmente se los determina a través de las columnas o

intervalos o también se los obtienen a través de las tablas de valores.

2) su símbolo de chi 2 es X2 se la representa en el plano cartesiano

Únicamente el CHI² solo es de una sola cola a la derecha.

Hay dos formas diferentes para determinar los grados de libertad.

gl = K – 1 o gl = ( c - ) ( F – 1 ) para la tabla de valores

C columnas y F filas

Sus fórmulas matemáticas de chi 2

X2 =

X 2 =

Oi frecuencias observadas

Ei frecuencias operadas

Page 135: Jonathanharo

Las frecuencias operadas se las obtienen multiplicando de un número total por

el porcentaje o también se las obtiene de la división.

E = (multiplicaciones)

Para llegar a la toma de decisiones también se debe utilizar los siete pasos que

se dan tanto en la prueba de hipótesis como en la t de student.

Generalmente su símbolo es .

Es una prueba que puede usarse para cualquier nivel de datos, es una medida

donde se encuentran las frecuencias (observadas y esperadas), en el caso de

las frecuencias esperadas estas se las obtiene a través de otros resultados.

Matemáticamente se la puede expresar de la siguiente forma:

= dónde:

fe= frecuencia esperada

X2 = Siempre va hacer positiva por estar elevada al cuadrado

Como en las anteriores pruebas hay que dar los 7 pasos fundamentales hasta

llegar a la toma de decisiones.

Generalmente se presentan dos casos para encontrar los grados de libertad.

1)

2) esta cuando existen filas y columnas y se realizan

tablas de contingencia.

Representación gráfica de la Campana de Gauss la cual solo tiene cola dirigida

hacia la derecha por poseer valores positivos.

a) X = 0,05 >>>>

(4gl) = 9,488 Se lee en la tabla.

Page 136: Jonathanharo

b) X =0,05 >>>>

= 18,307

EJEMPLO:

Un jugador quiere probar que es legal el dado con el que juega. Tiro el dado

120 veces y obtuvo la siguiente distribución de frecuencias de las caras

resultantes.

a) Enuncie las hipótesis de la prueba y determine las frecuencias

esperadas.

b) Describa la estadística de la prueba

c) Determine la región crítica de la prueba al nivel de significación del 5%.

d) ¿A qué conclusión llega usando el nivel de significación 0,05?

e) Determine la probabilidad P.

1.- Ho: El dado es legal.

Ha: El dado no es legal.

2.- Es de dos colas.

3.- Nivel de confianza

4.-

gl= k-1 gl=6-1 gl=5

5.-

RESULTADO 1 2 3 4 5 6

FRECUENCIA 15 25 33 17 16 14

11,07

Zona

aceptación

Page 137: Jonathanharo

6.-

Ei 20 20 20 20 20 20

Oi 15 25 33 17 16 14

6. Toma de decisiones Se acepta la hipótesis alternativa y se rechaza la

hipótesis nula, es decir el dado del jugador no es legal ya que se

encuentra dentro de la zona de rechazo

EJEMPLO:

1. Ho.- El suero no tiene efecto, y la recuperación es independiente del

uso del suero.

Ha.- que el suero es el que permite la recuperación del paciente.

2. Es cola unilateral

3. 0,05 (N. significancia.)

Nivel de confianza 95%

4. n =200 personas se puede utilizar la ji cuadrado para cualquier valor de

datos-

5. GRÁFICO

Page 138: Jonathanharo

gl =(F-1 ) (C-1)

gl =(2-1) (2-1)

x²=3,84

6. Calculo de x²

X2= (75 - 70)2 / 70 + (65 - 70)2 / 70 + (25-30)2 /30 + (35-30) 2 / 30 =

2,38

8.21 FRECUENCIAS OBSERVADAS

CURADOS NO CURADOS TOTAL

GRUPO A USANDO

SUERO

75 25 100

GRUPO B SIN SUERO

65 35 100

TOTAL

140 60 200

8.22 FRECUENCIAS ESPERADAS (DE Ho)

CURADOS NO CURADOS TOTAL

GRUPO A USANDO

SUERO

70 30 100

GRUPO B SIN SUERO

70 30 100

TOTAL

140 60 200

7. Ho aceptamos, concluyendo que el suero no tiene efecto, que la

recuperación es independiente

Page 139: Jonathanharo

Fe =(80 – 40) / 200 = 16

Fe= FRECUENCIA ESPERADA = (total del renglón) (total columna) / gran

total

Fe =(100 – 140) / 200 = 7

Fe =(100 – 60) / 200 = 30

EJERCICIO

La falta de muestra de estudiantes aprobados y suspendidos por 3 profesores

X, Y, Z

Ho= La proporción de estudiantes suspendidos son iguales.

Ha = L proporción de estudiantes suspendidos no son iguales.

X2 = (50 – 46,25)2 / 46,75 + (47 – 51,85)2 / 51,85 + (56 – 54,40)2 /54,40 + (5 –

8,25) 2 / 8,25 + (14 -9,15) 2 /9,15 + (8 -9,60)2 / 9,60

X2 = 4, 84

gl = (F-1) (C – 1)

gl = (2-1) (3-1)

X2 = 4, 61

X2= 0, 95 = 5, 99

X Y Z TOTAL

APROBADOS 50 47 56 153

SUSPENDIDOS

5 14 8 27

TOTAL

55 61 64 180

Page 140: Jonathanharo

X Y Z TOTAL

APROBADOS 46,75 51,85 54,40 153

SUSPENDIDOS

8,25 9,15 9,6 27

TOTAL 55 61 64 180

Page 141: Jonathanharo

NIVELES DE

LOGRO

ACTIVIDADES

MEDIADO AUTÓNOMO

TEÓRICO

BÁSICO

Lectura comprensiva de la CHI Cuadrado ,

Análisis de la CHI Cuadrado

Análisis y comprensión de la CHI Cuadrado de las tic’s

Consulta y lectura comprensiva de la CHI Cuadrado

TEÓRICO

SUPERIOR

Análisis de la realización de ejercicios de la JI Cuadrado.

Toma de decisiones para realizar los ejercicios con la

aplicación de la CHI Cuadrado mediante la aplicación de

los 7 pasos

Análisis de los conceptos investigados sobre la CHI Cuadrado

Comparación de los diferentes conceptos investigados sobre la CHI

Cuadrado

TEÓRICO

PRÁCTICO

ACEPTABLE

Aplicación en ejercicios de la teoría analizada acerca de la

CHI Cuadrado

Formulación de alternativas de solución

Aplicación de los ejercicios propuestos de la CHI Cuadrado

Realización de ejercicios de la CHI Cuadrado ,

TEÓRICO

PRÁCTICO

AVANZADO

Análisis de los problemas que suceden en la sociedad.

Análisis de ejercicios propuestos por diversos autores

Aplicación de ejercicios con datos a través de la elaboración de un

proyecto

Investigación de ejemplos sobre la JI Cuadrado

Page 142: Jonathanharo

CONCLUSIÓNES

De acuerdo con la realización del presente trabajo, hemos llegado a las

siguientes conclusiones:

La Estadística Descriptiva es un instrumento muy empleado por parte de

los investigadores en las distintas áreas científicas y su necesidad e

importancia han ido aumentando durante los últimos años.

El interés de los diferentes usuarios por la información Estadística

obedece principalmente a que permite adentrarse en aspectos

importantes de los fenómenos económicos y sociales: Su magnitud, es

decir, las dimensiones que estos tienen y su estructura, o sea, la forma

como esos fenómenos se desagregan en sus componentes.

Para que las Estadísticas sean de utilidad en cuanto a la caracterización

de los fenómenos y al conocimiento de la realidad, deben cumplir

determinados requisitos, siendo el principal el de veracidad, en el

sentido de que los datos correspondan a cuantificaciones con suficiente

precisión, de los universos de estudio y sus diversos subconjuntos,

dentro de márgenes de tolerancia. A asimismo los datos deben ser

conceptualmente significativos, es decir, obtenidos a partir de

definiciones previamente establecidas.

Page 143: Jonathanharo

RECOMENDACIONES

Es necesario el uso de la Estadística en la empresa, ya que a través de

ésta se cuenta con la capacidad para reconocer que actividades o

productos le generan utilidad, y cuales solo pérdida. No contar con datos

e interpretarlos correctamente, es para los administradores como

caminar a oscuras. Contar con los datos, les permite ver lo que está

aconteciendo y en consecuencia tomar las medidas más apropiadas.

Toda empresa debe contar con datos estadísticos en cuanto a lo que

acontece tanto interna como externamente, para decidir sobre bases

racionales, y adoptar las medidas preventivas y correctivas con

suficiente tiempo para evitar daños, en muchos casos irreparables para

la organización.

También es necesario acompañar la Estadística de las poderosas

herramientas informáticas, porque le permiten a los directivos, asesores

y personal, contar con la suficiente información para mejorar a partir de

ella los procesos de la empresa como por ejemplo: Tomar mejores

decisiones comerciales, mejorar la seguridad y hacer un uso mucho más

productivo y provechoso de los recursos.

Page 144: Jonathanharo

10. FINANCIEROS Y TÉCNICOS.

DESCRIPCIÓN CANTIDAD VALOR UNITARIO VALOR TOTAL

Papel bond 200 0,04 8

Impresiones 200 0,04 8

Material de oficina 0,00

Movilización 3

Internet 3

Imprevistos 5

TOTAL 200 0,08 21

8. CRONOGRAMA DE TAREAS

T DESCRIPCION DE LA TAREA 1 2 3 4 5 6 7 8

T1 X

T2 X

T3 X

T4 X

T5 X

T6 X

T7 X

T8 X

T9 X

T10 MODULO ESTADISTICA INFERENCIAL X

Page 145: Jonathanharo
Page 146: Jonathanharo

9 ANEXOS

Page 147: Jonathanharo

9.1 ORGANIZADOR GRAFICO DE LA ESTADISTICA DESCRIPTIVA E

INFERENCIAL

Page 148: Jonathanharo

Universidad Politécnica Estatal del Carchi

Comercio Internacional, Integración,

Administración y Economía Empresarial

Proyecto propuesto

por el estudiante

Page 149: Jonathanharo

Universidad Politécnica Estatal del Carchi

Comercio Internacional, Integración, Administración y Economía

Empresarial.

Escuela: Comercio Exterior y Negociación Comercial Internacional

TEMA: proyecto de aplicación de correlación, regresión lineal

SIMPLE APLICANDO Prueba de Hipótesis, T-STUDEN Y CHI2.

Integrantes:

Coral Sánchez Nancy

Ramírez Carla Damaris

Rosero Carmen Tatiana

Vizcaíno Luis Javier

Nivel: sexto Paralelo: “a” Noche

AÑO-LECTIVO

2012

Page 150: Jonathanharo

1.1 INTRODUCCIÓN

Los profesionales de la educación, como parte de su que hacer profesional,

realizan investigación científica: evaluación de la calidad de la educación,

someten a prueba diferentes métodos de comprensión lectora, estudian

problemas del aprendizaje, entre otros. Es así, que contamos con Internet,

como fuente general de información, que permite disponer de información

educativa, por ejemplo, sobre evaluaciones muéstrales, que realiza el

Ministerio de Educación y que está disponible en la página web:

Una vez que conoce tanto la forma de recoger información como la forma de

presentar a la misma, sea en forma de tablas o con el tratamiento realizado

para elaborar una tabla de frecuencias, ahora es conveniente seguir con las

características que permiten describir a un conjunto de datos que se recogen

de un problema a investigarse.

1.4 DEFINICIÓN DE ESTADÍSTICA INFERENCIAL

Estudia el comportamiento y propiedades de las muestras, y la posibilidad y

límites de la generalización de los resultados obtenidos a partir de aquellas a

las poblaciones que representan. Esta generalización de tipo inductivo, se basa

en la probabilidad. También se le llama también estadística matemática, por su

complejidad matemática en relación a la estadística descriptiva. (muestra. http://

www.wikipedia.)

Tiene como objetivo generalizar las propiedades de la población bajo estudio,

basado en los resultados de una muestra representativa de la población.

Es una parte de la Estadística que comprende los métodos y procedimientos

estadísticos en los que interviene la aplicación de modelos de probabilidad y

mediante los cuales se realiza alguna afirmación sobre poblaciones con base

en la información producida por muestras para deducir propiedades (hacer

inferencias) de una población, a partir de una pequeña parte de la misma

(muestra). (http://www.wikipedia: estadísticas.)

Page 151: Jonathanharo

Tema: Proyecto de aplicación al comercio exterior aplicando correlación,

regresión lineal simple aplicando, prueba de hipótesis, t-student y chi2 con

ayuda del programa SPSS.

1.2 Problema

El desconocimiento de la correlación, prueba de hipótesis, T-Student y Chi 2 y

su aplicación en problemas del contexto.

1.3 Objetivos

Objetivo General

Solucionar los datos investigados de exportaciones e importaciones de

comercio exterior aplicando correlación, regresión lineal, prueba de

hipótesis, T-Student y Chi 2.

Objetivos Específicos

Identificar la correlación de datos de exportaciones

Determinar su regresión lineal.

Identificar la hipótesis nula y la hipótesis alternativa.

Determinar si la prueba es unilateral o bilateral.

Asumir el nivel de significación de la prueba.

Determinar la distribución muestral que se usará en la prueba.

Calcular el estadístico de la prueba.

Tomar la decisión, para esto, se comparan el esquema de la parte de

esquema de prueba.

Determinar ejercicios en relaciona a nuestra carrera de comercio

exterior.

Page 152: Jonathanharo

Justificación

El uso de un programa informático (SSPS), es muy importante para la

resolución de problemas relacionados al comercio exterior por que representa

un alto nivel de importancia para una buena toma de decisiones.

En la estadística la aplicación de sistemas informáticos se da con mayor

frecuencia remplazando los procesos manuales, permitiendo al usuario

ahorrar tiempo y obtener resultados de manera directa y segura, haciendo que

de esta manera se vuelva más competitivo y profesional; permitiendo a la vez

ampliar su panorama ocupacional y logrando así la correcta toma de decisiones

en el campo laboral.

Page 153: Jonathanharo

1.5 MARCO TEÓRICO

El SPSS

SPSS es un programa estadístico informático muy usado en las ciencias

sociales y las empresas de investigación de mercado. Originalmente SPSS fue

creado como el acrónimo de Statistical Package for the Social Sciences aunque

también se ha referido como "Statistical Product and Service Solutions" (Pardo,

A., & Ruiz, M.A., 2002, p. 3). Sin embargo, en la actualidad la parte SPSS del

nombre completo del software (IBM SPSS) no es acrónimo de nada.

Como programa estadístico es muy popular su uso debido a la capacidad de

trabajar con bases de datos de gran tamaño. En la versión 12 es de 2 millones

de registros y 250.000 variables. Además, de permitir la recodificación de las

variables y registros según las necesidades del usuario. El programa consiste

en un módulo base y módulos anexos que se han ido actualizando

constantemente con nuevos procedimientos estadísticos. Cada uno de estos

módulos se compra por separado.

Actualmente, compite no sólo con softwares licenciados como lo son SAS,

MATLAB, Statistica, Stata, sino también con software de código abierto y libre,

de los cuales el más destacado es el Lenguaje R. Recientemente ha sido

desarrollado un paquete libre llamado PSPP, con una interfaz llamada PSPPire

que ha sido compilada para diversos sistemas operativos como Linux, además

de versiones para Windows y OS X. Este último paquete pretende ser un clon

de código abierto que emule todas las posibilidades del SPSS.

Page 154: Jonathanharo

CORRELACIÓN LINEAL

El análisis de correlación se dirige sobre todo a medir la fuerza de una relación

entre variables. El coeficiente de correlación lineal, r, es la medida de la fuerza

de la relación lineal entre dos variables. La fortaleza de la relación se determina

mediante la magnitud del efecto que cualquier cambio en una variable ejerce

sobre la otra. (JOHNSON, 1990)

Si X o Y son las dos variables en cuestión, un diagrama de la dispersión

muestra la localización de los puntos (X,Y) sobre un sistema rectangular de

coordenadas. Si todos los puntos del diagrama de dispersión parecen estar en

una recta, como la figura 14(a) y 14(b) la correlación se llama lineal. (SPIEGEL,

1992)

Y Y Y

X X

(a) Correlación lineal positiva (b) Correlación lineal negativa (c) Sin

correlación

Si Y tiende a crecer cuando X crece, como la figura anterior, la correlación se

dice positiva o directa. Si Y tiende a decrecer cuando X crece, como la figura

14.1 (b), la correlación se dice negativa o inversa.

Si todos los puntos parecen estar sobre una cierta curva la correlación se llama

no lineal, y una ecuación no lineal será apropiada para la regresión. Como

hemos visto en el capítulo 13 es claro q la correlación no lineal puede ser

positiva o negativa.

Page 155: Jonathanharo

Si no hay relación entre las variables como la figura 14.1(c), decimos que no

hay correlación entre ellas. (SPIEGEL, 1992)

Técnicas de correlación

A continuación abordaremos el estudio de dos variables y no solamente de

una, estudiaremos qué sentido tiene afirmar que dos variables están

relacionadas linealmente entre si y cómo podemos medir esta relación.

Relaciones lineales entre variables

Supongamos que dispongamos de dos pruebas de habilidad mental y la otra

pruebe de ingreso a la universidad, seleccionamos a cinco estudiantes que se

expresan en la tabla N° 1 con los puntajes obtenidos en estas dos pruebas.

La tabla nos dice que si podemos usar para pronosticar el puntaje alto en la

prueba de habilidad mental y también en los que tienen un puntaje alto en los

exámenes de admisión y los estudiantes con puntajes bajos en la en el examen

de habilidad como en el de admisión.

En circunstancias como la presente (cuando los puntajes altos de una variable

están relacionados con los puntajes altos de otra variable y los puntajes bajos

están relacionados con los puntajes bajos de otra variable) entonces podemos

asegurar que existe una relación positiva entre las dos variables.

Estudiantes X

Prueba de habilidad Mental

Y

Examen de Admisión

María

Olga

Susana

Aldo

Juan

18

15

12

9

3

82

68

60

32

18

Page 156: Jonathanharo

Supongamos que en lugar de los resultados de la tabla N° 1 hubiera obtenido

los puntajes que se muestran en la tabla N°2 ¿Podremos afirmar que con estos

datos en esta situación en la prueba de habilidad pueda usarse para

pronosticarse los puntajes del examen de admisión?

También, aunque en este caso los puntajes altos apresen con un puntaje bajo,

tomando en cuenta esto podemos definir una relación lineal negativa entre el

conjunto.

Estudiantes X

Prueba de habilidad

Mental

Y

Examen de Admisión

María

Olga

Susana

Aldo

Juan

18

15

12

9

3

18

32

60

68

82

Estudiantes X

Prueba de habilidad

Mental

Y

Examen de Admisión

María

Olga

Susana

Aldo

Juan

18

15

12

9

3

18

82

68

60

32

En este caso no podemos afirmar una relación lineal entre las variables X y Y

ya que unos puntajes se acotejan con otros y no están en concordancia.

Page 157: Jonathanharo

DIAGRAMA DE DISPERSIÓN

El diagrama de dispersión es útil para representar valores como lo

mostraremos a continuación utilizando los datos de la tabla N° 1, pero en la

vida real no todas las veces obtendremos datos de cinco parejas, tendremos

que comprender muchos más datos por esto es más sencillo utilizar un

diagrama para determinar la relación de los mismos.

COEFICIENTE DE CORRELACIÓN RECTILÍNEA DE PEARSON

Con la ayuda de las gráficas nos podemos formar una idea de la nube de

puntos o diagrama de dispersión, representa la relación lineal es positiva o

negativa y determinar la fuerza de relación.

El coeficiente de Pearson, toma valores entre -1 y +1, el coeficiente 0

demuestra que no existe correlación, así que independiente del número sea

negativo o positivo son iguales, claro está que entre más se aproxime al 1 o -1

mayor será la fuerza de relación.

EJERCICIO: CORRELACIÓN

El Banco Central del Ecuador nos presenta La siguiente informacion, la

cantidad y el precio del petroleo exportado por el Ecuador en los años 2008

hasta el 2011, se desea conocer si la informacion obtenida posee una

correlacion.

BANCO CENTRAL DEL ECUADOR

Año Meses

2008 2009 2010 2011

CANTI PRECIO CANTI PRECIO CANTI PRECIO CANTI PRECIO

Enero 11266 29,06 12427 46,69 10304 40,22 3383 76,44

Febrero 10193 32 11568 45,1 9210 46,29 5006 79,55

Marzo 11146 38,89 12428 46,8 10305 48,37 3502 85,49

Abril 10362 38,39 12577 54,67 9315 52,41 5494 91,25

Mayo 10761 35,95 10208 57,15 9224 53,78 5003 103,94

Junio 11521 42,26 10106 58,16 11842 56,94 4177 115,21

Julio 9744 46 9375 61,26 12239 63,73 3565 113,42

Agosto 10307 51,66 11206 59,29 10209 61,22 3989 99,13

Septiembre 10796 50,34 12310 49,34 10910 64,68 3630 87,47

Octubre 10001 45,43 11606 45 10605 71,36 3847 65,42

Noviembre 12569 40,33 12147 43,96 9214 79,81 2680 48,22

Diciembre 12929 42,76 10676 45,83 10722 77,21 5641 26,66

TOTAL 131595 493,07 136634 613,25 124099 716,02 49917 992,2

Page 158: Jonathanharo

DESARROLLO

Paso 1: Escogemos la opción Analizar/Correlaciones/Bi-variadas

Paso 2 : Seleccionamos las variables con el botón

Page 159: Jonathanharo

Escogemos la opción Pearson Clic en la opción Bilateral

Pasó 3 : Escoger la opción Marcar las correlaciones significativas Clic Aceptar

Paso 4 Aparece la tabla en la que constan los datos correspondientes a la

correlación.

Page 160: Jonathanharo

Regresión lineal

Fases del modelo de regresión lineal

La recta de regresión y el coeficiente de correlación tienen sentido en tanto en

cuanto son instrumento para inferir la relación de las variables en la población.

El conocimiento exacto del coeficiente de correlación solo es posible si

analizamos la totalidad de la población. Sin embargo, a la hora de evaluarlo,

nos encontramos con el problema habitual de tener que inferirlo desde la

estimación que proporcionan los datos de una muestra.

La recta de regresión lineal y=a+bx, es una estimación de la recta de regresión

lineal de la población y=α+ßx. Los parámetros α y ß son evaluados a partir de

los datos de una muestra, y es fundamental tener unas garantías de que los

valores a y b estimados no difieren significativamente de los parámetros

poblacionales α y ß.

El proceso que se sigue en la construcción del modelo de regresión se

compone de tres fases o etapas. En la primera fase, se comprueba si la

relación entre las variables que componen el modelo está de acuerdo con la

propia forma del modelo.

La segunda fase consiste en la estimación de los parámetros de acuerdo con el

criterio elegido (en nuestro caso, el método de mínimos cuadrados).

La última fase es fundamental para el investigador, que debe comprobar si las

inferencias o pronósticos que se pueden hacer de la relación encontrada entre

las variables se ajustan a los datos. (VARGAS, 1995)

El modelo de regresión lineal

El modelo de regresión lineal simple es un proceso experimental en el que

intervienen dos variables: una variable dependiente Y, que no es controlada por

el experimento, y que depende de otra variable independiente X, que si es

controlada por el experimento, por lo que esta no es una variable aleatoria.

Page 161: Jonathanharo

Para estudiar la relación de dependencia entre estas variables, se dispone de

una muestra aleatoria de tamaño N, que vamos a representar por {[x,y]}… n

Cuando tomamos distintas muestras para un mismo valor X, es de esperar que

varíen los correspondientes valores de Y; por ello, el valor y1 del par (x ,y) se

puede considerar como valor de una variable aleatoria por Y, que tendrá una

medida M(Y) y una varianza V(Y). (VARGAS, 1995)

Por lo tanto, para x=x, tenemos una variable aleatoria a la que vamos a

designar por Y, que tendrá una medida M (Y) y una varianza V(Y).

Admitir el modelo de regresión lineal supone aceptar que la medida de la

variable aleatoria M (Y), está relacionada linealmente con la variable x por

medio de la ecuación de la regresión de la población, es decir: (VARGAS,

1995)

Donde α y ß son los parámetros de la población.

M (Y) es la respuesta promedio; para simplificar la terminología, vamos a

designarla por P.

Los parámetros de la recta de regresión poblacional α y ß, son desconocidos y

deben ser estimados mediante los valores de a y b en la recta de regresión

muestral que se obtiene a partir de los datos de la muestra. (VARGAS, 1995)

Una vez evaluadas a y b, una estimación de la respuesta promedio P es:

EJERCICIO:

RELACIÓN LINEAL

Con los datos proporcionados por el Banco Central del Ecuador nos piden

encontrar una línea recta la cual acoja a todos los datos obtenidos de las

exportaciones de petróleo desde 2008 hasta el 2011 para de esta manera

elaborar pronósticos que se ajusten a los datos:

Page 162: Jonathanharo

Año Meses

2008 2009 2010 2011

CANTI PRECIO CANTI PRECIO CANTI PRECIO CANTI PRECIO

Enero 11266 29,06 12427 46,69 10304 40,22 3383 76,44

Febrero 10193 32 11568 45,1 9210 46,29 5006 79,55

Marzo 11146 38,89 12428 46,8 10305 48,37 3502 85,49

Abril 10362 38,39 12577 54,67 9315 52,41 5494 91,25

Mayo 10761 35,95 10208 57,15 9224 53,78 5003 103,94

Junio 11521 42,26 10106 58,16 11842 56,94 4177 115,21

Julio 9744 46 9375 61,26 12239 63,73 3565 113,42

Agosto 10307 51,66 11206 59,29 10209 61,22 3989 99,13

Septiembre 10796 50,34 12310 49,34 10910 64,68 3630 87,47

Octubre 10001 45,43 11606 45 10605 71,36 3847 65,42

Noviembre 12569 40,33 12147 43,96 9214 79,81 2680 48,22

Diciembre 12929 42,76 10676 45,83 10722 77,21 5641 26,66

TOTAL 131595 493,07 136634 613,25 124099 716,02 49917 992,2

Page 163: Jonathanharo

DESARROLLO

Paso 1 Clic en la opcion Gráficos/ Cuadro de diálogos antiguos/ Dispercion de

puntos

Elejimos la dispercion simple

En donde nos da como resultado el siguiente cuadro

Page 164: Jonathanharo

Paso 2 Colocamos las variables en el eje de la X & Y dependiendo de los datos

del problema a resolver, dando como resultado el siguiente cuadro:

Si queremos encontrar la línea de correlación click en gráficos/cuadros de

dialogo antiguo/ lineas

Page 165: Jonathanharo

Uniendo

ENCONTRAR LA ECUACIÓN

Paso 1 Escogemos la opción Analizar de la barra de herramientas/ Regresión/

Lineales

Page 166: Jonathanharo

Paso 2 Elegimos la variable dependiente e independiente según corresponda;

después clic en la opción Estadísticos.

Paso 3 Se escoge las siguientes opciones de la ventana, Estimaciones, Ajuste del

modelo, Cambio en R cuadrado y Descriptivos clic en Continuar.

Page 167: Jonathanharo

Paso 4 Clic en Aceptar

Paso 5 Nos aparecen los resultados del estadístico en donde podemos deducir

que la fórmula de la recta de los datos es:

F (x)= -20.183x+11795,561

Page 168: Jonathanharo

Prueba de hipótesis

La prueba de hipótesis comienza con una suposición, llamada hipótesis, que

hacemos acerca de un parámetro de población. Después recolectamos datos

de muestra, producimos estadísticas muéstrales y usamos esta información

para decidir qué tan probable es que nuestro parámetro de población hipotético

sea correcto. Digamos que suponemos un cierto valor para una medida de

población, para probar validez de esa suposición recolectamos datos de

muestra y determinamos la diferencia entre el valor hipotético y el valor real de

la media de la muestra. Después juzgamos si la diferencia obtenida es

significativa o no. Mientras más pequeña sea la diferencia, mayor será la

probabilidad de que nuestro valor hipotético para la media sea correcto.

Mientras mayor sea la diferencia, más pequeña será la probabilidad. (LEVIN,

2010)

Hipótesis nula y alternativa

La prueba de hipótesis empieza con algo de teoría, afirmación o aserción con

respecto a un parámetro particular de una población. Para fines de análisis

estadístico, el gerente de producción escoge como hipótesis inicial que el

proceso está bajo control; esto es, el contenido promedio es de 368 gramos y

no es necesario efectuar acciones correctivas. La hipótesis de que el parámetro

de la población es igual a la especificación de las compañías se conoce como

la hipótesis nula.

Una hipótesis nula es siempre una de status quo o de no diferencia. Por lo

general se le identifica con el símbolo Ho. Nuestro gerente de producción

establecería como hipótesis nula que el proceso de llenado está bajo control y

funcionando apropiadamente, que la cantidad media de cereal por caja es la

aplicación de la compañía de 368 gramos. Esto se establece como:

Ho2 µ=0

Page 169: Jonathanharo

Siempre que especifiquemos una hipótesis nula, también debemos especificar

una hipótesis alternativa o una que debe ser verdadera si se encuentra que la

hipótesis nula es falsa. La hipótesis alternativa (H1) es lo opuesto a la hipótesis

nula (Ho). Para el gerente de producción, la hipótesis alternativa se puede

establecer como:

Ho2 µx≠0

La hipótesis alternativa representa la conclusión a la que se llegaría si hubiera

suficiente evidencia de la información de la muestra para decidir que es

improbable que la hipótesis sea verdadera y, por tanto rechazarla. En nuestro

ejemplo, si el peso de las cajas muestreadas estuvieran lo suficiente por arriba

o por debajo del promedio.

Interpretación del nivel de significancia

El propósito del nivel de significancia no es cuestionar el valor calculado en el

estadístico de la muestra sino hacer un juicio respecto a la diferencia entre ese

estadístico y un parámetro hipotético de la población.

Si suponemos que la hipótesis es correcta, entonces el nivel de significancia

indicará el porcentaje de medias muéstrales que está fuera de ciertos límites.

Selección del nivel de significancia

No existe un nivel de significancia único estándar o universal para probar

hipótesis. En algunos casos se utiliza el nivel de significancia de 5%. Ciertos

resultados de investigaciones publicados a menudo prueban hipótesis para un

nivel de significancia del 1%. Es posible probar una hipótesis a cualquier nivel

de significancia.

Cuando más alto sea el nivel de significancia que utilizamos para probar una

hipótesis, mayor será la probabilidad de rechazar la hipótesis nula cuando es

cierta. (LEVIN, 2010)

Page 170: Jonathanharo

Error tipo I y Error tipo II

Rechazar una hipótesis nula cuando es cierta se denomina error tipo I, y su

probabilidad se simboliza con α (alfa). Por otro lado, aceptar una hipótesis nula

cuando es falsa se llama Error tipo II, y su probabilidad se simboliza con ß

(beta).

Existe relación entre estos dos tipos de errores: la probabilidad de cometer un

tipo de error puede reducirse solo si estamos dispuestos a aumentar la

probabilidad de cometer el otro tipo de error. (LEVIN, 2010)

Pasos de una prueba de hipótesis

En la prueba de hipótesis que goza de aceptación general figuran siete pasos:

Paso 1 Formular la hipótesis nula HO,

De manera que pueda determinarse exactamente α, la probabilidad de

cometer un error tipo 1. (Esto equivale a determinar el parámetro de población

que interesa y proponer la validez de un valor para él) (Signo =)

Formular la hipótesis alternativa Ha

De manera que el rechazo de la hipótesis nula signifique aceptar la hipótesis

alternativa. (Signo > o <)

Al formular estas dos hipótesis, se determinan el parámetro y el valor

propuesto;

Paso 2 Determinar si la prueba es unilateral o bilateral

Paso 3 Asumir el nivel de significación

Paso 4 Determinar la distribución muestral que se usara en la prueba

Paso 5 Elaborar el esquema de la prueba

Paso 6 Calcular el estadístico de la prueba

Paso 7 Tomar la decisión, para esto, se comparan el esquema de la parte 5,

con el estadístico del paso 6

Page 171: Jonathanharo

T DE STUDENT

En probabilidad y estadística, la distribución t-Student es una distribución de

probabilidad que surge del problema de estimar la media de una población

normalmente distribuida cuando el tamaño de la muestra es pequeño.

Una variable aleatoria se distribuye según el modelo de t-Student con n grados

de libertad.

Propiedades:

1. La gráfica de la función de densidad es en forma de campana.

2. Los datos están más disperso que la curva normal estándar.

3. A medida que n aumenta, la gráfica se aproxima a la normal N(0,1).

4. La gráfica es muy parecida a la de la normal estándar diferenciándose

en que las colas de t están por encima de la normal, y el centro se

encuentra por debajo del de la normal.

5. Cuando los grados de libertad son altos, los valores de t coinciden con

los de la normal.

EJERCICIO

Paso 1 Elegimos la opción analizar, donde se despliega otra ventana y

seleccionamos prueba T para una muestra.

Paso 2 Trasladamos la variable precio hacia la ventana derecha, y elegimos

aceptar, esperamos un momento y obtendremos los resultados.

Page 172: Jonathanharo

Paso 1 Escoger la opción Análisis/Regresión/Lineales

Paso 2 Se escoge la variable dependiente e independiente según sea el caso

de los datos. Clic en la opción Gráficos

Page 173: Jonathanharo

Paso 3 En la sección de colocar la variable X se utiliza DEPENDENT y para

ubicar Y se utiliza la opción *ZPRED, a la vez se escoge las opciones

histograma y grafico de prob. Normal. Clic en Continuar

Paso 4 Clic en Aceptar

Page 174: Jonathanharo

Paso 5 Después de comparar los grados de libertad en el ejercicio además del

nivel de confianza podemos determinar si el resultado del estadístico se

encuentra dentro del rango de aceptación o rechazo.

Chi- cuadrado

Pruebas paramétricas

Se llaman así a las pruebas de hipótesis que cumplen tres requisitos

fundamentales:

1 La variable de la prueba debe ser variable cuantitativa.

1 los datos se obtienen por muestreo estadístico.

2 Los datos deben ajustarse a determinadas distribuciones estadísticas.

Ejemplo

1) La prueba basada en la distribución normal de probabilidades.

2) La prueba de student.

Pruebas no paramétricas

Llamadas también pruebas de distribución libre son aquellas en que:

1 la variable de la prueba debe ser cualitativa o cuantitativa

2 los datos se obtienen pos muestreo estadístico

3 son independientes de cualquier distribución de cualquier probabilidad.

Page 175: Jonathanharo

Ejemplo

La prueba del chi-cuadrado

Las pruebas paramétricas son más poderosas sin embargo cuando la variable

es cualitativa, solo se puede usar las pruebas no paramétricas.

Estadístico chi-cuadrado

Es un estadístico que sirve de base para una prueba no paramétrica

denominada prueba de chi cuadrado que se utiliza especialmente para

variables cualitativas, esto es, variables que carecen de unidad y por lo tanto

sus valores no pueden expresarse numéricamente. Los valores de estas

variables son categorías que solo sirven para clasificar los elementos del

universo del estudio. También puede utilizarse para variables cuantitativas,

transformándolas, previamente, en variables cualitativas ordinales.

El estadístico Chi- Cuadrado se define por:

En donde:

n=número de elementos de la muestra

n-1= números de grados de libertad.

=varianza de la muestra

= varianza de la población

Page 176: Jonathanharo

EJERCICIO:

Paso1 Clic en analizar, seleccionar la opción tablas de contingencia.

Paso 2 Trasladamos las variables precio y volumen a la parte derecha, y

hacemos clic en estadísticos.

Paso 3 En la ventana que se despliega escogemos la opción chi-cuadrado y

hacemos clic en continuar.

Page 177: Jonathanharo

Paso 4 Cumplido los pasos anteriores, finalmente hacemos clic en aceptar

para obtener los resultados de este estadístico.

Paso 1 Escoger la opción Análisis/Regresión/Lineales

Page 178: Jonathanharo

Paso 2 Se escoge la variable dependiente e independiente según sea el caso

de los datos. Clic en la opción Gráficos.

Paso 3 En la sección de colocar la variable X se utiliza DEPENDENT y para

ubicar Y se utiliza la opción *ZPRED, a la vez se escoge las opciones

histograma y grafico de prob. Normal. Clic en Continuar

Paso 4 Clic en Aceptar

Page 179: Jonathanharo

Paso 5 Después de comparar los grados de libertad en el ejercicio además del

nivel de confianza podemos determinar si el resultado del estadístico se

encuentra dentro del rango de aceptación o rechazo.

Varianza

Cuando es necesario hacer comparaciones entre tres o más medias

muéstrales para determinar si provienen de poblaciones iguales utilizamos la

técnica de análisis de varianza. Esta técnica se realiza utilizando la distribución

de probabilidad F vista anteriormente. Para el uso de esta técnica es necesario

seguir los siguientes supuestos:

1) Las poblaciones siguen una Distribución de Probabilidad Normal

2) Las poblaciones tienen desviaciones estándar (σ) iguales

3) Las muestras se seleccionan de modo independiente

La técnica del análisis de varianza descompone la variación total en dos

componentes de variación llamados variación debida a los tratamientos y

variación aleatoria.

Cuando estamos frente a un problema de análisis de varianza lo primero que

debemos hacer es identificar en términos del problema lo siguiente:

Page 180: Jonathanharo

Variable dependiente o variable respuesta: Es la variable que nos interesa

medir o respuesta que se va a estudiar para determinar el efecto que tiene

sobre ella la variable independiente.

Variable independiente o factor: Es la variable o factor que puede influenciar

en la variabilidad de la respuesta o variable dependiente.

Nivel o tratamiento del factor: Es un valor o condición del factor bajo el cual

se observa la respuesta medible.

Unidad experimental: Es el objeto (persona, animal o cosa) donde se aplica

un determinado tratamiento, para obtener una medición de la variable

respuesta.

Error experimental: Es la variación que no se puede atribuir a un cambio de

tratamiento; es decir, la que se produce por los factores extraños que pueden

influir en la respuesta y que deben ser eliminados o controlados por el

investigador.

Aleatorización: Consiste en asignar en forma aleatoria los tratamientos a las

unidades experimentales con el propósito de remover los posibles sesgos

sistemáticos y neutralizar los efectos de todos aquellos factores externos que

no se encuentran bajo el control del investigador, pero pueden estar presentes

en el experimento.

Nosotros estudiaremos el diseño Completamente Aleatorizado con un solo

factor o un factorial.

Este modelo es apropiado en aquellas situaciones donde se tiene un solo factor

o variable independiente con “c” niveles o tratamientos.

Page 181: Jonathanharo

Ejercicio

Paso 1 Se selecciona la opción analizar, se desplegara otra barra donde se

escogerá la opción frecuencias.

Paso 2 Se traslada la variable dependiente a la parte derecha, posteriormente

hacemos chic en la opción estadísticos.

Paso 3 En esta ventana hacemos clic en varianza y luego clic en continuar.

Page 182: Jonathanharo

Paso 4 Para obtener finalmente los resultados hacemos clic en la opción

aceptar, y enseguida saldrán los resultados.

ABSTRACT

When testing hypotheses, we start from an assumed value (hypothetical) in the

population parameter. After collecting a random sample, comparing the

statistical sample, as well as the average (x), with the hypothetical parameter is

compared with an assumed population mean. Then accepted or rejected the

notional value, as appropriate. Notional value is rejected only if the sample

result is very unlikely if the hypothesis is true.

A statistical test is a method, based on a random sample and meaningful,

allowing conclusions to accept or reject a hypothesis previously issued on the

value of an unknown parameter of a population.

Page 183: Jonathanharo

Statistically a hypothesis test is any statement about a population and / or its

parameters.A hypothesis test is to contrast two statistical hypotheses. This

contrast involves making decisions about the hypothesis. The decision is to

reject or not a hypothesis in favor of the other. A statistical hypothesis is

denoted by “H” and is two:

- Ho: null

- H1: alternative hypothesis

Page 184: Jonathanharo
Page 185: Jonathanharo
Page 186: Jonathanharo