Post on 30-Dec-2014
Nombre del instituto: Instituto Tecnológico De Lázaro Cárdenas.
Carrera: Ing. Gestión Empresarial. Semestre: 4°
Materia: Estadísticas inferencial I.
Profesor: Vázquez Esqueda Isaac
Unidad 1 Introducción a la estadística inferencial.
Nombre del Alumno: Gustavo Fernando Florentino Carreón.
Numero de control: 11560019
1.1 Breve historia de la estadística.
Desde los comienzos de la civilización han existido formas sencillas de estadística,
pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas,
palos de madera y paredes de cuevas para contar el número de personas,
animales o ciertas cosas. Hacia el año 3000 a.C. los babilonios usaban ya
pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción
agrícola y de los géneros vendidos o cambiados mediante trueque.
Los egipcios analizaban los datos de la población y la renta del país mucho antes
de construir las pirámides en el siglo XXXI a.C. Los libros bíblicos de Números y
Crónicas incluyen, en algunas partes, trabajos de estadística. El primero contiene
dos censos de la población de Israel y el segundo describe el bienestar material
de las diversas tribus judías. En China existían registros numéricos similares con
anterioridad al año 2000 a.C. Los griegos clásicos realizaban censos cuya
información se utilizaba hacia el 594 a.C. para cobrar impuestos.
En la Biblia observamos en uno de los libros del Pentateuco, bajo el nombre de
Números, el censo que realizó Moisés después de la salida de Egipto.
Textualmente dice: "Censo de las tribus: El día primero del segundo año después
de la salida de Egipto, habló Yavpe a Moisés en el desierto de Sinaí en el
tabernáculo de la reunión, diciendo: "Haz un censo general de toda la asamblea
de los hijos de Israel, por familias y por linajes, describiendo por cabezas los
nombres de todos los varones aptos para el servicio de armas en Israel. En el
llibro bíblico Crónicas describe el bienestar material de las diversas tribus judías.
El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos
sobre la población, superficie y renta de todos los territorios bajo su control.
Durante la edad media sólo se realizaron algunos censos exhaustivos en Europa.
Los reyes carolingios Pipino, el Breve, y Carlomagno ordenaron hacer estudios
minuciosos de las propiedades de la Iglesia en los años 758 y 762
respectivamente. Después de la conquista normanda de Inglaterra en 1066, el rey
Guillermo I de Inglaterra encargó un censo. La información obtenida con este
censo, llevado a cabo en 1086, se recoge en el Domesday Book.
El registro de nacimientos y defunciones comenzó en Inglaterra a principios del
siglo XVI, y en 1662 apareció el primer estudio estadístico notable de población,
titulado Observations on the London Bills of Mortality (Comentarios sobre las
partidas de defunción en Londres). Un estudio similar sobre la tasa de mortalidad
en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el
astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad.
En 1662 un mercader de lencería londinense, John Graunt, publicó un tratado con
las observaciones políticas y naturales, donde Graunt pone de manifiesto las cifras
brutas de nacimientos y defunciones ocurridas en Londres durante el periodo
1.604-1.661, así como las influencias que ejercían las causas naturales, sociales y
políticas de dichos acontecimientos. Puede considerarse el primer trabajo
estadístico serio sobre la población.
Curiosamente, Graunt no conocía los trabajos de B. Pascal » (1.623-1.662) ni de
C. Huygens (1.629-1.695) sobre estos mismos temas. Un poco más tarde, el
astrónomo Edmund Halley (1.656- 1.742) presenta la primera tabla de mortalidad
que se puede considerar como base de los estudios contemporáneos. En dicho
trabajo se intenta establecer el precio de las anualidades a satisfacer a las
compañías de seguros. Es decir, en Londres y en París se estaban construyendo,
casi de manera simultánea, las dos disciplinas que actualmente llamamos
estadística y probabilidad.
En el siglo XIX, la estadística entra en una nueva fase de su desarrollo con la
generalización del método para estudiar fenómenos de las ciencias naturales y
sociales. Galton » (1.822-1.911) y Pearson (1.857-1936) se pueden considerar
como los padres de la estadística moderna, pues a ellos se debe el paso de la
estadística deductiva a la estadística inductiva.
Los fundamentos de la estadística actual y muchos de los métodos de inferencia
son debidos a R. A. Fisher. Se interesó primeramente por la eugenesia, lo que le
conduce, siguiendo los pasos de Galton a la investigación estadística, sus trabajos
culminan con la publicación de la obra Métodos estadísticos para investigaciones.
En él aparece la metodología estadística tal y como hoy la conocemos.
A partir de mediados del siglo XX comienza lo que podemos denominar la
estadística moderna, uno de los factores determinantes es la aparición y
popularización de los computadores. El centro de gravedad de la metodología
estadística se empieza a desplazar técnicas de computación intensiva aplicadas a
grandes masas de datos, y se empieza a considerar el método estadístico como
un proceso iterativo de búsqueda del modelo ideal.
1.2 Concepto de estadística.
La palabra Estadística procede del vocablo “Estado”, pues era función
principal de los Gobiernos de los Estados establecer registros de población,
nacimientos, defunciones, impuestos, cosechas... La necesidad de poseer
datos cifrados sobre la población y sus condiciones materiales de existencia
han debido hacerse sentir desde que se establecieron sociedades humanas
organizadas.
La estadística es una rama de las matemáticas que se ocupa de reunir,
organizar y analizar datos numéricos y que ayuda a resolver problemas
como el diseño de experimentos y la toma de decisiones.
La Estadística es una ciencia formal que estudia la recolección, análisis e
interpretación de datos de una muestra representativa, ya sea para ayudar
en la toma de decisiones o para explicar condiciones regulares o irregulares
de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o
condicional. Sin embargo, la estadística es más que eso, es decir, es el
vehículo que permite llevar a cabo el proceso relacionado con la
investigación científica.
1.3 Estadística descriptiva.
La estadística descriptiva, se dedica a la descripción, visualización y
resumen de datos originados a partir de los fenómenos de estudio. Los
datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de
parámetros estadísticos son: la media y la desviación estándar. Algunos
ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular,
entre otros.
La estadística descriptiva es una gran parte de la estadística que se dedica
a recolectar, ordenar, analizar y representar un conjunto de datos, con el fin
de describir apropiadamente las características de ese conjunto. Este
análisis es muy básico. Aunque hay tendencia a generalizar a toda la
población, las primeras conclusiones obtenidas tras un análisis descriptivo,
es un estudio calculando una serie de medidas de tendencia central, para
ver en qué medida los datos se agrupan o dispersan en torno a un valor
central. Esto es lo que podria ser un concepto aproximado.La Estadística es
la ciencia que se encarga de recolectar datos de una población o muestra.
1.4 Estadística inferencial.
La estadística inferencial, se dedica a la generación de los modelos,
inferencias y predicciones asociadas a los fenómenos en cuestión teniendo
en cuenta la aleatoriedad de las observaciones. Se usa para modelar
patrones en los datos y extraer inferencias acerca de la población bajo
estudio. Estas inferencias pueden tomar la forma de respuestas a
preguntas si/no (prueba de hipótesis), estimaciones de unas características
numéricas (estimación), pronósticos de futuras observaciones,
descripciones de asociación (correlación) o modelamiento de relaciones
entre variables (análisis de regresión). Otras técnicas de modelamiento
incluyen a nova, series de tiempo y minería de datos.
La estadística inferencial es una parte de la estadística que comprende los
métodos y procedimientos que por medio de la inducción determina
propiedades de una población estadística, a partir de una pequeña parte de
la misma. La estadística inferencial comprende como aspectos importantes:
La toma de muestras o muestreo.
La estimación de parámetros o variables estadísticas.
El contraste de hipótesis.
El diseño experimental.
La inferencia bayesiana.
Los métodos no paramétricos.
1.5 Breve introducción a la inferencia estadística.
Rama de la Estadística que estudia el comportamiento y propiedades de las
muestras y la posibilidad, y límites, de la generalización de los resultados
obtenidos a partir de aquellas a las poblaciones que representan. Esta
generalización de tipo inductivo, se basa en la probabilidad. También se le llama
también Estadística Matemática, por su complejidad matemática en relación a la
Estadística Descriptiva.
Tiene como objetivo, generalizar las propiedades de la población bajo estudio,
basado en los resultados de una muestra representativa de la población.
La siguiente pregunta: ¿El instrumento Perso, clasifica y discrimina
adecuadamente, a partir de variables de personalidad, a los alumnos de
Educación Básica Secundaria según requieran o no una escolarización especial?
se resuelve con el apoyo de la Estadística Inferencial.
En cuanto a la Probabilidad, Juez Martel, Pedro y Diez Vegas, Francisco Javier
(1997), manifiestan que: “Hoy en día la Probabilidad y la Estadística, íntimamente
unidas en sí, desempeñan un papel fundamental en prácticamente todos los
campos del saber, tanto en las ciencias naturales como en las ciencias humanas,
papel que va cobrando cada vez mayor importancia.”
La siguiente pregunta: ¿Cuánto es la probabilidad de que un alumno de Educación
Básica Secundaria requiera una escolarización especial, a partir de las variables
de su personalidad? es un caso típico que se resuelve con el apoyo de la
probabilidad y se logra empleando modelos probabilísticos.
Ningún método estadístico puede corregir los defectos por una inadecuada
selección del problema que se investiga, o por una mala recolección de datos. Una
investigación que empieza mal, con seguridad termina mal, con datos de mala
calidad, no será posible dar respuesta adecuada a un problema científico.
Nosotros recordamos al estudiante que los métodos estadísticos son las
herramientas más peligrosas en manos de gente inexperta. Pocas materias tiene
una aplicación tan amplia; Ninguna requiere tal cuidado en su aplicación.
También se le llama Inferencia Estadística, pero previamente recordemos que la
Estadística
(EI) comprende el conjunto de métodos estadísticos que permiten deducir (inferir)
cómo se distribuye la población bajo estudio a partir de la información que
proporciona una muestra representativa, obtenida de dicha población.
Para que la Estadística Inferencial proporcione buenos resultados debe:
1. Basarse en una técnica estadístico-matemática adecuada al problema y
suficientemente validada.
2. Utilizar una muestra que realmente sea representativa de la población y de un
tamaño suficiente.
1.6 Teoría de decisión en estadística.
La teoría de la decisión es una área interdisciplinaria de estudio, relacionada con
casi todos los participantes en ramas de la ciencia, ingeniería principalmente la
psicología del consumidor (basados en perspectivas cognitivo-conductuales).
Concierne a la forma y al estudio del comportamiento y fenómenos psíquicos de
aquellos que toman las decisiones (reales o ficticios), así como las condiciones por
las que deben ser tomadas las decisiones óptimas.
Existen tipos de decisión que son interesantes desde el punto de vista del
desarrollo de una teoría, estos son:
-Decisión sin riesgo entre mercancías inconmensurables (mercancías que no
pueden ser medidas bajo las mismas unidades).
-Elección bajo impredecibilidad.
-Elección intertemporal, estudio del valor relativo que la gente asigna a dos o más
bienes en diferentes momentos del tiempo.
-Decisiones sociales: decisiones tomadas en grupo o bajo una estructura
organizativa.
1.7 Componentes de una investigación estadística.
Es una forma especial de buscar el conocimiento, presenta toda una serie de
características que la diferencian de otras formas de abordar la realidad, como son
el conocimiento empírico espontáneo y el razonamiento especulativo. A
continuaciones se presentan algunas definiciones:
Un procedimiento reflexivo, sistemático, controlado y crítico, que permite descubrir
nuevos hechos o datos, relación o leyes, en cualquier campo del conocimiento
humano. Para entender qué se asume por investigación científica debemos
conocer su naturaleza, sus aspectos o características, como son:
1. Es un procedimiento mediante el cual se recogen nuevos conceptos de
fuentes primarias, una investigación existe cuando se ha pasado por el
proceso de comprobación y verificación de un problema, el replantear lo ya
conocido no se puede llamar investigación.
2. Una investigación es un aporte importante para el descubrimiento de
principios generales por su naturaleza inferencial.
3. La investigación es un trabajo de exploración profesional, organizada o
sistemática y exacta.
4. Es lógica y objetiva.
5. En lo posible procura ofrecer resultados cuantitativos de los datos
manejados.
6. El fin de una investigación se expresa en un informe el cual presentará no
solo la metodología, resultados, experimentaciones, sino también las
conclusiones y recomendaciones finales.
Objetivos
1. Describir la realidad. Proceso importante y necesario en el proceso del
conocimiento científico donde las técnicas y métodos se aplican para
recopilar datos y hechos, y establecer generalizaciones empíricas.
2. Explicar la realidad. Refleja mediante generalizaciones teóricas
(principios, leyes, conceptos) las propiedades y regularidades esenciales y
estables de los fenómenos, así como los factores causales que los
determinan.
3. Predecir la realidad. La explicación de la realidad y las generalizaciones
teóricas, permiten que cumpla con el objetivo de predecir los
comportamientos futuros de los fenómenos, esto es, establecer pronósticos
dentro de un determinado límite de la probabilidad.
Como función práctica y utilitaria, la ciencia transforma la realidad en
correspondencia con las necesidades y demandas de la sociedad, a fin de
lograr un bienestar, mejorar la calidad de vida.
Entonces la ciencia indaga su objeto de estudio utilizando de una manera
sistemática y rigurosa, empleando métodos y medios especiales de
conocimiento que permiten obtener datos empíricos confiables, así como un
reflejo profundo y exacto de las regularidades esenciales de la realidad.
En este caso, los métodos estadísticos cumplen funciones cognoscitivas
importantes como herramienta de investigación científica, por tanto el
proceso de investigación científica encuentra su fundamento metodológico
en la concepción científica general de la realidad objetiva.
Paradigmas de la investigación
Un paradigma es un enfoque general que asume el investigador y es de
carácter ontológico, epistemológico y metodológico. Este último tiene que
ver con las vías, formas, procedimientos y estrategias que se consideran
apropiados para estudiar al objeto, responde a la pregunta ¿Cómo se
conoce a la realidad?
En la literatura del método científico se habla con frecuencia de dos
paradigmas de la investigación científica, como son: el cualitativo y el
cuantitativo.
A continuación se plantea el siguiente cuadro:
1.8 Recolección de datos.
¿Para qué necesitamos Recolectar Datos?
Proporcionan la introducción imprescindible para un estudio de investigación.
Medir el desempeño en un servicio o proceso de producción. Ayudar en la
formulación de alternativas para la toma de decisiones. Satisfacer nuestra
curiosidad.
Por ejemplo:
Un gerente desea investigar si la calidad del servicio o de los productos se ajusta
a los estándares de la compañía. El investigador de mercados busca las
características que distinguen un producto del de sus competidores.
El inversionista potencial desea determinar qué compañías de qué industrias es
probable que hayan acelerado el crecimiento en un periodo de recuperación
económica. El fabricante farmacéutico necesita determinar si una nueva medicina
es más eficaz que las actualmente en uso.
Los Datos pueden concebirse como información numérica necesaria para
ayudarnos a tomar una decisión con más bases en una situación particular.
Técnicas e Instrumentos.
1. Encuesta:
Su instrumento es el Cuestionario. Se formulan preguntas respecto a
opiniones, actitudes, comportamiento y otras características. Después las
respuestas se editan, codifican y tabulan para su análisis.
2. Entrevista:
Su instrumento es la Guía de Preguntas. Es un diálogo flexible, permite
hacer preguntas más de una vez (repregunta).Tanto el entrevistador como
el (los) entrevistado (s) deben tener conocimientos fundamentados del tema
en discusión.
3. Observación:
Su instrumento es la Guía de Observación.
a) Observación Experimental: El investigador influye sobre los elementos de
estudio. Ej: Prueba de medicamentos, Ensayos de nuevos métodos de
enseñanza, etc.
b) Observación No Experimental: El investigador toma los datos tal y como
los encuentra. Ej: Tráfico, Rating, Supervisión.
4. Análisis Documental:
Su instrumento es la Ficha de Registro.
Consiste en recabar información relacionada al tema de investigación de
todas las fuentes disponibles: Tesis, Revistas, Páginas Web, Libros,
Historias Clínicas, Expedientes judiciales, Registro de ventas, Historial de
Notas, Documentales, etc.
Estas fuentes deben ser válidas para citarse.
Consideraciones éticas.
La información obtenida debe ser de interés, estrictamente, para el
estudio.
Mantener el anonimato de las fuentes, si fuera requerido.
Utilizar un lenguaje adecuado para las personas involucradas en el
estudio.
No sesgar (acomodar) los resultados obtenidos. “aleatoriedad”.
1.9 Estadística paramétrica (población y muestra aleatoria).
La estadística paramétrica es una rama de la estadística inferencial que
comprende los procedimientos estadísticos y de decisión que están
basados en las distribuciones de los datos reales. Estas son determinadas
usando un número finito de parámetros. Esto es, por ejemplo, si
conocemos que la altura de las personas sigue una distribución normal,
pero desconocemos cuál es la media y la desviación de dicha normal. La
media y la desviación típica de la desviación normal son los dos
parámetros que queremos estimar. Cuando desconocemos totalmente que
distribución siguen nuestros datos entonces deberemos aplicar primero un
test no paramétrico, que nos ayude a conocer primero la distribución.
La mayoría de procedimientos paramétricos requiere conocer la forma de
distribución para las mediciones resultantes de la población estudiada.
Para la inferencia paramétrica es requerida como mínimo una escala de
intervalo, esto quiere decir que nuestros datos deben tener un orden y una
numeración del intervalo.
Es decir nuestros datos pueden estar categorizados en: menores de 20
años, de 20 a 40 años, de 40 a 60, de 60 a 80, etc, ya que hay números
con los cuales realizar cálculos estadísticos. Sin embargo, datos
categorizados en: niños, jóvenes, adultos y ancianos no pueden ser
interpretados mediante la estadística paramétrica ya que no se puede
hallar un parámetro numérico (como por ejemplo la media de edad) cuando
los datos no son numéricos.
Más información sobre escalas: Escala de medida
Población
Este concepto vamos a definirlo bajo diferentes enfoques.
En investigación científica se le define como la totalidad de elementos
sobre los cuales recae la investigación. A cada elemento se le llama
unidad estadística, a ésta se le observa o se le somete a una
experimentación, estas unidades son medidas pertinentemente.
Si representamos mediante X una variable aleatoria bajo investigación, al
estudiar a ésta variable en la población, como resultado tendremos los
valores:
X1, X2, X3, Xn ..
Donde N es el total de elementos de la población.
Sea X , una variable aleatoria que representa la calificación obtenida en la
prueba de
conocimientos sobre educación ambiental (escala vigesimal), de los
alumnos de la Facultad
de Educación, si la población consta de 300 alumnos, entonces:
X1, X2,X3, Xn….
Es una población en términos de variable aleatoria, que se lee así:
La calificación que ha obtenido el alumno 1 en la prueba de conocimientos
sobre educación ambiental, la calificación que ha obtenido el alumno 2 en
la prueba de conocimientos sobre educación ambiental, la calificación que
ha obtenido el alumno 3 en la prueba de conocimientos sobre educación
ambiental, y así sucesivamente hasta la calificación que ha obtenido el
alumno 300 en la prueba de conocimientos sobre educación ambiental.
El propósito de un estudio estadístico es extraer conclusiones acerca de la
naturaleza de la población, pero resulta que las poblaciones son grandes o
por razones de ética, recursos financieros, metodológicos u otros no será
posible entonces se debe trabajar con una muestra extraída de la
población bajo estudio.