ESTADÍSTICA Y PROBABILIDADESTEMA 1: DATOS Y ESTADÍSTICA
Prof. Alberto Grados Mitteenn
SITUACIONES COTIDIANAS:
El Comercio informó que el precio medio de una vivienda en Lima es US$60000.
El rector de la PUCP informó que, de todos los ingresantes, el 45% son mujeres.
El tiempo medio que tarda una persona en llegar a su trabajo es 25 minutos.
¿QUÉ ES LA ESTADÍSTICA?
CIENCIA
RECOLECTAR MANIPULAR ANALIZAR
IMTERPRETAR
DATOS
APLICACIONES EN LOS NEGOCIOS Y LA ECONOMÍA
CONTABILIDAD
Auditoría
MARKETING
Escáner en las
tiendas
PRODUCCIÓN
Revisión de
eficiencia
ECONOMÍA
Pronósticos
DATOS• Elementos, variables y observaciones• Escalas de medición• Datos categóricos y cuantitativos• Datos de corte transversal y de series de tiempo
DATOS
Hechos y cifras recabados, analizados y resumidos, para su presentación e interpretación.
Se agrupan en un banco de datos. EDAD ESTATURA (m) DISTRITO
JUAN 15 1.70 Jesús María
PEDRO 18 1.58Pueblo Libre
MARÍA 15 1.67 La Molina
TERESA 12 1.45 Surco
ROBERTO 19 1.75Miraflores
ANA 20 1.67 Los Olivos
LUIS 17 1.80Comas
PEDRO 16 1.67 San Isidro
MARÍA 16 1.56Pueblo Libre
ELEMENTOS, VARIABLES Y OBSERVACIONES
ELEMENTO
VARIABLE
OBSERVACIÓN
• Entidades a partir de las cuales se reúnen los datos.
• Ejm: Nombres (tabla anterior)
• Característica de interés de los elementos.
• Ejm: Edad, estatura, distrito (tabla anterior)
• Es el conjunto de mediciones recabadas para cada elemento.
• Ejm: Para Juan es Jesús María; 1.70m y 15 años.
ESCALAS DE MEDICIÓN
Pueden ser: nominal, ordinal, de intervalo o de razón.
• Datos presentan las mismas características que los ordinales; además, son siempre numéricos.
• El intervalo entre los valores tiene unidad de medida fija (R.A. significativa)
• Datos presentan las mismas características que los de intervalo.
• La razón de dos valores es significativa (estatura, peso, tiempo) (R.G. significativa)
• Su orden es significativo (excelente:1; bueno:2; regular:3; malo:4)
• Suelen ser valores numéricos.
• Etiquetas o nombres.• Su orden no es
significativo.
ESCALA NOMINAL
ESCALA ORDINAL
ESCALA DE INTERVALO
ESCALA DE RAZÓN
CLASIFICACIÓN DE LOS DATOS
DATOS CATEGÓRICOS O CUALITATIVOS
• Se agrupan por categorías específicas.• Escala: nominal u ordinal.• Aún así se usen códigos numéricos, las operaciones entre datos no tiene sentido.
DATOS CUANTITATIVOS
• Usan valores numéricos.• Pueden ser discretos o continuos.• Escala: de intervalo o de razón.• Los datos se pueden sumar, restar, promediar.
DATOS DE CORTE TRANSVERSAL Y SERIES DE TIEMPO
DATOS DE CORTE TRANSVERSAL
•Recabados en el mismo momento.
DATOS DE SERIES DE
TIEMPO•Recabados a lo largo de varios periodos.
Ener
o
Febr
ero
Mar
zoAb
ril0
5
10
15
Serie 3Serie 2Serie 1
EDAD ESTATURA (m) DISTRITO
JUAN 15 1.70 Jesús María
PEDRO 18 1.58Pueblo Libre
MARÍA 15 1.67 La Molina
TERESA 12 1.45 Surco
ROBERTO 19 1.75Miraflores
ANA 20 1.67 Los Olivos
LUIS 17 1.80Comas
PEDRO 16 1.67 San Isidro
MARÍA 16 1.56Pueblo Libre
FUENTES DE DATOS• Fuentes existentes• Estudios estadísticos• Errores en la adquisición de datos
FUENTES EXISTENTES
Encuestas Estudios experimentales Empresas que venden bases de datos Internet Agencias gubernamentales
ESTUDIOS ESTADÍSTICOS
Se realizan cuando los datos no están disponibles en otras fuentes.
Pueden ser:
EXPERIMENTALES
1. Se identifica la variable de interés.
2. Se toman otras variables para ver cómo afectan a la
variable de interés.
Ejm: Nivel de presión sanguínea a partir de la edad y nivel de
grasas en los alimentos.
NO EXPERIMENTALES U OBSERVACIONALES
No pretenden controlar las
variables de interés.
Las encuestas son el tipo más común.
ERRORES EN LA ADQUISICIÓN DE DATOS
El uso de datos erróneos es peor que no usar datos.
Falla de registro (Ejm: 53 en lugar de 35) Datos falseados deliberadamente. Datos atípicos.
ESTADÍSTICA DESCRPTIVADefinición
CONCEPTOS
POBLACIÓN: Es el conjunto de todos los elementos de interés en un estudio en particular.
MUESTRA: Es un subconjunto de la población.
ESTADÍSTICA DESCRIPTIVA
Es la mayor parte de la información estadística que se muestran en las publicaciones; que se resumen de manera simple en tablas, gráficas o números.
Hace referencia a toda una población. El proceso de recabar datos de toda una
población se llama censo.
ESTADÍSTICA INFERENCIAL
Si un grupo de estudio es demasiado grande y no se puede censar por razones de tiempo, costo o falta de recursos; se recaba información de una porción de la población.
El proceso de recabar datos de una muestra se llama encuesta por muestreo (o simplemente, muestreo).
La estadística usa datos de una muestra para hacer estimaciones y probar hipótesis sobre las características de una población: inferencia estadística.
COMPUTADORAS Y ANÁLISIS ESTADÍSTICO
SOFTWARE
Para organizar, manipular e interpretar un banco de datos grande, se usan herramientas digitales: Excel Minitab StatTools
MINERÍA DE DATOS
MINERÍA DE DATOS
Hoy es posible capturar, almacenar y mantener una enorme cantidad de datos gracias a las computadoras: almacenamiento de datos.
Empleando estadística, matemáticas y ciencias de la computación, los analistas son capaces de extraer los datos para convertirlos en información útil: minería de datos.
Es usada a menudo para brindar información útil a minoristas sobre tendencias en las ventas, por ejemplo.
Es una tecnología que se basa en metodologías estadísticas: regresión múltiple, regresión logística y correlación.
LINEAMIENTOS ÉTICOS PARA LA PRÁCTICA DE LA ESTADÍSTICA
MALAS PRÁCTICAS FRECUENTES
Muestreo impropio Análisis inapropiado de los datos Desarrollo de gráfica erróneas Uso de resúmenes estadísticos inadecuados Interpretación tendenciosa de los datos
estadísticos
BIBLIOGRAFÍA
Anderson, Sweeney, Williams; Estadística para Negocios y Economía; Capítulo 1; CENGAGE Learning; 11° edición; México 2012
Top Related