Investigación Estadística de Usuarios de Internet
description
Transcript of Investigación Estadística de Usuarios de Internet
trabajo de investigacin
INSTITUTO POLITCNICO NACIONALESCUELA SUPERIOR DE INGENIERA MECNICA Y ELCTRICAUnidad ZacatencoIngeniera en Comunicaciones y ElectrnicaAcademia de matemticasMateria: Probabilidad y Estadstica Profesor: Salazar Pea EnriqueTrabajo de investigacinPrimer parcialAlumno: xxxxFecha de entrega: 28-04-2015
trabajo de investigacinUsuarios de internet en distintos pases
Organizacin del proyecto de investigacin:
I. Recoleccin de datos
II. Anlisis de datos
Datos no agrupadosa) Diagrama tallo-hojab) Listado ordenado c) Medidas de tendencia centrald) Medidas de dispersine) Medidas de posicin Datos agrupadosa) Formacin de intervalosb) Tabla de frecuenciasc) Medidas de tendencia centrald) Medidas de dispersine) Medidas de posicinf) Diagrama caja brazos g) Diagrama de barrash) Polgono de Frecuenciasi) Ojiva
III. Interpretacin de resultados
IV. Inferencia de datos
V. Anexos
Evidencias de la recoleccin de datos Glosario
Recoleccin de datos:En la siguiente tabla se muestra una recopilacin de datos, que relacionan un pas con el nmero de usuarios de internet, de una muestra de cien habitantes por cada pas, los datos fueron obtenidos de un estudio realizado por el banco mundial de datos y que estn disponibles en su pgina de internet http://datos.bancomundial.org/
PAIS2013Redondeo
Afganistn5,96
Albania60,160
Alemania84,084
Andorra94,094
Angola19,119
Antigua y Barbuda63,463
Arabia Saudita60,561
Argelia16,517
Argentina59,960
Armenia46,346
Aruba78,979
Australia83,083
Austria80,681
Azerbaiyn58,759
Bahamas72,072
Bahrin90,090
Bangladesh6,57
Barbados75,075
Belars54,254
Blgica82,282
Belice31,732
Benin4,95
Bermudas95,395
Bhutn29,930
Bolivia39,540
Bosnia y Herzegovina67,968
Botswana15,015
Brasil51,652
Brunei Darussalam64,565
Bulgaria53,153
Burkina Faso4,44
Burundi1,31
Cabo Verde37,538
Camboya6,06
Camern6,46
Canad85,886
Chad2,32
Chile66,567
China45,846
Chipre65,566
Colombia51,752
Comoras6,57
Costa Rica46,046
Cte d'Ivoire2,63
Croacia66,767
Cuba25,726
Japn 86,387
Dinamarca94,695
Djibouti9,510
Dominica59,059
Ecuador40,440
Egipto49,650
El Salvador23,123
Emiratos rabes Unidos88,088
Eritrea0,91
Eslovenia72,773
Espaa71,672
Estados Unidos84,284
Estonia80,080
Etiopa1,92
Ex Repblica Yugoslava 61,261
Federacin de Rusia61,461
Fiji37,137
Filipinas37,037
Finlandia91,592
Francia81,982
Gabn9,29
Gambia14,014
Georgia43,143
Ghana12,312
Granada35,035
Grecia59,960
Groenlandia65,866
Guam65,465
Guatemala19,720
Guinea1,62
Guinea-Bissau3,13
Guinea Ecuatorial16,417
Guyana33,033
Hait10,611
Honduras17,818
Hong Kong74,274
Hungra72,672
India15,115
Indonesia15,816
Irn31,431
Iraq9,29
Irlanda78,278
Mxico43,544
Anlisis de datos:Datos no agrupados.Diagrama Tallo Hoja-1, 1, 2, 2, 2, 3, 3, 4, 5, 6, 6, 6, 7, 7, 9, 9
10, 1, 2, 4, 5, 5, 6, 7, 7, 8, 9
20, 3, 6
30, 1, 2, 3, 5, 7, 7,8
40, 0, 3, 4, 6, 6, 6
50, 2, 2, 3, 4, 9, 9
60, 0, 0, 1, 1, 1, 3, 5, 5, 6, 6, 7, 7, 8
72, 2, 2, 3, 4, 5, 8, 9
80, 1, 2, 2, 3, 4, 4, 6, 7, 8
90, 2, 4, 5, 5
Tenemos 89 datos para ordenar.Lista ordenada:
1
1
2
2
2
3
3
4
5
6
6
6
7
7
9
9
10
11
12
14
15
15
16
17
17
18
19
20
23
26
30
31
32
33
35
37
37
38
40
40
43
44
46
46
46
50
52
52
53
54
59
59
60
60
60
61
61
61
63
65
65
66
66
67
67
68
72
72
72
73
74
75
78
79
80
81
82
82
83
84
84
86
87
88
90
92
94
95
95
Medidas de tendencia central:
Media
=4,18647.03*En promedio hay 47 usuarios de internet en cada pas de los 89 con los que se estn trabajando en este proyecto.Mediana:Dato a la mitad de la lista ordenada si son 89 en total la media es:
Moda:Es aquel dato que se repite un mayor nmero de veces, en este caso la moda pueden ser varios datos:
Medidas de dispersin: =47.03
Dato
12-92.0692.064,237.52
23-135.09135.096,083.10
32-88.0688.063,877.28
41-43.0343.031,851.58
51-42.0342.031,766.52
63-123.09123.095,050.38
72-80.0680.063,204.80
92-76.0376.032,892.56
101-37.0337.031,371.22
111-36.0336.031,298.16
121-35.0335.031,227.10
141-33.0333.031,090.98
152-64.0664.062,051.84
161-31.0331.03962.86
172-60.0660.061,803.60
181-29.0329.03842.74
191-28.0328.03785.68
201-27.0327.03730.62
231-24.0324.03577.44
261-21.0321.03442.26
301-17.0617.06291.04
311-16.0316.03256.96
321-15.0315.03225.90
331-14.0314.03196.84
351-12.0312.03144.72
372-20.0620.06201.20
381-9.039.0381.54
402-14.0614.0698.84
431-4.034.0316.24
441-3.033.039.18
463-3.093.093.18
5012.972,978.82
5229.949.9449.40
5315.975,9735.64
5416.976,9748.58
59223.9423.94286.56
60338.9138.91504.66
61341.9141,91585.48
63115.9715.97255.04
65235.9435.94645.84
66237.9437.94719.72
67239.9439.94797.60
68120.9720.97439.74
72374.9174.911,870.50
73125.9725.97674.44
74126.9726.97727.38
75127.9727.97782.32
78130.9730.97959.14
79131.9731.971,022.08
80132.9732.971,087.02
81133.9733.971,153.96
82269.9469.942,445.80
83135.9735.971,293.84
84236.9736.971,366.78
86138.9738.971,518.66
87139.9739.971,597.60
88140.9740.971,678.54
90142.9742.971,846.42
92144.9744.972,022.30
94146.9746.972,206.18
95295.9495.944,602.24
SUMA2,293.0676,906.16
Rango=DatoMayor DatoMenor
Rango=95-1=94
Desviacin media D.M.
Donde n = nmero de datos totales = 89Varianza:
Por lo tanto la varianza es:
Desviacin Standard
La desviacin standard es el equivalente a la raz cuadrada de la varianza por lo tanto:
Medidas de posicin:
=4668=96Datos agrupados:
Rango=DatoMayor DatoMenorRango=95-1=94
Longitud del intervalo ()
C es determinado a partir de la Regla de Sturges:
Y debe de estar entre los intervalos
Donde n es el nmero de datos en este caso 89:
Por lo tanto la longitud del intervalo queda de la siguiente manera:
Diagrama caja brazos:
Diagrama de barras:
Polgono de frecuencias:
Ojiva
Interpretacin de resultados:Los datos con los que se trabaj el proyecto, han sido obtenidos de una base de datos del banco mundial, en l se recopilaron el promedio de usuarios de internet en el ao 2013 de una muestra de cien personas por pas, en el estudio no observe un comportamiento ascendente en todos los pases puesto que se debe considerar que el estudio es general y no enfocado nicamente a pases tecnolgicamente desarrollados, por lo tanto obtuvimos un rango de datos muy amplio, a esta variacin tan grande se le puede atribuir el nivel de infraestructura de cada pas as como, el nivel de idiosincrasia de cada gobierno que delimita un medio tan asequible y que proporciona ms informacin de la que estn dispuestos a dejar conocer, entre otras cosas, el nivel de desarrollo tecnolgico a nivel mundial si es ascendente comparado con los estudios anuales anteriores, sin embargo no todos los pases tienen el mismo nivel de desarrollo y acceso a las tecnologas de informacin y comunicacin.Aun tomando como estudio a 89 pases, podemos decir que en promedio 46% o bien menos de la mitad de sus habitantes tienen acceso a internet, en base a esto concluyo que en el ao 2013 ms de la mitad del mundo tenia delimitado su acceso a las tecnologas de informacin y comunicacin.Inferencia de datos:El estudio, puede ayudar a identificar los pases ms rezagados en desarrollo tecnolgico y adems proporcionar un conocimiento estadstico sobre el crecimiento de la poblacin activa en internet, para poder planificar el desarrollo y mantenimiento de los servidores de las distintas plataformas que existen (Facebook, YouTube, Google, Yahoo!, Gmail, etc.). Pero adems de los servidores, se necesitan dispositivos para acceder a internet (Laptop, Smartphone, Tablet, etc.) Con ayuda de los datos estadsticos que reflejan el crecimiento de los usuarios de internet pueden determinar el aproximado de la demanda de los dispositivos electrnicos para su uso y consumo.Por lo tanto el estudio puede ayudar a empresas que proporcionan los servidores de internet y a las empresas productores de dispositivos electrnicos para que tengan acceso al mismo.
Anexo:Evidencias de la recoleccin de datos:Los datos fueron obtenidos de la pgina del banco mundial de datos, es el siguiente enlace:http://datos.bancomundial.org/indicador/IT.NET.USER.P2
Usuarios de Internet
Los datos se agruparon en una en la tabla que refiere en la recoleccin de datos, en la pgina de internet se muestran datos con punto decimal, por decisin personal se redondearon las cifras para poder trabajar nicamente con nmeros enteros y tener menor dificultad al desarrollar el trabajo.
Glosario:I. Estadstica: Laestadsticaes unaciencia formaly una herramienta que estudia el uso y los anlisis provenientes de una muestra representativa dedatos, busca explicar las correlaciones y dependencias de un fenmeno fsico o natural, de ocurrencia en formaaleatoriaocondicional. II. Estadstica descriptiva: Se dedica a la descripcin, visualizacin y resumen de datos originados a partir de los fenmenos de estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de parmetros estadsticosson: lamediay ladesviacin estndar. Algunos ejemplos grficos son:histograma,pirmide poblacional,grfico circular, entre otros.
III. Estadstica inferencial: Se dedica a la generacin de losmodelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta laaleatoriedad de las observaciones. Se usa paramodelarpatrones en los datos y extraer inferencias acerca de lapoblacinbajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas s/no (prueba de hiptesis), estimaciones de unas caractersticas numricas (estimacin),pronsticosde futuras observaciones, descripciones de asociacin (correlacin) o modelamiento de relaciones entre variables (anlisis de regresin). Otras tcnicas demodelamientoincluyena nova,series de tiempoyminera de datos.
IV. Parmetro estadstico: En estadstica, unparmetroes un nmero que resume la gran cantidad de datos que pueden derivarse del estudio de unavariable estadstica.1El clculo de este nmero est bien, usualmente mediante una frmulaaritmticaobtenida a partir dedatosde la poblacin
V. Poblacin: Enestadstica, tambin llamadauniverso, es el conjunto de elementos de referencia sobre el que se realizan las observaciones. Tambin es el conjunto sobre el que estamos interesados en obtener conclusiones (inferir). Normalmente es demasiado grande para poder abarcarla, motivo por el cual se puede hacer necesaria la extraccin de una muestra de sta.
VI. Muestra: es un subconjunto de casos o individuos de unapoblacin estadstica.
VII. Dato: es cada uno de los valores que se ha obtenido al realizar un estudio estadstico.
VIII. Medidas de tendencia central: Son valores que suelen situarse hacia el centro de la distribucin de datos. Los ms destacados son lasmediaso promedios (incluyendo lamedia aritmtica, lamedia geomtricay lamedia armnica), lamedianay lamoda
IX. Medidas de dispersin: Resumen la heterogeneidad de los datos, lo separados que estos estn entre s. Medidas de dispersin absolutas, que vienen dadas en las mismas unidades en las que se mide la variable: recorridos, desviaciones medias,varianza,desviacin tpicay media. Medidas de dispersin relativa, que informan de la dispersin en trminos relativos, como un porcentaje. Se incluyen entre estas elcoeficiente de variacin, el coeficiente de apertura, los recorridos relativos y el ndice de desviacin respecto de la mediana.
X. Rango: Es elintervaloentre el valor mximo y el valor mnimo; por ello, comparteunidadescon los datos. Permite obtener una idea de ladispersinde los datos, cuanto mayor es el rango, ms dispersos estn los datos de un conjunto.
XI. Variable: Unavariablees una propiedad que puede fluctuar y cuya variacin es susceptible de adoptar diferentes valores, los cuales pueden medirse u observarse. Lasvariables adquieren valor para la investigacin cuando se relacionan con otras variables, es decir, si forman parte de unahiptesiso de unateora. En este caso se las denomina constructosoconstrucciones hipotticas.
XII. Cuartiles: Loscuartilesson puntos tomados a intervalos regulares de lafuncin de distribucinde unavariable aleatoria., que dividen a la distribucin en cuatro partes (corresponden a los cuartiles 0,25; 0,50 y 0,75)
XIII. Deciles: Enestadstica descriptiva, el conceptodecilse refiere a cada uno de los 9 valores que dividen un grupo de datos (clasificados con unarelacin de orden) en diez partes iguales, y de manera que cada parte representa un dcimo de la poblacin. En resumen, los deciles son cada uno de los nueve valores que dividen un conjunto de datos en diez grupos con iguales efectivos.
XIV. Frecuencia absoluta: Es el promedio de una suma predeterminada y adems consiste en saber cul es el nmero o smbolo de mayor equivalencia. (ni) de una variable estadsticaXi, es el nmero de veces que este valor aparece en el estudio. A mayor tamao de la muestra aumentar el tamao de la frecuencia absoluta; es decir, la suma total de todas las frecuencias absolutas debe dar el total de la muestra estudiada
XV. Frecuencia relativa: es el cociente entre la frecuencia absoluta y el tamao de la muestra.
XVI. Frecuencia acumulada: Es lasuma de las frecuencias absolutasde todos losvalores inferiores o igualesalvalor considerado.
XVII. Media: Enmatemticasyestadsticaunamediaopromedioes unamedida de tendencia central.
XVIII. Mediana: En el mbito de laestadstica, lamedianarepresenta el valor de la variable de posicin central en un conjunto de datos ordenados
XIX. Moda: La moda es el dato ms repetido, el valor de la variable con mayorfrecuencia absoluta.15En cierto sentido se corresponde su definicin matemtica con la locucin "estar de moda", esto es, ser lo que ms se lleva.
XX. Varianza: Enteora de probabilidad, lavarianza(que suele representarse como) de unavariable aleatoriaes unamedida de dispersindefinida como laesperanzadel cuadrado de la desviacin de dicha variable respecto a su media.
XXI. Desviacin Estndar: es una medida del grado de dispersin de los datos con respecto al valor promedio. Dicho de otra manera, ladesviacin estndares simplemente el "promedio" o variacin esperada con respecto a la media aritmtica.
XXII. Medidas de dispersin: muestran la variabilidad de una distribucin, indicando por medio de un nmero si las diferentes puntuaciones de una variable estn muy alejadas de lamedia. Cuanto mayor sea ese valor, mayor ser la variabilidad, y cuanto menor sea, ms homognea ser a lamedia. As se sabe si todos los casos son parecidos o varan mucho entre ellos.
XXIII. Medidas de posicin: Lasmedidas de posicindividen un conjunto de datos en grupos con el mismo nmero de individuos. Para calcular lasmedidas de posicines necesario que los datosestn ordenados demenor a mayor.
Formulario:
Media Mediana:Dato a la mitad de la lista ordenadaModa:Es aquel dato que se repite un mayor nmero de veces.Rango=DatoMayor DatoMenorLongitud del intervalo ()
C es determinado a partir de la Regla de Sturges:
Y debe de estar entre los intervalos Desviacin media D.M.
Varianza:
Desviacin Estndar La desviacin standard es el equivalente a la raz cuadrada de la varianza