PAQUETES ESTADÍSTICOS

17
PAQUETES ESTADÍSTICOS Un paquete estadístico es un programa informático que está especialmente diseñado para resolver problemas en el área de la estadística, o bien está programado para resolver problemas de esta área. Existen muchos programas que no son especialmente estadísticos pero que pueden hacer algunos cálculos aplicables en estadística aplicada. Estos programas han impulsado y siguen impulsando enormemente la labor de los investigadores que desean utilizar la estadística como apoyo en su trabajo. Los paquetes más sencillos tienen interfaz por ventanas, lo que implica facilidad de uso y aprendizaje pero un mayor encorsetamiento a la hora de hacer cálculos que el programa no tenga predefinidos. Los programas más complejos suelen tener la necesidad de conocer su lenguaje de programación, pero suelen ser mucho más flexibles al poderse incluir en ellos funciones, tests o contrastes que no traen instalados por definición. Ventajas La potencia de cálculo de un ordenador puede ayudar a un investigador a realizar cientos o miles de contrastes de hipótesis en un tiempo muy reducido. Asimismo puede calcular decenas de modelos de regresión en un tiempo muy corto y después quedarse con el más apropiado de ellos. En problemas de investigación de operaciones un programa estadístico es capaz de realizar miles de iteraciones por segundo de un algoritmo en el que una persona tardaría varios minutos en cada una de ellas. Asimismo, es capaz de elegir entre miles de resultados posibles cuál de todos ellos es el óptimo. Básicamente, lo que permiten es resolver problemas de estadística aplicada por fuerza bruta o por probar miles de combinaciones para quedarse finalmente con la que se crea que es la mejor. Inconvenientes En los programas más complejos se necesita tener conocimientos de programación, así como para realizar los cálculos más laboriosos. Por ejemplo si se desea realizar una operación dada a una columna concreta, lo más frecuente es que se pueda hacer esto por ventanas, sin embargo, si deseamos hacer esto mismo para todas las columnas de nuestro documento, que pueden ser centenares, es posible que necesitemos programar un bucle en la sintaxis del programa.

Transcript of PAQUETES ESTADÍSTICOS

Page 1: PAQUETES ESTADÍSTICOS

PAQUETES ESTADÍSTICOSUn paquete estadístico es un programa informático que está especialmente diseñado para resolver problemas en el área de la estadística, o bien está programado para resolver problemas de esta área. Existen muchos programas que no son especialmente estadísticos pero que pueden hacer algunos cálculos aplicables en estadística aplicada. Estos programas han impulsado y siguen impulsando enormemente la labor de los investigadores que desean utilizar la estadística como apoyo en su trabajo.Los paquetes más sencillos tienen interfaz por ventanas, lo que implica facilidad de uso y aprendizaje pero un mayor encorsetamiento a la hora de hacer cálculos que el programa no tenga predefinidos. Los programas más complejos suelen tener la necesidad de conocer su lenguaje de programación, pero suelen ser mucho más flexibles al poderse incluir en ellos funciones, tests o contrastes que no traen instalados por definición.

VentajasLa potencia de cálculo de un ordenador puede ayudar a un investigador a realizar cientos o miles de contrastes de hipótesis en un tiempo muy reducido. Asimismo puede calcular decenas de modelos de regresión en un tiempo muy corto y después quedarse con el más apropiado de ellos. En problemas de investigación de operaciones un programa estadístico es capaz de realizar miles de iteraciones por segundo de un algoritmo en el que una persona tardaría varios minutos en cada una de ellas. Asimismo, es capaz de elegir entre miles de resultados posibles cuál de todos ellos es el óptimo. Básicamente, lo que permiten es resolver problemas de estadística aplicada por fuerza bruta o por probar miles de combinaciones para quedarse finalmente con la que se crea que es la mejor.

InconvenientesEn los programas más complejos se necesita tener conocimientos de programación, así como para realizar los cálculos más laboriosos. Por ejemplo si se desea realizar una operación dada a una columna concreta, lo más frecuente es que se pueda hacer esto por ventanas, sin embargo, si deseamos hacer esto mismo para todas las columnas de nuestro documento, que pueden ser centenares, es posible que necesitemos programar un bucle en la sintaxis del programa.Otro inconveniente está en que en estadística a menudo nos pueden salir resultados contradictorios entre tests distintos. Un programa informático se dará cuenta de ello y nos avisará de algún modo, pero tendrá que ser el usuario el que decida a cuál de los test hacer caso, y esto en ocasiones es complejo, sobre todo si no se está familiarizado a fondo con la estadística o se tiene poca experiencia.

Programas estadísticos más utilizados R SAS SPSS SPAD Stata Statgraphics Redatam Minitab Matlab S-PLUS

Page 2: PAQUETES ESTADÍSTICOS

LISREL WinQSB ExcelExisten multitud de paquetes informáticos aparte es éstos, tanto de software privado como de software libre, sin embargo, los más utilizados son estos. A pesar de que SAS y SPSS suelen ser considerados los más potentes, hay muchísimas empresas que utilizan programas mucho menos potentes como Excel. Esto se debe sobre todo a que su uso parece más sencillo, la mayoría de las personas están familiarizadas con él y la mayor parte de las empresas ya tienen instalado Excel en sus ordenadores, mientras que las licencias de SAS y SPSS cuestan varios miles de euros. Sin embargo, a nivel de investigación estadística se utilizan siempre paquetes estadísticos propiamente dichos ya que suelen tener una capacidad mucho mayor.

R (LENGUAJE DE PROGRAMACIÓN)R es un lenguaje y entorno de programación para análisis estadístico y gráfico.Se trata de un proyecto de software libre, resultado de la implementación GNU del premiado lenguaje S. R y S-Plus -versión comercial de S- son, probablemente, los dos lenguajes más utilizados en investigación por la comunidad estadística, siendo además muy populares en el campo de la investigación biomédica, la bioinformática y las matemáticas financieras. A esto contribuye la posibilidad de cargar diferentes bibliotecas o paquetes con finalidades específicas de cálculo o gráfico.R se distribuye bajo la licencia GNU GPL y está disponible para los sistemas operativos Windows, Macintosh, Unix y GNU/Linux.

HistoriaFue desarrollado inicialmente por Robert Gentleman y Ross Ihaka del Departamento de Estadística de la Universidad de Auckland en 1993. Su desarrollo actual es responsabilidad del R Development Core Team.

CaracterísticasR proporciona un amplio abanico de herramientas estadísticas (modelos lineales y no lineales, tests estadísticos, análisis de series temporales, algoritmos de clasificación y agrupamiento, etc.) y gráficas.Al igual que S, se trata de un lenguaje de programación, lo que permite que los usuarios lo extiendan definiendo sus propias funciones. De hecho, gran parte de las funciones de R están escritas en el mismo R, aunque para algoritmos computacionalmente exigentes es posible desarrollar bibliotecas en C, C++ o Fortran que se cargan dinámicamente. Los usuarios más avanzados pueden también manipular los objetos de R directamente desde código desarrollado en C. R también puede extenderse a través de paquetes desarrollados por su comunidad de usuarios.R hereda de S su orientación a objetos. La tarea de extender R se ve facilitada por su permisiva política de lexical scoping. Además, R puede integrarse con distintas bases de datos y existen bibliotecas que facilitan su utilización desde lenguajes de programación interpretados como Perl y Python.Otra de las características de R es su capacidad gráfica, que permite generar gráficos con alta calidad. R posee su propio formato para la documentación basado en LaTeX.R también puede usarse como herramienta de cálculo numérico, campo en el que puede ser tan eficaz como otras herramientas específicas tales como GNU Octave y su equivalente

Page 3: PAQUETES ESTADÍSTICOS

comercial,MATLAB. Se ha desarrollado una interfaz, RWeka para interactuar con Weka que permite leer y escribir ficheros en el formato arff y enriquecer R con los algoritmos de minería de datos de dicha plataforma.

Extensiones y paquetesR forma parte de un proyecto colaborativo y abierto. Sus usuarios pueden publicar paquetes que extienden su configuración básica. Existe un repositorio oficial de paquetes cuyo número superó en otoño de 2009 la cifra de los 2000.Dado el enorme número de nuevos paquetes, éstos se han organizado en vistas (o temas), que permiten agruparlos según su naturaleza y función. Por ejemplo, hay grupos de paquetes relacionados con estadística bayesiana, econometría, series temporales, etc.Para facilitar el desarrollo de nuevos paquetes, se ha puesto a servicio de la comunidad una forja de desarrollo que facilita las tareas relativas a dicho proceso.

SPSSSPSS es un programa estadístico informático muy usado en las ciencias sociales y las empresas de investigación de mercado. Originalmente SPSS fue creado como el acrónimo de Statistical Package for the Social Sciences aunque también se ha referido como "Statistical Product and Service Solutions" (Pardo, A., & Ruiz, M.A., 2002, p. 3). Sin embargo, en la actualidad la parte SPSS del nombre completo del software (IBM SPSS) no es acrónimo de nada. Es uno de los programas estadísticos más conocidos teniendo en cuenta su capacidad para trabajar con grandes bases de datos y un sencillo interface para la mayoría de los análisis. En la versión 12 de SPSS se podían realizar análisis con 2 millones de registros y 250.000 variables. El programa consiste en un módulo base y módulos anexos que se han ido actualizando constantemente con nuevos procedimientos estadísticos. Cada uno de estos módulos se compra por separado.Actualmente, compite no sólo con softwares licenciados como lo son SAS, MATLAB, Statistica, Stata, sino también con software de código abierto y libre, de los cuales el más destacado es el Lenguaje R. Recientemente ha sido desarrollado un paquete libre llamado PSPP, con una interfaz llamada PSPPire que ha sido compilada para diversos sistemas operativos como Linux, además de versiones para Windows y OS X. Este último paquete pretende ser un clon de código abierto que emule todas las posibilidades del SPSS.

HistoriaFue creado en 1968 por Norman H. Nie, C. Hadlai (Tex) Hull y Dale H. Bent. Entre 1969 y 1975 la Universidad de Chicago por medio de su National Opinion Research Center estuvo a cargo del desarrollo, distribución y venta del programa. A partir de 1975 corresponde a SPSS Inc.Originalmente el programa fue creado para grandes computadores. En 1970 se publica el primer manual de usuario del SPSS por Nie y Hall. Este manual populariza el programa entre las instituciones de educación superior en EE. UU. En 1984 sale la primera versión para computadores personales.Desde la versión 14, pero más específicamente desde la versión 15 se ha implantado la posibilidad de hacer uso de las librerías de objetos del SPSS desde diversos lenguajes de programación. Aunque principalmente se ha implementado para Python, también existe la posibilidad de trabajar desde Visual Basic, C++ y otros lenguajes.

Page 4: PAQUETES ESTADÍSTICOS

El 28 de junio de 2009 se anuncia que IBM, meses después de ver frustrado su intento de compra de Sun Microsystems, adquiere SPSS, por 1.200 millones de dólares.

Módulos del SPSSEl sistema de módulos de SPSS, como los de otros programas (similar al de algunos lenguajes de programación) provee toda una serie de capacidades adicionales a las existentes en el sistema base. Algunos de los módulos disponibles son: Modelos de Regresión Modelos Avanzados Reducción de datos: Permite crear variables sintéticas a partir de variables colineales por medio del Análisis Factorial. Clasificación: Permite realizar agrupaciones de observaciones o de variables (cluster analysis) mediante tres algoritmos distintos. Pruebas no paramétricas: Permite realizar distintas pruebas estadísticas especializadas en distribuciones no normales. Tablas: Permite al usuario dar un formato especial a las salidas de los datos para su uso posterior. Existe una cierta tendencia dentro de los usuarios y de los desarrolladores del software por dejar de lado el sistema original de TABLES para hacer uso más extensivo de las llamadas CUSTOM TABLES. Tendencias Categorías: Permite realizar análisis multivariados de variables normalmente categorías. También se pueden usar variables métricas siempre que se realice el proceso de recodificación adecuado de las mismas. Análisis Conjunto: Permite realizar el análisis de datos recogidos para este tipo específico de pruebas estadísticas. Mapas: Permite la representación geográfica de la información contenida en un fichero (descontinuado para SPSS 16). Pruebas Exactas: permite realizar pruebas estadísticas en muestras pequeñas. Análisis de Valores Perdidos: Regresión simple basada en imputaciones sobre los valores ausentes. Muestras Complejas: permite trabajar para la creación de muestras estratificadas, por conglomerados u otros tipos de muestras. SamplePower (cálculo de tamaños muestrales) Árboles de Clasificación: Permite formular árboles de clasificación y/o decisión con lo cual se puede identificar la conformación de grupos y predecir la conducta de sus miembros. Validación de Datos: Permite al usuario realizar revisiones lógicas de la información contenida en un fichero ".sav" y obtener reportes de los valores considerados atípicos. Es similar al uso de sintaxis o scripts para realizar revisiones de los ficheros. De la misma forma que estos mecanismos es posterior a la digitalización de los datos. SPSS Programmability Extension (SPSS 14 en adelante). Permite utilizar el lenguaje de programación Python para un mejor control de diversos procesos dentro del programa que hasta ahora eran realizados principalmente mediante scripts (con el lenguaje SAX Basic). Existe también la posibilidad de usar las tecnologías .NET de Microsoft para hacer uso de las librerías del SPSS. Aunque algunos usuarios han cuestionado sobre la necesidad de incluir otros lenguajes, la empresa no tiene esto entre sus objetivos inmediatos.Desde el SPSS/PC hay una versión adjunta denomina SPSS Student que es un programa completo de la versión correspondiente pero limitada en su capacidad en cuanto al número de

Page 5: PAQUETES ESTADÍSTICOS

registros y variables que puede procesar. Esta versión es para fines de enseñanza del manejo del programa.

ManejoSPSS tiene un sistema de ficheros en el cual el principal son los archivos de datos (extensión. SAV). Aparte de este tipo existen otros dos tipos de uso frecuente: Archivos de salida (output, extensión. SPO): en estos se despliega toda la información de manipulación de los datos que realizan los usuarios mediante las ventanas de comandos. Son susceptibles de ser exportados con varios formatos (originalmente HTML, RTF o TXT, actualmente la versión 15 incorpora la exportación a PDF junto a los formatos XLS y DOC que ya se encontraban en la versión 12) Archivos de sintaxis (extensión. SPS): Casi todas las ventanas de SPSS cuentan con un botón que permite hacer el pegado del proceso que el usuario desea realizar. Lo anterior genera un archivo de sintaxis donde se van guardando todas las instrucciones que llevan a cabo los comandos del SPSS. Este archivo es susceptible de ser modificado por el usuario. Muchos de los primeros usuarios del SPSS suelen escribir estos archivos en vez de utilizar el sistema de pegado del programa.Existe un tercer tipo de fichero: el fichero de scripts (extensión. SBS). Este fichero es utilizado por los usuarios más avanzados del software para generar rutinas que permiten automatizar procesos muy largos y/o complejos. Muchos de estos procesos suelen no ser parte de las salidas estándar de los comandos del SPSS, aunque parten de estas salidas. Buena parte de la funcionalidad de los archivos de scripts ha sido ahora asumida por la inserción del lenguaje de programación Python en las rutinas de sintax del SPSS. Procedimientos que antes solo se podían realizar mediante scripts ahora se pueden hacer desde el sintax mismo.El programa cuando se instala trae un determinado número de ejemplos o utilidades de casi todos los ficheros en cuestión. Estos son usados para ilustrar algunos de los ejemplos de uso del programa.Aquí está una pequeña lista de cosas que se pueden hacer mediante este programa:1. Introduccion de datos:Vamos a vista de datos y se introducen en DISTINTAS columnas (porque son distintas variables) de arriba abajo2. Cáculos básicos:- Para hacer operaciones: ANALIZAR>>estadísticos descriptivos>>frecuencias (para tablas de frecuencias) ahí llevas la variable que te interese al otro lado y le das a estadísticos donde marcaremos todo lo que queramos saber (media, moda, mediana, cuartiles…). Nos aparecerá una pantalla nueva con los resultados. Si necesitamos saber P2,5 o P97,5 habría que hacerlo aquí.- ANALIZAR>>estadísticos descriptivos>>explorar: ahí introducimos la variable en el primer campo (lista de dependientes) y le damos a aceptar. Aquí nos da toda la información de antes pero ADEMÁS nos da el intervalo de confianza y estimación muestral así como el error típico de la media ENCIMA nos da las gráficas del diagrama tronco hojas y el de cajas.- Para la ASIMETRIA y la KURTOSIS: En simetría: si es negativo está sesgada a la IZQUIERDA si es 0 es simétrica y si es positivo está sesgada a la DERECHA.En curtosis: si está rondando el 0 es mesocurtica, si es negativo platicúrtica y si es positiva leptocúrtica- ANALIZAR>>estadísticos descriptivos>>frecuencias>>gráficos esto es útil para ver la FORMA DE LA DISTRIBUCIÓN ya que podemos superponer la curva de la normal. Si la curva se parece al histograma podemos decir que es simétrica.-Si por ejemplo queremos hacer una nube de puntos o un diagrama de disperisón para ver dos variables cuantitativas,vamos a Gráficos>>cuadro de diálogos antiguos>>dispersión

Page 6: PAQUETES ESTADÍSTICOS

puntos>>dispersión simple>>definir>> OJO hay que saber cual es la dependiente y cual la independiente. En función de será la X (dependiente (Y) y independiente (X)[la edad por ejemplo sería independiente en la mayoría de los casos])- Otra cosa que podemos sacar es el coeficiente de correlación lineal de Pearson ANALIZAR>>correlaciones>>bivariadas. Ahí nos aparecerá una tabla. En una diagonal siempre nos saldrá 1 (no hacer caso) en el otro te aparecerá otro valor, que será el importante.- El coeficiente de regresión y el coeficiente de determinación: ANALIZAR>>regresión>>lineal. De todas las tablas que hay, hay que fijarse en la que pone RESUMEN DEL MODELO y fijarse en la R2 (coef. De determinación). Para sacar el coeficiente de regresión (b) hay que mirar en una tabla llama COEFICIENTES. Ahí vemos dos numero debajo de la B. la primera se llama constante (también denominada a) y el segundo es el coeficiente B de regresión. En resumen hay que coger el SEGUNDO.- Si queremos contrastar dos medias: ANALIZAR>> comparar medias>>prueba t para muestras independientes>>definir grupos.- Para hacer una selección de datos de una variable: DATOS>>Seleccionar casos>>Si satisface la condición>>Pones la variable a la derecha=(lo que quieras comparar) Ahora ya vamos a ANALIZAR>>explorar.- ANALIZAR>>Estadístico descriptivo>>tablas de contingencia>>casillas>>% en filas>> aceptar- ANALIZAR>>Estadísticos descriptivos>>Tablas de contingencia>>Mostras grafico de barras agrupados Y estadísticos>>(el estadístico que se quiera)- ANALIZAR>>Comparar medias>>Prueba T para 1 muestra>>(ponemos el valor en valor de prueba)>>Aceptar `[Miramos en Sig]- Si queremos cambiar el nombre a las variables para que sea más cómodo, se puede en VISTA DE VARIABLES (pestaña derecha) y clickas en el nombre.

Fichero de datos de SPSSLos ficheros de datos en formato SPSS tienen en Windows la extensión. SAV. Al abrir un fichero de datos con el SPSS, vemos la vista de datos, una tabla en la que las filas indican los casos y las columnas las variables. Cada celda corresponde al valor que una determinada variable adopta en un cierto caso.Además de esta vista de datos, en las últimas versiones del programa existe una vista de variables en la que se describen las características de cada una. En esta vista las filas corresponden a cada variable y las columnas nos permiten acceder a sus características: Nombre, limitado a 8 caracteres. Tipo de variable (compárese este listado de opciones con los tipos de variables estadísticas existentes) Numérico, número en formato estándar) Coma decimal, número con comas cada tres posiciones y con un punto como delimitador de los decimales Punto decimal, número con puntos cada tres posiciones y con una coma como límite delimitador de los decimales. Notación científica, número que se expresa con un formato tal que se sigue de una E y un número que expresa la potencia de 10 a la que se multiplica la parte numérica previa Fecha Moneda dólar, formato numérico con el que se expresan cantidades en dólares Moneda del usuario, formato numérico con el que se expresan cantidades en la moneda definida en la pestaña de monedas del cuadro de diálogo "Opciones" Cadena de caracteres o variable alfanumérica

Page 7: PAQUETES ESTADÍSTICOS

Tamaño total Tamaño de la parte decimal Etiqueta de la variable Etiquetas para los valores Valores perdidos Espacio que ocupa en la vista de datos Alineación de la variable en la vista de datos Escala de medición.Algunos usuarios pasan por alto las características de las variables cuando se trabaja en la base de datos. Sin embargo, cuando se utilizan scripts o Python las características de las variables pueden tomar gran relevancia en la construcción de procedimientos ad-hoc.

STATAStata es un paquete de software estadístico creado en 1985 por StataCorp. Es utilizado principalmente por instituciones académicas y empresariales dedicadas a la investigación, especialmente en economía, sociología, ciencias políticas, biomedicina y epidemiología.Stata permite, entre otras funcionalidades, la gestión de datos, el análisis estadístico, el trazado de gráficos y las simulaciones.El tipo de archivos que utiliza son dta archivos de datos do archivos de comandos ado programas hlp archivos de ayuda gph gráficos dct archivos diccionarios smcl archivos logEl nombre Stata es una "palabra baúl" que combina las palabras statistics (estadística) y data (datos); no es un acrónimo y por lo tanto no debe ser escrito en mayúsculas (es decir, no es "STATA" sino "Stata").

MINITABMinitab es un programa de computadora diseñado para ejecutar funciones estadísticas básicas y avanzadas. Combina lo amigable del uso de Microsoft Excel con la capacidad de ejecución de análisis estadísticos. En 1972, instructores del programa de análisis estadísticos de la Universidad Estatal de Pennsylvania (Pennsylvania State University) desarrollaron MINITAB como una versión ligera de OMNITAB, un programa de análisis estadístico del Instituto Nacional de Estándares y Tecnología (NIST) de los Estados Unidos. Minitab es frecuentemente usado con la implantación la metodología de mejora de procesos Seis Sigma.

MATLABMATLAB (abreviatura de MATrix LABoratory, "laboratorio de matrices") es un software matemático que ofrece un entorno de desarrollo integrado(IDE) con un lenguaje de programación propio (lenguaje M). Está disponible para las plataformas Unix, Windows y Mac OS X.Entre sus prestaciones básicas se hallan: la manipulación de matrices, la representación de datos y funciones, la implementación de algoritmos, la creación de interfaces de usuario (GUI) y la comunicación con programas en otros lenguajes y con otros dispositivos hardware. El paquete

Page 8: PAQUETES ESTADÍSTICOS

MATLAB dispone de dos herramientas adicionales que expanden sus prestaciones, a saber, Simulink (plataforma de simulación multidominio) y GUIDE (editor de interfaces de usuario - GUI). Además, se pueden ampliar las capacidades de MATLAB con las cajas de herramientas(toolboxes); y las de Simulink con los paquetes de bloques (blocksets).Es un software muy usado en universidades y centros de investigación y desarrollo. En los últimos años ha aumentado el número de prestaciones, como la de programar directamente procesadores digitales de señal o crear código VHDL.

HistoriaFue creado por Cleve Moler en 1984, surgiendo la primera versión con la idea de emplear paquetes de subrutinas escritas en Fortran en los cursos de álgebra lineal y análisis numérico, sin necesidad de escribir programas en dicho lenguaje. El lenguaje de programación M fue creado en 1970para proporcionar un sencillo acceso al software de matrices LINPACK y EISPACK sin tener que usar Fortran.En 2004, se estimaba que MATLAB era empleado por más de un millón de personas en ámbitos académicos y empresariales.1

SintaxisMATLAB es un programa de cálculo numérico orientado a matrices. Por tanto, será más eficiente si se diseñan los algoritmos en términos dematrices y vectores.Cajas de herramientas y paquetes de bloquesLas funcionalidades de Matlab se agrupan en más de 35 cajas de herramientas y paquetes de bloques (para Simulink), clasificadas en las siguientes categorías:2

MATLAB (Cajas de herramientas) Simulink

Matemáticas y Optimización Modelado de punto fijo

Estadística y Análisis de datos Modelado basado en eventos

Diseño de sistemas de control y análisis

Modelado físico

Procesado de señal y comunicaciones Gráficos de simulación

Procesado de imagen Diseño de sistemas de control y análisis

Pruebas y medidas Procesado de señal y comunicaciones

Biología computacional Generación de código

Modelado y análisis financiero Prototipos de control rápido y SW/HW HIL

Desarrollo de aplicaciones Tarjetas integradas

Informes y conexión a bases de datos Verificación, validación y comprobación

Limitaciones y alternativasDurante mucho tiempo hubo críticas porque MATLAB es un producto propietario de The Mathworks, y los usuarios están sujetos y bloqueados al vendedor. Recientemente se ha proporcionado una herramienta adicional llamada MATLAB Builder bajo la sección de herramientas "Application Deployment" para utilizar funciones MATLAB como archivos de biblioteca que pueden ser usados con ambientes de construcción de aplicación .NET o Java. Pero la desventaja es que el computador donde la aplicación tiene que ser utilizada necesita

Page 9: PAQUETES ESTADÍSTICOS

MCR(MATLAB Component Runtime) para que los archivos MATLAB funcionen correctamente. MCR se puede distribuir libremente con los archivos de biblioteca generados por el compilador MATLAB. LabVIEW GNU Octave, software libre similar a matlab. SAS Scilab Mathcad SciPy & Numerical Python Lenguaje R Álgebra computacional: Véase Anexo:Programas de álgebra computacional

Llamar funciones C y FortranMATLAB puede llamar funciones y subrutinas escritas en C o Fortran. Se crea una función envoltorio que permite que sean pasados y devueltos tipos de datos de MATLAB. Los archivos objeto dinámicamente cargables creados compilando esas funciones se denominan "MEX-files", aunque la extensión de nombre de archivo depende del sistema operativo y del procesador.

LISRELLISREL (acrónimo de linear structural relations), es un programa usado en análisis de ecuaciones estructurales. Fue desarrollado en los años setenta por Karl Jöreskog y Dag Sörbom, profesores ambos de la Universidad de Uppsala, Suecia. Su versión más reciente es la 8.8 de agosto de 2009.LISREL está principalmente basado en comandos, aunque las versiones más recientes han incorporado una interfaz gráfica. Lo distribuye la empresa SSI (Scientific Software International).

MICROSOFT EXCELMicrosoft Excel es una aplicación distribuida por Microsoft office para hojas de cálculo. Este programa es desarrollado y distribuido por Microsoft, y es utilizado normalmente en tareas financieras y contables.

Historia y versionesMicrosoft comercializó originalmente un programa de hojas de cálculo llamado Multiplan en 1982, que fue muy popular en los sistemas CP/M, pero en los sistemas MS-DOS perdió popularidad frente al Lotus 1-2-3. Microsoft publicó la primera versión de Excel para Mac en 1985, y la primera versión de Windows (numeradas 2-05 en línea con el Mac y con un paquete de tiempo de ejecución de entorno de Windows) en noviembre de 1987. Lotus fue lenta al llevar 1-2-3 para Windows y esto ayudó a Microsoft a alcanzar la posición de los principales desarrolladores de software para hoja de cálculo de PC. Este logro solidificó a Microsoft como un competidor válido y mostró su futuro de desarrollo como desarrollador de software GUI. Microsoft empujó su ventaja competitiva lanzando al mercado nuevas versiones de Excel, por lo general cada dos años. La versión actual para la plataforma Windows es Excel 14.0, también denominada Microsoft Excel 2010. La versión actual para Mac OS X es Microsoft Excel 2011.A principios de 1993, Excel se convirtió en el objetivo de una demanda por otra empresa que ya tenía a la venta un paquete de software llamado "Excel" en el sector financiero. Como resultado de la controversia Microsoft estaba obligada a hacer referencia al programa como "Microsoft

Page 10: PAQUETES ESTADÍSTICOS

Excel" en todos sus comunicados de prensa oficiales y documentos jurídicos. Sin embargo, con el tiempo esta práctica ha sido ignorada, y Microsoft aclaró definitivamente la cuestión cuando se adquirió la marca del otro programa. Microsoft también alentó el uso de las letras XL comoabreviatura para el programa; el icono del programa en Windows todavía consiste en una estilizada combinación de las dos letras, y la extensión de archivo por defecto del formato Excel puede ser .xls en versiones anteriores o iguales a Excel 2003 (11.0), .xlsx para libros de Excel regulares en versiones posteriores o iguales a Excel 2007 (12.0), .xlsm para libros de Excel preparados para macros en versiones posteriores o iguales a Excel 2007 (12.0) o .xlsb para libros de Excel binarios en versiones posteriores o iguales a Excel 2007 (12.0).Excel ofrece una interfaz de usuario ajustada a las principales características de las hojas de cálculo, en esencia manteniendo ciertas premisas que pueden encontrarse en la hoja de cálculo original, VisiCalc: el programa muestra las celdas organizadas en filas y columnas, y cada celda contiene datos o una fórmula, con referencias relativas ,absolutas o mixtas a otras celdas.Excel fue la primera hoja de cálculo que permite al usuario definir la apariencia (las fuentes, atributos de carácter y celdas). También introdujo recomputación inteligente de celdas, donde celdas dependientes de otra celda que han sido modificadas, se actualizan al instante (programas de hoja de cálculo anterior recalculaban la totalidad de los datos todo el tiempo o esperaban para un comando específico del usuario). Excel tiene una amplia capacidad gráfica, y permite a los usuarios realizar, entre otras muchas aplicaciones, listados usados en combinación de correspondencia.Cuando Microsoft primeramente empaquetó Microsoft Word y Microsoft PowerPoint en Microsoft Office en 1993, rediseñó las GUIs de las aplicaciones para mayor coherencia con Excel, producto insigne de Microsoft en el momento.Desde 1993, Excel ha incluido Visual Basic para Aplicaciones (VBA), un lenguaje de programación basado en Visual Basic, que añade la capacidad para automatizar tareas en Excel y para proporcionar funciones definidas por el usuario para su uso en las hojas de trabajo. VBA es una poderosa anexión a la aplicación que, en versiones posteriores, incluye un completo entorno de desarrollo integrado (IDE) conocido también como Editor de VBA. La grabación de macros puede producir código (VBA) para repetir las acciones del usuario, lo que permite la automatización de simples tareas. (VBA) permite la creación de formularios y controles en la hoja de trabajo para comunicarse con el usuario. Admite el uso del lenguaje (pero no la creación) de las DLL de ActiveX (COM); versiones posteriores añadieron soporte para los módulos de clase permitiendo el uso de técnicas de programación básicas orientadas a objetos.La funcionalidad de la automatización proporcionada por (VBA) originó que Excel se convirtiera en un objetivo para virus en macros. Este fue un grave problema en el mundo corporativo hasta que los productos antivirus comenzaron a detectar estos virus. Microsoft tomó medidas tardíamente para prevenir el uso indebido de Excel mediante la adición de la capacidad para deshabilitar la ejecución automática de las macros al abrir un archivo.AplicacionesExcel permite a los usuarios elaborar Tablas y formatos que incluyan cálculos matemáticos mediante fórmulas; las cuales pueden usar "operadores matemáticos" como son: + (suma), - (resta), * (multiplicación). / (división), y ^ (Exponenciación); además de poder utilizar elementos denominados "funciones" (especie de fórmulas, pre-configuradas) como por ejemplo: Suma(),Promedio(),BuscarV(), etc.Así mismo Excel es útil para gestionar "Listas" o "Bases de Datos"; es decir Ordenar y Filtrar la información.

Page 11: PAQUETES ESTADÍSTICOS

Especificaciones, límites y problemasEspecificaciones y límitesLas características, especificaciones y límites de Excel han variado considerablemente de versión en versión, exhibiendo cambios en su interfaz operativa y capacidades desde el lanzamiento de su versión 12.0 mejor conocida como Excel 2007. Se puede destacar que mejoró su límite de columnas ampliando la cantidad máxima de columnas por hoja de cálculo de 256 a 16.384 columnas. De la misma forma fue ampliado el límite máximo de filas por hoja de cálculo de 65.536 a 1.048.576 filas por hoja. Otras características también fueron ampliadas, tales como el número máximo de hojas de cálculo que es posible crear por libro que pasó de 256 a 1.024 o la cantidad de memoria del PC que es posible emplear que creció de 1 GB a 2 GB soportando además la posibilidad de usar procesadores de varios núcleos.Problema de manejo de fechas anteriores a 1900Uno de los problemas conocidos y relevantes de esta hoja de cálculo, es el hecho de su incapacidad para manejar fechas anteriores a 19002 (incluyendo versiones para Mac OS X), es decir, no puede manejar campos en formato de fecha anteriores a dicho año (como acontecimientos históricos). Este problema se ha venido presentando desde versiones más antiguas de 16 bits, persistiendo aún en la versión actual.Bug de multiplicaciónEl 23 de septiembre del 2007 se informó que la hoja de cálculo Excel 2007 mostraba resultados erróneos bajo ciertas condiciones. Particularmente para algunas parejas de números, para los que el producto sea 65535 (tales como 850 y 77.1), Excel muestra como resultado de la operación 100000. Esto ocurre con alrededor del 14.5% de tales pares. Además, si se suma uno a este resultado Excel lo calcula como 100001. No obstante, si se resta uno al resultado original, entonces muestra el valor correcto 65534. (también si se multiplica o divide por 2, muestra los valores correctos 131070 y 32767.5, respectivamente).3

Microsoft informó en el blog de Microsoft Excel,4 que el problema existe al mostrar seis puntos flotantes específicos entre 65534.9995 y 65535, y seis valores entre 65535.99999999995 y 65536 (no incluye los enteros). Cualquier cálculo realizado a celda es correcto, sólo el valor mostrado estaría errado. Sin embargo, en algunas instancias, como al redondear el valor con cero dígitos decimales, almacenará un valor incorrecto en memoria. Este error se introdujo con los cambios realizados a la lógica de información en pantalla de la versión 2007, y que no existe en las versiones anteriores. El 9 de octubre de 2007 Microsoft lanzó un parche para este bug. 5 Este problema también queda subsanado con la instalación del Service Pack 1, y desapareció por completo en todas las versiones de Excel lanzadas al mercado posteriormente.

Importancia de los Paquetes Estadísticos en los Procesos AdministrativosLa importancia de este conjunto de programas estadísticos informáticos para el análisis estadístico de datos con el objetivo de resolver problemas de estadística, es su capacidad al momento de hacer cálculos estadísticos. En ella describe un programa muy bien estructurado, con un sin fines de funciones en el cual hace que el usuario empresa en su organización, estudios estadísticos más organizados a pesar de lo amplio que pueda ser, o la gran cantidad de variables que contenga.