Guía para la visualización de datos: Bibliometrix

Post on 28-Jun-2022

10 views 0 download

Transcript of Guía para la visualización de datos: Bibliometrix

Universidad de La Salle Universidad de La Salle

Ciencia Unisalle Ciencia Unisalle

Recursos bibliográficos Dirección de Bibliotecas

2020

Guía para la visualización de datos: Bibliometrix Guía para la visualización de datos: Bibliometrix

Follow this and additional works at: https://ciencia.lasalle.edu.co/recursos_bibliograficos

Recommended Citation Recommended Citation "Guía para la visualización de datos: Bibliometrix" (2020). Recursos bibliográficos. 30. https://ciencia.lasalle.edu.co/recursos_bibliograficos/30

This Recurso interactivo is brought to you for free and open access by the Dirección de Bibliotecas at Ciencia Unisalle. It has been accepted for inclusion in Recursos bibliográficos by an authorized administrator of Ciencia Unisalle. For more information, please contact ciencia@lasalle.edu.co.

GUÍA PARA LA VISUALIZACIÓN DE DATOS: Bibliometrix

Dirección de BibliotecasVig

ila

da

Min

ed

uca

ció

n

BienvenidosBibliometrix

aplicación para estudios bibliométricos basada en RNota aclaratoria: Esta guía es una introducción a la aplicación Bibliometrix.

2

3

Tabla de contenido

1. Introducción 4

2. Instalación de Rstudio 6

3. Ejecución de Bibliometrix desde Rstudio 10

4. Trabajando datos con Bibliomtetrix 16

INTRODUCCIÓN

4

1

¿QUÉ ES BIBLIOMETRIX?

5

En el año 2016 dos italianos Massimo Aria y CorradoCuccurullo crearon una interfaz en ambiente Web con base en R llamado Bibliometrix con el propósito de brindar un conjunto de herramientas para la investigación cuantitativa en estudios cienciométricos y bibliométricos. Para poder ejecutar la aplicación es necesario tener instalado R y RStudio, en nuestro caso ya hemos instalado R entonces ahora veremos cómo instalar RStudio.

INSTALACIÓN DE RSTUDIO

6

2

INSTALANDO RSTUDIO

7

Ingrese a la página de RStudio digitando en su navegador: rstudio.com. Una vez estando en la página busque el vínculo de descarga con la palabra DOWNLOAD e ingrese en esa opción.

INSTALANDO RSTUDIO

8

En la siguiente ventana seleccione la opción de descarga gratuita.

En el caso de tener Windows haga clic en el icono DOWNLOAD RSTUDIO FOR WINDOWS

Esta selección lo lleva al vínculo directo para empezar la descarga. Si su sistema operativo es distinto a Windows seleccione en la lista el SO de su pc.

INSTALANDO RSTUDIO

9

Después de unos minutos se termina la descarga del archivo para ejecutar la instalación. Vaya a la carpeta de descargas de su sistema y ejecute el programa de instalación.

Siga todos los pasos de la instalación y permita que se genere un acceso directo en el escritorio.

EJECUCIÓN DE BIBLIOMETRIX DESDE RSTUDIO

10

3

EJECUTANDO BIBLIOMTERIX

11

Una vez terminada la instalación ejecute la aplicación de RStudio.

EJECUTANDO BIBLIOMETRIX

12

Como se ha dicho Bibliometrix es una aplicación que funcionan con base en R, es necesario instalar el paquete en nuestra interfaz de RStudio. En el tablero de la parte superior izquierda digite el siguiente comando: install.packages("bibliometrix"), luego accione el icono con la palabra Run:

De forma inmediata el tablero de la parte inferior izquierda del programa comienza a trabajar en la instalación de Bibliometrix.

EJECUTANDO BIBLIOMETRIX

13

Cuando termine la instalación verifique que esté instalado el paquete yendo al tablero de la parte inferior derecha, seleccione la opción “Packages” y en el cajón de búsqueda digite bibliometrix y este debe aparecer en la lista de nombres.

EJECUTANDO BIBLIOMETRIX

14

Ahora es necesario llamar el paquete Bibliometrix y el comando que ejecuta la interfaz en el ambiente Web que se denomina “biblioshiny”. Copie las siguientes líneas en el tablero de la parte superior izquierda de RStudio:

library(bibliometrix)

biblioshiny()

Con el cursor del mouse selecciones las dos líneas copiadas y haga clic en Run nuevamente, verifique que antes de ejecutar Bibliometrix tenga un navegador abierto, preferiblemente Google Chrome.

EJECUTANDO BIBLIOMTERIX

15

En su navegador se abre la ventana de la interfaz de Bibliometrix

TRABAJANDO DATOS CON BIBLIOMETRIX

16

4

RECUPERACIÓN DE LOS DATOS

17

Ahora se puede comenzar con el análisis de los datos de una búsqueda específica sobre un tema, para esto ingres en la base de datos Scopus y realice la búsqueda de los documentos publicados en su tema de interés, para nuestro caso vamos a buscar los documentos publicados con Afiliación de la Universidad de la Salle.

RECUPERACIÓN DE LOS DATOS

18

Selecciono los documentos publicados por la universidad.

RECUPERACIÓN DE LOS DATOS

19

En el dataset de todos los documentos selecciono la opción “ALL” e ingreso a la opción “Export” .

RECUPERACIÓN DE LOS DATOS

20

En esta opción selecciono todas las opciones de información de los registros y marque la opción de formato de “Bibtex” para la descarga, luego de esto haga clic en el ícono “export” de la parte inferior derecha.

Ya con el archivo descargado se verifica en dónde quedo guardado, que por lo general está en la carpeta de descargas del computador

CARGAR LOS DATOS EN BIBLIOMETRIX

21

Ahora vuelva a la interfaz de Bibliometrixque se abrió en su navegador, vaya a la opción Data y en ésta seleccione “ImportLoad files”.

Aparece una ventana con las opciones del archivo que voy a importar, para

esto seleccione las opciones como están en la imagen, busque el archivo con la opción “Browse”, cárguelo y luego haga clic en el ícono “Start”

CARGAR LOS DATOS EN BIBLIOMETRIX

22

En ese momento Bibliometrix comienza la ejecución de todas sus herramientas y se puede empezar a hacer el análisis de acuerdo con sus necesidades o expectativas.

En primera instancia la interfaz muestra un dataset con toda la información en texto sobre cada una de las publicaciones recuperadas en la búsqueda. Si se observa en la parte izquierda inferior en el título “Conversion results” debe coincidir el número de documentos con los que se descargaron de Scopus

CARGAR LOS DATOS EN BIBLIOMETRIX

23

LA OPCIÓN DE FILTROS

24

La primera opción que presenta Bibliometrix para analizar los datos son los Filtros que puedo aplicar si deseo minimizar las variables de análisis. En la Opción “Filter” se pueden limitar los datos por tipo de documento, año de publicación, citas recibidas y en caso de más experticia por las zonas de la Ley de Bradford.

LA VARIABLE DATASET

25

La segunda alternativa que nos presenta la aplicación es datos sobre el total del “Dataset”, en esta podemos obtener la información principal del total de los documentos, producción científica anual, citación promedio por año y una gráfica que puede combinar tres variables.

Seleccione la primera Opción de la variable “Dataset”: Main Information. Ahí se visualiza la información total de los datos recuperados en la búsqueda de Scopus. La información se puede descargar en formatos CSV, Excel, PDF o se puede imprimir de una vez tal como aparece.

LA VARIABLE DATASET

26

LA VARIABLE DATASET

27

En la segunda opción de la misma variable “Dataset” se puede observar la Producción Científica Anual.

La información se puede ver en forma de gráfico o en una tabla las cuales se pueden descargar ya sea en formato png la gráfica o la tabla en CSV, Excel o PDF como se puede observar en las gráficas siguientes:

LA VARIABLE DATASET

28

LA VARIABLE DATASET

29

En la tercera opción de la misma variable “Dataset” aparece el Promedio de Citas por Año con las mismas características de la opción anterior en cuanto a la visualización y opciones de descargas.

LA VARIABLE DATASET

30

En primera instancia se visualiza el gráfico del promedio de citaciones por año. Este promedio se obtiene de dividir el promedio de artículos por año sobre las citas por año, datos que se puede ver en la tabla.

LA VARIABLE DATASET

31

La última opción de la variable “Dataset” es una de las operaciones más interesantes de esta aplicación, pues permite hacer un gráfico que relaciona tres campos que el usuario puede elegir según su análisis.

LA VARIABLE DATASET

32

En la parte izquierda de la página están los filtros que se pueden aplicar para generar el gráfico. La primera variable que se puede aplicar corresponde a la columna del medio de la gráfica, la segunda a la columna de la izquierda y la tercera a la columna de la derecha. Es de aclarar que las variables que allí aparecen son las que se pueden relacionar entre sí para generar este gráfico. También en cada campo se puede elegir el número de ítems para cada uno, en el caso de este ejemplo se trabaja con 20 ítems.

Para este caso se relacionan los campos de Autor, Afiliación y País.

LA VARIABLE DATASET

33

Si se desea distinguir el nombre de una institución, autor o país paso el cursor sobre el nombre seleccionado y las líneas de la relación se tornan en un tono más oscuro que los demás.

LA VARIABLE SOURCES

34

La siguiente variable corresponde a “Sources” que traduce Fuentes, para este caso el título de las revistas en las cuales se publican los artículos.

En la primera opción de dicha variable se observa las revistas más relevantes en cuanto al número de artículos publicados en cada fuente.

LA VARIABLE SOURCES

35

Como en las anteriores visualizaciones de este tipo se tiene un gráfico y la tabla correspondiente que se pueden descargar si así se desea.

LA VARIABLE SOURCES

36

La segunda opción de la variable “Sources” muestra las fuentes más citadas de la información que se ha descargado en el dataset de Scopus.

LA VARIABLE SOURCES

37

En la opción siguiente de la misma variable se puede observar la gráfica con su respectiva tabla sobre la Ley de Bradford.

Conocida también como Ley de dispersión de la literatura científica. Se trata de una relación entre el número de revistas y el número de artículos científicos publicados en esas revistas acerca de un tema de investigación específico.

Esta ley trata de demostrar que en la producción de artículos en las revistas existe una distribución altamente desigual donde la mayoría de los artículos están concentrados en una pequeña población de revistas, mientras que una pequeña proporción de artículos se dispersa sobre una alta cantidad de artículos. (EcuRed, 2020)

LA VARIABLE SOURCES

38

LA VARIABLE SOURCES

39

Siguiendo con la variable “Sources” se observa la opción Impacto de la Fuente y hace referencia de cómo están las revistas en cuanto al impacto en los Índices H, G y M; así como también el total de citas.

Recordando, el Índice H es el resultado aplicado a un investigador o en este caso a una revista sobre el número de H artículos que han sido citado H veces, es decir, si el Índice H es igual a 5 quiere decir que se tienen 5 publicaciones que han sido citada por lo menos 5 veces.

LA VARIABLE SOURCES

40

Para el cálculo del Índice G, se listan los artículos de un autor en orden descendente de acuerdo con el número de citas recibidas por cada uno de ellos, como plantea la metodología de Hirsch. El mayor número de orden en el ranking donde la sumatoria de citas recibidas por el autor sea mayor o igual al cuadrado del número de orden, será considerado el Índice G de ese autor. De esta forma, se obtiene un indicador que considera la cantidad de citas recibidas por los artículos más citados de un autor, aspecto que no es tan significativo para el Índice H. (Arenbivia, R. & Carvajal, E., 2008. p. 3)

LA VARIABLE SOURCES

41

Para el cálculo del Índice R o M, la metodología es mucho más sencilla, por cuanto sólo se consideran los artículos comprendidos en el núcleo H, y no es más que la raíz cuadrada del total de citas recibidas por estos artículos. (Arenbivia, R. & Carvajal, E., 2008. p. 3)

En la parte izquierda de la aplicación se establecen los parámetros del Índice que se desea graficar, así como el número de fuentes. Para este ejemplo se graficaran los cuatro índices con un número de 20 fuentes.

LA VARIABLE SOURCES

42

Índice H Índice G

LA VARIABLE SOURCES

43

Índice M Total de citas

LA VARIABLE SOURCES

44

Tabla con todos la valores de las gráficas

LA VARIABLE AUTHORS

45

La siguiente variable se refiere a los Autores en la cual se puede obtener información respecto a: Relevancia por artículos publicados, Autores más citados, Producción en el tiempo, Ley le Lotka, Impacto de los autores, relevancia de las afiliaciones, Relación de autores por países, Producción científica por país y los países más citados. Para este ejemplo tomaremos algunas opciones.

LA VARIABLE AUTHORS

46

En la primera opción de ésta se observa los autores más relevantes por número de artículos publicados. Igual que en las opciones anteriores se muestra gráfica y la tabla correspondiente que se pueden descargar según la necesidad.

LA VARIABLE AUTHORS

47

Otra de las opciones relevantes en esta variable es la Ley de Lotka que se refiere a la distribución de los autores según su productividad.

La Ley de Lotka expresa, que el mayor número de autores publican el menor número de trabajos, mientras que el menor número de autores publica un mayor número de trabajos, siendo este el grupo más prolífico. (EcuRed, 2020)

LA VARIABLE AUTHORS

48

LA VARIABLE AUTHORS

49

Continuando con esta variable de los autores, se muestra a continuación las Afiliaciones por Autor más relevantes.

En este ejemplo es evidente ver como La Universidad de La Salle es la que más publicaciones tiene pues se está haciendo el estudio de dicha Institución.

LA VARIABLE AUTHORS

50

La siguiente y última opción de esta variable que se mostrará para este ejemplo es la Producción Científica por Países.

LA VARIABLE AUTHOR

51

Esta opción muestra un mapamundi en el cual se resaltan en color azul los países que han tenido producción científica según el dataset que se haya descargado de la base de datos. Cuanto más oscuro es el color azul, en este caso, más producción científica tiene el país.

LA VARIABLE DOCUMENTS

52

La Variable que se observa a continuación presenta características de los Documentos contenidos en el conjunto de datos descargados. En esta categoría se puede observar el Documento más citado por año o con el total de citas a nivel global, el Documento más citado por año o con el total de citas a nivel local, las referencias más citadas, Espectroscopia del año de publicación de la referencia;

y en esta misma variable se pueden observar algunas características de las palabras clave y palabras con más concurrencias en los documentos, de éstas palabras se puede observar: palabras más frecuentes en relación a Palabras Clave, en relación a Palabras de Autor, en relación al Título y en relación al Resumen; Con éstas palabras se puede realizar una nube de palabras que se parametriza según el gusto del usuario, un árbol de palabras, la dinámica de las palabras en el tiempo y por último las palabras tendencia.

53

LA VARIABLE DOCUMENTS

LA VARIABLE DOCUMENTS

53

Para esta guía se mostraran algunas de las opciones

Documentos más citados a nivel global Referencias más citadas a nivel local

LA VARIABLE DOCUMENTS

54

Nube de palabras Palabras tendencia en el tiempo

LA VARIABLE CONCEPTUAL STRUCTURE

55

Las siguientes tres variables que muestra la aplicación Bibliometrix se puede decir que son de un nivel muy avanzado en los estudio bibliométricos. Para esta guía se mostraran algunas opciones de cada variable dejando la salvedad que para un conocimiento a fondo de estas opciones es necesario la profundización de cada tema en relación a la bibliometría.

Esta variable se trata de la Estructura Conceptual en relación a los documentos que se han descargado en el dataset. Las categorías que se pueden trabajar en esta variable al igual que en algunas anteriores son las Palabras Clave, Palabras Clave de Autor, el título y el Abstrac.

LA VARIABLE CONCEPTUAL STRUCTURE

56

La primera opción de esta variable Estructura Conceptual es una Red de Co-Ocurrencias que hace referencia a una interconexión agrupada de términos, teniendo en cuenta su presencia en los documentos recuperados en la búsqueda inicial en Scopus. Estas redes se generan interconectando los términos de acuerdo a un conjunto de criterios de Co-Ocurrencias que se pueden parametrizar en la parte izquierda de la vista de la aplicación.

LA VARIABLE CONCEPTUAL STRUCTURE

57

Otra de las opciones de la misma variable es la Evolución Temática que hace un rastreo de al relación de las palabras clave, en este caso, en el periodo de tiempo registrado en las publicaciones. Igual que otras opciones se puede parametrizar de acuerdo con el gusto del analista.

LA VARIABLE INTELLECTUAL STRUCTURE

58

Otra de las últimas variables es la Estructura Intelectual que muestra una Red de co-citación de los diferentes artículos obtenidos en el dataset, la gráfica se puede parametrizar por autores, artículos o fuentes.

En este ejemplo se muestra la gráfica de co-citación por autores.

LA VARIABLE SOCIAL STRUCTURE

59

Por último está la variable Estructura Social que se refiere a las colaboraciones entre autores, países e instituciones.

La primera opción que presenta esta variable es Red de Colaboración. Para este ejemplo se grafica la colaboración entre las instituciones

LA VARIABLE SOCIAL STRUCTURE

60

La segunda opción de la misma variable es un Mapa Mundial de Colaboración entre países

Bibliometrix (2020). Bibliometrix 3.0 is out!. https://bibliometrix.org/

Rstudio (2020). Rstudio Connect 1.8.4. https://rstudio.com/

61

Referencias

GraciasEsta guía fue compilada por Henry Vargas Pacheco

Para mayor información escribe al correo: apoyoinvbiblioteca@lasalle.edu.co

Iconos y gráficos: https://www.flaticon.com/http://www.slidescarnival.com/es

62Este material es propiedad de la Universidad de La Salle