La publicación digital de las colecciones universitarias ...colección de obra artística, puede...

14
1 Más Museos Revista Digital Año 2, No. 3, julio-diciembre 2020 La publicación digital de las colecciones universitarias:integración, apertura e interoperabilidad Joaquín Giménez Héau y Tila María Pérez Ortiz Palabras clave: colecciones universitarias, colecciones digitales, estandarización, ciencia abierta, datos abiertos, control de calidad RESUMEN Las colecciones universitarias son acervos indispensables para la docencia y la investigación en diversas áreas del conocimiento. Estos generan información de alto valor histórico, científico y cultural que puede contribuir a la toma de decisiones en políticas públicas o bien, a enfrentar problemas complejos nacionales e internacionales. Por medio de tecnologías de la información, la publicación digital de estos recursos se incrementa; con ello, se potencializa el uso y reutilización de los datos de las colecciones científicas, humanísticas y culturales de la UNAM. En el presente artículo se describe el protocolo desarrollado por la Dirección General Cómo citar: Giménez Héau, J. y Pérez Ortiz, T.M. (2020). La publicación digital de las colecciones universitarias: integración, apertura e interoperabilidad, Más Museos Revista Digital, Año 2, No. 3, julio-diciembre 2020.

Transcript of La publicación digital de las colecciones universitarias ...colección de obra artística, puede...

Page 1: La publicación digital de las colecciones universitarias ...colección de obra artística, puede corresponder a una pieza (una fotografía o un objeto). La información de cada ejemplar

1

Más Museos Revista DigitalAño 2, No. 3, julio-diciembre 2020

La publicación digital de las colecciones universitarias:integración, apertura e interoperabilidadJoaquín Giménez Héau y Tila María Pérez Ortiz

Palabras clave: colecciones universitarias, colecciones digitales, estandarización, ciencia abierta, datos abiertos, control de calidad

RESUMEN

Las colecciones universitarias son acervos indispensables para la docencia y la investigación en diversas áreas del conocimiento. Estos generan información de alto valor histórico, científico y cultural que puede contribuir a la toma de decisiones en políticas públicas o bien, a enfrentar problemas complejos nacionales e internacionales. Por medio de tecnologías de la información, la publicación digital de estos recursos se incrementa; con ello, se potencializa el uso y reutilización de los datos de las colecciones científicas, humanísticas y culturales de la UNAM. En el presente artículo se describe el protocolo desarrollado por la Dirección General

Cómo citar: Giménez Héau, J. y Pérez Ortiz, T.M. (2020). La publicación digital de las colecciones universitarias: integración, apertura e interoperabilidad, Más Museos Revista Digital, Año 2, No. 3, julio-diciembre 2020.

Page 2: La publicación digital de las colecciones universitarias ...colección de obra artística, puede corresponder a una pieza (una fotografía o un objeto). La información de cada ejemplar

2

INTRODUCCIÓN

Como parte de las funciones sustantivas de docencia, investigación y difusión de la cultura de la Universidad Nacional Autónoma de México (UNAM), es fundamental reconocer la importancia del vasto acervo que conforman las colecciones científicas, humanísticas y culturales custodiadas por las entidades académicas y dependencias de la Universidad. En ellas se almacenan una cantidad sig-nificativa de datos únicos y de gran valor, colectados a través del trabajo cotidiano de sus académi-cos. Existen colecciones biológicas, geológicas, meteorológicas, antropológicas, químicas, genéticas, geográficas, artísticas, entre muchas otras, resguardadas en las distintas entidades universitarias, que pueden ser facultades, escuelas, institutos y centros.1 Estos acervos son herramientas fundamen-tales y de gran interés nacional para la investigación de fenómenos globales como el cambio climático y la conservación de la biodiversidad y los ecosistemas, la seguridad alimentaria, la salud pública, el desarrollo sostenible, entre muchos otros.

de Repositorios Universitarios para hacer posible la integración y publicación de colecciones universitarias digitales en el Portal de Datos Abiertos UNAM, Colecciones Universitarias. Este procedimiento requiere de una colaboración estrecha con los curadores, responsables y especialistas de las colecciones, así como con el respaldo del titular de cada entidad o dependencia que las resguarda. El proceso descrito incluye tres etapas para la definición de los proyectos y las colecciones susceptibles de publicarse en formatos abiertos, así como la metodología que abarca procesos de estandarización y control de calidad.

Figura 1. Ejemplares de colecciones universitarias, 2016.

1 En el Portal de Datos Abiertos UNAM se encuentran colecciones de 18 entidades y dependencias universitarias: Centro de Investigaciones Sobre América del Norte; Dirección General de Asuntos del Personal Académico; Facultad de Arquitectura; Facultad de Ciencias; Facultad de Medicina Veterinaria y Zootecnia; Facultad de Música; Facultad de Filosofía y Letras; Instituto de Biología; Instituto de Ciencias de Mar y Limnología; Instituto de Ecología; Instituto de Geografía; Instituto de Geología; Instituto de Geofísica; Instituto de Investigaciones Estéticas; Instituto de Investigaciones Sociales; Instituto de Investigaciones Económicas; Instituto de Ingeniería; Instituto de Química.

Page 3: La publicación digital de las colecciones universitarias ...colección de obra artística, puede corresponder a una pieza (una fotografía o un objeto). La información de cada ejemplar

3

Muchas de las colecciones universitarias se encuentran en formato digital, conformadas por un conjunto de datos clasificados por su valor académico, cultural, histórico y de identidad universitaria; estos se encuentran codificados en formatos electrónicos, se pueden leer y compartir por medio de computadoras y otros dispositivos digitales. En los últimos años, la UNAM ha fomentado el aumento de la visibilidad en línea de sus contenidos académicos. Los datos de las colecciones universitarias no son la excepción, ya que pueden ser consultados en línea a través del “Portal de Datos Abiertos de la UNAM, Colecciones Universitarias” (http://datosabiertos.unam.mx), desde el 2016.

Figura 2. Imágenes del “Portal de Datos Abiertos UNAM, Colecciones Universitarias” que muestra una pantalla de capas y datos geoespaciales; pantalla que muestra conjuntos de datos de colecciones; imagen de una ficha de un ejemplar, y una vista de imagen histológica de alta resolución. Captura de pantalla, Joaquín Giménez Héau y Tila María Pérez Ortiz.

Page 4: La publicación digital de las colecciones universitarias ...colección de obra artística, puede corresponder a una pieza (una fotografía o un objeto). La información de cada ejemplar

4

Este sistema de consulta es operado por la Coordinación de Colecciones y Datos de Investiga-ción (CDI) de la Dirección General de Repositorios Universitarios (DGRU) adscrita a la Secretaría de Desarrollo Institucional,2 que implementa un protocolo con pasos administrativos, normas técnicas y metodologías de publicación en línea a través del Portal de Datos Abiertos UNAM, Colecciones Uni-versitarias. Este flujo de trabajo se encuentra descrito en el “Protocolo de Integración y publicación en el Portal de Datos Abiertos UNAM, Colecciones Universitarias” (Pérez Ortiz et al., 2017). Su eje-cución requiere de una estrecha colaboración entre el personal especializado en el manejo de datos y tecnologías de la información, con los académicos expertos en cada colección de las entidades y dependencias que las custodian. El resultado de esta interacción es la homogeneización de los datos de las colecciones para que puedan ser consultadas en un punto de acceso en línea, garantizando la calidad de la información por medio de metodologías de control de calidad.

El primer paso para la integración consiste en seleccionar las colecciones que se desean publi-car en el Portal de Datos Abiertos UNAM. Para ello, la CDI considera tres requisitos esenciales:

Que exista una relación temática entre los datos que la conforman, como podrían ser los ejemplares de un herbario, fotografías de un archivo o datos de un proyec-to de investigación.

Que el conjunto de objetos o ejemplares cuente con un curador, responsable aca-démico o grupo de responsables.

Que las colecciones se publiquen como datos abiertos: estos son datos digitales, de carácter público y, en términos de las disposiciones aplicables por la Universi-dad, no tienen naturaleza reservada o confidencial; son accesibles en línea para ser utilizados, reutilizados y redistribuidos por cualquier interesado, de conformi-dad con los Términos de libre uso de datos abiertos de la UNAM.3

a)

b)

c)

2 La DGRU tiene en sus antecedentes a la Coordinación de Colecciones Universitarias Digitales (CCUD), dependencia de la UNAM, creada con la finalidad de integrar y publicar las colecciones universitarias para su consulta como datos abiertos a través del Portal de Datos Abiertos UNAM, Colecciones Universitarias. El 5 de noviembre de 2018 se ampliaron y reestructuraron sus funciones, por acuerdo del Rector. En este contexto, la DGRU se creó en sustitución de la Coordinación de Colecciones Universitarias Digitales. Más información en: https://dgru.unam.mx

3 Documento disponible para su consulta en línea en el siguiente enlace: https://dgru.unam.mx/wp-content/uploads/2019/10/D.TE_.DGRU_DG_2015_B_Termi-nos_Libre_Uso.pdf (última consulta: 10/09/2020).

Poner a disposición las colecciones en formatos abiertos implica reducir las restricciones de acceso a los usuarios, con el objetivo de potencializar el uso de la información. Para ello debe hacerse un análisis cuidadoso que permita identificar cualquier impedimento para su uso público. Algunos de estos impedimentos son los siguientes:

Page 5: La publicación digital de las colecciones universitarias ...colección de obra artística, puede corresponder a una pieza (una fotografía o un objeto). La información de cada ejemplar

5

4 Véase: https://www.ncbi.nlm.nih.gov/nucleotide/ (última consulta: 10/09/2020). 5 Véase: https://www.gbif.org/ (última consulta: 10/09/2020).

a) Que la información esté clasificada como confidencial o reservadab) Que contenga datos personalesc) Que afecte la integridad de personas, especies u objetosd) Que afecte el desarrollo de los proyectos de investigación en cursoe) Que afecte acuerdos de confidencialidadf) Que afecte procedimientos legales en curso

Es muy importante que los esfuerzos realizados en la publicación de datos abiertos generen el mayor impacto posible; por lo tanto, se recomienda priorizar las colecciones y conjuntos de datos que se publicarán en formatos abiertos a partir de los siguientes criterios:

Que existan iniciativas nacionales e internacionales donde se publica y fomenta la in-vestigación de los temas de la colección, por ejemplo: datos sobre genoma, que forman parte de iniciativas como la organización GenBank;4 o datos de biodiversidad que for-man parte de proyectos como Global Biodiversity Information Facility (GBIF).5

Que el tipo de datos de la colección tenga alta demanda de consulta por parte de en-tidades académicas, de gobierno o de la sociedad civil, por ejemplo: “Obra de Diego Rivera” o información de proyectos de investigación realizados en la Universidad.

Que los datos de la colección sean relevantes para la comprensión y solución de temá-ticas nacionales o para el diseño y aplicación de políticas públicas, por ejemplo: datos de contaminación o escenarios de cambio climático.

Que los datos de la colección cuenten con el mayor porcentaje posible de digitalización y estructuración. Esto incluye

a)

b)

c)

d)

• ○que se encuentran en formatos digitales, disponibles para publicación; • ○que se encuentran en formatos estructurados como tablas;• ○que están atomizados: con el máximo nivel de desagregación posible;• ○que sean permanentes: una de las características más importantes de los

datos abiertos es que se conservan en el tiempo y las versiones históricas relevantes se encuentran disponibles con los identificadores adecuados, y

• ○que cuenten con permisos de publicación: está implícito que las coleccio-nes seleccionadas contarán en su momento con permisos de publicación y únicamente en casos excepcionales habrá registros que no serán datos públicos.

Page 6: La publicación digital de las colecciones universitarias ...colección de obra artística, puede corresponder a una pieza (una fotografía o un objeto). La información de cada ejemplar

6

Una vez que se han seleccionado las colecciones que se publicarán en datos abiertos, a partir de los criterios mencionados anteriormente, es importante identificar cuáles son los tipos de datos que componen la colección. En la CDI los clasificamos a partir de cuatro grupos generales:

1) Registros de acervos digitales y proyectos universitarios:

2) Bases de datos y sus metadatos:

3) Capas geoespaciales y sus metadatos:

4) Metadatos de objetos digitales:

Son conjuntos de campos correspondientes a una fila dentro de una ta-bla. Entre cada registro no hay una relación directa y se pueden publicar con independencia de los demás; por ejemplo, en el caso de una base de datos de un herbario, un registro corresponde a un ejemplar colectado, o bien, en una colección de obra artística, puede corresponder a una pieza (una fotografía o un objeto). La información de cada ejemplar de herbario, así como cada objeto de obra artística, se pueden publicar de forma independiente al conjunto de ejemplares y objetos de la base de datos.

Es un conjunto de registros relacionados o pertenecientes a un mismo contexto que se encuentran dentro de un manejador de bases de datos o en una tabla. Estos datos deben publicarse en conjunto para que no pierdan valor, ya que tienen una relación directa entre sí; por ejemplo, en una tabla con medi-ciones de la temperatura de un lago, en un periodo determinado, cada registro corresponde a una lectura. La evolución de dicha variable se verá reflejada en el conjunto de lecturas, que es lo que le da valor a la base de datos.

Cada elemento de la base de datos tiene valor en su relación con un Sis-tema de Información Geográfica (SIG) por su asociación con coordenadas, po-lígonos o imágenes.

Los objetos digitales son archivos creados en formato electrónico, o convertidos a este, y se accede a ellos a través de dispositivos informáticos. Generalmente se trata de imágenes, documentos y archivos multimedia. Los metadatos contienen la información que describe al objeto digital como, por ejemplo, el autor, la fecha de creación o el formato en el que se encuentra.

Las colecciones que se definen bajo estas características mencionadas anteriormente, así como sus datos, son las que forman parte del Portal de Datos Abiertos UNAM, Colecciones Universitarias.

Page 7: La publicación digital de las colecciones universitarias ...colección de obra artística, puede corresponder a una pieza (una fotografía o un objeto). La información de cada ejemplar

7

INTEGRACIÓN Y PUBLICACIÓN DE COLECCIONES UNIVERSITARIAS DIGITALES

La metodología de arquitectura y gestión de datos para publicación de colecciones universita-rias digitales en el Portal de Datos Abiertos UNAM se lleva a cabo en la Coordinación de Colecciones y Datos de Investigación (CDI), de la Dirección General de Repositorios Universitarios (DGRU).6 Los pasos de este proceso se agrupan en tres etapas que consisten en la definición del proyecto; la arqui-tectura y gestión de datos, y la publicación de colecciones, como se muestran en la siguiente figura:

En el siguiente apartado se describe de manera general el procedimiento a través del cual se integran y publican los acervos universitarios. Cada uno de ellos es resultado de diversos proyectos de carác-ter institucional, ya que en cada uno de los casos cuentan con el respaldo del titular de la entidad o dependencia.

Figura 3. Protocolo de Integración y Publicación de Colecciones en el Portal de Datos Abiertos UNAM, Colecciones Universitarias. Los pasos numerados corresponden a etapas realizadas en colaboración con las entidades y depen-dencias responsables de las colecciones, mientras que los pasos no numerados corresponden a actividades internas de la DGRU, (Pérez Ortiz et al., 2017).

6 El procedimiento que se describe a continuación es resultado de la participación del equipo de trabajo de la Coordinación de Colecciones y Datos de Investigación. De este modo, su autoría y desarrollo es resultado de la participación del biólogo Daniel Pérez Castillo ([email protected]), la bióloga Cecelic Reséndiz Arias ([email protected]) y Edurne Uriarte Santillán ([email protected]).

Page 8: La publicación digital de las colecciones universitarias ...colección de obra artística, puede corresponder a una pieza (una fotografía o un objeto). La información de cada ejemplar

8

El “Protocolo de Integración y Publicación de Colecciones en el Portal de Datos Abiertos UNAM, Colecciones Universitarias” describe el procedimiento a seguir en los proyectos para que los datos de una colección se integren de manera estandarizada. Es necesario reiterar que este proceso se realiza en estrecha colaboración con los proveedores de datos, principalmente con los curadores, responsa-bles de los datos y del proyecto (Pérez Ortiz et al., 2017).

I. Definición del proyecto

II. Arquitectura y gestión de datos

Es fundamental dedicar un tiempo a la planeación del proyecto antes de iniciar con la integración de los datos. Para ello, se realizan una serie de reuniones entre el personal de la CDI y de las coleccio-nes, en que se definen las colecciones que se integrarán al Portal. En esta etapa es también prioritario que la entidad o dependencia establezca los criterios de publicación de sus colecciones, a través de la elaboración de lineamientos de publicación.7 Por otro lado, se definen los requerimientos técnicos, específicos y necesarios, para la integración al Portal, así como el estándar de datos y metadatos que se usará, y los catálogos para llevar a cabo, posteriormente, el control de calidad. Finalmente, se es-tablecen las fechas para entregar la documentación con la que se da inicio al proyecto de integración. Todos estos acuerdos entre las partes se formalizan en bases de colaboración interinstitucionales.

Una vez que se han definido las colecciones que se integrarán al Portal, se lleva a cabo el censo de colecciones, cuyo objetivo es contar con información que da contexto a cada uno de los registros de las colecciones que se integran al Portal de Datos Abiertos UNAM. Por medio de la información re-unida, el usuario final podrá conocer la procedencia, los responsables y las características principales de cada registro (ejemplar u objeto) consultado. El censo es un cuestionario breve que se responde en una reunión con el curador o responsable de los acervos, proyectos o repositorios. Los resultados del censo contribuyen con información de utilidad para la planeación de estrategias de trabajo y difusión de las colecciones universitarias digitales. Adicionalmente, permite la construcción de un catálogo de las colecciones digitales de la Universidad.

Esta etapa es la parte más importante del proceso, ya que es donde se llevan a cabo las mo-dificaciones a las bases de datos originales de las colecciones para su posterior integración y pu-blicación. Esta etapa inicia con la entrega de los datos de parte de los responsables de la colección, acompañada de los lineamientos de publicación (mencionados en la definición del proyecto) y los catálogos para el control de calidad estructural. Esta etapa se divide en dos procedimientos principa-les: la estandarización y el control de calidad. Todos los pasos de estos procesos se documentan, así como las modificaciones realizadas a las diferentes bases de datos.

7 Los lineamientos institucionales están alineados con los Lineamientos para la integración y publicación de las Colecciones Universitarias Digitales en el Portal de Datos Abiertos UNAM, Colecciones Universitarias, disponible en línea en el siguiente enlace: https://dgru.unam.mx/wp-content/uploads/2019/10/D.Li_.Ga_CCUD_2015_09_24_Integracion_Publicacion_Colecciones_PDA_UNAM.pdf

Page 9: La publicación digital de las colecciones universitarias ...colección de obra artística, puede corresponder a una pieza (una fotografía o un objeto). La información de cada ejemplar

9

1. Estandarización

La integración de la diversidad de datos, colecciones y proyectos universitarios requiere de estándares adecuados para lograr un acceso unificado de la información. En la UNAM, la Dirección General de Repositorios Universitarios desempeña la función de definir y documentar estándares para estructurar los datos abiertos y coordinar sus políticas de integración y publicación; esto incluye documentar y aplicar las normas internacionales y adecuarlas a las características espe-cíficas de la información de las colecciones universitarias digitales. El estándar es una norma que regula la estructura de los datos, las palabras que se utilizan (vocabulario controlado), y los cam-pos básicos (definidos en diccionarios). Sugiere o hace obligatorio el uso de convenciones como la escritura de las fechas, códigos de los países, el idioma, las unidades métricas, los acrónimos, etcétera. Trabajar con bases de datos estandarizadas tiene varias ventajas:

Permiten la interoperabilidad semántica, es decir que los datos puedan ser intercambia-dos entre distintas plataformas de manera uniforme y eficiente.

Permiten la descarga de datos que se pueden reutilizar sin necesidad de volverse a pro-cesar (es decir, darles un nuevo formato).

Facilitan el uso de los datos al contenerlos de manera organizada y clara.

Ahorran tiempo y agilizan el análisis.

Regulan la captura de una base de datos y la información básica que debe contener un registro.

Facilitan la validación académica, ya que el registro de la información parte de un con-senso de especialistas.

Simple: evita complicaciones en el registro de los datos.

Flexible: permite la captura de registros sin que sea obligatorio conocer la totalidad de los atributos del estándar.

Con independencia sintáctica: cuenta con datos que aportan el contexto necesario para tener significado por sí mismo.

Con interoperabilidad semántica: permite que los datos sean legibles por sistemas in-formáticos sin necesidad de intervención humana.

Con un alto nivel de normalización formal: registra datos que no presentan variantes, lo más atomizado posible, y sin perder su significado.

a)

b)

c)

d)

e)

a)

b)

c)

d)

e)

f)

La elección de un estándar debe cumplir con las siguientes características:

Page 10: La publicación digital de las colecciones universitarias ...colección de obra artística, puede corresponder a una pieza (una fotografía o un objeto). La información de cada ejemplar

10

Que su crecimiento y actualización esté mediado por instituciones formales y estables; se encuentra en una constante revisión y actualización.

Que cuente con un consenso internacional: es preferible que participe una mayor canti-dad de especialistas en la definición y actualización del estándar.

Que cuente con una arquitectura de metadatos para la web: define etiquetas para su uso por sistemas informáticos.

Que presente modularidad de metadatos en la web: define extensiones para bloques de atributos no considerados.

f)

g)

h)

i)

En el proceso de definición, es conveniente adoptar estándares existentes de preferencia internacionales, ya que son de amplia aceptación y aumentan las posibilidades de combinar y relacionar bases de datos de orígenes diversos. Algunos ejemplos de los utilizados en la DGRU son Darwin Core (colecciones de biodiversidad), Plinian Core (especies de biodiversidad) y Dublin Core (objetos digitales y archivos personales). En caso de que no exista uno para algún tipo de colección, se define el estándar con el curador o responsable de la colección y la CDI elabora la documentación correspondiente.

2. Control de calidad

A partir del estándar definido y documentado, la CDI diseña una “base de datos curatorial” a la cual se transfieren los datos originales de la colección. Esta nueva base de datos servirá para llevar a cabo el control de calidad. El control de calidad estructural es una evaluación técnica que se aplica a esta base de datos para reducir la presencia de errores y contar con datos de mayor ca-lidad, coherentes y actualizados. Los métodos de revisión deben considerar los formatos, idiomas y estándares, así como los diversos temas de los acervos, proyectos de investigación, repositorios y publicaciones.

Para realizar el control de calidad se utilizan catálogos, los cuales son listados de valores que siguen convenciones válidas de uso y nomenclatura para cada colección. A cada clase de dato le corresponderá uno o varios catálogos específicos para establecer criterios homogéneos de for-mato tales como fechas, nombres de personas, nombres geográficos, o bien, determinar criterios particulares a los temas y tipos de colección como nombres científicos (biodiversidad), género fotográfico (obra artística), tipo de publicación (objetos digitales) y disciplina (proyectos universi-tarios), entre otros (Pérez Ortiz et al., 2017). El proceso de revisión se realiza a un nivel atomizado y en su relación con otros para dar homogeneidad y estandarizarlos. A partir de un análisis de comparación lógica, se busca la equivalencia con los catálogos, así como la consistencia entre los datos de un mismo registro. Las modificaciones se documentan en bitácoras, es decir, tablas de control de calidad y monitoreo. Durante el proceso se califica:

Page 11: La publicación digital de las colecciones universitarias ...colección de obra artística, puede corresponder a una pieza (una fotografía o un objeto). La información de cada ejemplar

11

Si el dato existe

Si es consistente de origen: existe en catálogos y es coherente en su relación con otros campos

Si está desactualizado o no tiene lógica por sí mismo

Si está desactualizado o no tiene lógica en el conjunto

Si se aplica una modificación que no afecta su significado (acentos, mayúsculas, tra-ducción de un nombre, otros).

Consistentes con los catálogos: continúan el proceso de integración y publicación.

Modificados en el proceso: son consistentes con catálogos, pero requieren de una va-lidación por parte del curador o responsable de los datos, previo a su publicación. Se corrigen y documentan errores como asignación, omisión, ortográficos y sistemáticos.

Inconsistentes con los catálogos: se reportan al curador o responsable de la colección para su revisión. Estos registros se publicarán hasta que hayan sido revisados por el especialista.

a)

b)

c)

d)

e)

a)

b)

c)

La CDI es la responsable de definir y aplicar los métodos que permitan estimar la calidad de un dato, así como proponer modificaciones para homogeneizarlos sin perder información. Como resultado del control de calidad, los datos se clasifican en tres tipos:

Finalizado el control de calidad, el siguiente paso consiste en filtrar los datos de acuerdo con los lineamientos de publicación establecidos por las entidades y dependencias. Estos resultados se presentan a los responsables de la colección con un diagnóstico que describe el análisis reali-zado. El diagnóstico se presenta en una reunión donde el personal de la CDI expone al curador o responsable de la colección la documentación del proceso de gestión de datos. Como conclusión, el curador o responsable de la colección aprueba que los registros consistentes continúen su pro-ceso de publicación y, además, aprueba o rechaza los cambios sugeridos en los datos modificados.

Page 12: La publicación digital de las colecciones universitarias ...colección de obra artística, puede corresponder a una pieza (una fotografía o un objeto). La información de cada ejemplar

12

CONCLUSIÓN

Para concluir, es necesario reiterar que las colecciones académicas de la UNAM son parte funda-mental de su patrimonio, motivo por el cual se han mantenido en permanente desarrollo y crecimiento.

III. Publicación de colecciones

En esta etapa, la DGRU diseña la ficha en que aparecerán los datos de los objetos y ejemplares de las colecciones en el Portal de Datos Abiertos UNAM. Cada registro de la colección se publica en una ficha digital independiente y con una dirección única, para que pueda ser localizada por motores de búsqueda (como Google) y citada por los usuarios. Esta dirección le atribuye identidad digital a cada objeto o ejemplar, un elemento esencial de las normas bajo las cuales opera el Portal. Para esta dirección se incluye el nombre de recurso uniforme (Uniform Resource Name, URN por sus siglas en inglés) asignado por la CDI a cada registro dentro de una colección. Este identificador, denominado triplete, es necesario para crear registros únicos a partir de la integración de bases de datos indepen-dientes y se compone de la siguiente información:

De esta manera, se etiquetan los registros para que sean únicos y cada uno equivale a una pu-blicación en línea, recuperada por diferentes buscadores. Por otro lado, se crea la versión final que alimentará las fichas. Sobre esta base de datos, el titular de la entidad o dependencia otorga el per-miso para que se publiquen las colecciones. Finalmente, a través de diversos procesos técnicos que se llevan a cabo en la Coordinación de Desarrollo Tecnológico e Infraestructura (DTI), la DGRU hace pública la colección en el Portal de Datos Abiertos UNAM, Colecciones Universitarias.

Una de las características principales de los datos abiertos es que sean oportunos, es decir, actualizados periódicamente. Dado que las colecciones son dinámicas y sus contenidos se actualizan constantemente, es necesario actualizar las bases de datos para incorporar las modificaciones o co-rrecciones realizadas durante el trabajo continuo de curación. Un buen ejemplo de este dinamismo es el caso de las colecciones biológicas, donde los ejemplares cuentan con una determinación taxonómi-ca que se modifica conforme se actualizan los criterios de clasificación científica de los organismos por los especialistas.

a) acrónimo de la entidad o dependenciab) acrónimo de la colecciónc) número de catálogo del registro: código único con el que se identifica a cada objeto o ejemplar dentro de la colección.

Page 13: La publicación digital de las colecciones universitarias ...colección de obra artística, puede corresponder a una pieza (una fotografía o un objeto). La información de cada ejemplar

13

REFERENCIAS

• Pérez Ortiz, Tila María, Giménez Héau, Oliver Joaquín et al.; 2017. Manual de Datos Abiertos de Colecciones Universitarias Digitales. México, Universidad Nacional Autónoma de México.

Actualmente el Portal de Datos Abiertos cuenta con 1,877,435 registros de 57 colecciones; junto con los datos de los registros, se han publicado un total de 1,144,212 imágenes digitalizadas (la mayoría de alta resolución). Al momento, los datos provienen de las siguientes entidades: Centro de Investigaciones sobre América del Norte; Dirección General de Asuntos del Personal Académico; Facultad de Arquitectura; Facul-tad de Ciencias; Facultad de Filosofía y Letras; Facultad de Medicina Veterinaria y Zootecnia; Facultad de Música; Instituto de Biología; Instituto de Ciencias del Mar y Limnología; Instituto de Ecología; Instituto de Geografía; Instituto de Geología; Instituto de Geofísica; Instituto de Ingeniería; Instituto de Investigaciones Económicas; Instituto de Investigaciones Estéticas; Instituto de Química, y el Instituto de Investigaciones Sociales.

Con la apertura de estos datos se generan nuevas perspectivas de conocimiento en los procesos académicos. Del mismo modo, estimula la creatividad y el desarrollo de áreas emergentes de investigación y docencia. Su publicación impacta positivamente en la capacidad que tiene la Universidad, y la sociedad en general, para dar respuesta a diversos problemas científicos y sociales; nacionales y globales. Por otra parte, la publicación de datos abiertos de la UNAM fortalece la apertura y la rendición de cuentas de la Universidad a la sociedad, al transparentar procesos de investigación junto con la publicación de los resul-tados finales. De esta manera se suma y adopta la política de ciencia abierta (open science).

Page 14: La publicación digital de las colecciones universitarias ...colección de obra artística, puede corresponder a una pieza (una fotografía o un objeto). La información de cada ejemplar

Tila María Pérez OrtizDirección General de Repositorios Universitarios

Bióloga y doctora en Ciencias (Biología) por la Facultad de Ciencias de la UNAM. Investigadora Titular “C” del Instituto de Biología y cu-

radora de la Colección Nacional de Ácaros. Ha publicado alrededor de cien artículos científicos sobre la biología, ecología y taxonomía de los

ácaros, así como libros, capítulos de libro y artículos de difusión. Ha im-partido cursos y dirigido tesis a nivel de licenciatura y posgrado. Es miembro

del Sistema Nacional de Investigadores. Ha sido coordinadora del posgrado en Ciencias Biológicas de la UNAM (2000-2003), directora del Ins-tituto de Biología de la UNAM (2003-2011), coordinadora del Proyecto Universitario Impulsa 5 donde se creó SIBA (Sistema de Informática para la Biodiversidad y el Ambiente), coordinadora general de la Coordinación de Colecciones Universitarias Digitales (2013-2018) y a partir del 5 de noviembre de 2018 es la Directora General de la Dirección General de Repositorios Universitarios, adscrita a la Secretaría de Desarrollo Institucional de la UNAM.

Recibido agosto 2020 Aprobado agosto 2020 Publicado octubre 2020

Joaquín Giménez Héau UNAM

Biólogo egresado de la Facultad de Ciencias de la UNAM. Es el coor-dinador de Colecciones y Datos de Investigación de la Dirección Ge-

neral de Repositorios Universitarios (DGRU). Coordina los procesos de integración y publicación, en formatos abiertos, de las colecciones uni-

versitarias y datos de investigación en las plataformas interoperables de la DGRU. Su ámbito de interés se enfoca principalmente en la ciencia abierta

como herramienta de investigación y para el diseño de políticas públicas en el marco de la gobernanza ambiental. Tiene diversas publicaciones sobre el uso de datos de biodiversidad en modelos predictivos, así como de datos abiertos.

Fue coordinador de la Unidad de Informática para la Biodiversidad, destinada a la publicación electrónica de las bases de datos de las colecciones del Instituto de Biología de la UNAM. Realizó su maestría en Ciencias de la Sostenibilidad en la UNAM y actualmente cursa el doctorado en el mismo posgrado con el proyecto “La ciencia abierta en el contexto del impacto ambiental”.