Explotación y visualización de datos de investigación en Humanidades Digitales: la edición...
-
Upload
innovatics -
Category
Education
-
view
228 -
download
0
Transcript of Explotación y visualización de datos de investigación en Humanidades Digitales: la edición...
![Page 1: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/1.jpg)
Explotación y visualización de datos de investigación en Humanidades Digitales: la
edición digital académica en XML-TEI de textos poéticos
Gimena del Rio
(IIBICRIT, CONICET)
Congreso InnovaTICS 2016, Santiago de Chile
![Page 3: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/3.jpg)
![Page 4: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/4.jpg)
Kantorowicz (1962): la forma más extendida de hacer filología es a través de la edición de
textos.
![Page 5: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/5.jpg)
• Historia del libro
• Historia de la escritura
• Arqueología de los medios
![Page 6: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/6.jpg)
• Hipólito Escolar, Sven Dhal
• •Floriano Cumbreño, Millares Carlo
• •Friedrich Kittler, Lori Emerson
![Page 7: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/7.jpg)
Concepto de escritura
• Conjunto de operaciones y procesos recursivos en los que la escritura-lectura entablan un juego dialéctico.
• Escritura es siempre sinónimo de reescritura.
• Procesos lingüísticos cognitivos y culturales.
![Page 8: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/8.jpg)
![Page 9: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/9.jpg)
![Page 10: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/10.jpg)
![Page 11: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/11.jpg)
Pantalla como un nuevo soporte intelectual.
Alejandro Piscitelli, Internet, La imprenta del Siglo XXI
![Page 12: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/12.jpg)
http://vbd.humnet.unipi.it/beta2
![Page 13: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/13.jpg)
02/09/2016
Immanuel Kant Opus Postumum – Online-Edition – http://telota.bbaw.de/kant_op
![Page 14: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/14.jpg)
Lector (…) dinámico e inmersivo, (…) desarrolla capacidades cognitivas avanzadas (…) un conocimiento
de la organización del texto, y concibe el espacio informativo de la pantalla no sólo en su longitud sino
en su profundidad.
Javier Díaz Noci, Multimedia y modalidades de lectura: una aproximación al estado de la cuestión
![Page 15: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/15.jpg)
Los Nuevos proyectos digitales
-Tecnologías adaptadas a las HD
-Filosofía del software libre
-Trabajo colaborativo y compartido: coworking/crowdsourcing
-Herramientas y estándares
Bases de datos
Etiquetado TEI-XML
Web semántica
Visualización de datos
![Page 16: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/16.jpg)
Proyectos de investigación en Humanidades Digitales
• Academia • Financiamiento • Grupos de investigación multinacionales, híbridos
y numerosos • Grandes corpus • Datos primarios y/o secundarios • Perdurables • Modificables • Accesibles en abierto en la web
![Page 18: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/18.jpg)
Edición Digital Académica
• Plan / Concepto/ Flujo de trabajo • Modelización de los datos • Estándar → TEI • Arquitectura/estructura • Open source/ licencias • Aspecto “user friendly” • Búsquedas a texto completo / Índices • Visualización • Accesibilidad a largo plazo • Identificadores persistentes • Documentación
![Page 19: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/19.jpg)
www.remetca.uned.es
http://dialogo.linhd.es/
Algunos ejemplos: POEMETCA. http://poemetca.linhd.es/
![Page 20: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/20.jpg)
http://sade.textgrid.de/exist/apps/SADE/Dialogo_Medieval/index.html
Diálogo Medieval
![Page 21: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/21.jpg)
![Page 22: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/22.jpg)
Ediciones con TEI
• American memory: http://memory.loc.gov/ammem/index.html
• Biblioteca Digital del Pensamiento Novohispano: http://www.bdpn.unam.mx/
• Vincent Van Gogh: http://vangoghletters.org
• Voices of the Holocaust: http://voices.iit.edu/
• Manuscritos de Montesquieu: https://www.unicaen.fr/services/puc/sources/Montesquieu/
• Diálogo Medieval: http://sade.textgrid.de/exist/apps/SADE/Dialogo_Medieval/index.html
![Page 23: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/23.jpg)
EDITORES “PLANOS”
![Page 24: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/24.jpg)
![Page 25: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/25.jpg)
Proyectos de crowdediting
http://transcriu.bnc.cat/
http://beta.fromthepage.com/
http://www.ancestry.com/wiki/index.php?title=Keying_tool_how-tos http://diyhistory.lib.uiowa.edu/ http://www.archives.gov/citizen-archivist/ http://transcribe.archives.gov/
![Page 26: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/26.jpg)
http://beta.fromthepage.com/
• innovatics /innovatics
• Collections > Edición y crítica textual
![Page 27: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/27.jpg)
![Page 28: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/28.jpg)
TEIScribe
http://www.evilinhd.com:8080/TextEditor/?session=prueb
a
![Page 29: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/29.jpg)
Publicación
online
Creación de
una
biblioteca
digital
Edición digital
en XML-TEI Compartir
datos Compartir
documentos
Enviar
mensajes
Edición Digital y publicación Trabajo en
grupo
Proyecto de Humanidades en un EVI
![Page 30: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/30.jpg)
> Los usuarios pueden trabajar en diferentes
proyectos a la vez
Internet
www.evilinhd.com
. . .
![Page 31: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/31.jpg)
Arquitectura
![Page 33: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/33.jpg)
Oxygen
• http://www.oxygenxml.com/xml_editor/download_oxygen_xml_editor.html (licencia gratuita por 30 días; por favor, tengan en cuenta si la máquina trabaja a 32 o 64 bit para descargar la versión correcta del editor).
![Page 34: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/34.jpg)
¿Qué vamos a aprender hoy?
• Trabajar con metalenguaje y editar = Etiquetar, marcar, codificar o, lo que es lo mismo,
usar un lenguaje de marcado xml llamado TEI (Text Encoding Initiative):
-Módulos, etiquetas, esquemas
![Page 35: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/35.jpg)
Transcripción de un texto
Digitalización Transcripción Codificación
Paz a España, paz segura.
Canten abiertos los campos
dichosos de Extremadura. !
Lean los niños, las flores,
y entre las negras encinas
todos los trabajadores. !
¡Lejos tanta noche oscura!
¡Para siempre en primavera,
la tierra de Extremadura! !
Yo os traigo en este pregón,
el libro, fuente de gracia,
que ilumina el corazón. !
Agua tranquila, agua pura,
agua que riegue la sangre
del alma de Extremadura. !
Libros de amor, luz, ensueño.
Alta vida y viento en calma
en todo el pueblo extremeño
![Page 36: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/36.jpg)
Segunda etapa
• Indagar en los documentos TEI
• Base de datos (xml nativas)
• Un motor de búsqueda
• Una interfaz web
![Page 37: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/37.jpg)
Lenguajes de marcado
• Se desarrollan para tratar con documentos (información predominantemente textual), también para gestión de datos.
• Describen las partes lógicas (estructura, lógica y semántica) de un tipo de documento (o conjunto de datos), sin límite en el nivel de profundidad o detalle.
• Son lenguajes porque tienen – Vocabulario: Para denominar a cada elemento estructural del
documento de cualquier nivel de profundidad, a cada atributo de estos elementos, a cada valor de estos atributos (para cierto tipo de atributo), etc.
– Sintaxis (o gramática): Para indicar qué construcciones estructurales están permitidas: qué debe o puede contener cada elemento, si un elemento o atributo es obligatorio, si un elemento puede o no repetirse, qué tipo de valor admite un atributo, etc.
![Page 38: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/38.jpg)
¿Qué es XML?
• XML = Extensible Markup Language • XML es un heredero, más sencillo y eficaz, de su
antecesor SGML (Standard Generalized Markup Language)
• Se publicó en febrero de 1998 por el W3C Consortium.
• La documentación oficial está disponible en: http://www.w3.org/XML/
• Tutoriales en línea: Introducción a XML elaborada por TEI
![Page 39: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/39.jpg)
Ventajas del XML
• Simple, flexible y “human-readable”
• Soporta diferentes sistemas de escritura; utiliza el estándar Unicode, por defecto, el marcado es UTF-8.
• Ampliamente utilizado (soporte y herramientas)
• ISO estándar (International Organization for Standardization)
• Independiente de cualquier software
• Facilita el movimiento de datos (interoperabilidad) y su preservación
• Separa contenido de presentación
• Enorme cantidad de tutoriales en línea
![Page 40: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/40.jpg)
Noción de marcado
• Aislar una porción de texto con un significado semántico específico.
• La estructura consiste en la anidación sin límites de unos elementos al interior de otros, construyendo así una especie de árbol genealógico. Por eso, necesitamos siempre un solo elemento raíz del que cuelguen todos los otros.
![Page 41: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/41.jpg)
Estructura de una etiqueta
Elemento: son las unidades de información semántica compuestas de una marca de apertura <elemento> y de cierre </elemento>. La etiqueta es el identificador general. Puede contener texto, otros elementos o estar vacío <elemento/>.
Atributo: añaden una característica adicional al elemento y deben siempre llevar un valor. Pueden ser generales, es decir, utilizables en todos los elementos TEI (@xml:id,@xml:lang), o específicos de un elemento.
Valor: rellena el valor o contenido del atributo.
![Page 42: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/42.jpg)
Reglas
• El nombre del elemento puede solo contener
letras y números, sin acentos ni espacios, y solo algunos signos: - _ .
• El nombre no puede empezar por un número,
ni por un signo, etc.
![Page 43: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/43.jpg)
![Page 44: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/44.jpg)
<titulo>Int. a TEI</titulo>
<autor>Gimena del Rio</autor>
<fecha>24/10/2015</fecha>
Abrir Oxygen
Abrir file en blanco
Ver documento_xml_basico.xml
![Page 45: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/45.jpg)
Reglas del doc. XML
• Tiene que estar Bien formado, es decir estar expresado correctamente según la gramática del XML
• Tiene que ser Válido
-Para ello, necesita un modelo que fije la estructura básica y las posibilidades de anidación del documento. Los esquemas (RelaxNG, W3CSchema) establecen la sintaxis que debe tener el documento XML. Si este está formado según sus reglas, será válido.
![Page 46: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/46.jpg)
¿Qué significa bien formado?
1. Tiene que existir un único elemento raíz que contenga todo el documento 2. Cada subárbol debe estar correctamente anidado, es decir, no se pueden solapar 3. Los nombres de las etiquetas son case/sensitive: <de> ≠ <De> ≠ <DE> 4. Una etiqueta de apertura <p> debe tener siempre una etiqueta de cierre </p> (salvo en los casos de etiquetas vacías <vacia/> ) 5. No debe haber espacios en blanco tras < o antes de </ <p>párrafo</p> Y no < p>párrafo</ p> ni <p >párrafo</p > 6. El valor de los atributos ha de estar siempre entrecomillado <p type="text">algo de texto</p>
![Page 47: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/47.jpg)
¿Qué significa válido?
Un documento XML es válido cuando cumple las reglas establecidas en un esquema externo.
El esquema especifica, entre otras cosas,
1. El nombre del elemento raíz
2. El nombre de todos los elementos que se pueden utilizar
3. Los nombres, tipo de datos y (ocasionalmente) los valores por defecto de los atributos
4. Reglas acerca de cómo se pueden anidar los elementos
![Page 48: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/48.jpg)
Ahora veamos cómo TEI se expresa a través del XML
![Page 49: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/49.jpg)
Text Encoding Initiative. http://www.tei-c.org
![Page 50: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/50.jpg)
Text Encoding Initiative
• 1987: primera reunión (Vassar College, NY) con el fin de crear unas guías directrices para la codificación de textos electrónicos
• 1988 – 1990: TEI P1
• 1990 – 1992: TEI P2 y creación de grupos de trabajo por • 1993 – 1994: TEI P3, primera versión oficial de las Guidelines
• 2000: creación del Consortium TEI
• 2002: TEI P4, primera versión en XML (de la P3)
• 2007: TEI P5
• 2011-2015: TEI P5 en sus versiones
• 2015: TAPAS project, TEI Simple
![Page 51: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/51.jpg)
http://www.tei-c.org
- Guidelines - Lista de proyectos que utilizan TEI - Una Wiki - Herramientas - Lista de discusión
![Page 52: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/52.jpg)
Text Encoding Initiative
• Iniciativa de codificación de textos en Humanidades, Cs. Sociales y Lingüística.
• Se describe en las TEI Guidelines: el manual de uso.
• Se expresa a través del lenguaje XML.
• Tiene un carácter modular y es personalizable
• Es código abierto (GIThub), independiente de cualquier programa o plataforma.
![Page 53: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/53.jpg)
Algunos problemas
• Traducción parcial en español de las Guidelines.
• Modelo todavía poco conocido, utilizado sobretodo en países anglosajones, aunque también hay fuertes iniciativas en Francia, Alemania, Holanda, entre otros.
• Se tiende todavía a delegar el trabajo de codificar a los informáticos.
• Poca oferta de formación inicial y avanzada.
![Page 54: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/54.jpg)
Qué podemos marcar
• Estructura textual (párrafos, listas, tablas…) • Lagunas, caracteres especiales, saltos de línea,
saltos de página, abreviaturas • Comentarios, glosas • Errores, cancelaciones • Lecturas diferentes, adiciones • Poemas, versos, rimas
Todo eso podemos expresar en XML según las
directrices de la Text Encoding Initiative.
![Page 55: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/55.jpg)
• Divisiones estructurales del texto
• Información semántica
• Elementos tipográficos puntuales
• Otra información de interés:
– personas, lugares, fechas
– cuestiones gramaticales
– imágenes, etc.
Todo depende de la información que busquemos recuperar a posteriori y procesar informáticamente.
![Page 56: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/56.jpg)
• Para el procesamiento informático necesitamos hacer explícita toda la información.
• Debemos diferenciar el contenido semántico de su presentación.
![Page 57: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/57.jpg)
Guidelines
Definen y documentan un lenguaje de marcado para la representación de las características estructurales, físicas y conceptuales de los textos. Su foco de atención es el marcado de documentos en Humanidades y Cs. Sociales (aunque no exclusivamente), y en particular la representación de fuentes primarias para su explotación y análisis. Se expresan de forma modular, a través de esquemas XML extensibles, son acompañadas de una documentación detallada, y publicadas bajo una licencia open-source. Las Guidelines son mantenidas y desarrolladas por el TEI Consortium, a través de su Technical Council, con el respaldo y la participación de la comunidad TEI. http://www.tei-c.org/Guidelines/
![Page 58: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/58.jpg)
Guidelines
• Marco de trabajo flexible basado en módulos
(un total de 21; 4 obligatorios)
• Una selección de más de 500 etiquetas
• Una estructura en clases de modelo y atributos
• Módulos: http://www.tei-c.org/release/doc/tei-p5-doc/en/html/
![Page 59: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/59.jpg)
Módulos principales
• tei: definición de las clases, macros y tipos de
datos
• textstructure: elementos de base para estructurar un texto de tipo libro
• core: elementos disponibles en todos los documentos TEI
• header: encabezado TEI (metadatos del documento)
![Page 60: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/60.jpg)
Recordemos. Tipos de elementos
Un elemento puede contener, según se especifique en el esquema :
1. Otros elementos, subelementos o elementos hijos .
Ej.: <text><body><lg><l>
2. Texto.
Ej.: <author>Prescod, Paul</author>
3. Contenido mixto, o sea, una mezcla de elementos hijos y texto.
Ej.: <title>Charles F. Goldfarb's<enfasis>XML</enfasis> Handbook</title>
4. Nada, si es un elemento vacío. Ej.:<Cartel fuente=“imagen1.jpg"/>
![Page 61: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/61.jpg)
Tipos de elementos
Un elemento puede ser, según se especifique en el esquema,
1. Obligatorio
2. Opcional
3. Prohibido
![Page 62: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/62.jpg)
Etiquetas core
![Page 63: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/63.jpg)
HEADER
![Page 64: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/64.jpg)
<fileDesc>
<TEI> <teiHeader>
<fileDesc> <titleStmt> <title></title> <author></author> <editor></editor> </titleStmt>
<publicationStmt> <date></date> <publisher></publisher> <availability> <licence></licence> </availability> </publicationStmt> </fileDesc>
![Page 65: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/65.jpg)
<fileDesc>
<teiHeader> <fileDesc> <titleStmt> <title>Vi estar fermosa vista</title> <author>Pero González de Uceda</author> <editor>Gimena del Rio</editor> </titleStmt> <publicationStmt> <date>08/11/2014</date> <publisher>Jornadas de la AAHD</publisher> <availability> <licence>Creative Commons</licence> </availability> </publicationStmt> </fileDesc>
![Page 66: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/66.jpg)
<sourceDesc>
<sourceDesc> <bibl> <title></title> <editor></editor> <pubPlace></pubPlace> <publisher></publisher> <date></date> </bibl> </sourceDesc>
![Page 67: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/67.jpg)
<sourceDesc>
<sourceDesc>
<bibl type="url">http://cancionerovirtual.liv.ac.uk</bibl> <title>Cancionero Virtual</title> <editor>Brian Dutton</editor> <pubPlace>Liverpool</pubPlace> <publisher>U. of Liverpool</publisher> <date>2006-</date> </sourceDesc>
![Page 68: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/68.jpg)
Esquema
•Todo documento TEI necesita un esquema que establezca una sintaxis precisa. TEI ofrece algunos modelos, como una versión light (teilite.rng) o una versión con todos los elementos (tei_all.rng)(que es poco recomendable).
• La buena práctica sugiere que cada proyecto debe crear a su medida un esquema, adoptando los módulos que crea conveniente, eliminando y añadiendo elementos, eliminando y concretando atributos y valores. Así, la labor de marcado será mucho más fácil y consistente.
![Page 69: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/69.jpg)
¿Para qué un esquema?
1. Asegura que en los documentos solo se utilizan
los elementos, atributos y entidades predefinidas.
2. Establece las reglas estructurales del tipo ‘toda
receta debe incluir una lista de ingredientes’
3. Asegura que la misma cosa se llame de la misma
manera siempre
![Page 70: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/70.jpg)
ROMA
Para crear nuestro esquema, disponemos de una herramienta muy útil y fácil de manejar que se llama ROMA.
• Gracias a esta aplicación, podremos crear el fichero ODD = One Document Does it All, que será esencial para nuestro trabajo.
• Sería algo así como… :
– Roma: “el supermercado”
– Esquema: “los ingredientes”
– ODD: “la receta”
![Page 71: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/71.jpg)
ROMA
• Generar y modificar un esquema
• Elegir la lengua de la documentación
• Elegir los módulos que nos interesan
• Añadir y eliminar elementos en una determinada clase
• Modificar clases de atributos
• Elegir el tipo de esquema: RelaxNG, Schematron, W3C, Schema (no DTD)
• Generar una documentación (en HTML, por ejemplo)
• Guardar nuestra personalización
![Page 72: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/72.jpg)
• No hay una sola manera “correcta” de marcar los textos.
• Seguir la TEI significa seguir, en la medida de lo posible, las recomendaciones de codificación consensuadas en las Guidelines.
• Aprender de la codificación de otros proyectos es muy importante, por eso es importante compartir el código.
• Cada proyecto debe personalizar un modelo de marcado y un esquema, así como documentarlo detalladamente.
• El uso de TEI facilita el re-uso del texto, en diferentes formatos, en diferentes contextos, por diferentes usuarios, en diferentes plataformas, etc.
![Page 73: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/73.jpg)
ROMA. http://www.tei-c.org/Roma/
![Page 74: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/74.jpg)
Ejercicio 1. Esquema en Roma
![Page 75: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/75.jpg)
Ejercicio 2. Crear xml doc y asociar esquema
![Page 76: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/76.jpg)
Semáforo verde
• Para crear un doc. xml válido tengo que asociarle un esquema también válido. Solo así obtendré un documento bien formado
(LUZ ROJA vs. LUZ VERDE)
![Page 77: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/77.jpg)
EJEMPLO
![Page 78: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/78.jpg)
6. Verso
![Page 79: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/79.jpg)
HEADER Y VERSO
![Page 80: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/80.jpg)
![Page 81: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/81.jpg)
1782-a
Arbolito naranjado,
¡bonito pago me has dado!,
después de quedar conmigo,
a la luna me has dejado.
http://www.cervantesvirtual.com/obra-visor-din/cancionero-popular-
de-jujuy--0/html/ffea72c4-82b1-11df-acc7-002185ce6064_168.html#I_2265_
![Page 82: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/82.jpg)
Ejercicio 3. Completar
![Page 83: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/83.jpg)
<text> <body> módulo verso
![Page 84: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/84.jpg)
Tutoriales
• Learn TEI
• TEI WIKI
• TEI by Example
![Page 85: Explotación y visualización de datos de investigación en Humanidades Digitales: la edición digital académica en XML-TEI de textos poéticos por Gimena del Rio](https://reader031.fdocuments.mx/reader031/viewer/2022030222/5883d3b51a28abb7308b6fa5/html5/thumbnails/85.jpg)
Algunas herramientas
Lista de herramientas:
• Interedtion Wiki. Existing Tools
• TEI Tools
Herramientas de transformación:
• Oxgarage
Visualización y plataformas de publicación:
• TEI Viewer
• TEI Boilerplate
• V-Machine