Arqueología y Prehistoria del 01 01-6.pdfARPI. Arqueología y Prehistoria del Interior peninsular...

Arqueología y Prehistoria del

Interior Peninsular

01

2014

SARPI 01

Arqueología y Prehistoria del Interior peninsular

Publicación Anual: 2014 ISSN: 2341-2496 Dirección: Primitiva Bueno Ramírez (UAH) Subdirección: Rosa Barroso (UAH) Consejo editorial: Manuel Alcaraz (Universidad de Alca-lá); José Mª Barco (Universidad de Alcalá); Cristina de Juana (Universidad de Alcalá); Mª Ángeles Lancharro (Universidad de Alcalá); Estibaliz Polo (Universidad de Alcalá); Antonio Vázquez (Universidad de Alcalá); Pie-dad Villanueva (Universidad de Alcalá). Comité Asesor: Rodrigo de Balbín (Prehistoria-UAH); Margarita Vallejo (Historia Antigua- UAH); Lauro Olmo (Arqueología- UAH); Leonor Rocha (Arqueología – Uni-versidade de Évora); Enrique Baquedano (MAR); Luc Laporte (Laboratoire d'Anthropologie, Université de Rennes); Laure Salanova (CNRS). Edición: Área de Prehistoria (UAH)

SUMARIO 1.– PREVIO 04-21 Más sobre cronología del Paleolítico cantábrico: Tito Bustillo. Asturias De Balbín Behrmann, Rodrigo y Alcolea González, Javier 2.– ARTICULOS 22– 46 Restos óseos y contextos arqueológicos neanderthales en el Levante y Sur peninsular. Pérez Hernán, Rebeca 47– 63 Inicio al estudio de la piezas de arte mueble finipaleolóticas y azilienses sobre soporte lítico. De Juana Ortín, Cristina 64– 85 Dinámicas de ocupación y transformación del territorio medieval en el Alto Tajo (Guadalajara). Checa Herraiz, Joaquín 86- 108 Sur del Tajo, 1937. Patrimonio de una batalla de la Guerra Civil. Ruiz Casero, Luis Antonio 109- 120 La documentación epistolar como fuente Arqueológica Sánchez Salas, Francisco 121– 142 La Web en la investigación bibliográfica. Una herramienta para el historiador. Barco Belmonte, José María

ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 121

LA WEB EN LA INVESTIGACIÓN BIBLIOGRÁFI-

CA. UNA HERRAMIENTA PARA EL HISTORIA-

DOR

José María Barco Belmonte (1)

Resumen

Nos encontramos inmersos en la sociedad de la información, una era caracterizada por el uso masivo de

las TIC (Tecnologías de la Información y la Comunicación). En este nuevo marco social la Web se ha convertido en

un recurso fundamental para la documentación bibliográfica y sin embargo, apenas conocemos los conceptos

más elementales de su estructura y funcionamiento. En el presente artículo se realiza un acercamiento a estas

cuestiones que pretende mejorar nuestro conocimiento sobre las herramientas y recursos que la Web pone a

nuestra disposición. Sin duda, un uso adecuado y estructurado de estos recursos puede optimizar sustancialmen-

te nuestro trabajo en términos de tiempo y esfuerzo.

Palabras clave: Internet, Espacio Web, Bibliografía, Buscadores, Gestores bibliográficos.

Abstract

Today we live in an Information Age defined by the availability of Information Technology (IT). In this

environment the Web has become an indispensable resource for scholarship. However, many scholars seem to

be still unaware of its basics. This paper tries to address this problem strengthening our knowledge on the tools

and resources the Web makes available to scientific research. A more skillful employment of these resources

may improve significantly our work in terms of time and effort.

Key words: Internet, Web, Bibliography, Search engine, Bibliographic managers.

(1) Becario FPU. - UAH. [email protected]

Este artículo supone la ampliación del capítulo de metodología correspondiente al Trabajo Final de Master “Hocincavero y

las piedras hincadas de la Meseta Oriental” leído en la Universidad de Alcalá en julio de 2012.


1.- LA SOCIEDAD DE LA INFORMACIÓN: EL OR-

DENADOR E INTERNET

El desarrollo tecnológico alcanzado por

las sociedades industriales del siglo XX permitió la

paulatina implementación de las TIC (Tecnologías

de la Información y la Comunicación). Desde sus

primeros momentos se produce un avance expo-

nencial en su desarrollo y una perfecta simbiosis

con la sociedad que las usa y disfruta. En la actuali-

dad somos plenamente conscientes de que nos

hayamos inmersos en la era de la información. Por

supuesto, la Sociología se ha interesando por esta

cuestión, dando lugar a la acuñación de términos

que son suficientemente explicativos por sí mis-

mos. Así, se habla de nativo digital e inmigrante

digital, que sirven para caracterizar a la sociedad

en dos grupos; las generaciones que han crecido en

un entorno plenamente dominado por el ordena-

dor e Internet y las que por contra, se han visto

obligadas a entrar en el nuevo mundo digital

(Prensky 2001). En el camino que nos ha llevado

hasta este punto podemos señalar los dos hitos

más importantes; el ordenador e Internet. La ge-

neralización de los ordenadores supuso el paso

previo y casi coetáneo a la irrupción de Internet,

que pueden considerarse como los dos grandes

pilares que sostienen el desarrollo de la sociedad de

la información.

Los primeros ordenadores electrónicos

cuentan con nombres propios como el Z3 de Kon-

rad Zuse (1941), el Mark I de la universidad de

Hardvard (1944) o el ENIAC de la Universidad de

Pennsylvania (1946). Se trataba de auténticos co-

losos fruto de costosos proyectos de investigación.

A modo de ejemplo, el ENIAC ocupaba una superfi-

cie de 450 m² y pesaba 30 toneladas (Huidrobo

2008a). Sin embargo, la evolución de los ordena-

dores va fuertemente unida al vertiginoso avance

de las tecnologías y en los años 70 ya aparecen los

primeros PC u ordenadores personales. A princi-

pios de los años 80 encontramos el lanzamiento de

los primeros PC con éxito comercial, en 1981 IBM

lanza al mercado el modelo 5150 y muy poco des-

pués, la compañía Apple presenta el Macintosh

125kb. Desde entonces, han pasado poco más de

30 años y su vertiginosa expansión por todo el

mundo desarrollado resulta evidente, en 2008 se

estimaba que el mundo había llegado a los 1.000

millones de ordenadores (2). Desde entonces, las

ventas de ordenadores se han mantenido en cifras

estables que rondan los 100 millones de unidades

anuales (3).

En lo que concierne a la disciplina históri-

ca podemos señalar el uso de los ordenadores

desde fechas muy tempranas, coincidiendo con el

auge de las corrientes historiográficas derivadas

del cientificismo. El desarrollo de métodos cuanti-

tativos y estadísticos propios de la Historia econó-

mica o demográfica suponen una primera toma de

contacto entre el ordenador y el historiador

(Montesi 2011: 86). Sin embargo, consideramos

que el verdadero salto cualitativo en lo que con-

cierne al ejercicio de la Historia se debe a la apari-

ción de los ordenadores personales y el desarrollo

paralelo de los procesadores texto. Aunque apenas

ha sido mencionado o valorado por la historiogra-

fía, tanto el ordenador personal como el procesa-

(2) http://www.20minutos.es/noticia/247042/0/millones/ordenadores/estudio/ (3) http://www.gartner.com/newsroom/id/1893523


dor de texto se han convertido en dos elementos

básicos de cualquier tarea académica o de investi-

gación. Como acertadamente se ha señalado “La

tecnología más eficiente es la que apenas se nota:

simplemente se usa.” (Fernández Izquierdo 2006:

16). Estas dos herramientas suponen un cambio

sustancial en nuestra forma de escribir y trabajar,

transformando definitivamente la esencia misma

de los mecanismos de escritura; hemos pasado de

la escritura mecánica a la escritura electrónica.

Principalmente, supone la intermediación entre

los procesos mecánicos como el tecleado o la im-

presión en papel de una compleja trama de siste-

mas electrónicos e informáticos. Desde la creación

misma del documento hasta su difusión por los

diferentes medios y formatos partimos de un ele-

mento tan simple como el bit, que como acertada-

mente describiera Negroponte, constituye la esen-

cia misma, el ADN de la información: “Un bit no

tiene color, tamaño ni peso y viaja a la velocidad de

la luz. Es el elemento más pequeño en el ADN de la

información. Es un estado de ser: activo o inactivo,

verdadero o falso, arriba o abajo, negro o blanco.

Por razones prácticas consideramos que un bit es un

1 o un 0” (Negroponte 1995: 28).

No podría entenderse el éxito de los orde-

nadores sin el desarrollo coetáneo y completa-

mente simbiótico de Internet. Ambos elementos

se han retroalimentado impulsando mutuamente

su crecimiento. La gran contribución de Internet es

sin duda el WWW (World Wide Web), más conocido

como el Espacio Web.

La generalización de la Web ha crecido a

una velocidad aún mayor que la de los propios or-

denadores, especialmente, desde mediados de la

primera década del nuevo siglo. Un buen ejemplo

lo constituye Google, un buscador fundado en

1998 que antes de terminar el año 2011 alcanza los

1.000 millones de usuarios (4), es decir, uno de

cada siete habitantes del planeta usa Google a

diario. Otro caso significativo lo encontramos en

Facebook. Esta popular red social nace en el año

Fig. 1.- Crecimiento de la Web en febrero de 2013 (Fuente: http://news.netcraft.com/). Se ha añadido la indicación de la esti-mación realizada por Criado Fernández (2009).

(4) http://america.infobae.com/notas/27640-Google-alcanz-los-1000-millones-de-usuarios


2004 y a comienzos de 2013 supera los 650 millo-

nes de usuarios diarios. Esto nos sirve para dar

cuenta de la vertiginosa velocidad a la que avanza

la Web. El aumento de los datos disponibles co-

mienza a ser descomunal y su crecimiento sigue

un ritmo exponencial (Zazo et al. 2004). Resulta

muy complicado establecer cálculos sobre el ta-

maño total de la Web, especialmente, debido a

que un mismo sitio web contiene varias páginas

web. (5) Usando las gráficas de Netcraft (6) sobre el

número de sitios webs y los trabajos de Bergman

(2001) sobre el número de páginas que contiene

cada sitio web, se ha estimado que en mayo de

2009 el tamaño de la Web era equivalente a más

de 94 millones de libros (Criado 2009: 5-6). Como

se puede observar (Fig. 1), Criado realiza su esti-

mación en 2009 con 236 millones de sitios, sólo 3

años después el número de sitos webs ha aumen-

tado hasta los 678 millones. Siguiendo la estima-

ción de Criado y con los datos actualizados pode-

mos calcular que el tamaño de la Web equivale a

270 millones de libros.

Todo lo expuesto sirve para ilustrar que

nos encontramos ante un nuevo marco, un nuevo

contexto que crece y se transforma a un ritmo ver-

tiginoso y que ha cambiado notablemente la me-

todología de trabajo en cualquier tarea de investi-

gación. La disciplina histórica no constituye ningu-

na excepción, el método tradicional basado en la

(5) En realidad, no existe una diferencia estricta entre página web y sitio web por lo que ambos términos pueden utilizarse como sinónimos. No obstante, puede considerarse y así lo hacemos a lo largo de este artículo, el término sitio web para hacer referencia a la página inicial o principal de un conjunto de páginas webs interrelacionadas. (6) http://newsroom.fb.com/content/default.aspx?NewsAreaId=22

Fig. 2.- Comparación del uso de Internet y las bibliotecas como fuente de documentación entre alumnos de la Universi-dad de Granda. (Comas et al. 2011)


consulta de fuentes impresas en archivos y biblio-

tecas ya no es suficiente por sí solo y cada vez co-

bra una importancia mayor el uso de las TIC y el

entorno web (Karsenti y Lira 2011). Aunque resulta

difícil cuantificar el grado de generalización alcan-

zado por las TIC, contamos con algunos estudios

que nos aportan algunos datos orientativos. Re-

cientes trabajos (Comas et al. 2011) han estimado

que el porcentaje de alumnos universitarios que

usan Internet como fuente habitual para la búsque-

da de datos es superior al de las bibliotecas en to-

dos los niveles de estudio y en todas las áreas de

conocimiento (Fig. 2). Esto les ha llevado a concluir

que “Internet es, sin duda, la fuente predilecta entre

el alumnado universitario pregraduado para buscar

documentación académica” (Comas et al. 2011: 60)

lo que además es concordante con otros estudios

similares nacionales e internacionales (Arras et al.

2011; Sanuy y Guijosa 2011; Martínez y Acosta

2011). Aunque no disponemos de datos precisos

para cuantificarlo, creemos que entre los investiga-

dores y especialistas esta tendencia se encuentra

igualmente asentada e incluso ampliada, observa-

ción que resulta generalmente admitida entre

quienes se han acercado al temática (Echavarría

Ramírez 2004: 117; Fresquet 2005; Karsenti y Lira

2011: 2).

2.- ESTRUCTURA Y FUNCIONAMIENTO DE IN-

TERNET Y LA WEB

A pesar de lo cotidiano que nos resulta el

uso de Internet solemos quedarnos muy en la su-

perficie de su estructura y funcionamiento. No es

habitual que el usuario medio conozca los concep-

tos básicos del funcionamiento de la Red.

Internet es un conjunto de redes físicas

interconectadas que mediante un conjunto de pro-

tocolos de comunicación funcionan como una red

lógica única y mundial. Aunque existen decenas de

protocolos, el conjunto de los mismos se engloba

bajo el conocido TCP/IP, es decir, Transmission

Control Protocol (TCP) e Internet Protocol (IP). Ex-

plicar el funcionamiento completo de este entra-

mado resulta realmente complejo, pero encontra-

mos un buen referente en el modelo OSI desarro-

llado por la International Standard Organization

(ISO) que conceptualiza y estandariza la estructura

de Internet en capas o niveles. Como puede obser-

vase (Fig. 3), las siete capas del modelo OSI pueden

simplificarse en cuatro capas genéricas, a cada una

de las cuales se asocian un conjunto de protocolos

concreto. Existen cientos de protocolos, por lo que

sólo se mencionan algunos de los más importantes

o conocidos. TCP e IP constituyen los principales

protocolos de Red y Transporte, y en concreto, se

encargan de ubicar físicamente nuestro ordenador

en la Red. Es decir, hacen nuestro ordenador acce-

sible y nos facilitan el acceso al resto de los ordena-

dores de la Red. Sin embargo, los protocolos más

importantes para el tema que tratamos se locali-

zan en la denominada capa de aplicación; FTP que

permite el envío de archivos, SMTP para el correo

electrónico o DNS encargado de gestionar los

nombres de dominio. Entre éstos, nos interesa

especialmente el protocolo HTTP (Hypertext Trans-

fer Protocol) desarrollado por la World Wide Web

Consortium (3WC) y que constituye la base funda-

mental en la que se sustenta en funcionamiento de

la Web. Este protocolo permite realizar enlaces de

texto mediante hipervínculos, creando una red de

conexiones mediante los denominados enlaces de


hipertexto. De este modo, cada sitio o página web

constituye un punto o nodo que se conecta a otros

puntos o nodos mediante enlaces o hipervínculos.

Por lo tanto, la Web se compone de un inmenso

entramado de sitios o direcciones web interconec-

tados mediante hiperenlaces. Esto ha dado pie a la

famosa comparación de la estructura de la Web

con una gigantesca tela de araña.

Es importante diferenciar entre una direc-

ción de Internet y una dirección web. Cuando un

ordenador se conecta a la Red se le asigna una

dirección IP que sirve para ubicar e interconectar

nuestro ordenador en Internet. Esta dirección vie-

ne dada por los protocolos TCP/IP y consta de un

conjunto de 4 números enteros binarios de 8 bits

cada uno; 88.88.88.88. Cada número de 8 bits pue-

de alcanzar un valor máximo de 255, por lo puede

calcularse que el número máximo de IP disponibles

es de 4.228 millones. Por esta razón, aunque exis-

ten direcciones IP estáticas (no variables), a la in-

mensa mayoría de los usuarios diarios de Internet

se les asigna una dirección IP dinámica (variable)

cada vez que se conectan a la Red.

Una vez nos hemos conectado a Internet,

accedemos al espacio Web mediante las direccio-

nes web. Estas direcciones vienen dadas mediante

la conocida fórmula: http:/ www/ nombredelsi-

tio.com (.es, .net, .org…). La primera parte es fija y

se compone de dos grupos de letras; las 4 primeras

hacen referencia al mencionado protocolo HTTP y

las 3 siguientes nos indican el servicio de Internet

al que estamos accediendo (World Wide Web). La

segunda parte de la dirección es variable y se com-

pone de otros dos grupos de letras gestionados

por el protocolo DNS (Domain Name System); el

primer conjunto tiene una extensión variable y

constituye el nombre del sitio, mientras el segun-

do y último grupo está constituido por el nombre

de dominio. Entre estos últimos podemos destacar

dos grandes grupos: los genéricos (.com, .net,

.org…) y los geográficos (.es, .fr, .uk…). Estas di-

recciones nos sirven para reconocer y localizar los

diferentes sitios webs dentro de la Web.

Las páginas web son documentos realiza-

dos en formato HTML (HyperText Markup Langua-

Fig. 3.- Estructura de Internet por capas o niveles. Elaborado a partir de López Quesada (2012), consultado en 2013. http://dis.um.es/~lopezquesada/documentos/IES_1213/LMSGI/curso/xhtml/xhtml22/index.html


ge -lenguaje de marcado de hipertexto-). Pueden

contener texto, imágenes, videos o cualquier ma-

terial multimedia, en suma, contienen la informa-

ción. Para poder trabajar con la información conte-

nida en las páginas webs es necesario emplear un

Navegador. Los navegadores web son aplicaciones

capaces de interpretar el código HTML, lo que nos

sirve para visualizar la información que contienen

las webs y al mismo tiempo, nos permite despla-

zarnos de una página a otra mediante los enlaces o

hipervínculos. Actualmente, los navegadores más

populares son Internet Explorer, de la Corporación

Microsoft, Google Chrome de la compañía Google

Inc y Mozilla Firefox sustentado por la Fundación

Mozilla.

Fig. 4.- Los diferentes espacios de la Web. (Baeza Yates

2004: 5). Modificado

Aunque la Web se presenta ante nosotros

como un espacio único y más o menos homogé-

neo, esto no resulta estrictamente cierto y pueden

diferenciarse varios espacios Web. Desde los pri-

meros años del nuevo siglo se comienza a diferen-

ciar la Web 2.0 para referirse a los cambios ocurri-

dos en la Web a partir de la irrupción de sitios

esencialmente interactivos. Entre éstos se inclu-

yen sitios como los blogs, las wikis y las redes socia-

les que se caracterizan por la interacción y la crea-

ción colaborativa entre los propios usuarios. De

este modo, se utiliza la Web 1.0 para referirse a la

Web tradicional, caracterizada por los contenidos

estáticos que normalmente sólo son modificados y

actualizados por los administradores de la página.

Por el contrario, la Web 2.0 se caracteriza por los

contenidos dinámicos y en constante actualización

que al contrario de los anteriores, son generados

por una comunidad de usuarios.

Mención aparte merece la conocida como

Web Invisible o preferiblemente Web profunda, que

sirve para referirse a todo lo que no es Web visible

o superficial. Esta Web se caracteriza por no ser

accesible a través de los medios habituales, ya

sean navegadores o motores de búsqueda. Desde

el punto de vista documental está formada princi-

palmente por; páginas protegidas, páginas en for-

matos no indexables por los motores de búsqueda,

archivos, catálogos y bases de datos cuyos conte-

nidos no son completamente accesibles

(Echavarría Ramírez 2004: 118; Salazar 2005: 64).

Lejos de tratarse de información residual, se ha

estimado que la Web profunda tendría un tamaño

500 veces superior al de la Web visible y que la

calidad de sus contenidos es del mismo nivel, in-

cluso más valiosa, que la de la propia Web visible

(Bergman 2001; Baeza 2004; Salazar 2005: 64; He

et al. 2007, 95). En nuestro caso, destacan las re-

vistas electrónicas cuyos contenidos sólo son ac-

cesibles mediante el pago previo de una cuota de

inscripción, lo que deja en la web profunda una

importante cantidad de información relevante. Sin

embargo, en la mayor parte de los casos, resulta

posible acceder a la información contenida en la

Web profunda mediante las herramientas propias


del sitio o las tecnologías de búsqueda adecuadas.

( Esto hace muy interesante conocer este tipo de

recursos, puede consultarse algunos ejemplos en

Echavarría Ramírez 2004: 120; Salazar 2005: 145-

149).

Finalmente, cabe mencionar la Web Se-

mántica, un proyecto impulsado por el World Wide

Web Consortium que pretende dotar de mayor sig-

nificado a la Red mediante el desarrollo de lengua-

jes universales que permitan que la información

contenida en las webs esté mejor definida. Para

esto, utiliza fundamentalmente los mecanismos

RDF, SPARQL, y OWL, tecnologías que ayudan a

estandarizar, definir y ordenar los datos conteni-

dos en las páginas webs (7). El objetivo último con-

siste en dotar de cierta inteligencia artificial a la

Web futura, de tal modo, que no sólo se limite a

ejecutar nuestras búsquedas, sino que sea capaz

de comprender lo que estamos buscando.

3.- MÉTODOS DE BÚSQUEDA DE INFORMA-

CIÓN EN LA WEB

El uso de la Web ha generado un nuevo

escenario para investigación bibliográfica. Tene-

mos a nuestra disposición un volumen de informa-

ción en crecimiento exponencial y de una naturale-

za y calidad muy variables. Cada vez resulta más

laborioso y frustrante recopilar y filtrar los conteni-

dos realmente útiles, lo que pone de relieve la ne-

cesidad de adecuar nuestra metodología de traba-

jo para el tratamiento de grandes volúmenes de

información. Para comenzar esta tarea, se debe

atender a dos conceptos fundamentales; la bús-

queda y la gestión de la información.

En la Figura 5 se presenta un pequeño

esquema conceptual sobre los elementos básicos

que intervienen en una búsqueda de información

en la Web. En primer lugar, hay que considerar que

los sitios webs son generadores de contenidos. To-

(7) http://www.w3c.es/Divulgacion/GuiasBreves/WebSemantica

Fig. 5.– Mapa conceptual de la búsqueda de información en la Web.


dos los sitios webs generan contenidos, la dificul-

tad consiste en llegar hasta aquellos que producen

una información útil para nuestro trabajo. Como

puede observarse (figura 5) se han incluido algu-

nos ejemplos del tipo de generadores de conteni-

do más habituales para la investigación histórica.

Nos interesan los generadores de recursos biblio-

gráficos, especialmente, los catálogos de bibliote-

cas, universidades o instituciones, las webs de re-

vistas electrónicas, los archivos digitalizados, las

bibliotecas virtuales así como una larga lista de

recursos que podemos obtener de sitios webs es-

pecializados. Estos sitios ponen a disposición de la

Web una serie de recursos (bases de datos, archi-

vos de texto, imágenes…) que en suma, componen

la información útil para los trabajos de investiga-

ción. La principal problemática que debemos

afrontar es cómo recuperar esta información, có-

mo llegar hasta ella, en definitiva, lo que llama-

mos, la búsqueda.

En primer lugar necesitamos un navega-

dor web. Mediante la navegación podemos despla-

zarnos de un sitio web a otro, visualizar sus conte-

nidos y recuperar la información que contienen.

Por lo tanto, es posible realizar búsquedas de in-

formación mediante la simple navegación, aunque

resulta necesario ayudarnos de directorios (figura

5). Los directorios son sitios webs que contienen

un listado de enlaces ordenados y agrupados por

categorías y subcategorías, lo que nos permite

realizar con cierta eficacia búsquedas temáticas.

Además de los directorios generalistas como el de

Yahoo (http://www.yahoo.es/) o Terra (http://

www.terra.es/) cualquier página especializada,

normalmente, incluirá un pequeño directorio con

otras páginas de interés también especializadas en

la misma temática que suelen agruparse bajo epí-

grafes como Enlaces de interés u Otros sitios. Este

tipo de búsquedas pueden ser útiles cuando quere-

mos informaciones generalistas o comenzar a in-

formarnos sobre temas desconocidos o ajenos a

nuestra propia disciplina. Nos permite navegar con

facilidad de un sitio a otro ampliando o concretan-

do la información recopilada. Se trata de una suer-

te de exploración de la Web que también puede

llevarnos fácilmente a localizar información rele-

vante que desconocíamos y no andábamos bus-

cando antes de comenzar la exploración. No obs-

tante, si bien los directorios tuvieron su utilidad en

los primeros tiempos, en la actualidad, resultan

claramente insuficientes. Por esta razón suelen

llevar incorporado un Buscador, de modo que hoy

en día la mayor parte de las páginas de búsqueda

ofrecen una combinación de directorios y busca-

dores (Salazar y Vidal 2000: 94; Salazr 2005: 46-

47).

Los buscadores, o más correctamente los

motores de búsqueda, son sistemas de búsqueda

de archivos en la Web basados en palabras clave.

Mientras los directorios de búsqueda suelen crear-

se manualmente por especialistas, el funciona-

miento de estos motores se basa en robots que

realizan búsquedas automáticas en la Red. Perió-

dicamente estos robots, conocidos como spiders o

arañas, rastrean la Red en busca de páginas webs

que serán almacenadas en sus bases de datos.

Estas arañas se desplazan por la Web siguiendo los

enlaces de hipertexto que existen en los propios

documentos encontrados de tal forma, que saltan

de página a página registrando la información re-

cuperada en cada una. Los datos recuperados por

las arañas serán organizados por un indexador,


que indizará cada página en la base de datos del

buscador. Durante el proceso de indización se re-

cuperan todos los términos representativos del

documento y son ordenados a partir de dos pará-

metros, la frecuencia de aparición y su localización

en el texto. Esto da lugar a la creación de un fiche-

ro índice (index file) que contiene todos los térmi-

nos ordenados alfabéticamente con dos valores

asociados; el número de ocurrencias y la localiza-

ción. Los propios términos indizados aportan el

significado, el tema sobre el que trata la página

web indexada, el número de ocurrencias indica el

número de veces que ese término se repite en el

texto y la locación indica el lugar del texto en el

que aparece el término (Pérez-Montoro 2010: 241-

245). Contrariamente a la creencia generalizada,

cuando realizamos una consulta en un buscador en

realidad, no estamos buscando en toda la Web

sino en las páginas previamente indexadas en la

base de datos del buscador por sus arañas. El bus-

cador utiliza los términos introducidos en nuestra

consulta para compararlos con su fichero índice,

de donde podrá recuperar las páginas webs que

contienen esos términos y finalmente, presentar

los resultados de la búsqueda ordenados en fun-

ción de su relevancia.

Una vez hemos presentado los aspectos

básicos de su funcionamiento resulta más sencillo

entender su problemática. Como se ha visto, el

buscador no explora toda la Web, se encuentra

limitado a las páginas previamente indexadas por

sus arañas. Una parte de estos documentos for-

man parte de la Web profunda y no pueden ser

indexados, otra parte corresponde a documentos

indexables que no han sido localizados por las ara-

ñas y constituyen el denominad silencio de los bus-

cadores. En consecuencia, cuando realizamos una

Fig.6.- Conceptos básicos sobre el funcionamiento de los motores de búsqueda en la Web. Ferrán y Pérez-Montoro 2009.


búsqueda en la Web siempre existirá un grupo de

documentos relevantes que no estará indexado

por el buscador y por lo tanto, no serán encontra-

dos. Por otra parte, dentro del conjunto de webs

indexadas y recuperadas, nuestros términos de

búsqueda aparecerán en una cantidad importante

de páginas que en realidad, no contienen informa-

ción relevante para nosotros. Este conjunto de

resultados encontrados pero no relevantes consti-

tuyen el denominado ruido, es decir, páginas recu-

peradas que en realidad, no son útiles (Meadow

1993; Ferrán y Pérez-Montoro 2009). Estos con-

ceptos sirven de base para evaluar la eficiencia de

los buscadores que viene dada por dos índices

principales; el índice de exhaustividad y el índice de

precisión (Meadow 1993: Ferrán y Pérez-Montoro

2009, Pérez-Montoro 2010). El índice de exhausti-

vidad nos indica la capacidad del buscador para

encontrar todas las páginas relevantes que existen

en la Web sobre el tema buscado. El índice de pre-

cisión nos indica la relación entre el total de pági-

nas encontradas por el buscador con nuestro tema

de búsqueda y cuáles de éstas son realmente rele-

vantes.

Las descomunales dimensiones de la in-

formación disponible en la Web está haciendo que

cada vez sean más evidentes los problemas para

filtrar y gestionar su calidad; “Este gran desarrollo

ha convertido el proceso de acceso a la información

en un problema cada vez más crítico. Los buscado-

res funcionaron muy bien durante estos años; sin

embargo, el extraordinario crecimiento que ha expe-

rimentado la Web empieza a mostrar sus primeros

síntomas frustrantes. Cada día el usuario necesita

dedicar más tiempo para filtrar las páginas web que

devuelve una búsqueda, es decir, la calidad de la

información es cada vez peor” (Criado 2009). Con

lo visto hasta el momento podemos entender me-

jor las dimensiones de esta problemática, los lími-

tes de los buscadores y la importancia de realizar

búsquedas exhaustivas y precisas.

Una búsqueda con cientos de páginas

recuperadas en realidad, no es una búsqueda útil,

ya que el esfuerzo necesario para revisar todos los

resultados sería inabarcable. El usuario medio sólo

revisará los primeros resultados ofrecidos por el

buscador, de modo, que la clave del buen funcio-

namiento de los buscadores se encuentra en su

capacidad de valorar adecuadamente la relevancia

de los documentos encontrados. Este es uno de

los objetivos perseguidos por la ya mencionada

Web Semántica pero, independientemente de

ésta, los buscadores disponen de diversas herra-

mientas para establecer la relevancia de los docu-

mentos. Entre éstas, destaca el uso de los operado-

res que podemos dividir en tres categorías: opera-

dores lógicos o booleanos, operadores posicionales

y operadores de exactitud o truncamiento (Salazar

2005: 101-103). Estos operadores son diferentes

símbolos o marcas que podemos utilizar cuando

introducimos los términos de nuestra búsqueda y

nos sirven para definir mejor nuestras peticiones al

buscador. Los más conocidos son los operadores

booleanos [AND] y [OR] que sirven para especificar

si buscamos documentos que contengan todos los

términos introducidos en la búsqueda o si nos sir-

ven los documentos donde aparece cualquiera de

los términos buscados. También son muy conoci-

dos los operadores de exactitud o truncamiento

como las comillas [“”], utilizadas para buscar tér-

minos exactos o el asterisco [*], utilizado cuando

queremos buscar palabras que comiencen por un


mismo conjunto de letras (Bomb*, nos devolverá

valores como bomba, bombero, bombón, bombi-

lla…). Aunque nosotros no lo especifiquemos

cuando introducimos nuestros términos de bús-

queda estos operadores son utilizados por defec-

to. De hecho, cuando utilizamos las herramientas

de búsqueda avanzada disponibles en la mayoría

de buscadores, en realidad, la interfaz del busca-

dor nos está guiando para utilizar correctamente

este tipo de operadores. En cualquier caso, resulta

de gran interés conocer los diferentes operadores

que podemos utilizar con nuestro buscador habi-

tual. El hecho de conocerlos y saber utilizarlos por

nosotros mismos nos ayudará a precisar nuestras

búsquedas sin tener que confiar en el criterio del

buscador.

A pesar de lo visto, la clave del éxito de

los buscadores se encuentra en los denominados

algoritmos de búsqueda. Se trata del conjunto de

fórmulas y procesos informáticos que discriminan

las páginas útiles de las que no lo son y nos las pre-

sentan ordenadas según su grado de relevancia.

Un ejemplo ilustrativo lo encontramos en el famo-

so PageRanke, la familia de algoritmos desarrolla-

dos por los fundadores de Google y que fue clave

para el tremendo éxito de su buscador. El Page-

Ranke confía en la experiencia de la propia Web y

valora la relevancia de un sitio web en función del

número de otros sitios webs que apuntan hacia él.

Es decir, cuantos más sitios tengan un link hacia

una misma página mayor relevancia tendrá ésta.

Este mismo ejemplo nos sirve para ilustrar el pro-

blema de utilizar buscadores generalistas en los

trabajos de investigación. Cualquier buscador al

uso tratará de desarrollar algoritmos capaces de

satisfacer las necesidades del usuario medio, es

decir, dará relevancia a los resultados más comu-

nes. Sin embargo, un investigador requiere de re-

sultados mucho más concretos y que prioricen los

contenidos de un determinado área de conoci-

miento. En respuesta a esto, han proliferado los

buscadores especializados. La diferencia esencial

con respecto a los buscadores genéricos radica en

que utiliza unos criterios de discriminación espe-

cialmente indicados para otorgar un mayor grado

de relevancia a los resultados vinculados a un de-

terminado ámbito de especialización. Esto se con-

sigue mediante algoritmos de búsqueda que res-

tringen los resultados obtenidos a los documentos

que cumplen una serie de requisitos. A modo de

ejemplo; el tipo de documento (artículo científico,

referencia bibliográfica…), la temática

(Humanidades, Tecnología…) o el sitio de proce-

dencia (documentos radicados en las webs de ins-

tituciones científicas, universidades, bibliotecas,

revistas electrónicas…). Gracias a esta discrimina-

ción los resultados obtenidos por los buscadores

especializados serán mucho más precisos. Pierden

exhaustividad pero eliminan la mayor parte del

ruido en los resultados.

4.- RECURSOS BIBLIOGRÁFICOS EN LA WEB.

El verdadero cambio que ha supuesto la

Web para la investigación bibliográfica se debe a

su capacidad para facilitar y acelerar el acceso a la

información. No obstante, las implicaciones del

uso generalizado de la Web, van mucho más allá.

Primero el correo electrónico y después diferentes

medios de trabajo en grupo o foros especializados

han facilitado enormemente las relaciones entre

investigadores, acortando sensiblemente las dis-


tancias entre la comunidad científica (Montesi

2011: 89). Esta accesibilidad no se limita a los docu-

mentos sino también al propio investigador. Inter-

net y la Web nos facilitan vínculos mucho más di-

rectos con otros especialistas, creando redes per-

sonales sin fronteras físicas. Las TIC han transfor-

mado las jerarquías tradicionales propiciado que

junto a la jerarquía formal aparezca una nueva je-

rarquía. Esta nueva jerarquía, mucho más atomiza-

da e informal, se basa en las relaciones personales

que además de reducir las distancias entre los dife-

rentes niveles académicos, introduce un importan-

te grado de transversalidad en la comunidad cientí-

fica (Montesi 2011: 89).

Estas nuevas relaciones personales y aca-

démicas encuentran sus mejores ejemplos en las

redes sociales de Internet. En este tipo de redes

contamos con numerosos contactos de nuestro

entorno social y laboral que nos hacen partícipes

de su actividad individual. Mediante la comunica-

ción de noticias novedosas, referencias bibliográfi-

cas, oportunidades laborales e información de toda

naturaleza y, de forma intencionada o no, pueden

facilitarnos información útil para nuestra propia

investigación. De forma indirecta, las redes socia-

les han abierto nuevos e interesantes caminos para

los aspectos relacionados con la difusión científica

dirigida al público general. Entre éstos se puede

destacar el conocido como crowdfunding o micro-

mecenazgo. Portales de esta naturaleza como la-

zanos.org o goteo.org están resultando fundamen-

tales para poner en marcha interesantes proyectos

de gestión patrimonial como cinetínere vinculado

al proyecto Maila (http://goteo.org/project/

cinetinere) o Zamoraprotohistórica un proyecto ya

consolidado que se ha servido de este método para

sufragar la campaña de excavación de 2013 en el

castro del Castillón (http://www.lanzanos.com/

proyectos/excavaciones-arqueologicas/ ).

Mención aparte merecen las redes socia-

les profesionales o especializadas. El portal acade-

mia.edu, dedicado al mundo académico, y que ilus-

tra mejor que ningún otro ejemplo lo que venimos

desarrollando anteriormente. Este portal sigue un

formato de mini-blogs inspirado en la red social

Facebook. Esto permite a cada investigador publi-

car sus artículos y definir sus campos de interés

mediante una serie de etiquetas o keywords prede-

finidos. De este modo, compartimos nuestro traba-

jo y campos de interés con otros investigadores,

creando redes de especialistas que comparten los

mismos ámbitos de trabajo. La facilidad de consul-

tar y ser consultados por otros investigadores re-

sulta de gran interés para potenciar la difusión y el

impacto de los artículos publicados. Academia.edu

supone un ejemplo perfecto del aprovechamiento

de los nuevos recursos que ofrecen las redes socia-

les, parece evidente el enorme potencial de este

tipo de portales como dinamizadores de la investi-

gación científica.

En las tareas propias de la investigación

histórica la Web se utiliza, esencialmente, como

una fuente de documentación bibliográfica. En

este punto, cabe realizar algunas consideraciones

previas con respecto al modo en el que se utiliza

Internet en los trabajos de investigación. A pesar

de la visión que hemos ofrecido sobre la importan-

te generalización del uso de la Web entre los inves-

tigadores, encontramos un importante contraste


en la escasa presencia de páginas webs en la biblio-

grafía de cualquier trabajo de investigación. Esto

se debe a que resulta muy poco frecuente el uso de

las páginas webs como fuente directa de docu-

mentación. Esta situación debe dar lugar a un pro-

fundo debate que en este artículo no podemos

abordar en toda su dimensión. No obstante, sí po-

demos señalar las principales razones por las que

las páginas webs resultan poco útiles como fuentes

de documentación para los trabajos de investiga-

ción histórica:

Predominan los documentos no científicos. Re-

sulta muy frecuente que las páginas webs con-

tengan textos que no cumplen los requisitos me-

todológicos más básicos. No indican ni el autor

ni la bibliografía correspondiente, lo cual, impide

cualquier posibilidad de contrastar las fuentes

que se han utilizado para generar el documento.

Alojadas en entornos no confiables. Las páginas

webs carecen de un el entorno de publicación

confiable. Desconocemos si los textos localiza-

dos en las webs cuentan con algún tipo de aval o

respaldo científico.

Estabilidad del soporte. Los textos localizados en

las páginas webs no ofrecen garantías sobre su

estabilidad en el tiempo. Por una parte, descono-

cemos la posibilidad de que el texto sea modifi-

cado en alguna actualización de la página. De

otra parte, desconocemos las garantías que ofre-

ce el servidor donde se encuentra alojada la pági-

na, de tal forma, que ésta podría ser borrada y

desaparecer de la Web.

Por lo tanto, y aunque el espacio Web

ofrece un potencial de información inagotable, en

realidad, en los trabajos especializados se utiliza

básicamente como medio de acceso al documen-

to, ya sea para localizarlo en la biblioteca, acceder

al documento digitalizado o realizar cualquier tipo

de búsqueda bibliográfica. Esto resulta fundamen-

tal para enfocar de manera correcta nuestra meto-

dología de trabajo en la Web y escoger las herra-

mientas de búsqueda más adecuadas para nues-

tros objetivos.

Uno de los usos más habituales que va-

mos a dar a la Web consiste en la localización de un

documento al que queremos acceder físicamente.

En este caso, utilizaremos las páginas webs de las

propias bibliotecas. Las bibliotecas comenzaron a

utilizar las TIC, esencialmente, para informatizar

los antiguos sistemas de catálogo basados en fi-

chas o tarjetas perforadas. Desde los años 80 co-

mienzan a implementarse los OPAC (On-line Pu-

blic Access Catalogue), que permiten el acceso a

estos catálogos desde Internet y la Web. Aunque

en España este proceso ha llegado con algunos

años de retraso (Ríos 1991: 141), en la actualidad

podemos acceder a la mayoría de catálogos nacio-

nales como el de la Biblioteca Nacional de España

(http://catalogo.bne.es/uhtbin/webcat), o el catá-

logo colectivo del Centro de Ciencias Humanas y

sociales del CSIC (http://www.csic.es/web/guest/

bibliotecas). Por supuesto, los fondos bibliográfi-

cos de las universidades también se encuentran a

nuestra disposición y además del uso de los catálo-

gos y repertorios propios de cada biblioteca, con-

tamos con La Red de Bibliotecas Universitarias RE-

BIUN (http://www.rebiun.org/). En este excelente

catálogo colectivo se integran los fondos de 75

universidades y centros asociados. A nivel interna-

cional podemos destacar el catálogo colectivo

Worldcat (http://www.worldcat.org/), gestionado


por la Online Computer Library Center (OCLC) y que

además de su carácter como pionero e impulsor de

los OPAC está considerado el mayor catálogo en

línea del mundo.

En la actualidad, las mismas bibliotecas se

encuentran inmersas en proyectos de digitaliza-

ción de sus fondos, dando lugar a diferentes reper-

torios y bibliotecas virtuales como La Biblioteca

Digital Hispánica de la BNE (http://www.bne.es/

Catalogos/BibliotecaDigitalHispanica) o la Bibliote-

ca Virtual del CSIC (http://bibliotecas.csic.es/

biblioteca-virtual). De este modo, la Web también

nos ofrece la posibilidad de trabajar con los libros

digitalizados o e-book, que nos evitan tener que

desplazarnos físicamente a las instalaciones biblio-

tecarias. Estos proyectos también tienen su corre-

lato internacional, donde bibliotecas e institucio-

nes de diferentes países colaboran en la creación

de grandes repertorios bibliográficos. Un ejemplo

reciente lo constituye la Biblioteca Digital Mundial

(http://www.wdl.org/es/), un macro proyecto inter-

nacional impulsado por la UNESCO. También de-

bemos mencionar las bibliotecas estrictamente

digitales y no vinculadas a instituciones académi-

cas, como la Biblioteca Virtual Cervantes (http://

www.cervantesvirtual.com/) sostenida por la Fun-

dación Biblioteca Virtual Miguel de Cervantes y

otros recursos de utilidad similar como el servicio

de digitalización de libros Google books (http://

books.google.es/) de la compañía Google Inc.

En el caso de los artículos contamos con

las mismas opciones de formato que tenemos con

los libros, pero resulta aconsejable utilizar otros

recursos de búsqueda. Para facilitar la exposición,

durante las próximas líneas englobamos dentro de

la categoría artículo cualquier trabajo o estudio de

investigación parcial que forma parte de una obra

principal. Esto incluye los propios artículos de re-

vistas o trabajos de investigación, capítulos o sec-

ciones de libros, comunicaciones o ponencias de

congreso, en suma, cualquier trabajo que no cons-

tituye una obra en sí mismo y forma parte de otra

publicación que la engloba. El problema funda-

mental de este tipo de documentos, radica en que

los OPAC disponibles en la Web siguen las mismas

reglas y tradiciones de catalogación que los catálo-

gos y repertorios bibliotecarios manuales y por

tanto, sólo contienen el registro de la obra princi-

pal de referencia (Moscoso y Ortiz 2002: 47-48). De

este modo, salvo escasas excepciones, los índices,

los artículos o secciones concretas contenidas en

otras obras, resultan “invisibles” para las búsque-

das realizadas en los catálogos bibliotecarios.

En el caso concreto de los artículos de

revistas, normalmente, vamos a disponer de la

propia página web de la revista correspondiente,

donde tendremos acceso al índice completo de

cada publicación. Cada vez son más comunes las

revistas estrictamente electrónicas, en cuyo caso,

la página web correspondiente siempre nos ofrece

acceso tanto al índice como al texto completo de la

publicación. En la actualidad, parece que todas las

revistas científicas tienden a facilitar el acceso

completo al documento digitalizado, independien-

temente de la existencia de una versión impresa o

no.

Para los artículos de revistas sin acceso

desde la propia Web y el resto de artículos y seccio-

nes de libros que hemos incluido en este grupo,

contamos con los repertorios bibliográficos. Estos


repertorios, además de incluir los índices y seccio-

nes de las obras de referencia, nos aportan la ven-

taja de centralizar las búsquedas desde un único

recurso web. Entre éstos, podemos destacar ISOC

(http://bddoc.csic.es:8080/index.jsp) base de datos

de recursos bibliográficos del CINDOC dependien-

te del CSIC y Dialnet (http://dialnet.unirioja.es/) el

portal de recursos bibliográficos de la Universidad

de la Rioja. El primero de éstos, constituye una

base datos especializada que pretende recoger

todas las publicaciones periódicas españolas agru-

padas por campos de interés científico. Para esto,

exige una serie de requisitos mínimos de calidad en

las publicaciones recogidas, lo que nos ofrece un

repertorio de gran calidad bibliográfica. Por su par-

te, Dialnet funciona como un centro integrador de

recursos bibliográficos especializado en las Cien-

cias Humanas y Sociales que cuenta con una in-

mensa colección gracias a la colaboración de 70

bibliotecas e instituciones nacionales. Una impor-

tante alternativa a los repertorios bibliográficos la

encontramos en los buscadores especializados

como Scirus (http://www.scirus.com/) desarrollado

por la editorial Holandesa Elsevier B.V. o Google

Académico (http://scholar.google.es/), la versión

española de Google Scholar. Tanto los portales

como los buscadores cuentan opciones avanzadas

que nos ofrecen herramientas útiles de búsqueda

(por categoría, por fecha, por autor…). De igual

modo, ofrecen la posibilidad de visualizar o descar-

gar el documento digitalizado, exportar las refe-

rencias bibliográficas y el enlace a la página web

que suministra el documento. La mayor diferencia

entre ambos tipos de recursos la encontramos en

que los motores de búsqueda pueden indexar un

número ilimitado de documentos, entre los que se

incluyen los propios repertorios bibliográficos. Asi-

mismo, mientras los registros de los repertorios

suelen estar limitados al índice y el resumen del

documento, durante el proceso de indexación los

buscadores pueden llegar a incorporar a su base de

datos fragmentos de texto, incluso el contenido

completo de los libros y artículos. Resulta evidente

que con estas ventajas técnicas los motores de

búsqueda van a proporcionarnos búsquedas más

exhaustivas, es decir, tienen mayor potencial para

encontrar lo que buscamos y siempre devolverán

un número mayor de resultados. Sin embargo, los

repertorios bibliográficos contienen una informa-

ción muy ordenada, completa y muy homogénea

para sus registros, de modo, que sus búsquedas

son muy precisas y de muy alta calidad. Por el con-

trario, los motores de búsqueda recuperan sus

registros desde fuentes muy heterogéneas que

contienen una información muy desigual. En con-

secuencia, aunque recupera una cantidad muy ele-

vada de resultados, son poco precisos y de muy

diversa calidad, siendo frecuentes los errores y los

registros incompletos. Por lo tanto, cuando cono-

cemos el artículo que buscamos, los repertorios

bibliográficos resultan más recomendables, puesto

que nos ofrecerán resultados más precisos y de

mejor calidad.

Como hemos visto, existe una gran varie-

dad de recursos para las búsquedas bibliográficas

en la Web, y cada tipo de recurso puede resultar

adecuado o no en función de nuestras necesidades

de documentación. Por este motivo se puede recu-

rrir a metabuscadores como El Buscón (http://

elbuscon.bne.es/) de la BNE, especializado en la

búsqueda de recursos bibliográficos. Se trata de

un metabuscador que realiza búsquedas simultá-

neas en varios buscadores y otros recursos alterna-


tivos. A continuación nos presenta un resumen de

los resultados obtenidos en la búsqueda de cada

uno de los recursos utilizados y finalmente, utiliza

sus propios criterios de priorización para presentar

los resultados obtenidos de forma unificada y orde-

nados por orden de relevancia. Aunque presentan

un potencial extraordinario y algunas ventajas evi-

dentes, los metabuscadores tampoco están exen-

tos de problemas. Del mismo modo que los moto-

res de búsqueda especializados, recuperan infor-

mación de un conjunto de recursos heterogéneo y

ajeno al propio buscador, dando lugar a resultados

de calidad muy desigual. Por otra parte, cuando

unifica los resultados de las diferentes búsquedas,

utiliza sus propios criterios de priorización y por lo

tanto, descarta los resultados que no son relevan-

tes o que considera repetidos. Esto puede ocasio-

nar que algún registro relevante para nuestro tra-

bajo sea omitido de la lista de resultados.

5.- LA GESTIÓN DE LA INFORMACIÓN

En una investigación histórica el aparato

bibliográfico cuenta con un peso fundamental. El

volumen de referencias bibliográficas manejadas

suele alcanzar grandes dimensiones, por lo que

resulta esencial y casi imprescindible utilizar un

gestor bibliográfico. Estas aplicaciones informáticas

están diseñadas para la recopilación y construcción

de bibliografías. Se trata de bases de datos espe-

cializadas en la gestión de registros bibliográficos

que cuentan con herramientas específicas para los

entornos web. Actualmente, podemos considerar

Refworks, Endnote, Zotero y Mendeley como los

gestores bibliográficos más populares. Aunque sus

funciones básicas son similares cada uno de éstos

nos ofrece algunas herramientas y accesorios es-

pecíficos, por lo que resulta interesante conocer

sus particularidades con el fin de escoger el más

adecuado a nuestras necesidades. Independiente-

mente del gestor utilizado, con el uso de esta he-

rramienta se consiguen varios objetivos. En primer

lugar, mejorar y facilitar la búsqueda, recopilación

y almacenaje de referencias bibliográficas. En se-

gundo término, nos permite ordenar, organizar y

trabajar con la información de los registros biblio-

gráficos. Por último, estos gestores nos permiten

elaborar de forma automatizada nuestras biblio-

grafías y algunos de ellos, cuentan con herramien-

tas que facilitan el proceso de citas durante la edi-

ción de los textos.

Los registros bibliográficos pueden ser

introducidos manualmente, rellenando uno a uno

los campos correspondientes (autor, título, año de

publicación…). Sin embargo, una de las ventajas

más importantes de estos programas consiste en

las opciones de búsqueda e importación de regis-

tros desde la Web, para lo que cuentan con dos

alternativas principales. La primera opción consiste

en la posibilidad que ofrecen gestores como

EndNote o Refworks de realizar búsquedas directas

sobre las bases de datos bibliográficas disponibles

en la Web. En este caso, nos conectamos directa-

mente con la base de datos correspondiente, reali-

zamos la búsqueda dentro del propio catálogo e

importamos los registros recuperados a nuestra

base de datos personal. La segunda opción, dispo-

nible para todos los gestores, nos permite buscar

las referencias libremente por la Web y una vez

localizadas, importarlas a nuestra base de datos.

De esto modo, cualquier gestor bibliográfico puede

recuperar una amplia gama de archivos bibliográfi-


cos mediante la importación o descarga de archi-

vos con formatos de intercambio como RIS, Refer/

BibIX, ISI-CE o XML. En la actualidad, la mayor

parte de los recursos bibliográficos disponibles en

la Web incluyen opciones de exportación cuya fina-

lidad consiste, precisamente, en compartir sus

registros. De hecho, todas las páginas y recursos

bibliográficos citados en este trabajo ofrecen dife-

rentes opciones de exportación de sus referencias.

Por lo tanto, resultan accesibles para cualquier

gestor bibliográfico.

Gracias a las posibilidades de importación

de registros y búsqueda online que nos ofrecen los

gestores podemos elaborar con facilidad nuestra

propia base de datos bibliográfica. Prácticamente,

resulta innecesario introducir registros manual-

mente, lo que por sí mismo ya supone un ahorro

de tiempo y esfuerzo considerable. Como cual-

quier base de datos al uso, los gestores bibliográfi-

cos nos permiten trabajar con nuestros registros;

organizarlos por temas, adjuntarles etiquetas, des-

cripciones, imágenes, realizar búsquedas… Ade-

más de las funciones propias de una base de da-

tos, incorporan algunas herramientas especial-

mente diseñadas para trabajar con registros bi-

bliográficos. Destaca la posibilidad de generar au-

tomáticamente una bibliografía en formato txt

completamente preparada para ser insertada en

los procesadores de texto. Asimismo, todos los

gestores bibliográficos cuentan con la posibilidad

de cambiar automáticamente el estilo de cita en el

que presentamos nuestra bibliografía, para lo que

cuentan con una amplia variedad de estilos de cita.

Ya hemos argumentado las razones por

las cuales las páginas webs no suelen utilizarse

como bibliografía de los trabajos de investigación.

No obstante, esto no es óbice para que podamos

encontrar información y recursos de muy diversa

naturaleza que pueden resultar de gran valor para

nuestro trabajo. Se pueden englobar aquí todos

los recursos no estrictamente bibliográficos como

páginas especializadas en temáticas propias

(Arqueología o Historia), las dedicadas a temas o

aplicaciones de utilidad, (Dibujo Arqueológico,

Dibujo en 3D o Sistemas SIG) o las páginas de noti-

cias (culturales, históricas, patrimoniales). Este

tipo de información útil que encontramos en la

Web procede de unas fuentes muy heterogéneas y

responde a una enorme variedad de temas y con-

tenidos. De una forma genérica esta información

no bibliográfica puede clasificarse en dos grandes

categorías; Las procedentes de páginas estáticas y

las de páginas dinámicas, que se corresponden con

la ya menciona distinción entre Web 1.0 y Web 2.0.

Dentro de las primeras, normalmente,

encontraremos información temática con conteni-

dos útiles o complementarios para nuestra investi-

gación (páginas de historia, de arqueología, de

dibujo arqueológico, de herramientas SIG…). Para

localizar y llegar hasta estas páginas bastará con

utilizar el propio navegador o los buscadores gene-

ralistas como Google o Yahoo. Para el tratamiento

de estos recursos, normalmente alojados en pági-

nas estáticas, los navegadores web al uso pueden

ser herramientas lo suficientemente potentes co-

mo para cubrir nuestras necesidades. Todos los

navegadores ofrecen la posibilidad de emplear los

marcadores. Se trata de una utilidad que nos per-

mite almacenar las direcciones de las páginas

webs que nos interesan y ordenarlas en un árbol

de carpetas. En realidad, estamos creando así


nuestros propios directorios personalizados. Tam-

bién nos ofrecen algunas utilidades muy prácticas,

como la posibilidad de incluir en la barra de herra-

mientas botones de acceso directo a los recursos

web más utilizados. Finalmente, si estas herra-

mientas resultan insuficientes, todos los navegado-

res cuentan con una serie de módulos opcionales,

llamados complementos o accesorios, que nos per-

miten instalar nuevas herramientas especializadas

en determinados aspectos de la navegación y la

festión de páginas web. El propio gestor bibliográ-

fico Zotero es un buen ejemplo de este tipo de

complementos.

En el caso de las páginas englobadas den-

tro de la Web 2.0 y debido al carácter dinámico y

cambiante de sus contenidos, resulta aconsejable

utilizar algunos recursos específicos. Dentro de

este grupo podemos considerar los sitios como

blogs y noticieros especializados, periódicos digita-

les o portales de noticia. Este tipo de webs ofrece

un caudal constante y masivo de información que

en su mayor parte resulta completamente irrele-

vante para nuestros intereses. Por tanto, la proble-

mática principal radica en filtrar esta información.

Es necesario descartar las noticias irrelevantes para

localizar aquellas informaciones que son verdade-

ramente importantes para nuestro trabajo .

Para comenzar, es importante saber que

la inmensa mayoría de sitios webs dedicados a la

difusión de noticias utilizan el sistema RSS (Really

Simple Syndication). Se trata de un formato XML

Fig. 7.– Proceso seguido por un gestor bibliográfico desde la recuperación de los registros bibliográficos mediante los recursos de la Web hasta la elaboración de una bibliografía en formato txt.


para sindicar o compartir contenido en la Web.

Como puede observarse en el mapa conceptual de

la figura 8, existen sitios webs que usan agregado-

res para recoger y agrupar información de otros

sitios webs. Estos agregadores se suscriben me-

diante formatos RSS o su alternativa Atom, a pá-

ginas webs de redifusión de noticias, recopilando

los contenidos publicados y mostrando las nove-

dades y cambios ocurridos en los mismos

(Huidobro 2008: 58-59). La mayoría de blogs y

portales de noticias especializados en cualquier

materia utilizan estos agregadores para recopilar

las noticias de su interés desde otras fuentes webs,

asimismo, suelen sindicar (intercambiar) sus con-

tenidos con otros portales especializados.

Aunque podríamos utilizar directamente

las fuentes de noticias originales, como periódicos

nacionales o regionales, resulta aconsejable identi-

ficar aquellos portales que se han especializado en

nuestro ámbito de trabajo (sólo por mencionar

algunos ejemplos; Noticias de Historia Antigua y

Arqueología -historiayarqueologia.com- Lista de

Prehistoria -listadeprehistoria.blogspot.com.es-,

Paleorama en Red -paleorama.wordpress.com-

Arquehistoria -http://arquehistoria.com/-). Estos

portales, ya sea mediante agregadores o mediante

la selección manual de noticias, nos están ayudan-

do a realizar un primer filtro de las noticias que

realmente pueden resultarnos útiles.

Una vez hemos seleccionado los portales

de noticias de nuestro interés, podemos suscribir-

nos mediante RSS a estos portales especializados.

Figura 8.- Esquema conceptual del flujo de noticias mediante RSS y su presentación final en el lector de noticias integrado en la barra del navegador.


Esto nos permitirá tener un acceso sencillo y rápido

a las noticias novedosas que recojan, sin necesidad

de revisar uno por uno cada sitio web. Finalmente,

podemos integrar en la barra de nuestro navegador

un pequeño agregador o lector de noticias RSS. De

esta forma, con un simple clic en el botón corres-

pondiente se despliega un listado de todas las noti-

cias recogidas en el portal, incluyendo una indica-

ción visual para distinguir las noticias antiguas de

las novedosas. Como resultado, podemos optimi-

zar en términos de tiempo y esfuerzo nuestra capa-

cidad para filtrar y ordenar la información prove-

niente de páginas de noticias. Una tarea, que sin

estas sencillas herramientas nos exigiría un impor-

tante esfuerzo de revisión.

6.- CONCLUSIONES

La Web se ha convertido en un recurso

fundamental para la documentación bibliográfica

en el desarrollo de cualquier trabajo de investiga-

ción. Sin embargo, y a pesar del uso cotidiano que

hacemos de sus recursos, predomina un conoci-

miento muy superficial de la Red.

A lo largo de este artículo se han presentado algu-

nos conceptos básicos sobre la estructura y funcio-

namiento de la Web que pueden ayudarnos a me-

jorar el diseño de nuestras estrategias de búsqueda

y gestión de la información. Cada vez cobra mayor

importancia conocer y escoger adecuadamente los

recursos y herramientas bibliográficas, como los

repertorios, motores de búsqueda, gestores bibliográ-

ficos o los sistemas de sindicación de contenidos

(RSS o Atom). Como se ha puesto en relieve a lo

largo de este artículo, un uso combinado y estruc-

turado de estas herramientas nos ayudará a opti-

mizar nuestro trabajo en términos de tiempo y es-

fuerzo.

BIBLIOGRAFÍA

Arras, A. M., Torres, C. A. y García-Valcárcel, A. 2011:

Competencias en tecnologías de información y co-

municación (TIC) de los estudiantes universitarios.

Revista Latina De Comunicación Social, 66.

Baeza Yates, R. 2004: Excavando la web. El profesional

de la información, 13 (1): 4-10

Bergman, M. K. 2001: White Paper: The Deep Web: Sur-

facing Hidden Value. Journal of electronic publishing,

7 (1).

Comas, R., Sureda, J., Pastor, M. y Morey, M. 2011. La

búsqueda de información con fines académicos

entre el alumnado universitario. Revista española de

documentación científica, 34 (1): 44-64.

Criado, L. 2009: Procedimiento semi-automático para

transformar la web en web semántica. Tesis UNED.

Echavarría Ramírez, A. F. 2004: Una visión al mundo de

la búsqueda y recuperación de la información elec-

trónica. Revista Lasallista de Investigación, 1 (2): 117

-122.

Fernández, F. 2006: Investigar, escribir y enseñar historia

en la era de inernet: Presentación. Hispania: Revista

Española De Historia, 66 (222): 11-30.

Ferran, N. y Pérez-Montoro, M. 2009: Gestión de la infor-

mación personal en usuarios avanzados en TIC. El

Profesional De La Información, 18 (4), 65-373.

Fresquet, J. L. 2005: Las TIC (tecnologías de la informa-

ción y la comunicación) y los estudios biográficos.

Asclepio. Revista De Historia De La Medicina y De La

Ciencia, 57 (1): 167-187.

He, B., Patel, M., Zhang, Z., y Chang, K. 2007: Accessing

the Deep Web. Communications of the ACM, 50 (5):

94-101.

Huidobro, J. M. 2008a: Historia de los ordenadores. Pági-

na web: http://www.coit.es/foro/pub/ficheros/

historia_de_los_ordenadores_dbce153a.pdf. Último

acceso (2013).


- 2008b: La sindicación WEB : RSS. Bit, 167: 58-61

Karsenti, T. y Lira, M. L. 2011: Las tecnologías de infor-

mación y de comunicación (tic): un componente

esencial de la investigación en ciencias humanas.

Revista Actualidades Investigativas en Educación, 11:

1-27.

Martínez, F. y Acosta, Y. 2011: Integración de las tecno-

logías de la información y la comunicación (TIC) en la

universidad: Diez propuestas de aprendizaje. Revista

Mediterránea De Comunicación Social, 2: 43-58.

Meadow, C. T. 1993: Text Information Retrieval Systems.

San Diego: Academic Press.

Montesi, L. 2011: El oficio del historiador en tiempos de

internet. Historiografías: Revista De Historia y Teoría,

2: 85-97.

Moscoso, P., y Ortiz-Repiso, V. 2002: OPACs en Web:

entre la tradición y la innovación. Información, cultu-

ra y sociedad, 6: 34-52.

Negroponte, N. P. 1995: El mundo digital (1ª ed.) Edicio-

nes B.

- 2002: El ADN de la información. Sociedad de la informa-

ción. 1: 57-63.

Pérez-Montoro, M. 2010: Arquitectura de la información

en entornos web. Ediciones Trea S.L. Gijón.

Prensky, M. 2001: Nativos digitales, inmigrantes digita-

les. En El Horizonte. 9 (5)

Ríos, Y. 1991: Catálogos en línea de acceso público. Se-

lección bibliográfica. Revista española de documen-

tación científica, 14 (2): 121-142.

Salazar, I. 2005: Las profundidades de Internet. Ediciones

Trea, S.L. Gijón.

Salvador , J. A., y Vidal, F. J. 2000: Evaluación del rendi-

miento de los motores de búsqueda en la recupera-

ción de información en la WWW. Documentación de

las ciencias de la información, 23: 93-108.

Sanuy, J., y Guijosa, A. 2011: Resolviendo problemas de

historia en y con la web. Iber. Didáctica De Las Cien-

cias Sociales, Geografía e Historia, 69: 75-83.

Zazo, Á. F., García-Figuerola, C., y Alonso, J. L. 2004:

Cibermetría: Nuevas técnicas de estudio aplicables al

web. Ediciones Trea, S.L. Gijón.

Arqueología y Prehistoria del 01 01-6.pdfARPI. Arqueología y Prehistoria del Interior peninsular...

Documents

Transcript of Arqueología y Prehistoria del 01 01-6.pdfARPI. Arqueología y Prehistoria del Interior peninsular...