Arqueología y Prehistoria del 01 01-6.pdfARPI. Arqueología y Prehistoria del Interior peninsular...
Transcript of Arqueología y Prehistoria del 01 01-6.pdfARPI. Arqueología y Prehistoria del Interior peninsular...
Arqueología y Prehistoria del
Interior Peninsular
01
2014
SARPI 01
Arqueología y Prehistoria del Interior peninsular
Publicación Anual: 2014 ISSN: 2341-2496 Dirección: Primitiva Bueno Ramírez (UAH) Subdirección: Rosa Barroso (UAH) Consejo editorial: Manuel Alcaraz (Universidad de Alca-lá); José Mª Barco (Universidad de Alcalá); Cristina de Juana (Universidad de Alcalá); Mª Ángeles Lancharro (Universidad de Alcalá); Estibaliz Polo (Universidad de Alcalá); Antonio Vázquez (Universidad de Alcalá); Pie-dad Villanueva (Universidad de Alcalá). Comité Asesor: Rodrigo de Balbín (Prehistoria-UAH); Margarita Vallejo (Historia Antigua- UAH); Lauro Olmo (Arqueología- UAH); Leonor Rocha (Arqueología – Uni-versidade de Évora); Enrique Baquedano (MAR); Luc Laporte (Laboratoire d'Anthropologie, Université de Rennes); Laure Salanova (CNRS). Edición: Área de Prehistoria (UAH)
SUMARIO 1.– PREVIO 04-21 Más sobre cronología del Paleolítico cantábrico: Tito Bustillo. Asturias De Balbín Behrmann, Rodrigo y Alcolea González, Javier 2.– ARTICULOS 22– 46 Restos óseos y contextos arqueológicos neanderthales en el Levante y Sur peninsular. Pérez Hernán, Rebeca 47– 63 Inicio al estudio de la piezas de arte mueble finipaleolóticas y azilienses sobre soporte lítico. De Juana Ortín, Cristina 64– 85 Dinámicas de ocupación y transformación del territorio medieval en el Alto Tajo (Guadalajara). Checa Herraiz, Joaquín 86- 108 Sur del Tajo, 1937. Patrimonio de una batalla de la Guerra Civil. Ruiz Casero, Luis Antonio 109- 120 La documentación epistolar como fuente Arqueológica Sánchez Salas, Francisco 121– 142 La Web en la investigación bibliográfica. Una herramienta para el historiador. Barco Belmonte, José María
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 121
LA WEB EN LA INVESTIGACIÓN BIBLIOGRÁFI-
CA. UNA HERRAMIENTA PARA EL HISTORIA-
DOR
José María Barco Belmonte (1)
Resumen
Nos encontramos inmersos en la sociedad de la información, una era caracterizada por el uso masivo de
las TIC (Tecnologías de la Información y la Comunicación). En este nuevo marco social la Web se ha convertido en
un recurso fundamental para la documentación bibliográfica y sin embargo, apenas conocemos los conceptos
más elementales de su estructura y funcionamiento. En el presente artículo se realiza un acercamiento a estas
cuestiones que pretende mejorar nuestro conocimiento sobre las herramientas y recursos que la Web pone a
nuestra disposición. Sin duda, un uso adecuado y estructurado de estos recursos puede optimizar sustancialmen-
te nuestro trabajo en términos de tiempo y esfuerzo.
Palabras clave: Internet, Espacio Web, Bibliografía, Buscadores, Gestores bibliográficos.
Abstract
Today we live in an Information Age defined by the availability of Information Technology (IT). In this
environment the Web has become an indispensable resource for scholarship. However, many scholars seem to
be still unaware of its basics. This paper tries to address this problem strengthening our knowledge on the tools
and resources the Web makes available to scientific research. A more skillful employment of these resources
may improve significantly our work in terms of time and effort.
Key words: Internet, Web, Bibliography, Search engine, Bibliographic managers.
(1) Becario FPU. - UAH. [email protected]
Este artículo supone la ampliación del capítulo de metodología correspondiente al Trabajo Final de Master “Hocincavero y
las piedras hincadas de la Meseta Oriental” leído en la Universidad de Alcalá en julio de 2012.
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 122
1.- LA SOCIEDAD DE LA INFORMACIÓN: EL OR-
DENADOR E INTERNET
El desarrollo tecnológico alcanzado por
las sociedades industriales del siglo XX permitió la
paulatina implementación de las TIC (Tecnologías
de la Información y la Comunicación). Desde sus
primeros momentos se produce un avance expo-
nencial en su desarrollo y una perfecta simbiosis
con la sociedad que las usa y disfruta. En la actuali-
dad somos plenamente conscientes de que nos
hayamos inmersos en la era de la información. Por
supuesto, la Sociología se ha interesando por esta
cuestión, dando lugar a la acuñación de términos
que son suficientemente explicativos por sí mis-
mos. Así, se habla de nativo digital e inmigrante
digital, que sirven para caracterizar a la sociedad
en dos grupos; las generaciones que han crecido en
un entorno plenamente dominado por el ordena-
dor e Internet y las que por contra, se han visto
obligadas a entrar en el nuevo mundo digital
(Prensky 2001). En el camino que nos ha llevado
hasta este punto podemos señalar los dos hitos
más importantes; el ordenador e Internet. La ge-
neralización de los ordenadores supuso el paso
previo y casi coetáneo a la irrupción de Internet,
que pueden considerarse como los dos grandes
pilares que sostienen el desarrollo de la sociedad de
la información.
Los primeros ordenadores electrónicos
cuentan con nombres propios como el Z3 de Kon-
rad Zuse (1941), el Mark I de la universidad de
Hardvard (1944) o el ENIAC de la Universidad de
Pennsylvania (1946). Se trataba de auténticos co-
losos fruto de costosos proyectos de investigación.
A modo de ejemplo, el ENIAC ocupaba una superfi-
cie de 450 m² y pesaba 30 toneladas (Huidrobo
2008a). Sin embargo, la evolución de los ordena-
dores va fuertemente unida al vertiginoso avance
de las tecnologías y en los años 70 ya aparecen los
primeros PC u ordenadores personales. A princi-
pios de los años 80 encontramos el lanzamiento de
los primeros PC con éxito comercial, en 1981 IBM
lanza al mercado el modelo 5150 y muy poco des-
pués, la compañía Apple presenta el Macintosh
125kb. Desde entonces, han pasado poco más de
30 años y su vertiginosa expansión por todo el
mundo desarrollado resulta evidente, en 2008 se
estimaba que el mundo había llegado a los 1.000
millones de ordenadores (2). Desde entonces, las
ventas de ordenadores se han mantenido en cifras
estables que rondan los 100 millones de unidades
anuales (3).
En lo que concierne a la disciplina históri-
ca podemos señalar el uso de los ordenadores
desde fechas muy tempranas, coincidiendo con el
auge de las corrientes historiográficas derivadas
del cientificismo. El desarrollo de métodos cuanti-
tativos y estadísticos propios de la Historia econó-
mica o demográfica suponen una primera toma de
contacto entre el ordenador y el historiador
(Montesi 2011: 86). Sin embargo, consideramos
que el verdadero salto cualitativo en lo que con-
cierne al ejercicio de la Historia se debe a la apari-
ción de los ordenadores personales y el desarrollo
paralelo de los procesadores texto. Aunque apenas
ha sido mencionado o valorado por la historiogra-
fía, tanto el ordenador personal como el procesa-
(2) http://www.20minutos.es/noticia/247042/0/millones/ordenadores/estudio/ (3) http://www.gartner.com/newsroom/id/1893523
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 123
dor de texto se han convertido en dos elementos
básicos de cualquier tarea académica o de investi-
gación. Como acertadamente se ha señalado “La
tecnología más eficiente es la que apenas se nota:
simplemente se usa.” (Fernández Izquierdo 2006:
16). Estas dos herramientas suponen un cambio
sustancial en nuestra forma de escribir y trabajar,
transformando definitivamente la esencia misma
de los mecanismos de escritura; hemos pasado de
la escritura mecánica a la escritura electrónica.
Principalmente, supone la intermediación entre
los procesos mecánicos como el tecleado o la im-
presión en papel de una compleja trama de siste-
mas electrónicos e informáticos. Desde la creación
misma del documento hasta su difusión por los
diferentes medios y formatos partimos de un ele-
mento tan simple como el bit, que como acertada-
mente describiera Negroponte, constituye la esen-
cia misma, el ADN de la información: “Un bit no
tiene color, tamaño ni peso y viaja a la velocidad de
la luz. Es el elemento más pequeño en el ADN de la
información. Es un estado de ser: activo o inactivo,
verdadero o falso, arriba o abajo, negro o blanco.
Por razones prácticas consideramos que un bit es un
1 o un 0” (Negroponte 1995: 28).
No podría entenderse el éxito de los orde-
nadores sin el desarrollo coetáneo y completa-
mente simbiótico de Internet. Ambos elementos
se han retroalimentado impulsando mutuamente
su crecimiento. La gran contribución de Internet es
sin duda el WWW (World Wide Web), más conocido
como el Espacio Web.
La generalización de la Web ha crecido a
una velocidad aún mayor que la de los propios or-
denadores, especialmente, desde mediados de la
primera década del nuevo siglo. Un buen ejemplo
lo constituye Google, un buscador fundado en
1998 que antes de terminar el año 2011 alcanza los
1.000 millones de usuarios (4), es decir, uno de
cada siete habitantes del planeta usa Google a
diario. Otro caso significativo lo encontramos en
Facebook. Esta popular red social nace en el año
Fig. 1.- Crecimiento de la Web en febrero de 2013 (Fuente: http://news.netcraft.com/). Se ha añadido la indicación de la esti-mación realizada por Criado Fernández (2009).
(4) http://america.infobae.com/notas/27640-Google-alcanz-los-1000-millones-de-usuarios
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 124
2004 y a comienzos de 2013 supera los 650 millo-
nes de usuarios diarios. Esto nos sirve para dar
cuenta de la vertiginosa velocidad a la que avanza
la Web. El aumento de los datos disponibles co-
mienza a ser descomunal y su crecimiento sigue
un ritmo exponencial (Zazo et al. 2004). Resulta
muy complicado establecer cálculos sobre el ta-
maño total de la Web, especialmente, debido a
que un mismo sitio web contiene varias páginas
web. (5) Usando las gráficas de Netcraft (6) sobre el
número de sitios webs y los trabajos de Bergman
(2001) sobre el número de páginas que contiene
cada sitio web, se ha estimado que en mayo de
2009 el tamaño de la Web era equivalente a más
de 94 millones de libros (Criado 2009: 5-6). Como
se puede observar (Fig. 1), Criado realiza su esti-
mación en 2009 con 236 millones de sitios, sólo 3
años después el número de sitos webs ha aumen-
tado hasta los 678 millones. Siguiendo la estima-
ción de Criado y con los datos actualizados pode-
mos calcular que el tamaño de la Web equivale a
270 millones de libros.
Todo lo expuesto sirve para ilustrar que
nos encontramos ante un nuevo marco, un nuevo
contexto que crece y se transforma a un ritmo ver-
tiginoso y que ha cambiado notablemente la me-
todología de trabajo en cualquier tarea de investi-
gación. La disciplina histórica no constituye ningu-
na excepción, el método tradicional basado en la
(5) En realidad, no existe una diferencia estricta entre página web y sitio web por lo que ambos términos pueden utilizarse como sinónimos. No obstante, puede considerarse y así lo hacemos a lo largo de este artículo, el término sitio web para hacer referencia a la página inicial o principal de un conjunto de páginas webs interrelacionadas. (6) http://newsroom.fb.com/content/default.aspx?NewsAreaId=22
Fig. 2.- Comparación del uso de Internet y las bibliotecas como fuente de documentación entre alumnos de la Universi-dad de Granda. (Comas et al. 2011)
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 125
consulta de fuentes impresas en archivos y biblio-
tecas ya no es suficiente por sí solo y cada vez co-
bra una importancia mayor el uso de las TIC y el
entorno web (Karsenti y Lira 2011). Aunque resulta
difícil cuantificar el grado de generalización alcan-
zado por las TIC, contamos con algunos estudios
que nos aportan algunos datos orientativos. Re-
cientes trabajos (Comas et al. 2011) han estimado
que el porcentaje de alumnos universitarios que
usan Internet como fuente habitual para la búsque-
da de datos es superior al de las bibliotecas en to-
dos los niveles de estudio y en todas las áreas de
conocimiento (Fig. 2). Esto les ha llevado a concluir
que “Internet es, sin duda, la fuente predilecta entre
el alumnado universitario pregraduado para buscar
documentación académica” (Comas et al. 2011: 60)
lo que además es concordante con otros estudios
similares nacionales e internacionales (Arras et al.
2011; Sanuy y Guijosa 2011; Martínez y Acosta
2011). Aunque no disponemos de datos precisos
para cuantificarlo, creemos que entre los investiga-
dores y especialistas esta tendencia se encuentra
igualmente asentada e incluso ampliada, observa-
ción que resulta generalmente admitida entre
quienes se han acercado al temática (Echavarría
Ramírez 2004: 117; Fresquet 2005; Karsenti y Lira
2011: 2).
2.- ESTRUCTURA Y FUNCIONAMIENTO DE IN-
TERNET Y LA WEB
A pesar de lo cotidiano que nos resulta el
uso de Internet solemos quedarnos muy en la su-
perficie de su estructura y funcionamiento. No es
habitual que el usuario medio conozca los concep-
tos básicos del funcionamiento de la Red.
Internet es un conjunto de redes físicas
interconectadas que mediante un conjunto de pro-
tocolos de comunicación funcionan como una red
lógica única y mundial. Aunque existen decenas de
protocolos, el conjunto de los mismos se engloba
bajo el conocido TCP/IP, es decir, Transmission
Control Protocol (TCP) e Internet Protocol (IP). Ex-
plicar el funcionamiento completo de este entra-
mado resulta realmente complejo, pero encontra-
mos un buen referente en el modelo OSI desarro-
llado por la International Standard Organization
(ISO) que conceptualiza y estandariza la estructura
de Internet en capas o niveles. Como puede obser-
vase (Fig. 3), las siete capas del modelo OSI pueden
simplificarse en cuatro capas genéricas, a cada una
de las cuales se asocian un conjunto de protocolos
concreto. Existen cientos de protocolos, por lo que
sólo se mencionan algunos de los más importantes
o conocidos. TCP e IP constituyen los principales
protocolos de Red y Transporte, y en concreto, se
encargan de ubicar físicamente nuestro ordenador
en la Red. Es decir, hacen nuestro ordenador acce-
sible y nos facilitan el acceso al resto de los ordena-
dores de la Red. Sin embargo, los protocolos más
importantes para el tema que tratamos se locali-
zan en la denominada capa de aplicación; FTP que
permite el envío de archivos, SMTP para el correo
electrónico o DNS encargado de gestionar los
nombres de dominio. Entre éstos, nos interesa
especialmente el protocolo HTTP (Hypertext Trans-
fer Protocol) desarrollado por la World Wide Web
Consortium (3WC) y que constituye la base funda-
mental en la que se sustenta en funcionamiento de
la Web. Este protocolo permite realizar enlaces de
texto mediante hipervínculos, creando una red de
conexiones mediante los denominados enlaces de
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 126
hipertexto. De este modo, cada sitio o página web
constituye un punto o nodo que se conecta a otros
puntos o nodos mediante enlaces o hipervínculos.
Por lo tanto, la Web se compone de un inmenso
entramado de sitios o direcciones web interconec-
tados mediante hiperenlaces. Esto ha dado pie a la
famosa comparación de la estructura de la Web
con una gigantesca tela de araña.
Es importante diferenciar entre una direc-
ción de Internet y una dirección web. Cuando un
ordenador se conecta a la Red se le asigna una
dirección IP que sirve para ubicar e interconectar
nuestro ordenador en Internet. Esta dirección vie-
ne dada por los protocolos TCP/IP y consta de un
conjunto de 4 números enteros binarios de 8 bits
cada uno; 88.88.88.88. Cada número de 8 bits pue-
de alcanzar un valor máximo de 255, por lo puede
calcularse que el número máximo de IP disponibles
es de 4.228 millones. Por esta razón, aunque exis-
ten direcciones IP estáticas (no variables), a la in-
mensa mayoría de los usuarios diarios de Internet
se les asigna una dirección IP dinámica (variable)
cada vez que se conectan a la Red.
Una vez nos hemos conectado a Internet,
accedemos al espacio Web mediante las direccio-
nes web. Estas direcciones vienen dadas mediante
la conocida fórmula: http:/ www/ nombredelsi-
tio.com (.es, .net, .org…). La primera parte es fija y
se compone de dos grupos de letras; las 4 primeras
hacen referencia al mencionado protocolo HTTP y
las 3 siguientes nos indican el servicio de Internet
al que estamos accediendo (World Wide Web). La
segunda parte de la dirección es variable y se com-
pone de otros dos grupos de letras gestionados
por el protocolo DNS (Domain Name System); el
primer conjunto tiene una extensión variable y
constituye el nombre del sitio, mientras el segun-
do y último grupo está constituido por el nombre
de dominio. Entre estos últimos podemos destacar
dos grandes grupos: los genéricos (.com, .net,
.org…) y los geográficos (.es, .fr, .uk…). Estas di-
recciones nos sirven para reconocer y localizar los
diferentes sitios webs dentro de la Web.
Las páginas web son documentos realiza-
dos en formato HTML (HyperText Markup Langua-
Fig. 3.- Estructura de Internet por capas o niveles. Elaborado a partir de López Quesada (2012), consultado en 2013. http://dis.um.es/~lopezquesada/documentos/IES_1213/LMSGI/curso/xhtml/xhtml22/index.html
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 127
ge -lenguaje de marcado de hipertexto-). Pueden
contener texto, imágenes, videos o cualquier ma-
terial multimedia, en suma, contienen la informa-
ción. Para poder trabajar con la información conte-
nida en las páginas webs es necesario emplear un
Navegador. Los navegadores web son aplicaciones
capaces de interpretar el código HTML, lo que nos
sirve para visualizar la información que contienen
las webs y al mismo tiempo, nos permite despla-
zarnos de una página a otra mediante los enlaces o
hipervínculos. Actualmente, los navegadores más
populares son Internet Explorer, de la Corporación
Microsoft, Google Chrome de la compañía Google
Inc y Mozilla Firefox sustentado por la Fundación
Mozilla.
Fig. 4.- Los diferentes espacios de la Web. (Baeza Yates
2004: 5). Modificado
Aunque la Web se presenta ante nosotros
como un espacio único y más o menos homogé-
neo, esto no resulta estrictamente cierto y pueden
diferenciarse varios espacios Web. Desde los pri-
meros años del nuevo siglo se comienza a diferen-
ciar la Web 2.0 para referirse a los cambios ocurri-
dos en la Web a partir de la irrupción de sitios
esencialmente interactivos. Entre éstos se inclu-
yen sitios como los blogs, las wikis y las redes socia-
les que se caracterizan por la interacción y la crea-
ción colaborativa entre los propios usuarios. De
este modo, se utiliza la Web 1.0 para referirse a la
Web tradicional, caracterizada por los contenidos
estáticos que normalmente sólo son modificados y
actualizados por los administradores de la página.
Por el contrario, la Web 2.0 se caracteriza por los
contenidos dinámicos y en constante actualización
que al contrario de los anteriores, son generados
por una comunidad de usuarios.
Mención aparte merece la conocida como
Web Invisible o preferiblemente Web profunda, que
sirve para referirse a todo lo que no es Web visible
o superficial. Esta Web se caracteriza por no ser
accesible a través de los medios habituales, ya
sean navegadores o motores de búsqueda. Desde
el punto de vista documental está formada princi-
palmente por; páginas protegidas, páginas en for-
matos no indexables por los motores de búsqueda,
archivos, catálogos y bases de datos cuyos conte-
nidos no son completamente accesibles
(Echavarría Ramírez 2004: 118; Salazar 2005: 64).
Lejos de tratarse de información residual, se ha
estimado que la Web profunda tendría un tamaño
500 veces superior al de la Web visible y que la
calidad de sus contenidos es del mismo nivel, in-
cluso más valiosa, que la de la propia Web visible
(Bergman 2001; Baeza 2004; Salazar 2005: 64; He
et al. 2007, 95). En nuestro caso, destacan las re-
vistas electrónicas cuyos contenidos sólo son ac-
cesibles mediante el pago previo de una cuota de
inscripción, lo que deja en la web profunda una
importante cantidad de información relevante. Sin
embargo, en la mayor parte de los casos, resulta
posible acceder a la información contenida en la
Web profunda mediante las herramientas propias
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 128
del sitio o las tecnologías de búsqueda adecuadas.
( Esto hace muy interesante conocer este tipo de
recursos, puede consultarse algunos ejemplos en
Echavarría Ramírez 2004: 120; Salazar 2005: 145-
149).
Finalmente, cabe mencionar la Web Se-
mántica, un proyecto impulsado por el World Wide
Web Consortium que pretende dotar de mayor sig-
nificado a la Red mediante el desarrollo de lengua-
jes universales que permitan que la información
contenida en las webs esté mejor definida. Para
esto, utiliza fundamentalmente los mecanismos
RDF, SPARQL, y OWL, tecnologías que ayudan a
estandarizar, definir y ordenar los datos conteni-
dos en las páginas webs (7). El objetivo último con-
siste en dotar de cierta inteligencia artificial a la
Web futura, de tal modo, que no sólo se limite a
ejecutar nuestras búsquedas, sino que sea capaz
de comprender lo que estamos buscando.
3.- MÉTODOS DE BÚSQUEDA DE INFORMA-
CIÓN EN LA WEB
El uso de la Web ha generado un nuevo
escenario para investigación bibliográfica. Tene-
mos a nuestra disposición un volumen de informa-
ción en crecimiento exponencial y de una naturale-
za y calidad muy variables. Cada vez resulta más
laborioso y frustrante recopilar y filtrar los conteni-
dos realmente útiles, lo que pone de relieve la ne-
cesidad de adecuar nuestra metodología de traba-
jo para el tratamiento de grandes volúmenes de
información. Para comenzar esta tarea, se debe
atender a dos conceptos fundamentales; la bús-
queda y la gestión de la información.
En la Figura 5 se presenta un pequeño
esquema conceptual sobre los elementos básicos
que intervienen en una búsqueda de información
en la Web. En primer lugar, hay que considerar que
los sitios webs son generadores de contenidos. To-
(7) http://www.w3c.es/Divulgacion/GuiasBreves/WebSemantica
Fig. 5.– Mapa conceptual de la búsqueda de información en la Web.
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 129
dos los sitios webs generan contenidos, la dificul-
tad consiste en llegar hasta aquellos que producen
una información útil para nuestro trabajo. Como
puede observarse (figura 5) se han incluido algu-
nos ejemplos del tipo de generadores de conteni-
do más habituales para la investigación histórica.
Nos interesan los generadores de recursos biblio-
gráficos, especialmente, los catálogos de bibliote-
cas, universidades o instituciones, las webs de re-
vistas electrónicas, los archivos digitalizados, las
bibliotecas virtuales así como una larga lista de
recursos que podemos obtener de sitios webs es-
pecializados. Estos sitios ponen a disposición de la
Web una serie de recursos (bases de datos, archi-
vos de texto, imágenes…) que en suma, componen
la información útil para los trabajos de investiga-
ción. La principal problemática que debemos
afrontar es cómo recuperar esta información, có-
mo llegar hasta ella, en definitiva, lo que llama-
mos, la búsqueda.
En primer lugar necesitamos un navega-
dor web. Mediante la navegación podemos despla-
zarnos de un sitio web a otro, visualizar sus conte-
nidos y recuperar la información que contienen.
Por lo tanto, es posible realizar búsquedas de in-
formación mediante la simple navegación, aunque
resulta necesario ayudarnos de directorios (figura
5). Los directorios son sitios webs que contienen
un listado de enlaces ordenados y agrupados por
categorías y subcategorías, lo que nos permite
realizar con cierta eficacia búsquedas temáticas.
Además de los directorios generalistas como el de
Yahoo (http://www.yahoo.es/) o Terra (http://
www.terra.es/) cualquier página especializada,
normalmente, incluirá un pequeño directorio con
otras páginas de interés también especializadas en
la misma temática que suelen agruparse bajo epí-
grafes como Enlaces de interés u Otros sitios. Este
tipo de búsquedas pueden ser útiles cuando quere-
mos informaciones generalistas o comenzar a in-
formarnos sobre temas desconocidos o ajenos a
nuestra propia disciplina. Nos permite navegar con
facilidad de un sitio a otro ampliando o concretan-
do la información recopilada. Se trata de una suer-
te de exploración de la Web que también puede
llevarnos fácilmente a localizar información rele-
vante que desconocíamos y no andábamos bus-
cando antes de comenzar la exploración. No obs-
tante, si bien los directorios tuvieron su utilidad en
los primeros tiempos, en la actualidad, resultan
claramente insuficientes. Por esta razón suelen
llevar incorporado un Buscador, de modo que hoy
en día la mayor parte de las páginas de búsqueda
ofrecen una combinación de directorios y busca-
dores (Salazar y Vidal 2000: 94; Salazr 2005: 46-
47).
Los buscadores, o más correctamente los
motores de búsqueda, son sistemas de búsqueda
de archivos en la Web basados en palabras clave.
Mientras los directorios de búsqueda suelen crear-
se manualmente por especialistas, el funciona-
miento de estos motores se basa en robots que
realizan búsquedas automáticas en la Red. Perió-
dicamente estos robots, conocidos como spiders o
arañas, rastrean la Red en busca de páginas webs
que serán almacenadas en sus bases de datos.
Estas arañas se desplazan por la Web siguiendo los
enlaces de hipertexto que existen en los propios
documentos encontrados de tal forma, que saltan
de página a página registrando la información re-
cuperada en cada una. Los datos recuperados por
las arañas serán organizados por un indexador,
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 130
que indizará cada página en la base de datos del
buscador. Durante el proceso de indización se re-
cuperan todos los términos representativos del
documento y son ordenados a partir de dos pará-
metros, la frecuencia de aparición y su localización
en el texto. Esto da lugar a la creación de un fiche-
ro índice (index file) que contiene todos los térmi-
nos ordenados alfabéticamente con dos valores
asociados; el número de ocurrencias y la localiza-
ción. Los propios términos indizados aportan el
significado, el tema sobre el que trata la página
web indexada, el número de ocurrencias indica el
número de veces que ese término se repite en el
texto y la locación indica el lugar del texto en el
que aparece el término (Pérez-Montoro 2010: 241-
245). Contrariamente a la creencia generalizada,
cuando realizamos una consulta en un buscador en
realidad, no estamos buscando en toda la Web
sino en las páginas previamente indexadas en la
base de datos del buscador por sus arañas. El bus-
cador utiliza los términos introducidos en nuestra
consulta para compararlos con su fichero índice,
de donde podrá recuperar las páginas webs que
contienen esos términos y finalmente, presentar
los resultados de la búsqueda ordenados en fun-
ción de su relevancia.
Una vez hemos presentado los aspectos
básicos de su funcionamiento resulta más sencillo
entender su problemática. Como se ha visto, el
buscador no explora toda la Web, se encuentra
limitado a las páginas previamente indexadas por
sus arañas. Una parte de estos documentos for-
man parte de la Web profunda y no pueden ser
indexados, otra parte corresponde a documentos
indexables que no han sido localizados por las ara-
ñas y constituyen el denominad silencio de los bus-
cadores. En consecuencia, cuando realizamos una
Fig.6.- Conceptos básicos sobre el funcionamiento de los motores de búsqueda en la Web. Ferrán y Pérez-Montoro 2009.
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 131
búsqueda en la Web siempre existirá un grupo de
documentos relevantes que no estará indexado
por el buscador y por lo tanto, no serán encontra-
dos. Por otra parte, dentro del conjunto de webs
indexadas y recuperadas, nuestros términos de
búsqueda aparecerán en una cantidad importante
de páginas que en realidad, no contienen informa-
ción relevante para nosotros. Este conjunto de
resultados encontrados pero no relevantes consti-
tuyen el denominado ruido, es decir, páginas recu-
peradas que en realidad, no son útiles (Meadow
1993; Ferrán y Pérez-Montoro 2009). Estos con-
ceptos sirven de base para evaluar la eficiencia de
los buscadores que viene dada por dos índices
principales; el índice de exhaustividad y el índice de
precisión (Meadow 1993: Ferrán y Pérez-Montoro
2009, Pérez-Montoro 2010). El índice de exhausti-
vidad nos indica la capacidad del buscador para
encontrar todas las páginas relevantes que existen
en la Web sobre el tema buscado. El índice de pre-
cisión nos indica la relación entre el total de pági-
nas encontradas por el buscador con nuestro tema
de búsqueda y cuáles de éstas son realmente rele-
vantes.
Las descomunales dimensiones de la in-
formación disponible en la Web está haciendo que
cada vez sean más evidentes los problemas para
filtrar y gestionar su calidad; “Este gran desarrollo
ha convertido el proceso de acceso a la información
en un problema cada vez más crítico. Los buscado-
res funcionaron muy bien durante estos años; sin
embargo, el extraordinario crecimiento que ha expe-
rimentado la Web empieza a mostrar sus primeros
síntomas frustrantes. Cada día el usuario necesita
dedicar más tiempo para filtrar las páginas web que
devuelve una búsqueda, es decir, la calidad de la
información es cada vez peor” (Criado 2009). Con
lo visto hasta el momento podemos entender me-
jor las dimensiones de esta problemática, los lími-
tes de los buscadores y la importancia de realizar
búsquedas exhaustivas y precisas.
Una búsqueda con cientos de páginas
recuperadas en realidad, no es una búsqueda útil,
ya que el esfuerzo necesario para revisar todos los
resultados sería inabarcable. El usuario medio sólo
revisará los primeros resultados ofrecidos por el
buscador, de modo, que la clave del buen funcio-
namiento de los buscadores se encuentra en su
capacidad de valorar adecuadamente la relevancia
de los documentos encontrados. Este es uno de
los objetivos perseguidos por la ya mencionada
Web Semántica pero, independientemente de
ésta, los buscadores disponen de diversas herra-
mientas para establecer la relevancia de los docu-
mentos. Entre éstas, destaca el uso de los operado-
res que podemos dividir en tres categorías: opera-
dores lógicos o booleanos, operadores posicionales
y operadores de exactitud o truncamiento (Salazar
2005: 101-103). Estos operadores son diferentes
símbolos o marcas que podemos utilizar cuando
introducimos los términos de nuestra búsqueda y
nos sirven para definir mejor nuestras peticiones al
buscador. Los más conocidos son los operadores
booleanos [AND] y [OR] que sirven para especificar
si buscamos documentos que contengan todos los
términos introducidos en la búsqueda o si nos sir-
ven los documentos donde aparece cualquiera de
los términos buscados. También son muy conoci-
dos los operadores de exactitud o truncamiento
como las comillas [“”], utilizadas para buscar tér-
minos exactos o el asterisco [*], utilizado cuando
queremos buscar palabras que comiencen por un
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 132
mismo conjunto de letras (Bomb*, nos devolverá
valores como bomba, bombero, bombón, bombi-
lla…). Aunque nosotros no lo especifiquemos
cuando introducimos nuestros términos de bús-
queda estos operadores son utilizados por defec-
to. De hecho, cuando utilizamos las herramientas
de búsqueda avanzada disponibles en la mayoría
de buscadores, en realidad, la interfaz del busca-
dor nos está guiando para utilizar correctamente
este tipo de operadores. En cualquier caso, resulta
de gran interés conocer los diferentes operadores
que podemos utilizar con nuestro buscador habi-
tual. El hecho de conocerlos y saber utilizarlos por
nosotros mismos nos ayudará a precisar nuestras
búsquedas sin tener que confiar en el criterio del
buscador.
A pesar de lo visto, la clave del éxito de
los buscadores se encuentra en los denominados
algoritmos de búsqueda. Se trata del conjunto de
fórmulas y procesos informáticos que discriminan
las páginas útiles de las que no lo son y nos las pre-
sentan ordenadas según su grado de relevancia.
Un ejemplo ilustrativo lo encontramos en el famo-
so PageRanke, la familia de algoritmos desarrolla-
dos por los fundadores de Google y que fue clave
para el tremendo éxito de su buscador. El Page-
Ranke confía en la experiencia de la propia Web y
valora la relevancia de un sitio web en función del
número de otros sitios webs que apuntan hacia él.
Es decir, cuantos más sitios tengan un link hacia
una misma página mayor relevancia tendrá ésta.
Este mismo ejemplo nos sirve para ilustrar el pro-
blema de utilizar buscadores generalistas en los
trabajos de investigación. Cualquier buscador al
uso tratará de desarrollar algoritmos capaces de
satisfacer las necesidades del usuario medio, es
decir, dará relevancia a los resultados más comu-
nes. Sin embargo, un investigador requiere de re-
sultados mucho más concretos y que prioricen los
contenidos de un determinado área de conoci-
miento. En respuesta a esto, han proliferado los
buscadores especializados. La diferencia esencial
con respecto a los buscadores genéricos radica en
que utiliza unos criterios de discriminación espe-
cialmente indicados para otorgar un mayor grado
de relevancia a los resultados vinculados a un de-
terminado ámbito de especialización. Esto se con-
sigue mediante algoritmos de búsqueda que res-
tringen los resultados obtenidos a los documentos
que cumplen una serie de requisitos. A modo de
ejemplo; el tipo de documento (artículo científico,
referencia bibliográfica…), la temática
(Humanidades, Tecnología…) o el sitio de proce-
dencia (documentos radicados en las webs de ins-
tituciones científicas, universidades, bibliotecas,
revistas electrónicas…). Gracias a esta discrimina-
ción los resultados obtenidos por los buscadores
especializados serán mucho más precisos. Pierden
exhaustividad pero eliminan la mayor parte del
ruido en los resultados.
4.- RECURSOS BIBLIOGRÁFICOS EN LA WEB.
El verdadero cambio que ha supuesto la
Web para la investigación bibliográfica se debe a
su capacidad para facilitar y acelerar el acceso a la
información. No obstante, las implicaciones del
uso generalizado de la Web, van mucho más allá.
Primero el correo electrónico y después diferentes
medios de trabajo en grupo o foros especializados
han facilitado enormemente las relaciones entre
investigadores, acortando sensiblemente las dis-
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 133
tancias entre la comunidad científica (Montesi
2011: 89). Esta accesibilidad no se limita a los docu-
mentos sino también al propio investigador. Inter-
net y la Web nos facilitan vínculos mucho más di-
rectos con otros especialistas, creando redes per-
sonales sin fronteras físicas. Las TIC han transfor-
mado las jerarquías tradicionales propiciado que
junto a la jerarquía formal aparezca una nueva je-
rarquía. Esta nueva jerarquía, mucho más atomiza-
da e informal, se basa en las relaciones personales
que además de reducir las distancias entre los dife-
rentes niveles académicos, introduce un importan-
te grado de transversalidad en la comunidad cientí-
fica (Montesi 2011: 89).
Estas nuevas relaciones personales y aca-
démicas encuentran sus mejores ejemplos en las
redes sociales de Internet. En este tipo de redes
contamos con numerosos contactos de nuestro
entorno social y laboral que nos hacen partícipes
de su actividad individual. Mediante la comunica-
ción de noticias novedosas, referencias bibliográfi-
cas, oportunidades laborales e información de toda
naturaleza y, de forma intencionada o no, pueden
facilitarnos información útil para nuestra propia
investigación. De forma indirecta, las redes socia-
les han abierto nuevos e interesantes caminos para
los aspectos relacionados con la difusión científica
dirigida al público general. Entre éstos se puede
destacar el conocido como crowdfunding o micro-
mecenazgo. Portales de esta naturaleza como la-
zanos.org o goteo.org están resultando fundamen-
tales para poner en marcha interesantes proyectos
de gestión patrimonial como cinetínere vinculado
al proyecto Maila (http://goteo.org/project/
cinetinere) o Zamoraprotohistórica un proyecto ya
consolidado que se ha servido de este método para
sufragar la campaña de excavación de 2013 en el
castro del Castillón (http://www.lanzanos.com/
proyectos/excavaciones-arqueologicas/ ).
Mención aparte merecen las redes socia-
les profesionales o especializadas. El portal acade-
mia.edu, dedicado al mundo académico, y que ilus-
tra mejor que ningún otro ejemplo lo que venimos
desarrollando anteriormente. Este portal sigue un
formato de mini-blogs inspirado en la red social
Facebook. Esto permite a cada investigador publi-
car sus artículos y definir sus campos de interés
mediante una serie de etiquetas o keywords prede-
finidos. De este modo, compartimos nuestro traba-
jo y campos de interés con otros investigadores,
creando redes de especialistas que comparten los
mismos ámbitos de trabajo. La facilidad de consul-
tar y ser consultados por otros investigadores re-
sulta de gran interés para potenciar la difusión y el
impacto de los artículos publicados. Academia.edu
supone un ejemplo perfecto del aprovechamiento
de los nuevos recursos que ofrecen las redes socia-
les, parece evidente el enorme potencial de este
tipo de portales como dinamizadores de la investi-
gación científica.
En las tareas propias de la investigación
histórica la Web se utiliza, esencialmente, como
una fuente de documentación bibliográfica. En
este punto, cabe realizar algunas consideraciones
previas con respecto al modo en el que se utiliza
Internet en los trabajos de investigación. A pesar
de la visión que hemos ofrecido sobre la importan-
te generalización del uso de la Web entre los inves-
tigadores, encontramos un importante contraste
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 134
en la escasa presencia de páginas webs en la biblio-
grafía de cualquier trabajo de investigación. Esto
se debe a que resulta muy poco frecuente el uso de
las páginas webs como fuente directa de docu-
mentación. Esta situación debe dar lugar a un pro-
fundo debate que en este artículo no podemos
abordar en toda su dimensión. No obstante, sí po-
demos señalar las principales razones por las que
las páginas webs resultan poco útiles como fuentes
de documentación para los trabajos de investiga-
ción histórica:
Predominan los documentos no científicos. Re-
sulta muy frecuente que las páginas webs con-
tengan textos que no cumplen los requisitos me-
todológicos más básicos. No indican ni el autor
ni la bibliografía correspondiente, lo cual, impide
cualquier posibilidad de contrastar las fuentes
que se han utilizado para generar el documento.
Alojadas en entornos no confiables. Las páginas
webs carecen de un el entorno de publicación
confiable. Desconocemos si los textos localiza-
dos en las webs cuentan con algún tipo de aval o
respaldo científico.
Estabilidad del soporte. Los textos localizados en
las páginas webs no ofrecen garantías sobre su
estabilidad en el tiempo. Por una parte, descono-
cemos la posibilidad de que el texto sea modifi-
cado en alguna actualización de la página. De
otra parte, desconocemos las garantías que ofre-
ce el servidor donde se encuentra alojada la pági-
na, de tal forma, que ésta podría ser borrada y
desaparecer de la Web.
Por lo tanto, y aunque el espacio Web
ofrece un potencial de información inagotable, en
realidad, en los trabajos especializados se utiliza
básicamente como medio de acceso al documen-
to, ya sea para localizarlo en la biblioteca, acceder
al documento digitalizado o realizar cualquier tipo
de búsqueda bibliográfica. Esto resulta fundamen-
tal para enfocar de manera correcta nuestra meto-
dología de trabajo en la Web y escoger las herra-
mientas de búsqueda más adecuadas para nues-
tros objetivos.
Uno de los usos más habituales que va-
mos a dar a la Web consiste en la localización de un
documento al que queremos acceder físicamente.
En este caso, utilizaremos las páginas webs de las
propias bibliotecas. Las bibliotecas comenzaron a
utilizar las TIC, esencialmente, para informatizar
los antiguos sistemas de catálogo basados en fi-
chas o tarjetas perforadas. Desde los años 80 co-
mienzan a implementarse los OPAC (On-line Pu-
blic Access Catalogue), que permiten el acceso a
estos catálogos desde Internet y la Web. Aunque
en España este proceso ha llegado con algunos
años de retraso (Ríos 1991: 141), en la actualidad
podemos acceder a la mayoría de catálogos nacio-
nales como el de la Biblioteca Nacional de España
(http://catalogo.bne.es/uhtbin/webcat), o el catá-
logo colectivo del Centro de Ciencias Humanas y
sociales del CSIC (http://www.csic.es/web/guest/
bibliotecas). Por supuesto, los fondos bibliográfi-
cos de las universidades también se encuentran a
nuestra disposición y además del uso de los catálo-
gos y repertorios propios de cada biblioteca, con-
tamos con La Red de Bibliotecas Universitarias RE-
BIUN (http://www.rebiun.org/). En este excelente
catálogo colectivo se integran los fondos de 75
universidades y centros asociados. A nivel interna-
cional podemos destacar el catálogo colectivo
Worldcat (http://www.worldcat.org/), gestionado
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 135
por la Online Computer Library Center (OCLC) y que
además de su carácter como pionero e impulsor de
los OPAC está considerado el mayor catálogo en
línea del mundo.
En la actualidad, las mismas bibliotecas se
encuentran inmersas en proyectos de digitaliza-
ción de sus fondos, dando lugar a diferentes reper-
torios y bibliotecas virtuales como La Biblioteca
Digital Hispánica de la BNE (http://www.bne.es/
Catalogos/BibliotecaDigitalHispanica) o la Bibliote-
ca Virtual del CSIC (http://bibliotecas.csic.es/
biblioteca-virtual). De este modo, la Web también
nos ofrece la posibilidad de trabajar con los libros
digitalizados o e-book, que nos evitan tener que
desplazarnos físicamente a las instalaciones biblio-
tecarias. Estos proyectos también tienen su corre-
lato internacional, donde bibliotecas e institucio-
nes de diferentes países colaboran en la creación
de grandes repertorios bibliográficos. Un ejemplo
reciente lo constituye la Biblioteca Digital Mundial
(http://www.wdl.org/es/), un macro proyecto inter-
nacional impulsado por la UNESCO. También de-
bemos mencionar las bibliotecas estrictamente
digitales y no vinculadas a instituciones académi-
cas, como la Biblioteca Virtual Cervantes (http://
www.cervantesvirtual.com/) sostenida por la Fun-
dación Biblioteca Virtual Miguel de Cervantes y
otros recursos de utilidad similar como el servicio
de digitalización de libros Google books (http://
books.google.es/) de la compañía Google Inc.
En el caso de los artículos contamos con
las mismas opciones de formato que tenemos con
los libros, pero resulta aconsejable utilizar otros
recursos de búsqueda. Para facilitar la exposición,
durante las próximas líneas englobamos dentro de
la categoría artículo cualquier trabajo o estudio de
investigación parcial que forma parte de una obra
principal. Esto incluye los propios artículos de re-
vistas o trabajos de investigación, capítulos o sec-
ciones de libros, comunicaciones o ponencias de
congreso, en suma, cualquier trabajo que no cons-
tituye una obra en sí mismo y forma parte de otra
publicación que la engloba. El problema funda-
mental de este tipo de documentos, radica en que
los OPAC disponibles en la Web siguen las mismas
reglas y tradiciones de catalogación que los catálo-
gos y repertorios bibliotecarios manuales y por
tanto, sólo contienen el registro de la obra princi-
pal de referencia (Moscoso y Ortiz 2002: 47-48). De
este modo, salvo escasas excepciones, los índices,
los artículos o secciones concretas contenidas en
otras obras, resultan “invisibles” para las búsque-
das realizadas en los catálogos bibliotecarios.
En el caso concreto de los artículos de
revistas, normalmente, vamos a disponer de la
propia página web de la revista correspondiente,
donde tendremos acceso al índice completo de
cada publicación. Cada vez son más comunes las
revistas estrictamente electrónicas, en cuyo caso,
la página web correspondiente siempre nos ofrece
acceso tanto al índice como al texto completo de la
publicación. En la actualidad, parece que todas las
revistas científicas tienden a facilitar el acceso
completo al documento digitalizado, independien-
temente de la existencia de una versión impresa o
no.
Para los artículos de revistas sin acceso
desde la propia Web y el resto de artículos y seccio-
nes de libros que hemos incluido en este grupo,
contamos con los repertorios bibliográficos. Estos
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 136
repertorios, además de incluir los índices y seccio-
nes de las obras de referencia, nos aportan la ven-
taja de centralizar las búsquedas desde un único
recurso web. Entre éstos, podemos destacar ISOC
(http://bddoc.csic.es:8080/index.jsp) base de datos
de recursos bibliográficos del CINDOC dependien-
te del CSIC y Dialnet (http://dialnet.unirioja.es/) el
portal de recursos bibliográficos de la Universidad
de la Rioja. El primero de éstos, constituye una
base datos especializada que pretende recoger
todas las publicaciones periódicas españolas agru-
padas por campos de interés científico. Para esto,
exige una serie de requisitos mínimos de calidad en
las publicaciones recogidas, lo que nos ofrece un
repertorio de gran calidad bibliográfica. Por su par-
te, Dialnet funciona como un centro integrador de
recursos bibliográficos especializado en las Cien-
cias Humanas y Sociales que cuenta con una in-
mensa colección gracias a la colaboración de 70
bibliotecas e instituciones nacionales. Una impor-
tante alternativa a los repertorios bibliográficos la
encontramos en los buscadores especializados
como Scirus (http://www.scirus.com/) desarrollado
por la editorial Holandesa Elsevier B.V. o Google
Académico (http://scholar.google.es/), la versión
española de Google Scholar. Tanto los portales
como los buscadores cuentan opciones avanzadas
que nos ofrecen herramientas útiles de búsqueda
(por categoría, por fecha, por autor…). De igual
modo, ofrecen la posibilidad de visualizar o descar-
gar el documento digitalizado, exportar las refe-
rencias bibliográficas y el enlace a la página web
que suministra el documento. La mayor diferencia
entre ambos tipos de recursos la encontramos en
que los motores de búsqueda pueden indexar un
número ilimitado de documentos, entre los que se
incluyen los propios repertorios bibliográficos. Asi-
mismo, mientras los registros de los repertorios
suelen estar limitados al índice y el resumen del
documento, durante el proceso de indexación los
buscadores pueden llegar a incorporar a su base de
datos fragmentos de texto, incluso el contenido
completo de los libros y artículos. Resulta evidente
que con estas ventajas técnicas los motores de
búsqueda van a proporcionarnos búsquedas más
exhaustivas, es decir, tienen mayor potencial para
encontrar lo que buscamos y siempre devolverán
un número mayor de resultados. Sin embargo, los
repertorios bibliográficos contienen una informa-
ción muy ordenada, completa y muy homogénea
para sus registros, de modo, que sus búsquedas
son muy precisas y de muy alta calidad. Por el con-
trario, los motores de búsqueda recuperan sus
registros desde fuentes muy heterogéneas que
contienen una información muy desigual. En con-
secuencia, aunque recupera una cantidad muy ele-
vada de resultados, son poco precisos y de muy
diversa calidad, siendo frecuentes los errores y los
registros incompletos. Por lo tanto, cuando cono-
cemos el artículo que buscamos, los repertorios
bibliográficos resultan más recomendables, puesto
que nos ofrecerán resultados más precisos y de
mejor calidad.
Como hemos visto, existe una gran varie-
dad de recursos para las búsquedas bibliográficas
en la Web, y cada tipo de recurso puede resultar
adecuado o no en función de nuestras necesidades
de documentación. Por este motivo se puede recu-
rrir a metabuscadores como El Buscón (http://
elbuscon.bne.es/) de la BNE, especializado en la
búsqueda de recursos bibliográficos. Se trata de
un metabuscador que realiza búsquedas simultá-
neas en varios buscadores y otros recursos alterna-
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 137
tivos. A continuación nos presenta un resumen de
los resultados obtenidos en la búsqueda de cada
uno de los recursos utilizados y finalmente, utiliza
sus propios criterios de priorización para presentar
los resultados obtenidos de forma unificada y orde-
nados por orden de relevancia. Aunque presentan
un potencial extraordinario y algunas ventajas evi-
dentes, los metabuscadores tampoco están exen-
tos de problemas. Del mismo modo que los moto-
res de búsqueda especializados, recuperan infor-
mación de un conjunto de recursos heterogéneo y
ajeno al propio buscador, dando lugar a resultados
de calidad muy desigual. Por otra parte, cuando
unifica los resultados de las diferentes búsquedas,
utiliza sus propios criterios de priorización y por lo
tanto, descarta los resultados que no son relevan-
tes o que considera repetidos. Esto puede ocasio-
nar que algún registro relevante para nuestro tra-
bajo sea omitido de la lista de resultados.
5.- LA GESTIÓN DE LA INFORMACIÓN
En una investigación histórica el aparato
bibliográfico cuenta con un peso fundamental. El
volumen de referencias bibliográficas manejadas
suele alcanzar grandes dimensiones, por lo que
resulta esencial y casi imprescindible utilizar un
gestor bibliográfico. Estas aplicaciones informáticas
están diseñadas para la recopilación y construcción
de bibliografías. Se trata de bases de datos espe-
cializadas en la gestión de registros bibliográficos
que cuentan con herramientas específicas para los
entornos web. Actualmente, podemos considerar
Refworks, Endnote, Zotero y Mendeley como los
gestores bibliográficos más populares. Aunque sus
funciones básicas son similares cada uno de éstos
nos ofrece algunas herramientas y accesorios es-
pecíficos, por lo que resulta interesante conocer
sus particularidades con el fin de escoger el más
adecuado a nuestras necesidades. Independiente-
mente del gestor utilizado, con el uso de esta he-
rramienta se consiguen varios objetivos. En primer
lugar, mejorar y facilitar la búsqueda, recopilación
y almacenaje de referencias bibliográficas. En se-
gundo término, nos permite ordenar, organizar y
trabajar con la información de los registros biblio-
gráficos. Por último, estos gestores nos permiten
elaborar de forma automatizada nuestras biblio-
grafías y algunos de ellos, cuentan con herramien-
tas que facilitan el proceso de citas durante la edi-
ción de los textos.
Los registros bibliográficos pueden ser
introducidos manualmente, rellenando uno a uno
los campos correspondientes (autor, título, año de
publicación…). Sin embargo, una de las ventajas
más importantes de estos programas consiste en
las opciones de búsqueda e importación de regis-
tros desde la Web, para lo que cuentan con dos
alternativas principales. La primera opción consiste
en la posibilidad que ofrecen gestores como
EndNote o Refworks de realizar búsquedas directas
sobre las bases de datos bibliográficas disponibles
en la Web. En este caso, nos conectamos directa-
mente con la base de datos correspondiente, reali-
zamos la búsqueda dentro del propio catálogo e
importamos los registros recuperados a nuestra
base de datos personal. La segunda opción, dispo-
nible para todos los gestores, nos permite buscar
las referencias libremente por la Web y una vez
localizadas, importarlas a nuestra base de datos.
De esto modo, cualquier gestor bibliográfico puede
recuperar una amplia gama de archivos bibliográfi-
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 138
cos mediante la importación o descarga de archi-
vos con formatos de intercambio como RIS, Refer/
BibIX, ISI-CE o XML. En la actualidad, la mayor
parte de los recursos bibliográficos disponibles en
la Web incluyen opciones de exportación cuya fina-
lidad consiste, precisamente, en compartir sus
registros. De hecho, todas las páginas y recursos
bibliográficos citados en este trabajo ofrecen dife-
rentes opciones de exportación de sus referencias.
Por lo tanto, resultan accesibles para cualquier
gestor bibliográfico.
Gracias a las posibilidades de importación
de registros y búsqueda online que nos ofrecen los
gestores podemos elaborar con facilidad nuestra
propia base de datos bibliográfica. Prácticamente,
resulta innecesario introducir registros manual-
mente, lo que por sí mismo ya supone un ahorro
de tiempo y esfuerzo considerable. Como cual-
quier base de datos al uso, los gestores bibliográfi-
cos nos permiten trabajar con nuestros registros;
organizarlos por temas, adjuntarles etiquetas, des-
cripciones, imágenes, realizar búsquedas… Ade-
más de las funciones propias de una base de da-
tos, incorporan algunas herramientas especial-
mente diseñadas para trabajar con registros bi-
bliográficos. Destaca la posibilidad de generar au-
tomáticamente una bibliografía en formato txt
completamente preparada para ser insertada en
los procesadores de texto. Asimismo, todos los
gestores bibliográficos cuentan con la posibilidad
de cambiar automáticamente el estilo de cita en el
que presentamos nuestra bibliografía, para lo que
cuentan con una amplia variedad de estilos de cita.
Ya hemos argumentado las razones por
las cuales las páginas webs no suelen utilizarse
como bibliografía de los trabajos de investigación.
No obstante, esto no es óbice para que podamos
encontrar información y recursos de muy diversa
naturaleza que pueden resultar de gran valor para
nuestro trabajo. Se pueden englobar aquí todos
los recursos no estrictamente bibliográficos como
páginas especializadas en temáticas propias
(Arqueología o Historia), las dedicadas a temas o
aplicaciones de utilidad, (Dibujo Arqueológico,
Dibujo en 3D o Sistemas SIG) o las páginas de noti-
cias (culturales, históricas, patrimoniales). Este
tipo de información útil que encontramos en la
Web procede de unas fuentes muy heterogéneas y
responde a una enorme variedad de temas y con-
tenidos. De una forma genérica esta información
no bibliográfica puede clasificarse en dos grandes
categorías; Las procedentes de páginas estáticas y
las de páginas dinámicas, que se corresponden con
la ya menciona distinción entre Web 1.0 y Web 2.0.
Dentro de las primeras, normalmente,
encontraremos información temática con conteni-
dos útiles o complementarios para nuestra investi-
gación (páginas de historia, de arqueología, de
dibujo arqueológico, de herramientas SIG…). Para
localizar y llegar hasta estas páginas bastará con
utilizar el propio navegador o los buscadores gene-
ralistas como Google o Yahoo. Para el tratamiento
de estos recursos, normalmente alojados en pági-
nas estáticas, los navegadores web al uso pueden
ser herramientas lo suficientemente potentes co-
mo para cubrir nuestras necesidades. Todos los
navegadores ofrecen la posibilidad de emplear los
marcadores. Se trata de una utilidad que nos per-
mite almacenar las direcciones de las páginas
webs que nos interesan y ordenarlas en un árbol
de carpetas. En realidad, estamos creando así
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 139
nuestros propios directorios personalizados. Tam-
bién nos ofrecen algunas utilidades muy prácticas,
como la posibilidad de incluir en la barra de herra-
mientas botones de acceso directo a los recursos
web más utilizados. Finalmente, si estas herra-
mientas resultan insuficientes, todos los navegado-
res cuentan con una serie de módulos opcionales,
llamados complementos o accesorios, que nos per-
miten instalar nuevas herramientas especializadas
en determinados aspectos de la navegación y la
festión de páginas web. El propio gestor bibliográ-
fico Zotero es un buen ejemplo de este tipo de
complementos.
En el caso de las páginas englobadas den-
tro de la Web 2.0 y debido al carácter dinámico y
cambiante de sus contenidos, resulta aconsejable
utilizar algunos recursos específicos. Dentro de
este grupo podemos considerar los sitios como
blogs y noticieros especializados, periódicos digita-
les o portales de noticia. Este tipo de webs ofrece
un caudal constante y masivo de información que
en su mayor parte resulta completamente irrele-
vante para nuestros intereses. Por tanto, la proble-
mática principal radica en filtrar esta información.
Es necesario descartar las noticias irrelevantes para
localizar aquellas informaciones que son verdade-
ramente importantes para nuestro trabajo .
Para comenzar, es importante saber que
la inmensa mayoría de sitios webs dedicados a la
difusión de noticias utilizan el sistema RSS (Really
Simple Syndication). Se trata de un formato XML
Fig. 7.– Proceso seguido por un gestor bibliográfico desde la recuperación de los registros bibliográficos mediante los recursos de la Web hasta la elaboración de una bibliografía en formato txt.
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 140
para sindicar o compartir contenido en la Web.
Como puede observarse en el mapa conceptual de
la figura 8, existen sitios webs que usan agregado-
res para recoger y agrupar información de otros
sitios webs. Estos agregadores se suscriben me-
diante formatos RSS o su alternativa Atom, a pá-
ginas webs de redifusión de noticias, recopilando
los contenidos publicados y mostrando las nove-
dades y cambios ocurridos en los mismos
(Huidobro 2008: 58-59). La mayoría de blogs y
portales de noticias especializados en cualquier
materia utilizan estos agregadores para recopilar
las noticias de su interés desde otras fuentes webs,
asimismo, suelen sindicar (intercambiar) sus con-
tenidos con otros portales especializados.
Aunque podríamos utilizar directamente
las fuentes de noticias originales, como periódicos
nacionales o regionales, resulta aconsejable identi-
ficar aquellos portales que se han especializado en
nuestro ámbito de trabajo (sólo por mencionar
algunos ejemplos; Noticias de Historia Antigua y
Arqueología -historiayarqueologia.com- Lista de
Prehistoria -listadeprehistoria.blogspot.com.es-,
Paleorama en Red -paleorama.wordpress.com-
Arquehistoria -http://arquehistoria.com/-). Estos
portales, ya sea mediante agregadores o mediante
la selección manual de noticias, nos están ayudan-
do a realizar un primer filtro de las noticias que
realmente pueden resultarnos útiles.
Una vez hemos seleccionado los portales
de noticias de nuestro interés, podemos suscribir-
nos mediante RSS a estos portales especializados.
Figura 8.- Esquema conceptual del flujo de noticias mediante RSS y su presentación final en el lector de noticias integrado en la barra del navegador.
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 141
Esto nos permitirá tener un acceso sencillo y rápido
a las noticias novedosas que recojan, sin necesidad
de revisar uno por uno cada sitio web. Finalmente,
podemos integrar en la barra de nuestro navegador
un pequeño agregador o lector de noticias RSS. De
esta forma, con un simple clic en el botón corres-
pondiente se despliega un listado de todas las noti-
cias recogidas en el portal, incluyendo una indica-
ción visual para distinguir las noticias antiguas de
las novedosas. Como resultado, podemos optimi-
zar en términos de tiempo y esfuerzo nuestra capa-
cidad para filtrar y ordenar la información prove-
niente de páginas de noticias. Una tarea, que sin
estas sencillas herramientas nos exigiría un impor-
tante esfuerzo de revisión.
6.- CONCLUSIONES
La Web se ha convertido en un recurso
fundamental para la documentación bibliográfica
en el desarrollo de cualquier trabajo de investiga-
ción. Sin embargo, y a pesar del uso cotidiano que
hacemos de sus recursos, predomina un conoci-
miento muy superficial de la Red.
A lo largo de este artículo se han presentado algu-
nos conceptos básicos sobre la estructura y funcio-
namiento de la Web que pueden ayudarnos a me-
jorar el diseño de nuestras estrategias de búsqueda
y gestión de la información. Cada vez cobra mayor
importancia conocer y escoger adecuadamente los
recursos y herramientas bibliográficas, como los
repertorios, motores de búsqueda, gestores bibliográ-
ficos o los sistemas de sindicación de contenidos
(RSS o Atom). Como se ha puesto en relieve a lo
largo de este artículo, un uso combinado y estruc-
turado de estas herramientas nos ayudará a opti-
mizar nuestro trabajo en términos de tiempo y es-
fuerzo.
BIBLIOGRAFÍA
Arras, A. M., Torres, C. A. y García-Valcárcel, A. 2011:
Competencias en tecnologías de información y co-
municación (TIC) de los estudiantes universitarios.
Revista Latina De Comunicación Social, 66.
Baeza Yates, R. 2004: Excavando la web. El profesional
de la información, 13 (1): 4-10
Bergman, M. K. 2001: White Paper: The Deep Web: Sur-
facing Hidden Value. Journal of electronic publishing,
7 (1).
Comas, R., Sureda, J., Pastor, M. y Morey, M. 2011. La
búsqueda de información con fines académicos
entre el alumnado universitario. Revista española de
documentación científica, 34 (1): 44-64.
Criado, L. 2009: Procedimiento semi-automático para
transformar la web en web semántica. Tesis UNED.
Echavarría Ramírez, A. F. 2004: Una visión al mundo de
la búsqueda y recuperación de la información elec-
trónica. Revista Lasallista de Investigación, 1 (2): 117
-122.
Fernández, F. 2006: Investigar, escribir y enseñar historia
en la era de inernet: Presentación. Hispania: Revista
Española De Historia, 66 (222): 11-30.
Ferran, N. y Pérez-Montoro, M. 2009: Gestión de la infor-
mación personal en usuarios avanzados en TIC. El
Profesional De La Información, 18 (4), 65-373.
Fresquet, J. L. 2005: Las TIC (tecnologías de la informa-
ción y la comunicación) y los estudios biográficos.
Asclepio. Revista De Historia De La Medicina y De La
Ciencia, 57 (1): 167-187.
He, B., Patel, M., Zhang, Z., y Chang, K. 2007: Accessing
the Deep Web. Communications of the ACM, 50 (5):
94-101.
Huidobro, J. M. 2008a: Historia de los ordenadores. Pági-
na web: http://www.coit.es/foro/pub/ficheros/
historia_de_los_ordenadores_dbce153a.pdf. Último
acceso (2013).
ARPI. Arqueología y Prehistoria del Interior peninsular 01– 2014 142
- 2008b: La sindicación WEB : RSS. Bit, 167: 58-61
Karsenti, T. y Lira, M. L. 2011: Las tecnologías de infor-
mación y de comunicación (tic): un componente
esencial de la investigación en ciencias humanas.
Revista Actualidades Investigativas en Educación, 11:
1-27.
Martínez, F. y Acosta, Y. 2011: Integración de las tecno-
logías de la información y la comunicación (TIC) en la
universidad: Diez propuestas de aprendizaje. Revista
Mediterránea De Comunicación Social, 2: 43-58.
Meadow, C. T. 1993: Text Information Retrieval Systems.
San Diego: Academic Press.
Montesi, L. 2011: El oficio del historiador en tiempos de
internet. Historiografías: Revista De Historia y Teoría,
2: 85-97.
Moscoso, P., y Ortiz-Repiso, V. 2002: OPACs en Web:
entre la tradición y la innovación. Información, cultu-
ra y sociedad, 6: 34-52.
Negroponte, N. P. 1995: El mundo digital (1ª ed.) Edicio-
nes B.
- 2002: El ADN de la información. Sociedad de la informa-
ción. 1: 57-63.
Pérez-Montoro, M. 2010: Arquitectura de la información
en entornos web. Ediciones Trea S.L. Gijón.
Prensky, M. 2001: Nativos digitales, inmigrantes digita-
les. En El Horizonte. 9 (5)
Ríos, Y. 1991: Catálogos en línea de acceso público. Se-
lección bibliográfica. Revista española de documen-
tación científica, 14 (2): 121-142.
Salazar, I. 2005: Las profundidades de Internet. Ediciones
Trea, S.L. Gijón.
Salvador , J. A., y Vidal, F. J. 2000: Evaluación del rendi-
miento de los motores de búsqueda en la recupera-
ción de información en la WWW. Documentación de
las ciencias de la información, 23: 93-108.
Sanuy, J., y Guijosa, A. 2011: Resolviendo problemas de
historia en y con la web. Iber. Didáctica De Las Cien-
cias Sociales, Geografía e Historia, 69: 75-83.
Zazo, Á. F., García-Figuerola, C., y Alonso, J. L. 2004:
Cibermetría: Nuevas técnicas de estudio aplicables al
web. Ediciones Trea, S.L. Gijón.