Nous mètodes per a la comparació de textos5 vora el mar (1967)–, a més de dos reculls de contes...
Transcript of Nous mètodes per a la comparació de textos5 vora el mar (1967)–, a més de dos reculls de contes...
-
Nous mètodes per a la comparació de textos El cas d’”Aloma” de Mercè Rodoreda
Josep M. Domènech Gibert [email protected]
Novembre de 2016
Premi Fundació Mercè Rodoreda 2017
La Fundació Mercè Rodoreda, a proposta de la Comissió Tècnica, constituïda pels
il·lustríssims senyors Josep Massot, Joaquim Mallafrè i Damià Pons, acordà concedir el
Premi Fundació Mercè Rodoreda 2017 a Josep M. Domènech Gibert pel seu treball “Nous
mètodes per a la comparació de textos. El cas d’’Aloma’ de Mercè Rodoreda”.
El Premi Fundació Mercè Rodoreda s’atorga anualment al “millor treball d’investigació sobre l’obra de Mercè Rodoreda o sobre la novel·la i el conte des de la caiguda de Primo de Rivera fins a la fi del franquisme (1930-1975)”.
-
1
De tota novel·la, sempre en sobra la meitat.
JOAN FUSTER, Consells, proverbis i insolències.
-
2
Índex
1 Introducció ............................................................................................................................. ............ 4
2 Obtenció i preparació de les dades ................................................................................................... 15
2.1 Els textos ............................................................................................................................ ..... 15
2.1.1 Origen dels textos codificats ..................................................................................... ..... 15
2.1.2 Adaptacions................................................................................................................ ..... 16
2.2 Dades sobre la freqüència dels mots en la llengua ................................................................. 17
2.3 Eines desenvolupades .................................................................................................... ......... 22
2.3.1 Alineació dels dos textos ................................................................................................ 22
2.3.2 Creació d’un sistema de consultes ................................................................................. 24
3 Les dues versions d’Aloma, en xifres. Cap a la simplicitat ................................................................ 29
3.1 Dades generals ................................................................................................................... ..... 29
3.2 Mots que apareixen un sol cop a cada versió ......................................................................... 36
3.3 Dades de categories gramaticals ........................................................................................ .... 37
4 Dades sobre la freqüència dels mots en la llengua. Cap a la senzillesa .......................................... 48
5 Índex de valoració del lèxic .......................................................................................................... ..... 62
5.1 Concepte ................................................................................................. ................................ 62
5.2 El model matemàtic ............................................................................................................ ..... 62
5.3 Un exemple real .................................................................................................................. ..... 64
5.4 El cas de les dues versions d’Aloma ....................................................................................... 66
5.5 Una possible objecció, una segona opció ........................................................................... .... 66
6 Més enllà d’Aloma, més enllà de Rodoreda ................................................................................. ..... 69
7 Quatre apunts sobre sintaxi ......................................................................................................... ..... 77
7.1 Les estructures de clivellament ........................................................................................... .... 78
7.2 La doble negació – Concordança negativa ......................................................................... .... 83
8 A tall de conclusió ........................................................................................................................ ..... 92
9 Bibliografia bàsica utilitzada ......................................................................................................... ..... 94
Annexos ............................................................................................................................. .................. 98
Versió 1 .................................................................................................................... ...................... 98
Noms – Alfabètic ..................................................................................................................... 99
Noms – Per freqüència .......................................................................... ................................. 112
Adjectius – Alfabètic ................................................................................................................ 125
Adjectius – Per freqüència ...................................................................................................... 132
Verbs – Alfabètic ..................................................................................................................... 139
Verbs – Per freqüència .......................................................................... .................................. 146
-
3
Adverbis – Alfabètic ............................................................................... .................................. 153
Adverbis – Per freqüència ....................................................................................................... 155
Noms propis – Alfabètic .......................................................................................................... 157
Noms propis – Per freqüència ................................................................................................. 158
Versió 2 ............................................................................................................................. ............. 159
Noms – Alfabètic ..................................................................................................................... 160
Noms – Per freqüència ................................................................................................. ........... 168
Adjectius – Alfabètic ..................................................................................................... ........... 176
Adjectius – Per freqüència ........................................................................................... ........... 180
Verbs – Alfabètic .......................................................................................................... ........... 184
Verbs – Per freqüència ............................................................................................................ 188
Adverbis – Alfabètic ...................................................................................................... ........... 192
Adverbis – Per freqüència ....................................................................................................... 193
Noms propis – Alfabètic ............................................................................................... ........... 194
Noms propis – Per freqüència ................................................................................................. 195
-
4
1. Introducció
This novel merited the Crexells Prize given by the Institució de les Lletres Catalanes in 1937 and
was extensively revised for publication in 1968. What was the nature of these changes, and can
they tell us anything about how changed the author?1
Quan, a meitat de la dècada dels seixanta del segle passat, Mercè Rodoreda va decidir
reescriure Aloma, la novel·la que havia escrit trenta anys abans, segurament no era conscient
que estava dotant els estudiosos posteriors de la seva obra d’una eina bàsica. Disposar de dues
versions d’una mateixa novel·la –escrites, la primera, durant el període de formació de l’autora, i
la segona, en plena maduresa literària i personal– ens hauria de permetre entendre quina era la
seva visió de la literatura, quin va ser el seu aprenentatge i, sobretot, amb quins criteris estètics,
lingüístics i literaris s’enfrontava al full en blanc. Quan Sadurní Martí, l’any 1993, es preguntava
“Quines són les línies de força que regnen en aquesta transformació? A quins elements
afecta?”,2 es referia justament a aquest desig i a aquesta realitat: treure l’entrellat de les
diferències entre les dues versions significarà conèixer de veritat el motor literari de Mercè
Rodoreda des de tots els punts de vista. És molt clara la conclusió de Pere Gamisans en aquest
sentit:
Mais la présence de deux versions de "Aloma" donne à ce texte en tant qu'objet d'étude, un
avantage sur les autres, en effet elle place devant nos yeux le travail de réécriture auquel s'est
livré l'auteur. Nous sommes en présence d'éléments concrets que nous pouvons comparer, et
donc nous avons la possibilité d'étudier plus facilement l'écriture puisque nous sommes à la fois
en présence de ce qu'elle affirme et de ce qu'elle refuse [...].3
Parlàvem de període d’aprenentatge i ho fèiem, també, de maduresa. En el moment en què
Rodoreda va escriure la primera versió d’Aloma, era una escriptora en formació –una dona que
volia ser escriptora, en realitat–, tot i que la seva producció, ni que sigui des del punt de vista
quantitatiu, no era gens menyspreable.4 Trenta anys més tard, Rodoreda ja havia publicat tres de
les seves grans novel·les –La plaça del Diamant (1962), El carrer de les Camèlies (1966) i Jardí
1 Pope (1994), pàg. 135. 2 Martí (1993), pàg. 65: “Es tracta de dos textos que comparteixen una trama, però que presenten unes diferències formals, d’escriptura, tan notables que els converteix en textos pràcticament diferents. Quines són les línies de força que regnen en aquesta transformació? A quins elements afecta?” 3 Gamisans (1988), pàg. 6. Agraïm a Marta Viñuales, de la Fundació Mercè Rodoreda, i al personal de l’Arxiu Mercè Rodoreda les facilitats donades per a la consulta d’aquesta tesi doctoral. 4 A més d’un llibre d’assaig (Polèmica, 1934, escrit en col·laboració amb Delfí Dalmau) i d’una pila de contes a diaris i revistes, Rodoreda havia publicat quatre novel·les: Sóc una dona honrada? (1932), Del que hom no pot fugir (1934), Un dia en la vida d’un home (1934) i Crim (1936).
-
5
vora el mar (1967)–, a més de dos reculls de contes –Vint-i-dos contes (1958) i La meva Cristina
i altres contes (1967)–, i treballava des de feia temps en el seu magne Mirall trencat. Maduresa
literària, doncs, tota. Però això no és tot. En aquells trenta anys, Rodoreda havia viscut dues
guerres, havia marxat a l’exili i havia residit a diverses ciutats europees, en la misèria més
absoluta, primer, i en una posició més confortable, més endavant. Maduresa personal, per tant,
també tota. Aquesta maduresa, aquest “fer-se escriptora”, els resumeix Giuseppe Grilli en aquest
paràgraf:
La novel·la és del 1938, però Rodoreda és definitivament un escriptor de llengua catalana entre
el 1958 i el 1962. Aquesta dada il·lumina amb una llum peculiar l’obra de revisió del text que
l’autora va acomplir l’any 1968 sobre un original datat el 1936.5
Ho explicava, també, la mateixa Rodoreda, amb aquestes paraules a Baltasar Porcel, en la
coneguda entrevista de l’any 1966 a “Serra d’Or”:
[...] salvo només, dels meus llibres d’abans de la guerra, Aloma, i amb moltíssimes correccions, i
potser mitja dotzena de contes. Quan vaig publicar els meus primers llibres era molt jove i molt
innocent. Tenia unes ganes fabuloses d’escriure… i no gaire cosa més.6
I, és clar, no podem oblidar els més de vint anys de convivència amb Armand Obiols –alter ego
de Joan Prat–, escriptor i crític literari que, sigui en la mesura que sigui, va exercir una forta
influència en l’autora i, per descomptat, en la seva obra. Tot i que no disposem, encara, d’un
estudi exhaustiu que l’analitzi a fons, hem de pensar que, segurament, no és tan insignificant
com pretenen uns ni tan definitiva com insinuen altres.7 La mateixa Rodoreda ho comentava a
Josep M. Castellet a Ginebra amb paraules com aquestes:
Mai no he escrit per al públic. Jo escrivia només per a l’Obiols, i ara ja no hi és.
5 Grilli (1987), pàg. 145. 6 Porcel (1966), pàg. 40. 7 En parla, per exemple, Montserrat Casals (1991, pàg. 291-292), quan comenta la intervenció d’Obiols en la revisió d’Aloma: “Fins a tal punt la molestava la reescriptura –fer els “adobs”, deia ella– d’Aloma que, finalment, se’n va ocupar Armand Obiols [...]. No queden pistes de quins són els canvis realitzats sota la ploma de Rodoreda i quins són els aplicats per l’Obiols. Caldria un minuciós treball que aportaria nous coneixements sobre la manera d’escriure de l’una i de l’altre. Però, veient com s’establia habitualment la col·laboració entre Rodoreda i l’Obiols, sembla raonable creure que les qüestions més purament gramaticals i les d’eliminar una excessiva retòrica, present a la primera versió, van ser resoltes per l’Obiols. De fet, per a ell això era feina fàcil: era un magnífic editor del treball creatiu dels altres.” William Viestenz (2011, pàg. 104-105), parlant de la inacabable escriptura de La mort i la primavera, afirma que “Without Obiols, it is possible that Rodoreda could do nothing other than unproductively donar voltes.”, tot i que “Without Obiols’s watchful eye, Rodoreda indeed discovered a different writing routine and finally completed and published her most ambitious novel, Mirall trencat, in 1974.” Castellet (1988, pàg. 43) tanca el tema quan sentencia: “Tanmateix, si es llegeix Aloma, o alguna de les obres rebutjades, ningú no podrà negar que el món de la Rodoreda existia abans de la seva vida amb Obiols. I qui hagi llegit els llibres publicats després de la mort d’ell comprendrà que la Mercè era capaç d’escriure sola, malgrat saber, també, com és d’útil, per a tot escriptor, que alguna persona intel·ligent li llegeixi els llibres abans de publicar-los.”
-
6
Tanmateix, amb mi vivia un escriptor català que llegia el que jo escrivia, que m’ho comentava
llargament i que em feia totes les observacions que pot fer un lector intel·ligent.
I quan venia li llegia el que havia escrit: tenia un esperit terriblement crític i així m’enriquia. De tan
crític com era –més amb ell mateix que amb els altres– va acabar no escrivint res. M’han explicat
que algú ha dit que era ell qui m’escrivia els llibres: una bestiesa, com pots comprendre, perquè
els meus llibres són llibres de dona, i els homes no en saben res, del món de les dones.8
En la revisió d’Aloma, Rodoreda fa canvis de tota mena, des dels estrictament literaris als
purament lingüístics, si és que els uns es poden separar dels altres. Pere Gamisans, un dels
autors que ha dedicat més temps i pàgines a analitzar les diferències lingüístiques entre una
versió i l’altra, comenta així l’oportunitat que ens ofereix el fet de disposar de dues versions de la
novel·la:
La comparació entre l’obra novel·lesca inicial –rebutjada per la mateixa autora– de Mercè
Rodoreda i la que se situa després del 1939 palesa la cura amb la qual ha anat remodelant i
transformant l’arsenal lingüístic que utilitzava abans de la guerra i permet d’analitzar i de
comprendre millor les característiques del discurs rodoredià. [...] Les dues versions d’Aloma són
un document de suma importància per a l’estudi de la llengua de Mercè Rodoreda en la mesura
que ensenyen les dues cares de l’elecció estilística de l’autora barcelonina: el que rebutja i el que
fa seu.9
No hi pot haver, doncs, millor manera de conèixer l’evolució de la narrativa de Mercè Rodoreda
que analitzant els canvis entre les dues versions d’Aloma.
La gènesi de la segona versió
A través de la lectura de la correspondència amb Joan Sales10 (el seu editor), Joaquim Molas11
(editor de les Obres completes) i Armand Obiols12 (el seu company i, sobretot, crític literari
personal), sabem que la revisió d’Aloma no va ser una tasca ni ràpida ni senzilla. Segons
aquesta correspondència, en va començar a parlar amb Joaquim Molas13 (qui acabaria editant la
8 Castellet (1988), pàg. 41-42. 9 Gamisans (1991), pàg. 353-354. 10 Correspondència recollida a Rodoreda (2008). 11 Correspondència recollida a Arnau (2010). 12 Correspondència recollida a Obiols (2010). 13 Deia Rodoreda, el 2 d’agost de 1965: “M’hauria de dir, més o menys, la data en què pensa publicar Aloma. Tot i que no crec gaire en les revisions d’una obra de joventut, perquè molt sovint en comptes de millorar-la l’esguerren, hi ha trossos d’Aloma que fan angúnia de llegir.” Arnau (2010), pàg. 236.
-
7
segona versió) durant l’estiu de 1965, i no li va lliurar l’original fins a la primavera de 1969, quan
comunica al mateix Molas que “Per correu a part us envio Aloma”,14 amb el convenciment que
“Aloma és un llibre nou. No he fet simplement una revisió [...].”15
Ara per ara, però, no podem saber amb quina intensitat va treballar en l’obra durant aquests
gairebé quatre anys. Només en tenim alguna informació que, de vegades, és contradictòria. A
començaments de l’any 1967, Rodoreda diu a Joan Sales que hi està treba llant:
El que em destorba –i faig amb certa mala gana– és l’adob d’Aloma.16
[...] em cal acabar Aloma. Em fa nosa i em destorba.17
I Obiols fa un comentari similar a Rodoreda durant els primers mesos de 1968:
Ahir a la nit vaig reprendre la revisió d’Aloma.18
Tinc realment ganes d’enllestir la revisió.19
Quan en parla amb Joaquim Molas, però, un mes abans d’enviar-li la novel·la, Rodoreda redueix
el temps que ha dedicat a aquesta feina:
Us vaig dir que us donaria Aloma el mes de gener o de febrer d’aquest any. No m’hi vaig poder
posar a treballar fins a mig mes de febrer. I Aloma, tot i que està molt avançada, em dóna més
feina que si fes una novel·la nova. Hi ha tantes ruqueries, l’estil és tan abominable, que, per
arreglar tants nyaps, suo tinta xina. Quan un paràgraf em queda decent, l’altre se m’espatlla.
Aloma és un una mitja que s’escorre per tot arreu (sic). Però em penso que quedarà molt bé. He
procurat conservar tot el que hi havia, però ja veureu, quan tindreu ocasió de llegir-la, que l’he
millorada molt. Ha perdut, és clar, la santa innocència i la gran espontaneïtat. Però, tal com era,
francament, no es podia publicar.20
Sigui com sigui, i més enllà de les mitges veritats que Rodoreda pogués dir als seus editors, és
evident que la revisió d’Aloma va ser una tasca feixuga, un malson inacabable. I tant les seves
paraules com les de l’Obiols així ho corroboren. El que havien de ser quatre canvis per a netejar-
la i fer-la més presentable –una simple revisió– es va convertir en una autèntica reescriptura de
14 Carta del 8 d’abril de 1969. Arnau (2010), pàg. 242. 15 Carta del 17 de maig de 1969. Arnau (2010), pàg. 242. 16 Carta del 26 de gener de 1967. Rodoreda (2008), pàg. 322. 17 Carta del 6 de febrer de 1967. Rodoreda (2008), pàg. 329. 18 Carta del 13 de febrer de 1968. Obiols (2010), pàg. 376. 19 Carta del 21 de febrer de 1968. Obiols (2010), pàg. 379. 20 Carta del 17 de març de 1969. Arnau (2010), pàg. 241.
-
8
la novel·la i, amb això, en una obra més en el conjunt de la seva producció i en un regal per als
estudiosos.
La importància de l’estudi de la llengua de Rodoreda
Diversos estudis i ressenyes ens han proporcionat moltes interpretacions i anàlisis minucioses de
la producció literària d’una de les autores més importants del nostre segle. Amb tot, s’hi pot
evidenciar una mancança: la llengua de les obres rodoredianes hi ha estat insuficientment
contemplada.21
Efectivament, des que l’any 1979 Carme Arnau va publicar22 la tesi doctoral que havia presentat
dos anys abans a la Universitat de Barcelona, l’obra de Mercè Rodoreda ha estat analitzada des
de tots –o gairebé tots– els punts de vista. En són una bona demostració el recull bibliogràfic de
Maria Isidra Mencos23 i la posterior ampliació de Kathleen McNerney,24 que comenten centenars
de monografies i articles de revistes d’arreu del món sobre tota mena d’aspectes de l’obra
rodorediana. De tota manera, resseguint aquests dos reculls, ens adonem del baixíssim nombre
d’estudis dedicats a la seva llengua, més enllà de la tesi doctoral de Pere Gamisans –que ja hem
esmentat i que comentarem més endavant–, d’alguns articles sobre alguna qüestió concreta i
d’alguna referència en textos d’abast més general. No hauríem d’obl idar que la llengua era un
potent motiu de reflexió per a l’autora a l’hora d’escriure (vegeu, si no, els debats que ella i el seu
editor, Joan Sales, mantenen sobre qüestions lingüístiques en la seva correspondència). Imma
Contrí i Carles Cortés es feien ressò, l’any 1999, d’aquestes mancances i de la necessitat
d’abordar ja un estudi aprofundit sobre la llengua de Mercè Rodoreda:
Com veiem, Rodoreda era conscient de la importància que té la llengua en el producte literari. No
és gratuït, per tant, plantejar una anàlisi dels elements lingüístics de la seva obra.25
Cal, doncs, un estudi seriós i complet de la llengua de Mercè Rodoreda, tant pel que fa a
cadascuna de les seves obres analitzada individualment com en conjunt, de manera que puguem
conèixer-ne l’evolució al llarg dels anys.
21 Contrí (1999), pàg. 284 22 Arnau (1979). 23 Mencos (2004), 24 McNerney (2015). 25 Contrí (1999), pàg. 286.
-
9
I, és clar, si estudiem la llengua de Rodoreda, caldrà analitzar-ne molt especialment el lèxic,
l’element lingüístic més visible per al lector i el que, juntament amb la sintaxi, permet a l’autora
anar desenvolupant i modificant el seu estil, el seu codi. Ho explica molt bé Josep-Miquel Sobré
en aquest paràgraf:
El lèxic és l’element més vistós del llenguatge i ofereix més variació optativa que no pas la
morfologia o la sintaxi, sempre dins del reialme de la correcció. És en el vocabulari sobretot on
un autor manifesta el tipus de llengua que creu més convenient per als seus propòsits estilístics.
La mena de llenguatge que apareix en una obra literària és una cadena d’eleccions que obeeixen
al desig de l’autor de trobar la forma, el “codi” amb què podrà desenvolupar millor els efectes que
busca.26
Sobre la senzillesa de la segona versió d’Aloma. El treball de Pere Gamisans
De la lecture des premières pages des deux versions se dégage l'impression qu'une distance
sépare les deux textes du point de vue de la langue utilisée: la version de 1968 présente un
lexique mais aussi une morphologie et une syntaxe plus courants. Mais qu'entend-on par
"courant"? Que signifie écrire dans une langue plus courante? En quoi cela consiste-t-il?
Pourquoi avoir écrit ainsi? Quels effets de sens s'en dégagent?27
Sempre que es parla del lèxic de Mercè Rodoreda –i molt especialment del de la segona versió
d’Aloma en comparació amb la primera–, es fa amb adjectius que n’evoquen la senzillesa: planer
i senzill,28 col·loquial,29 natural i fluid,30 o corrent,31 per esmentar alguns exemples. I és així. Si
llegim les dues novel·les en paral·lel, ens adonem de seguida del caràcter planer, senzill,
col·loquial, natural, fluid i, en definitiva, corrent –per dir-ho amb les mateixes paraules que han
utilitzat els crítics– del lèxic i del conjunt del llenguatge de la segona versió. Vegeu, si no,
aquests fragments del capítol VII:
26 Sobré (1973), pàg. 228-229. 27 Gamisans (1988), pàg. 7. 28 “Em sembla que és prou palès que l’estil de La plaça del Diamant és més popular que no pas erudit, més planer que no pas ampul·lós, més senzill que no pas feixuc, més col·loquial que no pas fredament científic.” Sobré (1973), pàg. 231. 29 “[...] pel que fa al lèxic s’eliminen les paraules literàries, substituïdes per altres de més col·loquials [...].” Arnau (2006), pàg. 38. 30 “El llenguatge artificiós, rebuscat i estrafet de la 1ª edició és substituït per un altre de més natural i fluid, menys afectat.” Bernal (1992), pàg. 346. 31 “Elles présentent des différences importantes dans leur lexique, différences qui mettent en évidence l'opposition non courant/courant [...].” Gamisans (1988), pàg. 33.
-
10
Aloma 1 Aloma 2
Un cop la feina enllestida té tràfecs a proveir-
se de tinter i ploma. Paper i sobres. Ha de
fugir del nen, que és l'únic a adonar-se de les
seves angúnies.32
+++++
Dintre de la seva cambra comença, quan és
sola i li sembla que tots dormen, la seva
correspondència a ningú.
Escriu damunt d'un llibre amb les cames
arronçades sobre el llit, i l'ampolla de tinta
ficada dins d'un gerro xato que s'aguanta
perfectament si ella no es belluga.33
+++++
No sé escriure. Si ho sabia dir bé... Esquinça
el paper, comença de bell nou i continua:34
Va saltar del llit i es va posar a fer la feina de
pressa. Quan va haver acabat va baixar a
buscar sobres i paper. Dani la va veure.35
+++++
Després de rentar els plats amb Anna van
pujar juntes a dalt. Quan ja feia una estona
que no sentia gens de soroll es va asseure al
llit i es va posar a escriure. Tenia el paper
damunt d'una capsa i l'ampolla de la tinta a la
tauleta de nit.36
+++++
No sabia escriure, és clar... Va tornar a
esquinçar el paper i va començar altra
vegada:37
Malauradament, aquesta mena d’afirmacions s’han hagut de fer sempre des d’un punt de vista
subjectiu –si més no, fins a la presentació de la tesi de Pere Gamisans–. S’han donat molts
exemples d’aquesta suposada senzillesa però no s’ha trobat la manera de fer una valoració
general i objectiva dels dos textos. És a dir, es diu que hi ha unes determinades paraules de la
primera versió que desapareixen a la segona però no es pot –o no s’ha pogut– fer un llistat
complet d’aquestes paraules ni es pot dir a partir de quins criteris s’afirma que un conjunt lèxic és
més senzill o més complex que un altre. De fet, quan donem exemples a favor d’una
determinada tesi, segur que en podríem donar de la contrària. Més enllà d’això, sobre quines
bases podem dir que una paraula és més senzilla que una altra? Com podem demostrar-ho?
Ho va intentar Pere Gamisans en la seva tesi doctoral i cal dir que, tenint en compte l’absència
de mitjans tecnològics en aquell moment, el resultat del seu treball és digne d’esment. La feina
que hi ha al darrere és immensa; el conjunt de dades que n’extreu, espectacular. A partir del
buidatge exhaustiu de bona part de la novel·la38 –de les dues versions de la novel·la, per ser
32 Rodoreda (1938), pàg. 91. 33 Rodoreda (1938), pàg. 92-93. 34 Rodoreda (1938), pàg. 95. 35 Rodoreda (1969), pàg. 57. 36 Rodoreda (1969), pàg. 58. 37 Rodoreda (1969), pàg. 59. 38 L’autor explica així les parts de la novel·la amb què treballa de manera exhaustiva: “Pour ce faire nous avons menè une étude comparative qui s'est volue exhastive sur plus de la moitié du texte: de la page 217 (‘De tant en tant
-
11
exactes–, Gamisans és capaç d’oferir-nos llistes de paraules que apareixen o desapareixen i
d’analitzar-les per demostrar el caràcter “courant” del llenguatge de la segona versió per oposició
al “non courant” de la primera. Aquests són, segons Gamisans, els canvis que Rodoreda aplica
en la reescriptura d’Aloma, des del punt de vista del lèxic:
1. La version de 1936 est marquée par le caractére synthétique et littéraire d'un certain nombre de ses termes, qui en 1968 sont substyitués par des associations syntaxiques de mots courants (analystisme).
2. La polysémie, la généralité caractérisent la deuxième version.
3. Des variantes dialectales et techniques y disparaissent.
4. Le castillan n'est plus un repoussoir dans la deuxième version.
5. Les termes disparus dans la deuxième version n'ont pas cours dans le discours oral.
6. Substitution de termes qui apparaissent dans des acceptions non courantes.
7. Disparition de nombreuses variantes littéraires.
8. Disparition des adverbes en "ment".
9. Forte réduction du lexique abstrait.
10. Substitution d'éléments lexicaux par des éléments formes.
11. La variété dans la dénomination fait place à la récurrence du même terme.
12. Régularité des substitutions.
13. Présence de quelques contre-exemples.39
És evident que, amb la tecnologia que tenim avui, aquesta mena d’anàlisi es pot fer de manera
molt més senzilla i, alhora, amb un major grau d’objectivitat i exhaustivitat. Francesc Vallverdú,
en el seu llibre L’escriptor català i el problema de la llengua, afirmava, referint-se al lèxic de
Mercè Rodoreda:
Lèxic: Remarquem pocs cultismes o mots no usuals en la llengua parlada; vorera, quadre,
furient, església, empènyer, cloure, etc. Rodoreda evita els arcaismes.
En contrast, tampoc no abusa dels mots secundaris corrents en la llengua parlada. Entre els més
remarcables hem trobat: buscar, quedar, rotllo, sortidor, etc.
ella es veu...’) à 234 de la version de 1936, et des pages 157 à 166 de la version de 1968 (obres completes) soit une partie du chapitre XIX et le chapitre XX en entier, et de la page 9 à 112 de la version de 1936 et 49 à 103 de la version de 1968, soit des chapitres I à IX inclus. Notre étude exhaustive concerne donc plus de 10 chapitres sur 20, 123 pages sur 234 (version de 1936), et 65 pages sur 118 (version de 1968). La plupart des phénomènes lexicaux, syntaxiques, morphologiques on été examinés sur cette éntendue, pour certains le pourcentage du texte scruté a été moindre, quan l'extension étudiée exhaustivement nous semblait suffisante à établir une caractéristique. Quant aux chapitres restants X à XVIII nous y avons relevé aussi de nombreux éléments qui n'ont pas de valeur statistique puisque l'étude, n'a pas été exhaustive, mais ils nous fournissent souvent des indications et des exemples intéressants, qui confirment généralement les tendances observées dans les chapitres I à IX et XIX et XX.” Gamisans (1988), pàg. 7. 39 Gamisans (1988), pàg. 33.
-
12
Són abundants els vulgarismes genuïns o ja assimilats per una llarga tradició: dematí (subs.),
pellingos, maco, resar, enrecordar, entornar-se’n, etc.
No són gaire abundants, en canvi, els vulgarismes no genuïns: cuidar-se (per tenir cura), direcció
(per adreça), atropellar (per aixafar), gastar (per despendre), puro, etc.40
Segurament, aquestes característiques del lèxic rodoredià són certes. Gràcies a la informàtica,
però, podem anar molt més enllà. Podem, per exemple, buscar aquests mots –referits tots a La
plaça del Diamant– en altres novel·les de la mateixa autora per mirar de detectar diferències en
la seva produció de diverses èpoques. Si busquem els exemples que Vallverdú esmenta com a
“cultismes o mots no usuals en la llengua parlada” en les dues versions d’Aloma, per centrar-nos
en un cas, trobem aquests resultats:
Mot Ocurrències
Aloma 1 Ocurrències
Aloma 2
església n. 5 4
quadre n. 1 0
vorera n. 6 2
furient adj. 0 0
cloure v. 9 0
empènyer v. 10 3 Taula 1
Segons aquest quadre, veiem que, a la primera versió d’Aloma, Rodoreda utilitza cinc dels sis
exemples que Vallverdú donava per a La plaça del Diamant. D’aquests cinc casos, dos
desapareixen a la segona versió; els altres tres casos veuen reduït el seu nombre d’aparicions.
En els dos mots que podríem considerar més cultes –‘empènyer’ i ‘cloure’–, veiem que la
disminució és molt important en el primer cas i total en el segon.41
Tot i que només es tracta d’un exemple, ja hi detectem clarament la tendència de Mercè
Rodoreda a anar reduint la presència de cultismes en les seves obres.
40 Vallverdú (1968), pàg. 153. 41 Anant una mica més enllà i revisant els textos, veiem com dos dels casos de ‘cloure’ –“cloure la boca” (al capítol IV) i “cloent el puny” (al capítol XIII)– són substituïts a la segona versió per “aguantar el malhumor” i “estrenyent el puny”. En els altres set casos –“cloure les parpelles”, “els ulls” (cinc cops) o “una etapa”–, Rodoreda canvia la redacció del paràgraf i el verb desapareix. Per exemple, al capítol XX, el paràgraf:
“Els carrers són quiets. D'una paret penja un roser sense roses. Enllà hi ha el brogit de la ciutat, de totes les ciutats del món on hi ha noies que es planten de cara a la vida sense que els calgui cloure els ulls: que no necessiten fer somnis.” Rodoreda (1938), pàg. 234.
és substituït per aquest: “Es va agafar fort les mans perquè no li tremolessin tant. Els carrers eren quiets. D'una paret penjava un roser sense roses. Lluny, hi havia la remor sorda de la ciutat; noies que plantaven cara a la vida, sense somnis.” Rodoreda (1969), pàg. 141.
-
13
Objectius
Hem parlat, a les pàgines precedents, de la gènesi de la segona versió d’Aloma, de les
possibilitats que la reescriptura de la novel·la ens ofereix per a l’estudi de l’evolució de la
narrativa rodorediana i d’alguns intents que s’han fet d’aproximació a l’anàlisi de la seva llengua
–i, més concretament, del seu lèxic–. Hem comentat, també, la insuficiència d’aquests estudis
sobre la llengua i la necessitat de fer-ne un de seriós i exhaustiu.
Ara mateix, en ple segle XXI, disposem de mitjans que ens permeten l’anàlisi de grans quantitats
de dades de manera ràpida i, encara millor, objectiva. Alhora, el desenvolupament de corpus
lingüístics –i dels treballs que se’n deriven– per a la llengua catalana, que permeten ser utilitzats
per a tota mena d’estudis, posa al nostre abast unes eines que no fa pas gaires anys eren
inimaginables.
I doncs, què pretenem, en aquestes pàgines?
Aquest treball vol ser una mena de conjunció dels tres ítems que acabem d’esmentar:
i. Aprofitament de l’existència d’una segona versió d’Aloma –escrita trenta anys més tard–
per a l’anàlisi de l’evolució de la llengua en la narrativa rodorediana.
ii. Necessitat de l’estudi de la llengua de Mercè Rodoreda: cal conèixer el model lingüístic
de cadascuna de les seves obres i cal veure’n l’evolució al llarg dels anys.
iii. Aprofitament de les possibilitats que ens aporten els mitjans computacionals, també per
a l’estudi de la llengua i la literatura.
Això no vol dir, en cap cas, que el que farem aquí sigui una anàlisi exhaustiva de la llengua de
les dues versions d’Aloma per tal de comparar-les. L’objectiu d’aquestes pàgines és molt menys
ambiciós. De fet, vist de manera estricta, aquest no és un treball sobre la llengua de Mercè
Rodoreda, en general, ni sobre la d’Aloma, en particular. O, potser, no és només això.
El que pretenem –basant-nos en l’exemple d’Aloma– és oferir als investigadors nous mitjans de
recerca que algun dia puguin donar resultats, aquests sí, més ambiciosos. Amb l’ajuda de la
informàtica i de les matemàtiques, oferirem una colla de dades sobre el lèxic i n’extraurem unes
primeres conclusions. I treballarem amb les dues versions d’Aloma perquè ens serviran per
demostrar de manera indiscutible la utilitat dels sistemes d’anàlisi que mostrarem.
Concretament, el contingut del treball és aquest:
-
14
Anàlisi de l’extensió dels textos, nombre de paraules i nombre de paraules diferents.
Anàlisi del grau de dificultat dels elements lèxics dels textos.
L’Índex de valoració del lèxic: un intent d’assignar un valor numèric exacte al conjunt del
lèxic d’un text a partir de la seva major o menor freqüència en la llengua corrent.
Tots tres punts seran treballats a partir de les dues versions d’Aloma. En un altre apartat, però,
treballarem aquestes mateixes dades per a un conjunt representatiu de les obres de Mercè
Rodoreda per veure’n l’evolució i en una obra de Salvador Espriu, que ens permetrà de fer una
primera comparació del lèxic de tots dos autors.
A més, tot i que, bàsicament, treballarem sobre el lèxic, en un apartat específic comentarem
alguns canvis sintàctics entre les dues versions d’Aloma.
Finalment, per tal de mostrar les possibilitats de l’aprofitament dels corpus lingüístics per a
l’anàlisi de la llengua literària, oferirem, en un annex, diversos llistats del lèxic de les dues
versions d’Aloma, que poden obrir la porta a estudis posteriors.
-
15
2. Obtenció i preparació de les dades
2.1. Els textos
2.1.1. Origen dels textos codificats
Per a l’elaboració d’aquest treball, necessitàvem disposar d’informació en format electrònic de
diversos textos. En alguns casos, hem pogut aprofitar els resultats de projectes anteriors; en
algun altre, hem hagut de preparar el text de manera expressa.
Concretament, els textos utilitzats en aquest treball són els següents:
Les dues versions d’Aloma:
Aloma (primera versió). Primera edició. Barcelona: Institució de les Lletres Catalanes,
1938.
Aloma (segona versió). Primera edició. El Balancí, 59. Barcelona: Edicions 62, juny de
1969.42
Altres obres de Mercè Rodoreda:
La plaça del Diamant. Primera edició. Club dels Novel·listes, 22. Barcelona: Club Editor,
març de 1962.
Mirall trencat. Primera edició. Club dels Novel·listes, 81. Barcelona: Club Editor,
desembre de 1974.
Quanta, quanta guerra... Primera edició. Club dels Novel·listes, 85. Barcelona: Club
Editor, desembre de 1980.
Obres d’altres autors:
SALVADOR ESPRIU: Les roques i el mar, el blau. Primera edició. El Cangur, 74. Barcelona:
Edicions 62, 1984.
Per a totes les obres, excepte la segona versió d’Aloma, hem pogut aprofitar la feina feta en el
marc del projecte de recerca del Corpus Textual Informatitzat de la Llengua Catalana (CTILC) de
42 Concretament, hem treballat amb la quaranta-dosena edició a la col·lecció El Cangur d’Edicions 62 (Barcelona, setembre de 1995).
-
16
l’Institut d’Estudis Catalans, durant la gestació del qual van ser digitalitzades i lematitzades.43 En
tots aquests casos, hem treballat amb els resultats de la lematització dels textos.44
Tenint en compte que el CTILC recull la primera versió d’Aloma però no pas la segona, aquesta
ha hagut de ser escanejada, sotmesa a un sistema de reconeixement òptic de caràcters,
revisada i lematitzada especialment per a aquest treball. Per tal de poder comparar els textos
amb les màximes garanties, això sí, tot el procés s’ha fet seguint els mateixos criteris utilitzats en
el marc dels treballs de constitució del corpus de l’IEC.
Pel que fa al cas concret de la lematització de la segona versió, tot i que els avenços tecnològics
i la recerca dels últims anys haurien permès realitzar el procés de manera gairebé automàtica, la
tasca s’ha fet manualment per tal de poder treballar de manera exhaustiva amb els criteris
seguits en els altres textos, lematitzats, com hem dit, com a part del projecte del CTILC.
2.1.2. Adaptacions
Per tal de simplificar les dades resultants de la lematització dels textos, hem reduït el sistema de
categorització gramatical utilitzat en el moment de la constitució del corpus de l’IEC.
Concretament, hem reduït les nou categories verbals, les set nominals i les nou adjectivals45 a
una de sola per a cada cas. Així, per exemple, en el cas dels verbs, hem ajuntat les dades
corresponents a ‘haver’ com a verb transitiu amb les de l’intransitiu i pronominal; pel que fa als
adjectius, podem esmentar el cas de ‘granat’, que pot ser de quatre terminacions (“Color vermell
fosc”) o de dues (“Que té el gra ben format”); en el cas dels noms, ‘artista’, que pot ser un mot de
gènere masculí o un de gènere femení, o ‘mar’, mot que accepta els dos gèneres . Amb aquesta
43 La lematització és el procés a partir del qual s’assigna un lema a cadascun dels mots que apareixen en un text. En paraules de Joaquim Rafel, "a través de la lematització, s'aconsegueixen, doncs, dos objectius particulars, que són, de fet, un conseqüència de l'altre: cada una de les ocurrències de cada mot gràfic (és a dir, cada una de les seves aparicions al llarg del text) és categoritzada gramaticalment i associada a una forma de referència anomenada lema (que es correspon aproximadament amb allò que podem considerar una entrada de diccionari) [...]. Així, per una banda es desambigüen gramaticalment les formes homògrafes, i per una altra s'agrupen sota un mateix lema els diferents components d'una mateixa sèrie inflectiva [...]". Vegeu Rafel (1994), pàg. 223. 44 Agraïm a l’Institut d’Estudis Catalans i al doctor Joaquim Rafel, director del CTILC, la cessió d’aquestes dades. 45 Categories verbals del CTILC: V (verb transitiu i intransitiu, o, simplement, verb, quan aquest no apareix al Diccionari de la llengua catalana de Pompeu Fabra ni al Diccionari de la llengua catalana d’Enciclopèdia Catalana), VA (infinitiu hipotètic de les formes usades en el perfet perifràstic), VI (verb intransitiu), VIA (verb intransitiu i auxiliar), VIP (verb intransitiu i pronominal), VP (verb pronominal), VT (verb transitiu), VTP (verb transitiu i pronominal) i VVP (verb transitiu, intransitiu i pronominal); categories nominals: M (nom masculí), MF (nom usat amb gènere masculí i amb gènere femení), MP (nom masculí plural), MS (nom masculí singular), F (nom femení), FP (nom femení plural) i FS (nom femení singular); categories adjectivals: A (adjectiu variable), AF (adjectiu usat només en femení), AI (adjectiu invariable pel que fa al gènere), AII (adjectiu invariable pel que fa al gènere i al nombre), AIP (adjectiu invariable pel que fa al gènere, usat només en plural), AM (adjectiu usat només en masculí), AMP (adjectiu usat només en masculí plural), AN (adjectiu numeral) i AP (adjectiu plural). Vegeu Rafel (1996), volum 1, pàg. XXXVI.
-
17
simplificació, s’ha passat de 72698 noms a 71868; de 44724 adjectius, a 44699; i de 12845
verbs, a 12773.
2.2. Dades sobre la freqüència dels mots en la llengua
Per a la valoració d’un text des del punt de vista de la major o menor especificitat dels mots que
en formen part, es fa imprescindible disposar de dades sobre la freqüència del conjunt de les
unitats lèxiques de la llengua en el seu ús real. Com afirma Joaquim Rafel, és obvi que no tots
els mots d’una llengua tenen la mateixa probabilitat d’aparèixer o no en un text; n’hi ha que els
trobem a tots –o gairebé tots– els textos i d’altres que s’utlitzen molt rarament:
L’anàlisi del vocabulari d’una llengua des del punt de vista de l’ús que se’n fa en la pràctica
comunicativa ens mostra que no tots els mots que podem trobar en un diccionari tenen la
mateixa probabilitat d’aparèixer en un text qualsevol: hi ha mots que se solen repetir d’una
manera més o mens reiterada i, en canvi, n’hi ha d’altres que apareixen més rarament; d’acord
amb això, podem pensar en una classificació de les unitats lèxiques basada en criteris
quantitatius, és a dir, en la major o menor possibilitat d’aparició de cada una d’aquestes unitats.46
L’any 1968, Josep Llobera, amb la pretensió de proporcionar una eina als ensenyants i als
aprenents de la llengua catalana, va publicar un volum –El català bàsic– en què proposava una
llista de les mil paraules més utilitzades en català (el que anomenava “Vocabulari bàsic de primer
grau”); sumant-n’hi mil més, formalitzava el seu “Vocabulari bàsic de segon grau”.47 Tot i que va
ser una tasca ingent i que el recull va ser molt útil en el seu moment, el fet d’haver de fer la
selecció dels mots a partir d’un corpus molt reduït no permet assegurar-ne la fiabilitat dels
resultats.48
46 Rafel (1996), volum 1, pàg. VIII. 47 Llobera explica així la iniciativa d’aquest treball: “El fet de conèixer l’existència del “Basic English” i del “Français fondamental”, unit a la nostra experiència personal d’estudis i d’ensenyament, ens va fer veure la necessitat urgentíssima d’obtenir per a la llengua catalana una eina de treball semblant a aquelles citades per a les llengües anglesa i francesa; una eina de treball tan senzilla que (portada a la seva aplicació pràctica) es pogués posar fins i tot a les mans dels qui comencen a estudiar la nostra parla (tant si es tracta de persones de llengua catalana que no la coneixen més que parlada, com si es tracta de no catalans que la volen aprendre).” Llobera (1968), pàg. 7. 48 La metodologia utilitzada en l’establiment del “Català bàsic”, segons Llobera, és aquesta:
“1. Recollir converses de viva veu a fi de poder determinar els mots més freqüents al llenguatge parlat. 2. A les paraules trobades a l’apartat anterior, afegir-hi les paraules ideològicament interessants (o sia,
segons l’expressió del ‘Français fondamental’, les paraules ‘disponibles’) per a poder expressar de manera ben simple les diverses idees que puguin sorgir en una conversa normal o en un escrit senzill.
(Amb aquests dos primers apartats ja tindríem el Vocabulari Bàsic de Primer Grau.) 3. Establir quines normes gramaticals són més senzilles, eliminant aquelles innecessàries. 4. Admetre algunes variants, tant de vocabulari com de gramàtica, a fi de donar entrada a mots i normes
molt usuals en alguns dialectes.
-
18
En el nostre treball, si tenim la pretensió de l’objectivitat, és importantíssim que les dades amb
què treballem s’hagin extret d’un corpus textual prou representatiu i que estiguin organitzades
adequadament.
Afortunadament, gràcies als avenços tecnològics de les últimes dècades, en el cas de la llengua
catalana disposem d’una eina que ens pot resultar molt útil a l’hora d’analitzar la major o menor
senzillesa del lèxic dels textos: es tracta del Diccionari de freqüències (d’ara endavant, DF),
basat en el Corpus Textual Informatitzat de la Llengua Catalana de l’Institut d’Estudis Catalans i
publicat pel mateix IEC entre els anys 1996 i 1998.49 En aquesta obra es recullen en diversos
llistats el conjunt de lemes resultants de la lematització del corpus compilat per l’IEC, amb
informacions diverses sobre la seva freqüència absoluta (nombre total de vegades que el mot
apareix al corpus), freqüència relativa (raó entre aquest valor i l’extensió del corpus), etc.50
No sembla massa agosarat pensar que els resultats obtinguts a partir de l’anàlisi d’un corpus de
més de 50 milions de paraules seran més fiables que els extrets d’un recull de dimensions molt
reduïdes. Com a mostra, els mots “guaitar v.”, “puny n.” i “calçar v.”, que Llobera inclou en el seu
“Vocabulari bàsic de primer grau” (els mil mots més utilitzats), segons la freqüència absoluta en
el CTILC se situarien en els llocs 1902, 2566 i 8040, respectivament. És per això que una eina
com el DF era imprescindible per a aquest treball.
Una de les informacions més interessants que ens ofereix el DF és el que s’hi anomena ús. Tot i
que no farem aquí una explicació exhaustiva del concepte ni del model matemàtic utilitzat per a
calcular-lo, sí que caldrà donar-ne una idea per tal de poder entendre el que significa i la utilitat
que tindrà per a la quëstió que volem analitzar.51
Si, com hem dit més amunt, entenem per freqüència absoluta el nombre total de vegades que un
mot apareix en el corpus, l’ús representa una modificació a la baixa d’aquesta freqüència segons
(Amb aquests quatre apartats ja tindríem el Català Bàsic de Primer Grau.) 5. Comprovar la bondat pràctica del Català Bàsic de Primer Grau obtingut. 6. Establir el Segon Grau de manera semblant al Primer, i com a continuació d’aquest.” Llobera (1968),
pàg. 9. 49 Per a l’explicació detallada de la gestació del Corpus, vegeu la Introducció de l’obra: Rafel (1996), volum 1, pàg. XXIX-XXXV. 50 “Entenem per FREQÜÈNCIA d’una unitat lèxica el nombre de vegades que apareix en un text, en un conjunt de textos qualssevol o en un corpus organitzat més o menys extens [...]. [...] dir que un mot té una freqüència igual a 250 té un valor diferent si l’extensió del text en què s’ha determinat és de 25.000 mots que si és de 250.000; en el primer cas, apareix una vegada cada 100 mots i en el segon, una vegada cada 1.000: el que és realment indicatiu, per tant, no és el que anomenem FREQÜÈNCIA ABSOLUTA (en aquest cas 250), sinó la raó entre aquest valor i l’extensió del text, que anomenem FREQÜÈNCIA RELATIVA (0,01 en el primer cas i 0,001 en el segon, o bé, en termes percentuals, l’1 % en el primer cas i el 0,1 en el segon)”. Rafel (1996), volum 1 pàg. VIII. 51 Trobareu tota la informació sobre aquest concepte a Rafel (1996), volum 1, pàg, XLV-XLIX.
-
19
el millor o pitjor repartiment de les seves ocurrències en els diferents gèneres –en el cas del
subcorpus literari– o en els diferents grups temàtics –en el cas del subcorpus no literari– en què
es divideix el corpus, tenint en compte, és clar, el diferent volum de cada gènere o cada grup en
el corpus. El resultat s’acostarà a la freqüència original si les ocurrències del mot es troben ben
repartides en els diferents grups que formen el corpus, i se n’allunyarà si estan agrupades en un
sol grup o en un conjunt reduït de grups.
Per adonar-nos de la importància del concepte i de les diferències que implica treballar amb un o
altre valor, bastarà veure l’exemple de dos lemes als quals, tot i que en el subcorpus no literari
tenen la mateixa freqüència absoluta (487), els correspon un ús força diferent:
conferir v. 416,29 atleta m. 192,88
Segons aquestes dades, veiem com el lema ‘conferir v.’ té un ús molt més alt i més proper a la
freqüència absoluta que el lema ‘atleta m.’. Això ens indica que les ocurrències del primer cas es
troben molt ben repartides entre els diferents grups temàtics en què s’organitza el subcorpus no
literari, mentre que les del segon apareixen majoritàriament en uns grups molt determinats.
Concretament, el repartiment és el que es pot veure a la taula 2, on es pot comprovar com les
ocurrències del lema ‘atleta m.’ es concentren, majoritàriament, en el grup “Arts, jocs i esport”.
Atès que en el CTILC el volum de mots varia molt d’un grup a l’altre, afegim a la taula una fila en
què veurem el nombre d’ocurrències que, proporcionalment segons el percentatge que cada
grup temàtic representa sobre el total del subcorpus no literari, aquests mots haurien de tenir.52
Filosofia Religió Ciències
socials Premsa
Ciències
pures i naturals
Ciències
aplicades
Arts,
jocs i esport
Llengua i
literatura
Història i
geografia Corresp.
Ocurrències esperables
29,22 49,6 93,01 59,9 37,01 74,51 46,75 37,01 58,44 2,43
conferir v. 40 83 130 24 19 59 43 27 62 0
atleta m. 15 34 5 50 8 48 302 14 11 0 Taula 2
Considerem, doncs, que per a aquest treball serà molt més interessant la utilització de les dades
de l’ús que les de la freqüència, ja que sembla clar que reflecteix molt millor el grau d’utilització
real del mot en la llengua. Tot i això, en algun punt, haurem de referir-nos, també, a la freqüència
absoluta.
52 En el cas de ‘conferir v.’, les diferències de freqüència tan grans entre els grups reflecteixen aquest diferent volum de mots de cadascun en el corpus. Concretament, el repartiment dels mots entre els diferents grups del corpus no literari és aquest: Filosofia, 6 % dels mots; Religió, 10,2 %; Ciències socials, 19,1 %; Premsa, 12,3 %; Ciències naturals, 7,6 %; Ciències aplicades, 15,3 %; Arts, jocs i esport, 9,6 %; llengua i literatura, 7,6 %; Història, 12 %; i Correspondència, 0,5 %.
-
20
De tota manera, abans d’entrar en matèria, haurem de fer, encara, alguna altra adaptació de les
dades del DF. D’entrada, val a dir que treballarem sempre amb la suma dels dos usos, el
corresponent al subcorpus literari i el que es refereix al subcorpus no literari. Tot i que el DF
presenta separades les dues dades, sembla que, sumant-les, podrem treballar amb una
informació més propera a l’ús general de la llengua, sense patir desviacions a causa de les
especificitats del lèxic utilitzat en els textos literaris o en els no literaris. A la taula 3 podem veure
alguns resultats d’aquesta operació.
Lema Ús (corpus literari) Ús (corpus no literari) Suma d’usos
despertar v. 62,52 62,03 124,55
graduable adj. 0,46 6,84 7,3
hàbilment adv. 47,04 85,99 133,03
hegemonia n. 68,45 266,44 334,89 Taula 3
En alguns casos, la gran diferència entre l’ús en el corpus literari i en el no literari justifica encara
més la necessitat de treballar amb la suma de les dues dades. Si no ho féssim així, els resultats
podrien ser molt diferents segons si treballéssim amb les dades d’un o altre subcorpus. En són
una bona mostra els lemes que apareixen a la taula 4.53
Lema Ús (corpus literari) Ús (corpus no literari)
ull n. 22387,72 5592,77
mirar v. 25165,27 4968,9
forma n. 3881,2 22476,12
sistema n. 518,1 9576,24
conjunt n. 529,58 6439,93 Taula 4
Fet això, ordenem la llista resultant de manera decreixent segons la suma d’usos i assignem un
número d’ordre a cada lema, començant pel 0.54 Aquest número d’ordre, que anomenarem
Rang, serà el valor que donarem a cadascun dels lemes. A la taula 5 podem veure els primers
lemes de la llista.
Lema Suma d’usos Rang
el ar. 4993290,50 0
de prep. 3157141,68 1
i conj. 1657865,85 2
ell pron. 1405726,89 3
a prep. 1187478,42 4 Taula 5
53 Per adonar-se de la magnitud d’aquestes diferències, cal tenir present que el nombre de paraules del subcorpus literari i el del no literari són molt similars; concretament, un 44 % de les paraules del CTILC pertanyen al subcorpus literari i un 56 %, al no literari. 54 Més endavant, veurem per què comencem pel 0 i no pas per l’1.
-
21
En el cas que hi hagi més d’un lema amb la mateixa suma d’usos, els assignarem el mateix
número d’ordre (i, per tant, el mateix Rang). En mostrem un exemple a la taula 6.
Lema Suma d’usos Rang
parador n.
65,17 14357 avingut adj.
constatat adj. Taula 6
El resultat és una taula de 136474 lemes repartits en un rang que va del 0 al 22604.
Un cop assignat un valor a cadascun dels lemes, els agruparem de manera que puguem saber
quants n’hi ha entre el rang 0 i el 500, quants entre el 501 i el 1000, quants en tre el 1001 i el
1500, etc. El repartiment és el que es mostra a la taula 7. Com podem comprovar, la majoria dels
lemes s’agrupen en els rangs més alts, que corresponen als usos més baixos en el corpus.55
Rang Lemes Rang Lemes
0-500 501 11501-12000 604
501-1000 500 12001-12500 629
1001-1500 501 12501-13000 650
1501-2000 505 13001-13500 669
2001-2500 502 13501-14000 679
2501-3000 511 14001-14500 748
3001-3500 506 14501-15000 736
3501-4000 508 15001-15500 732
4001-4500 513 15501-16000 792
4501-5000 514 16001-16500 854
5001-5500 513 16501-17000 972
5501-6000 513 17001-17500 1.019
6001-6500 518 17501-18000 1.040
6501-7000 521 18001-18500 1.147
7001-7500 530 18501-19000 1.307
7501-8000 523 19001-19500 1.476
8001-8500 542 19501-20000 1.767
8501-9000 565 20001-20500 2.028
9001-9500 553 20501-21000 2.777
9501-10000 567 21001-21500 4.038
10001-10500 582 21501-22000 7.121
10501-11000 603 22001-22500 25.861
11001-11500 577 22501-22604 66.660 Taula 7
55 Les dades que ens ofereix el DF ens mostren l’ús amb només dos decimals; és per això que hi ha una quantitat tan gran de lemes als quals hem hagut d’atribuir el mateix rang, especialment en els més alts. Vegeu, per exemple, com, en l’últim grup –el que recull els lemes situats entre els rangs 22501 i 22604–, n’hi ha 66660, gairebé la meitat del total. S’ha de tenir en compte que, dels 136474 lemes que conté el corpus, n’hi ha 46107 (un 33,78 %) que hi apareixen un sol cop.
-
22
Aquesta és la informació bàsica de referència que utilitzarem en els diversos sistemes de
valoració del lèxic del text que veurem en els apartats següents.
2.3. Eines desenvolupades
Hem vist, fins ara, l’origen de les dades amb què treballarem i les adaptacions que hi hem fet. De
tota manera, per poder enfrontar-nos a la comparació de dos textos com les dues versions
d'Aloma, ens caldrà disposar d’eines que ens facilitin la tasca. És cert que el sistema de
consultes al CTILC ens permet d’accedir als contextos de la primera versió d’Aloma a partir dels
criteris que ens calgui, però no podem fer el mateix amb els de la segona versió ni –per
descomptat– treballar amb tots dos alhora, l’un al costat de l’altre. És per això que hem
desenvolupat dues eines essencials a l’hora de fer un treball com el que pretenem: d’una banda,
l’alineació dels dos textos, que ens permetrà de fer-ne una lectura en paral·lel i localitzar les
equivalències entre les dues versions; i de l’altra, la creació d’un sistema informàtic de consultes
que ens faciliti l’acarament dels dos textos.
2.3.1. Alineació dels dos textos
Una manera ideal d’alinear dos textos seria fer-ho a nivell de paràgraf: és a dir, una operació tan
senzilla com numerar-los i dir que el paràgraf 1 de la primera versió correspon al paràgraf 1 de la
segona; el 2, al 2; i així successivament. La realitat, però, és molt més complexa i, molt sovint, un
paràgraf de la primera versió no es correspon exactament amb un altre de la segona, sinó que la
mateixa informació la trobem distribuïda en diversos paràgrafs contigus. També es produeix el
cas invers, és clar.
Per exemple, si ens fixem en el començament del capítol I, podem veure com els dos primers
paràgrafs poden alinear-se perfectament: els paràgrafs 1 i 2 de la primera versió es corresponen
exactament amb els paràgrafs 1 i 2 de la segona:
Paràgraf
Text Aloma 1
Paràgraf
Text Aloma 2
1 L'amor em fa fàstic! 1 -L'amor em fa fàstic!
2 Va dir-s'ho pensant en aquell pobre gat i tancà el reixat d'una revolada: aquest féu un gran soroll de frontisses rovellades. Al capdamunt, en un adornament de ferros cargolats, amb la pintura escrostonada i el rovell menjant-se'ls, hi havia una data: 1886.
2 Havia pensat tota la tarda en aquell pobre gat i, sense voler, va tancar el reixat d'una revolada. A dalt de tot, entre rodones i cargols de ferro despintat, mig decantada i coberta de rovell, es veia una data: 1886. Havien comprat el reixat feia uns quants
-
23
Aquesta no ens aclareix pas la de construcció de la casa, car el reixat havia estat adquirit en l'enderroc d'una finca expropiada per eixampla. Havia estat un esdeveniment l'adquisició, sobretot perquè, amb poca despesa, la torre, que no tenia torratxa com era costum en qualsevol que volgués lluir una mica, adquiria un aire més senyor. I el jardí també: fins llavors havia calgut entrar-hi per una porta menuda que obligava a ajupir-se en passar-la si, qui ho feia, no volia ésser rebatut enfora. Depenia de l'embranzida, és clar.56
anys, a preu de ferro vell, en l'enderroc d'una finca expropiada per eixampla. La casa de seguida va semblar més senyora. I el jardí. Abans tenia una porteta de fusta i si el qui hi entrava era massa alt s'havia d'ajupir una mica.57
La continuació del text, en canvi, ja no permet aquesta alineació: el paràgraf 3 de la segona
versió recull tota la informació dels paràgrafs 3 i 4 de la primera.
Paràgraf
Text Aloma 1
Paràgraf
Text Aloma 2
3
4
El reixat ample va deixar passar més aire i els arbres van adonar-se'n. El taronger, amb les taronges agres com fel, però ben florit quan n'era temps, tenia les fulles més verdes; els rosers, els brots més ferms. Llàstima que el carrer era un cul de sac i pocs foren els qui hagueren esment de la important millora. Malgrat això la remor sorda dels diumenges entrava per l'esvoranc i s'arraulia al jardí, vora el respir de les plantes.58
3 El reixat, més ample, va deixar passar més aire i els arbres va semblar que se n'adonessin. El taronger, amb les taronges agres com fel, tenia les fulles més verdes. Els rosers feien més roses. Era una pena que per aquell carrer no hi passés mai ningú. Acabava dos jardins més enllà amb una paret alta, el vent a penes movia les herbes que naixien ran de les pedres i hi havia una gran quietud com si cada dia fos diumenge.59
Per tal de solucionar aquest problema, el model que s’ha seguit és la divisió de tot el text en
grups de paràgrafs seguint aquests criteris:
Cada grup ha de contenir el mínim nombre de paràgrafs possible.
No ha de quedar cap paràgraf d’una versió sense estar assignat a un grup.
Si un paràgraf afegeix una informació inexistent a l’altra versió, cal incloure’l en el grup
del paràgraf anterior.
Com a mostra d’aquest últim criteri, podem veure aquest fragment del capítol II, en què la
segona versió elimina dues intervencions en un diàleg:
56 Rodoreda (1938), pàg. 9. 57 Rodoreda (1969), pàg. 7. 58 Rodoreda (1938), pàg. 10. 59 Rodoreda (1969), pàg. 7.
-
24
Grup Paràgraf
Text Aloma 1
Paràgraf
Text Aloma 2
22
32
-Què és goleta?
22
-Què és una goleta?
23
33
34
35
-Una nau de molta valentia. -I nau? -Vaixell.
23
-Una barca de molta valentia.
24 36 -Per què els pirates van en vaixell?60 24 -Per què van en barca els pirates?61
Tot i que la casuística és molt diversa, tots els casos s’han pogut solucionar seguint els criteris
establerts.
Com a resultat de l’aplicació d’aquests criteris, el primer capítol –per posar un exemple– s’ha
dividit en 69 grups de paràgrafs, que recullen els 127 de la primera versió i els 78 de la segona.
Per tal de facilitar les consultes posteriors, tota aquesta informació s’ha registrat en una base de
dades. Els primers registres –entre els quals s’inclouen els fragments del capítol I que hem vist–
quedarien codificats d’aquesta manera:
Capítol Grup Versió 1 Versió 2
1 1 1 1
1 2 2 2
1 3 3 3
1 4 5 4
1 5 7 7
1 6 8 8
En aquesta taula informatitzada, cada registre representa un grup de paràgrafs. Les columnes
“Versió 1” i “Versió 2” es refereixen al número del paràgraf en què comença el grup a cadascuna
de les dues versions.
2.3.2. Creació d’un sistema de consultes
La segona eina que hem desenvolupat és un sistema informàtic que, a partir de l’alineació que
hem explicat breument en el punt anterior i d’un algorisme de reconstrucció del text,62 ens permet
60 Rodoreda (1938), pàg. 35. 61 Rodoreda (1969), pàg. 22. 62 S’ha de tenir en compte que el text no es guarda com a tal en el suport informàtic sinó en una base de dades en què cada registre emmagatzema la informació referent a una localització (versió, capítol, número de paràgraf i posició del mot dins el paràgraf), juntament amb les dades de caràcter lèxic (forma gràfica, lema i categoria gramatical), contextual (signes de puntuació que estan en contacte amb el mot) o de caràcter gràfic (característiques tipogràfiques).
-
25
d'accedir a tots els contextos de qualsevol mot i, des d'allà, veure els que corresponen a l'altra
versió.63 Tot i que tant l’arquitectura com el disseny del sistema són originals, s’ha seguit
l’exemple de diversos sistemes de consulta de corpus lingüístics actualment en func ionament,
entre els quals hi ha, òbviament, el CTILC.
El funcionament és molt simple. Partim de la selecció del llistat de lemes que volem consultar.64
Per a cada versió, podem seleccionar aquests llistats:
Tots els lemes (ordenació alfabètica)
Tots els lemes (ordenació per freqüència)
Noms propis (ordenació alfabètica)
Noms propis (ordenació per freqüència)
Noms propis (ordenació alfabètica acompanyada de les localitzacions)
Noms propis exclusius (ordenació alfabètica)
Noms propis exclusius (ordenació per freqüència)
Noms (ordenació alfabètica)
Noms (ordenació per freqüència)
Noms (ordenació alfabètica acompanyada de les localitzacions)
Noms exclusius (ordenació alfabètica)
Noms exclusius (ordenació per freqüència)
Adjectius (ordenació alfabètica)
Adjectius (ordenació per freqüència)
Adjectius (ordenació alfabètica acompanyada de les localitzacions)
Adjectius exclusius (ordenació alfabètica)
Adjectius exclusius (ordenació per freqüència)
Verbs (ordenació alfabètica)
Verbs (ordenació per freqüència)
Verbs (ordenació alfabètica acompanyada de les localitzacions)
Verbs exclusius (ordenació alfabètica)
Verbs exclusius (ordenació per freqüència)
Adverbis (ordenació alfabètica)
Adverbis (ordenació per freqüència)
Adverbis (ordenació alfabètica acompanyada de les localitzacions)
Adverbis exclusius (ordenació alfabètica)
Adverbis exclusius (ordenació per freqüència)
A més, en el cas del lèxic compartit entre les dues versions, podem seleccionar aquests llistats:
63 Es tracta d’un conjunt de pàgines ASP (Active Server Pages) amb consultes SQL (Structured Query Language) que interroguen una base de dades MS Acces. 64 Tot i que no es poden considerar lemes, hem inclòs en el sistema la possibilitat de fer consultes per als noms propis.
-
26
Noms propis (ordenació alfabètica)
Noms propis (ordenació alfabètica acompanyada de les localitzacions)
Noms (ordenació alfabètica)
Noms (ordenació alfabètica acompanyada de les localitzacions)
Adjectius (ordenació alfabètica)
Adjectius (ordenació alfabètica acompanyada de les localitzacions)
Verbs (ordenació alfabètica)
Verbs (ordenació alfabètica acompanyada de les localitzacions)
Adverbis (ordenació alfabètica)
Adverbis (ordenació alfabètica acompanyada de les localitzacions)
El resultat és sempre un llistat de lemes (o de noms propis, si s’escau). La imatge 1 és la captura
de pantalla d’una d’aquestes possibilitats de consulta. Com es pot veure, al costat de cada lema
hi apareix la informació sobre el nombre de vegades que apareix a l’obra.
Imatge 1
A partir de la selecció d’un dels lemes, el sistema ens en construeix el llistat de concordances, és
a dir, per a cada ocurrència del lema, ens mostra una línia de context amb la paraula clau enmig
(imatge 2).
-
27
Imatge 2
Des d’aquesta pantalla,65 un clic del ratolí a qualsevol dels contextos ens portarà a la fitxa de la
localització, on consta tota la informació sobre l’ocurrència seleccionada, a més d’un context
format per la paraula clau, vint paraules al davant i vint al darrere (imatge 3). Aquesta mateixa
fitxa la podem veure, també, amb el paràgraf en què apareix la paraula clau sencer (imatge 4).
Imatge 3
65 Els contextos mostrats corresponen a Rodoreda (1938), pàg. 32, 41, 53, 114, 121, 155, 166, 215, 216, 233.
-
28
Imatge 4
Des de qualsevol d’aquestes dues fitxes, finalment, hi ha la possibilitat de veure el fragment
equivalent de l’altra versió. El que ens mostra el sistema és, concretament, el grup de paràgrafs
a què pertany el mot seleccionat, segons el que hem comentat en el punt anterior (imatge 5).66
Imatge 5
És evident que disposar d’aquestes dues eines facilita molt la feina i permet analitzar en
profunditat tots els canvis entre les dues versions. Més enllà d’aquest treball, el sistema podria
ser útil per a qualsevol estudi que es faci en aquesta direcció.
66 Rodoreda (1938), pàg. 53; i Rodoreda (1969), pàg. 35.
-
29
3. Les dues versions d’Aloma, en xifres. Cap a la simplicitat
3.1. Dades generals
Des del punt de vista numèric, la dada més evident que se’ns mostra quan ens enfrontem a la
comparació de les dues versions d’Aloma és la reducció, la disminució del nombre de paraules
utilitzades; Rodoreda s’adona que pot dir el mateix simplificant el text d’una manera important.
No només això: pot dir el mateix i, des del punt de vista de la qualitat literària, pot dir-ho millor
(ara per ara, aquesta és una afirmació que no discuteix ningú). Ho explica ella mateixa en el
“Pròleg” a Mirall trencat:
Escriure bé costa. Per escriure bé entenc dir amb la màxima simplicitat les coses essencials.
Donar relleu a cada paraula; les més anodines poden brillar encegadores si les col·loques en un
lloc adequat.67
A la gràfica 1, podem veure com les 51987 ocurrències68 de la primera versió passen a ser
41807 a la segona, un 19,5798 % menys; les ocurrències lematitzades69 passen de 51089 a
67 Rodoreda (1974), pàg. 14. 68 Entenem per ocurrència qualsevol cadena de caràcters, generalment delimitada per un espai en blanc, un apòstrof, un guionet o un signe de puntuació. 69 No són susceptibles de ser lematitzades (si més no, en el sistema utilitzat en el CTILC i en aquest treball) les ocurrències que representen xifres representades amb caràcters numèrics, noms propis, citacions d'altres obres, noms de diaris o revistes, mots en una llengua estrangera o qualsevol altra cadena de caràcters a la qual no es pugui assignar un lema. A la primera versió d'Aloma, aquesta restricció afecta 898 ocurrències (un 1,72 % del total); a la segona, tot i ser més breu, 1174 (un 2,80 %).
51987 51089
41808 40634
0
10000
20000
30000
40000
50000
60000
Ocurrències (incr.: -19,5798 %) Ocurrències lematitzades (incr.: -20,4642 %)
GRÀFICA 1. Nombre d'ocurrències
Aloma 1
Aloma 2
-
30
40633, amb una disminució gairebé idèntica a la de la dada anterior, com era esperable, un
20,4662 %.
L’evidència d’aquesta dada no li treu rellevància; al contrari, ens indica una primera intenció de
Rodoreda a l’hora de reescriure Aloma. Són diversos els autors que han fet referència a aquest
canvi en la segona versió de la novel·la. L’any 1992, M. Carme Bernal i C. Rubio ho comentaven
amb aquestes paraules:
Per altra part, els diàlegs són molt més reduïts en l’edició revisada, s’han eliminat frases
supèrflues i, en canvi, es guanya en densitat narrativa. [...] Sovint, un paràgraf llarg de la primera
edició és substituït en l’edició revisada per una sola frase engalzada en el context descriptiu.70
Efectivament, si ens mirem els dos textos, veurem com, molt sovint, un fragment de text és
substituït per un altre de significat similar –o idèntic– però molt més breu. Es tracta, en paraules
de Carme Arnau, d’eliminar “tot el que faci massa ‘olor’ de literatura”.71 Vegem-ne, per exemple,
aquest cas (capítol IV):
Aloma 1 Aloma 2
És quan Anna treu la plàtera de pastissos i
les ampolles de vi bo que tots s'apropen a la
taula i el nen esbatana els ulls, llaminers de
tot el que veuen.72
-Per què no vas a buscar els pastissos? -va
dir Joan.73
O aquest altre (capítol XVIII):
Aloma 1 Aloma 2
Però sorgeix bruscament el retrat d'aquella
dona, i tot mor. Per a prendre vida. El
problema es dreça viu. Ha passat sempre
titubejant i allò que cal són resolucions.
El pensament crida fort. Cal trobar camins.
Anar amb el corrent i, si cau, aixecar-se.
Acceptar el dolor sense témer-lo. És
necessari d'acumular molta valentia per a les
hores que vindran. El fill clourà una etapa de
Va veure aquell retrat com si encara
l'estigués mirant. "Té els ulls bonics -havia dit
Anna- però no és gaire maca." Hauria de ser
molt valenta. Ja començava a semblar-li que
tenia el fill al costat. Li hauria d'ensenyar de
mica en mica com era la vida. Perquè s'hi
avesés. Podria aprofitar la robeta de Dani;
gairebé era nova.75
70 Bernal (1992), pàg. 345. 71 Arnau (1979), pàg. 201. 72 Rodoreda (1938), pàg. 59-60. 73 Rodoreda (1969), pàg. 39. 75 Rodoreda (1969), pàg. 127.
-
31
la seva vida. Començarà sense temors i
sense dubtes. Ara sí que de debò no serà
una noia i troba nicis els anys viscuts
somniant. El fill, que tot just pren vida,
l'encara amb la realitat i potser li ensenyarà
d'estimar-la. Es farà gran i ella li haurà
explicat talment les coses de la vida, que ell
no la temerà. Sense mentides, tal com és.
Crua i nua. Amb tota l'aspror, però també
amb tot el goig, que bé deu haver-n'hi.
Fa projectes per a quan el fill serà gran.
Podrà aprofitar, quan neixi, la robeta de Dani.
És gairebé nova.74
Tot i que també podríem trobar paràgrafs amb el fenomen contrari, aquesta simplificació és la
norma general quan ens enfrontem a les dues versions de manera paral·lela. L’any 1979, Carme
Arnau insinuava ja les raons i els objectius d’aquest canvi quan afirmava que “A grans trets la
segona versió, menys retòrica, és més condensada que no pas la primera. Demostra així el
treball i l’esforç que costa d’arribar a la senzillesa i al despullament, els quals s’assoleixen, tan
sols, amb els anys, amb la plenitud creadora.”76
Si ens endinsem més en les dades, veiem que, a la segona versió, també es redueix el nombre
de lemes utilitzats (gràfica 2): passem de 4319 a 2479, un 42,6024 % menys. Si tenim en compte
que, en el cas de les ocurrències i de les ocurrències lematitzades, la disminució era d’un
19,5818 % i d’un 20,4662 %, respectivament, aquesta dada no deixa de ser transcendent i ens
mostra la voluntat –i potser, també, la capacitat– de l’autora de dir el mateix amb un conjunt lèxic
molt menor.
74 Rodoreda (1969), pàg. 206-207. 76 Arnau (1979), pàg. 200.
-
32
De tota manera, com que el nombre de lemes utilitzats pot estar molt condicionat per l’extensió
de l’obra, val la pena veure quantes vegades s’utilitza, de mitjana, cadascun d’aquests lemes
(gràfica 3).
Es tracta d’una diferència molt significativa entre les dues versions de la novel·la. Algunes raons
que podrien explicar aquest ús més freqüent de cada mot poden ser la utilització, a la segona
versió, d’elements perifràstics per substituir-ne de lèxics, la reducció dels casos de sinonímia i la
4319
2478
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
Lemes (increment: -42,6256 %)
GRÀFICA 2. Nombre de lemes
Aloma 1
Aloma 2
11,8288
16,3979
0
2
4
6
8
10
12
14
16
18
Ocurrències per lema (increment: 27,8326 %)
GRÀFICA 3. Mitjana d'ocurrències per lema
Aloma 1
Aloma 2
-
33
preferència de l’autora pels mots polisèmics. Pere Gamisans, en la seva tesi doctoral, esmenta,
per exemple, casos de substitució per elements perifràstics com aquests, en adjectius:77
“pantalons exigus” “pantalons tan petits” (capítol XIII)
“llavis ensangonats” “llavis bruts de sang” (capítol XVI)
“esguard encuriosit” “ulls plens de curiositat” (capítol XIX)
O aquests, en verbs:78
“encaixar amb Robert”79 “allargar la mà a Robert” (capítol IV)
“qui no peca” “els qui no feien cap pecat” (capítol XII)
Certament, en tots aquests exemples, Rodoreda substitueix un lema que només utilitzava en
aquests casos per una expressió perifràstica formada per lemes de freqüència generalment molt
alta. A la taula 8, podem veure els detalls de la freqüència, a les dues versions de la novel·la,
dels lemes substituïts i dels que els substitueixen.
Lema a Aloma 1 Freqüència a
Aloma 1 Freqüència a
Aloma 2 Lema a Aloma 2
Freqüència a Aloma 1
Freqüència a Aloma 2
exigu adj. 1 0 petit adj. 6 2
ensangonat adj. 1 0 brut adj. 9 11
sang n. 14 12
encuriosit adj. 1 0 ple adj. 47 38
curiositat n. 4 2
encaixar v. 2 0
allargar v. 5 3
donar v. 61 70
mà n. 132 98
pecar v. 1 0 fer v. 593 496
pecat n. 1 1 Taula 8
Cap dels lemes substituïts en aquests contextos esmentats per Gamisans no apareix a la segona
versió; els lemes que formen part de les expressions perifràstiques que els substitueixen, en
canvi, hi són molt freqüents (excepte el cas del substantiu 'mà', que hi apareix un sol cop).
Pel que fa a la polisèmia, Gamisans fa aquesta observació:
Le lexique de la deuxième version se caractérise par une plus grande polysémie. Le terme
substitut est plus polysémique (POL), soit qu’il puisse être employé avec le même sens dans un
77 Gamisans (1988), pàg. 36. 78 Gamisans (1988), pàg. 58. 79 En el mateix capítol IV, hi ha un altre cas d’”encaixar amb Robert”, substituït per “donar la mà a Robert”.
-
34
plus grand nombre de contextes, ce que nous pouvons appeler polysémie contextuelle, soit qu’il
ait plus de sens que celui qu’il substitue (polysémie inhérente).80
Hem vist, fins ara, diferències numèriques entre diversos conceptes (nombre d’ocurrències,
d’ocurrències lematitzades, de lemes i d’ocurrències per lema). Serà interessant, ara, de veure
de manera gràfica i conjunta quines diferències hi ha entre els increments en la segona versió
respecte a la primera, en cadascun d’aquests conceptes (gràfica 4).
Podem comprovar que, mentre que els tres primers paràmetres (ocurrències, ocurrències
lematitzades i nombre de lemes) disminueixen de manera molt significativa en la segona versió,
l’últim (ocurrències per lema) hi és clarament superior.
A la gràfica 5 podem veure la mitjana d’ocurrències per lema tenint en compte, exclusivament,
els lemes de les categories que tenen més pes en la narració (noms, adjectius, verbs i adverbis) i
desestimant, per tant, les categories menors (és evident que la presència d’articles, preposicions,
conjuncions o pronoms –generalment de freqüència molt alta– en els càlculs altera de manera
significativa la mitjana resultant).81 En tots els casos, la mitjana és superior en la segona versió
que en la primera, molt especialment pel que fa als verbs i els adverbis (si, en el cas dels noms i
els adjectius, l’increment és d’un 21,67 % i un 18,72 %, respectivament, el dels verbs és d’un
71,32 % i el dels adverbis, d’un 86,36 %).
80 Gamisans (1988), pàg. 65. 81 A la primera versió, per exemple, en què la mitjana és de 27,8336 ocurrències per lema, l’article el hi apareix 3885 cops; la preposició de, 2417 cops; la conjunció que, 1068 cops; i el pronom que, 772 cops. A la segona, els mateixos lemes hi tenen 3001, 1871, 788 i 495 ocurrències.
-20,4642 -19,5798
-42,6256
27,8326
-50
-40
-30
-20
-10
0
10
20
30
40
GRÀFICA 4. Percentatges d'increment entre les dues versions
Ocurrències
Ocurrències lematitzades
Lemes
Ocurrències per lema
-
35
En el mateix sentit que comentàvem, és cert que, en alguns casos, la presència de mots de
freqüència necessàriament molt alta pot pervertir-ne el resultat. És per això que, a la gràfica 6,
modifiquem les columnes dels verbs i dels adverbis. En el primer cas, eliminem dels càlculs els
verbs ‘haver’ (que apareix 1264 cops a la primera versió i 1184 a la segona), ‘ésser’ (amb 1113
aparicions a la primera i 551 a la segona), ‘anar’ (505 a la primera i 2167 a la segona)82 i ‘estar’
(133 a la primera i 314 a la segona); en el segon, l’adverbi ‘no’, el més utilitzat, amb diferència, a
qualsevol obra i, per descomptat, a les dues versions d’Aloma (1310 aparicions a la primera
versió i 875 a la segona). Fent-ho així, l’increment serà d’un 44,76 % en els verbs i d’un 87,54 %
en els adverbis.
82 En aquest cas, l’augment tan alt en la segona versió es deu al canvi del temps en la narració. Si la primera versió és narrada en present i la segona en passat, és obvi que en aquesta darrera s’hi ha d’incrementar de manera molt important l’ús del perfet perifràstic i, per tant, del verb ‘anar’, que inclou entre les seves formes les auxiliars d’aquest temps verbal. Ho comenten, per exemple, M. Carme Bernal i C. Rubio: “Pel que fa al llenguatge, el narrador passa d’una veu narrativa en present a la utilització de la forma del perfet perifràstic de manera que el narrador deixa d’estar present contínuament dins la història i desapareix del mig.” Bernal (1992), pàg. 346.
4,43 4,38
11,96
17,68
7,035,39 5,2
20,49
32,95
9,94
0
5
10
15
20
25
30
35
Noms Adjectius Verbs Adverbis Suma
GRÀFICA 5. Mitjana d'ocurrències per lema segons la categoria
Aloma1
Aloma 2
-
36
3.2. Mots que apareixen un sol cop a cada versió
Una