N. 6 – 2007 –
Memorie//Scienza-giuridica
Università della Valle d’Aosta
Université de la Vallée d’Aoste
Il database delle 168 Novelle e la
nuova edizione di BIA*
Sommario: 1. Premessa.
– 2. Il materiale di
partenza. – 3. Il
database delle novelle greche prodotto dall’ILC-CNR: problemi e soluzioni
adottate. – 4. Le
fasi del lavoro di conversione e messa a punto del nuovo database. – 5.
L’inserimento
delle novelle latine e l’ulteriore revisione del prodotto. – 6. L’ultima fase del lavoro.
Al momento di redigere il programma di ricerca per il bando PRIN 2004, la
scelta dell’argomento («L’esperienza
giuridica giustinianea dopo
Grazie alla collaborazione, sfociata in una convenzione ad hoc, tra il gruppo PRIN guidato dal
Prof. Francesco Sitzia e il gruppo di ricerca BIA del CNR, coordinato dal Prof.
Nicola Palazzolo, è stato possibile procedere alla realizzazione di una
base di dati contenente il testo delle 168 Novelle indicizzato ed organizzato
secondo i criteri che caratterizzano quello strumento di ricerca, ormai
quotidiano, che è BIA e, al tempo stesso, procedere
all’elaborazione di una versione digitale utile ai fini del PRIN. Il
risultato sarebbe stato un prodotto in grado di soddisfare due esigenze in una
volta sola: l’implementazione significativa di BIA2000 cdrom con
l’unica parte del cd. Corpus Iuris
Civilis ancora non consultabile dai suoi utenti (le novelle in lingua greca
e latina) e la produzione di un supporto informatico organizzato in modo tale
da evidenziare, per la prima volta le corrispondenze tra i luoghi delle Novelle
e le epitomi di Teodoro e Atanasio, che sono state digitalizzate presso
Per procedere nella direzione individuata, il gruppo BIA del CNR ha messo a
disposizione del gruppo PRIN il testo digitale delle Novellae giustinianee greche e delle Appendices I e II, redatto dall’Istituto di
Linguistica Computazionale (ILC-CNR)[1],
affinché gli stessi fossero convertiti in un formato compatibile con gli
usuali editor testuali moderni e con le specifiche di BIA (Bibliotheca Iuris Antiqui).
Il testo «base» era stato redatto grazie al lavoro di un gruppo
di studiosi, guidati dalla professoressa Bartoletti Colombo, per essere poi
utilizzato per realizzare il Vocabularium,
relativo alla pars Graeca, delle Novellae Iustinianeae, pubblicato, a partire dal 1984 e fino al
1989, per i tipi della casa editrice Goliardica di Milano, moderatore il Prof.
G.G. Archi. Com’è facile intuire, il materiale, pur
abbondantissimo, non comprendeva il testo delle novelle in lingua latina.
Come si evince dalla prefazione del Vocabularium
stessa, il gruppo coordinato dalla Bartoletti Colombo aveva lavorato sulla IV editio minor dell’opera di
ricostruzione compiuta da Schoell e Kroll, all’incirca dieci anni prima
della effettiva pubblicazione della pars
Graeca[2]
del Vocabularium, partendo dalla
completa traslitterazione in caratteri latini dell’originale greco. Le
ragioni per cui proprio quell’edizione venne preferita emergono con
particolare evidenza dalle parole della stessa Bartoletti Colombo: «il
testo assunto come base per lo spoglio è dunque quello
dell’edizione Schoell-Kroll, di cui è stata preferita la ristampa
del 1912, che è apparsa la più curata dal punto di vista
tipografico, quasi immune da errori»[3].
Per quanto attiene alla scelta della traslitterazione, essa fu semplicemente
resa obbligata dalla limitata disponibilità di caratteri codificati nei
primi anni ’70[4]
e dalla necessità di servirsi di macchine per la predisposizione di
schede forate in grado di lavorare solo con caratteri latini.
All’atto di riprendere quello che fu un monumentale lavoro risalente
ormai a oltre trent’anni, poiché la finalità era anche
quella dell’implementazione di BIA, è stata adottata una scelta
destinata a influenzare in modo significativo il lavoro successivo. Dal
momento, infatti, che BIA2000 si basa, per quanto attiene al testo del Digesto
e del Codex, su di una versione
indicizzata della XII editio minor
(1954, praefatio Kunkel, in
realtà un’anastatica della V editio
minor) dei volumi curati da Mommsen e Krüger, cui si aggiungono i
testi indicizzati delle altre fonti giuridiche, derivati da un lavoro svolto
presso l’università di Linz, al fine di garantire, in prospettiva,
un risultato finale che offrisse la versione digitale il più possibile
fedele ad un’unica edizione cartacea, la scelta è stata quella di
procedere, in fase di revisione, all’«adeguamento» del database
alla V editio minor delle Novellae di Schoell e Kroll.
Il file originale (FILEST.NVG) del testo elettronico delle Novellae giustinianee greche era stato
redatto dall’Istituto di Linguistica Computazionale del CNR (ILC-CNR)
negli anni ’70 del secolo scorso, in un formato testuale di tipo DOS, con
un linguaggio di marcatura non standardizzato[5]
e quindi fruibile esclusivamente tramite un applicativo informatico dedicato
(in grado cioè di attribuire alle singole sequenze di bit il
corrispondente carattere greco corretto), ormai obsoleto per i moderni sistemi
operativi. In pratica, un software era stato elaborato esclusivamente al fine
di creare e gestire quel database: una scelta del tutto logica se si pensa alle
capacità supporti di archiviazione disponibili all’epoca (i floppy
disk da
Il software messo a punto negli anni settanta, era ovviamente già
realizzato per computer funzionanti grazie ad un «Disc Operating
System», ma non poteva risultare compatibile non solo con i computer
attuali, che vengono usati mediante un’interfaccia grafica con
l’utente (User Graphical Interface), ma nemmeno con i modelli prodotti a
partire dagli anni ’80 e funzionanti grazie a sistemi operativi «di
massa», come MS-DOS[8]
o le sue principali alternative del tempo: OS/2 (prodotto dalla IBM), AmigaDOS
(prodotto dalla Commodore) e MAC OS (prodotto dalla Apple).
Come già anticipato, tuttavia, il problema più rilevante, per
l’impiego ai fini della presente ricerca del database realizzato presso
il centro di linguistica computazionale del CNR, era la mancata
standardizzazione del linguaggio utilizzato.
Per rendersi conto di che cosa significa che il testo greco originario era
stato reso con una codifica non standard e per comprendere appieno le
difficoltà che apparivano evidenti, sin dall’inizio del lavoro di
recupero del pur imponente database degli anni ’70, è sufficiente
un esempio. Basta prendere un frammento prelevato dall’originale,
visualizzato con gli attuali editor di testo e constatare come si presenti in
modo a dir poco confuso:
%NVG, 001 , RUBR.
$0001$ }<Per_ tw^n klhron¢mwn ka_
to–
Falkid¡ou.
% NVG, 001 ,
INSCR.
Au6tokr twr
I6oustinian•s Au6Ùgoustos I6w nnhj tw^j e6ndocot twj
e6p rxwj tw^n
iùerw^n th^s EùÙw PRAETORIwn t• #B'@,
a6p•
uùp twn ka_ patrik¡wj.&|
...
Dopo aver convertito il testo originariamente composto con caratteri
occidentali ASCII in testo MS-DOS, esso assumeva un formato appena più
intelligibile:
%NVG, 001 , RUBR.
$0001$ }<Perì
tw^n klhronómwn kaì
toû
Falkidíou.
% NVG, 001 , INSCR.
Au6tokrátwr
I6oustinianòs Au6+goustos I6wánnhj tw^j e6ndocotátwj
e6párxwj tw^n i¨erw^n th^s E¨+w
PRAETORIwn tò #B'@,
a6pò u¨pátwn kaì
patrikíwj.&|
Com’è agevole immaginare il primo lavoro svolto dal tecnico incaricato,
Giuliano Salerno, è stato quello di ricostruire la vecchia codifica dei
caratteri greci usata dall'ILC-CNR, raffrontando il testo digitale con
l’edizione cartacea di riferimento, individuata nell’edizione
Schoell-Kroll (più precisamente, come ricordato, nell’editio stereotypa quinta del 1928), alla
quale l’edizione digitale deve conformarsi, per le ragioni esposte supra.
La principale difficoltà consisteva nell’individuare
correttamente quali segni, presenti della tabella occidentale ASCII al tempo
della formazione delle schede forate, fossero stati usati per rendere gli
spiriti, gli accenti, le iota sottoscritte
e soprattutto la combinazione tra questi segni proprie della lingua greca
antica, ma, come noto, non delle lingue moderne e segnatamente non della lingua
inglese, sulla quale l’originario American Standard Code for Informations
Interchange, per ovvie ragioni, era stato modellato.
Il linguaggio di marcatura scelto per rendere il prodotto finale della
conversione è stato il Rich Text Format (RTF), sviluppato da Microsoft.
La scelta è stata determinata dalla preferibilità di un formato
multipiattaforma, che potesse pertanto essere consultato utilizzando la maggior
parte degli editor di testo e dei word processor disponibili per diversi sistemi
operativi quali quelli attualmente prodotti da Microsoft, Apple, oltre che per
Linux[9].
Inoltre l’RTF è già lo standard usato dalla banca-dati
BIA, nell’edizione 2000, attualmente in circolazione, che il testo delle Novellae giustinianee greche era destinato
ad integrare, per quanto concerne l’archivio Fontes.
Sono state quindi ricostruite tutte le varie corrispondenze tra le
codifiche utilizzate dal vecchio applicativo MS-DOS ed i valori esadecimali del
formato RTF di BIA, relativi al font Greek.ttf utilizzato da BIA.
Prendendo per esempio l’estratto riportato supra, la codifica «u6+», nella parola
«Au6+goustos» corrisponde al carattere «Ü», che a sua volta nel formato RTF di BIA ha,
come codifica esadecimale «\’dc».
Nella tabella seguente sono riportati, per maggiore chiarezza alcuni esempi
di conversione dalla codifica propria dell’applicativo MS DOS originario,
alla codifica propria del BIA Editor Fontes, confrontati, infine, con i
caratteri Greek.ttf che l’utente della banca dati vedrà
visualizzati sullo schermo:
Codifica applicativo dos |
Codifica BEF |
Carattere visualizzato a video |
A¨`j |
\'95Ai |
•Ai |
w¨`j |
\'f7 |
÷ |
u6^ |
\'e2 |
â |
w+ |
\'e8 |
è |
Una volta messe a punto e chiarite tutte le corrispondenze, si è potuti
passare alla fase di conversione vera e propria, tramite diverse procedure
automatizzate realizzate ad hoc dal
tecnico informatico.
Sono state individuate, una ad una, le fonti presenti nel file originale ed
in contemporanea alla conversione del testo sono stati inseriti i marcatori
(tag) RTF.
A questo punto il testo è stato uniformato alle specifiche di BIA.
In pratica ogni fonte è stata scomposta in rubrica, praefatio (ulteriormente
ripartita in principium e
§§, ove presenti), capita (ulteriormente
ripartiti in principium e
§§, ove presenti) ed epilogus (ulteriormente
ripartito in principium e
§§, ove presenti). Ognuna di queste partizioni in cui è stata
suddivisa la fonte, è stata corredata dell’inscriptio (eventualmente abbreviata) e della subscriptio, proprie della costituzione imperiale, che nel file
originale risultavano rispettivamente come primo ed ultimo record della lista
di tutti i frammenti relativi a ciascuna novella. Inoltre, il testo è
stato suddiviso in righe della lunghezza massima di 80 caratteri, già
individuato come limite per il
corpo del testo di tutte le fonti nelle precedenti edizioni di BIA.
In BIA, poi, il campo inscriptio
prevede solo due righe di testo, ciascuna composta al massimo da 70 caratteri e
poiché diverse inscriptiones
delle novelle superavano tale spazio si è reso necessario
l’inserimento dell’intera inscriptio
nel primo frammento di testo per ogni fonte (usualmente il primo della praefatio, se presente), troncando automaticamente a due righe
di testo il campo inscriptio di tutte
le partizioni di testo di ogni novella. Ciò ha conservato una
significativa porzione dell’inscriptio,
nel campo omonimo di ogni frammento, che insieme alla ripetizione della subscriptio permette un utile, rapido e
soprattutto costante richiamo visivo all’emanatore, al destinatario, al
luogo e alla data di emissione.
Ogni «luogo fonte» è stato quindi riordinato secondo il
sistema di codifica BIA: in particolare, la separazione tramite virgole
adottata negli anni ’70 è stata sostituita dai punti, sono stati
eliminati gli zeri che precedevano i numeri, l’indicazione delle rubriche
da RUBR è stata convertita in R e le sigle delle tre collezioni di
novelle sono state abbreviate nel modo seguente:
Titolo della raccolta |
Abbreviazione ILC CNR |
Abbreviazione BEF |
|
Iustiniani Novellae |
NVG |
N. |
|
Corporis CLXVIII novellarum Appendices |
I. Iustiniani XIII edicta quae vocantur |
EDG |
E.Iu. |
II. Appendix
constitutionum dispersarum |
ADG |
App. |
Il lavoro così ultimato è stato suddiviso in tre files rtf
con estensione “.bef” contenenti rispettivamente le novelle, gli edicta Iustiniani e l'Appendix II. I tre files sono stati
messi a disposizione del gruppo PRIN 2004 insieme all’applicativo BEF
– BIA Editor Fonti, che è in grado di modificare i file sorgenti
in formato rtf senza inserire «tag» non necessari alla
indicizzazione ed alla fruizione del testo tramite BIA. Modificando infatti i
files con l’estensione «.bef» mediante un qualunque altro
editor RTF (come MSWord, ad esempio) questi verrebbero inevitabilmente
«sporcati», ovvero arricchiti di numerosi «tag», utili
per l’applicativo impiegato, ma del tutto inutili ai fini della
pubblicazione e dell’utilizzo di BIA. Ne consegue, che pur restando
fruibili, i files sorgente, come file di testo RTF, verrebbero a presentare
evidenti errori sia in fase di indicizzazione del testo ulteriore, che in fase
di visualizzazione tramite BIA.
Il lavoro strettamente tecnico-informatico di conversione sin qui descritto
è stato portato a termine nella primavera 2006.
L’unità di ricerca di Alessandria, insieme a quella di Torino,
ha quindi assunto il compito di provvedere alla prima, generale revisione del
testo prodotto dalla conversione, sulla base dell’edizione cartacea
modello. Per fare ciò, l’intera collezione delle 168 novelle, in
uno con le due appendix è stata stampata ed il cartaceo così
realizzato è stato suddiviso tra quattro unità di ricerca locale,
partners del progetto, per la correzione delle bozze. L’operazione
è stata condotta presso le università di Modena e Reggio Emilia
(dall’unità guidata dal Prof. Renzo Lambertini), Parma
(dall’unità guidata dal Prof. Salvatore Puliatti), Genova
(dall’unità guidata dalla Prof.ssa Maria Grazia Bianchini) e
Sassari (dall’unità guidata dalla Prof.ssa Maria Rosa Cimma) nel
corso dell’estate 2006.
Il lavoro, come i coordinatori e i loro collaboratori delle unità di
ricerca locali sanno perfettamente, non è stato per nulla agevole, dal
momento che le correzioni più scrupolose hanno evidenziato una media di
difformità, nelle bozze rispetto all’edizione a stampa di
riferimento, pari o superiore a venti per pagina. Si tratta ovviamente di un
numero enorme, che si spiega riflettendo sui passaggi attraverso i quali si
è giunti al prodotto che qui presentiamo, alle scelte del passato e del
presente nonché, fondamentalmente, al fatto che la base di partenza
è stata un archivio grezzo, costituito da un database realizzato
mediante schede perforate, prodotte a seguito di una traslitterazione del greco
antico in caratteri latini.
Al termine della correzione, ogni unità di ricerca locale ha
rispedito le proprie bozze all’indirizzo del Dipartimento di Scienze
Giuridiche di Torino, presso il quale si è provveduto
all’inserimento delle correzioni mediante l’applicativo BEF, grazie
alla collaborazione di un gruppo di ricercatori della scuola romanistica
torinese: la collega Raffaella Siracusa e i giovani Pierfrancesco Arces ed
Enrico Sciandrello.
La scelta di collazionare le bozze corrette per operare in un’unica
sede le correzioni sui files sorgenti è dipesa dalla peculiarità
dell’applicativo (che ha richiesto comunque l’acquisizione di una
certa manualità) e dalla necessità di non produrre un numero di «spezzoni»
potenzialmente in grado di minare la produzione di un unico, definitivo file
corretto.
Dalla prima
revisione erano emersi i numerosissimi errori stereotipati: la sostituzione
sistematica della lettera «x» con la «c», in primo luogo e i frequenti casi in cui una «s» interclusa compariva in luogo di
una «j»,
all’interno di parole composte quali ‘éjte’ o ‘projt£ttw’.
In
quest’ultimo caso, il problema deriva da una scelta fatta, addirittura,
al momento di scegliere i criteri di traslitterazione adottati negli anni
’70: in base ad essi, tutte le sigma intercluse erano state uniformate
usando il codice corrispondente al segno «s». Per perseguire efficacemente l’obiettivo di
un ampliamento dei fontes di BIA che
fosse il più aderente possibile all’edizione cartacea di
riferimento, si è provveduto, grazie all’opera delle unità
locali e ad una seconda revisione mirata condotta a Torino e Alessandria, a
reinserire le sigma uncinate all’interno delle parole composte, in
aderenza al modello dell’edizione Schoell-Kroll.
Come
anticipato supra, se si riflette sul
fatto che il monumentale lavoro condotto negli anni Settanta era
inevitabilmente passato per una traslitterazione, del tutto manuale, del testo
greco e che il database oggetto di questa presentazione ha avuto come base una
sorta di «riconversione» in greco di quel prodotto, ben si
comprende come mai i files sorgenti corretti dalle singole unità locali
e poi riesaminati dalle unità di Torino ed Alessandria abbiano
presentato un numero davvero notevole di errori e refusi: dalle maiuscole divenute
minuscole e viceversa, alle espressioni latine dell’originale
impropriamente traslitterate in greco, ai già ricordati problemi di resa
delle lettere ‘x’ e ‘s’.
In media,
al momento di collazionare le bozze provenienti dalle singole unità
locali, erano presenti quindici segnalazioni di errori per ognuna delle oltre
700 pagine a stampa e a queste se ne sono aggiunte altre, emerse
all’occhio allenato dei membri dell’équipe
torinese-alessandrina.
Una volta
terminato l’inserimento delle correzioni ai files relativi alle novelle
greche, è stato pressoché naturale porsi il problema
dell’eventuale aggiunta delle novelle in lingua latina al database, dal
momento che per ovvie ragioni il gruppo coordinato dalla Bartoletti Colombo non
aveva digitalizzato anche queste fonti. Non c’è stato alcun dubbio
circa l’opportunità di una simile scelta, se non altro alla luce
del criterio dirimente della massima aderenza all’edizione Schoell-Kroll
assunta come riferimento. In questo modo, infatti, la futura edizione di BIA
offrirà agli utenti la possibilità di consultare rapidamente il
testo completo delle fonti pubblicate nei tre volumi della XII editio minor del Corpus Iuris Civilis.
Il lavoro
di digitalizzazione, correzione e inserimento è stato curato dallo
scrivente presso la sede torinese, insieme ai colleghi Raffaella Siracusa e
Saverio Masuelli e ai dottori Enrico Sciandrello e Marco Antonio Fenocchio. In
totale sono state aggiunte agli archivi interessati, all’incirca, 150
fonti, con un aumento di poco inferiore al 10% rispetto all’insieme di
fonti già digitalizzate, in lingua greca.
Sebbene la
mancanza dell’apparato critico nel database renda di fatto
imprescindibile il raffronto con il testo a stampa, questa fondamentale
integrazione, a completamento di un’opera di trasferimento su supporto
elettronico ch’è certo tra le più rilevanti nel panorama
giusantichistico, consentirà di svolgere con grandissima rapidità
tutta una serie di confronti testuali, consultazioni e analisi statistiche che,
viceversa, oggi richiedono una molteplicità di operazioni lunghe,
laboriose e certamente più soggette al rischio dell’errore umano.
Proprio
l’inserimento delle novelle in lingua latina, contenute nelle Novellae e nella Appendix II, rappresenta un apporto fondamentale in questo senso.
Se infatti
la realizzazione del cdrom curato dall’unità di ricerca
cagliaritana, contenente il testo delle Novelle e le epitomi di Teodoro e Atanasio,
consentirà un rapido raffronto tra le diverse versioni di una medesima
fonte, la pubblicazione nella nuova edizione di BIA delle novelle in lingua
latina permetterà un’operazione semplicemente fondamentale, in
chiave esegetica, anche con riguardo a testi del Digesto e del Codice. Lo
strumento informatico, infatti, permette di verificare con grande
velocità e affidabilità la ricorrenza di costruzioni sintattiche,
eventualmente presenti in frammenti del Digesto o in novelle di lingua latina.
Questa possibilità, lungi, dal rinverdire tout court uno dei filoni
più noti della critica interpolazionistica, basata sulla verifica della
«classicità» di determinate espressioni conservate nei testi
ex inscriptione attribuibili ai
giuristi romani, consente, oggettivamente, di ricavare delle evidenze preziose.
Il
ricorrere di una espressione, di una particolare costruzione verbale, tanto in
una costituzione di Giustiniano, quanto in un responso di Ulpiano, può,
aprioristicamente, essere letta come una prova del classicismo
dell’imperatore ovvero come un sintomo dell’intervento compilatorio
su di un frammento inserito nel Digesto. Ciò che è però,
obiettivamente, importante è la possibilità, rapida e
automatizzata, del confronto, tale da mettere gli interpreti al riparo da
possibili ricostruzioni teoriche viziate, in partenza, dalla mancata
conoscenza, e fino ad oggi dalla non conoscibilità, di una particolare
ricorrenza.
Naturalmente,
lo strumento di per sé non basta: è non solo auspicabile, ma
necessaria una generale evoluzione nell’approccio alle banche dati a
disposizione dei giusantichisti, che peraltro alcuni lavori di giovani
ricercatori lasciano presagire. In generale, infatti, continua ad essere
prevalente un approccio alle fonti digitalizzate come comodo, sebbene assai
pericoloso, sostituto della fonte edita su carta. Il cambio di prospettiva
dovrebbe addirittura essere radicale: ogni studioso, con a disposizione la
prossima edizione di BIA, non solo potrà, ma a parere dello scrivente,
dovrà porsi una serie di domande che oggi non rientrano normalmente nei
protocolli di ricerca solo perché lo strumento per rispondervi non
esiste o, peggio, non è utilizzato che al 20% delle sue
possibilità.
Basti un
esempio a illustrare le ragioni di questa istanza. Il sostantivo ‘administrator’, secondo la
versione in circolazione di BIA ricorre 34 volte nelle fonti ivi pubblicate.
Trentun volte in costituzioni tardoantiche o giustinianee e tre volte in
frammenti dei giuristi, rispettivamente Pomponio, Ulpiano e Paolo. Considerate
le modalità con cui il segno è presente nei tre frammenti giusriprudenziali,
si potrebbe ipotizzare una ipostatizzazione del sostantivo, che indica
l’onerato dell’‘administratio’,
piuttosto tarda ed un inserimento da parte dei compilatori anche in contesti
ove non era originariamente presente. La consultazione delle novelle in lingua
latina, consente di trovare due ulteriori ricorrenze del segno ‘administrator’, rispettivamente in
Nov.52.praef.1 e Nov.114.1pr. D’altra parte, l’esame delle fonti
letterarie, contenute nel Cdrom BTL2, permette di rinvenire una ricorrenza
classica del segno, nel De oratore di
Cicerone (1.210), mentre le sole altre quattro sono tutte appartenenti o
successive al IV sec. d.C.
Com’è
evidente non siamo alla messa a punto di un meccanismo automatizzato, tale da
permettere di trarre dei dati interpretativi dalla linguistica computazionale,
ma sembra intuibile che la possibilità di svolgere queste operazioni di
verifica in pochi secondi possa legittimarne l’adozione,
all’interno di un «protocollo di ricerca», come atto
preliminare rispetto all’interpretazione di qualsivoglia fonte, utile per
una prima, rapida verifica delle prime, fondamentali ipotesi circa la
genuinità della stessa. Verificare le ricorrenze della costruzione linguistica
su cui si basa l’ipotesi ricostruttiva, valutarne l’importanza
statistica, può e deve rappresentare uno sforzo preliminare rispetto
all’esegesi tradizionale perché può offrire degli spunti di
riflessione estremamente utili e, soprattutto, ricavabili pressoché da
ogni fonte scritta che conservi un frammento della sapienza giuridica romana.
Non utilizzare in questo, che appare come il modo più appropriato, le
novità tecniche già presenti sul mercato e ancora di più quelle
future che questo lavoro ha inteso favorire, equivarrebbe a possedere una
Ferrari e tenerla in garage ovvero limitarsi ad usarla per andare in edicola.
Dato
l’alto numero di errori e refusi che sono stati riscontrati a seguito del
lavoro svolto per l’inserimento delle novelle greche e latine
all’interno del database FONTES di BIA, è apparso opportuno un
ulteriore livello di verifica della rispondenza del testo digitale
all’originale cartaceo. Non appare infatti verosimile che tutti gli
errori siano stati individuati e corretti. Per tale ragione, con un apposito
contratto, stipulato grazie a fondi di ricerca locale messi a disposizione
dall’Università della Valle d’Aosta - Université de
* La realizzazione del presente contributo
è stata possibile seguendo le fasi del lavoro e utilizzando la relazione
prodotti da Giuliano Salerno, tecnico che in collaborazione con
l’unità di ricerca alessandrina, cui lo scrivente apparteneva,
sotto la direzione del Prof. Paolo Garbarino, ha materialmente curato le
operazioni informatiche di restituzione del database realizzato negli anni
’70, a partire dalla versione cartacea delle Novelle, degli edicta Iustiniani e dell’Appendix II, dal gruppo di lavoro
coordinato dalla Prof. Campolunghi. Il supporto tecnico di Giuliano Salerno
è stato reso possibile da un contratto ad hoc stipulato con il Dipartimento di Scienze Giuridiche ed
Economiche dell’Università del Piemonte Orientale e finanziato dal
PRIN 2004 “L’esperienza giuridica giustinianea dopo
[1] Le elaborazioni elettroniche prodromiche
all’uscita della parte latina di G.G. Archi
(mod.), A.M. Bartoletti Colombo (cur.), Legum
Iustiniani Augusti Vocabularium, Novellae – Pars Latina, I, Milano
1977, IV, furono eseguite presso la divisione linguistica del CNUCE-CNR di
Pisa, diretto da Antonio Zampolli, pioniere dell’elettronica applicata
alla linguistica ed alla lessicografia in genere, e curate da E. Picchi e M.
Sassi. La pars graeca, viceversa,
richiedette un lavoro presumibilmente maggiore, che coinvolse sette studiosi
nella fase di lemmatizzazione, preventiva rispetto alle elaborazioni
elettroniche curate da Remo Bindi, presso quello che nel frattempo era divenuto
l’ILC, diretto sempre da Antonio Zampolli: cfr. G.G. Archi (mod.), A.M. Bartoletti
Colombo (cur.), Legum
Iustiniani Augusti Vocabularium, Novellae – Pars Graeca, Indices,
Milano 1984, s.n. ma IV.
[2] Un lasso di tempo obiettivamente enorme in
campo informatico, se si pensa che, come dettagliatamente spiega la curatrice,
il lavoro di trasferimento del testo dalla quarta edizione delle Novellae di Schoell e Kroll (1912) avvenne
mediante schede perforate, intorno alla metà degli anni ’70,
mentre nel 1984 (anno di realizzazione del volume degli indici della pars graeca) dopo questo strumento di archiviazione dati era già
ampiamente caduto in disuso.
[3] A.M. Bartoletti
Colombo, Introduzione, in G.G.
Archi (mod.), A.M. Bartoletti
Colombo (cur.), Legum
Iustiniani Augusti Vocabularium, Novellae – Pars Latina, I, XIII. La
stessa Autrice (nt. 15) chiarisce esplicitamente che «la quinta e ultima
edizione stereotipa si presenta, sotto l’aspetto tipografico, meno
corretta della quarta».
[5] La standardizzazione del linguaggio in
ambito informatico è una vicenda in continua evoluzione. Basti pensare
che la prima versione del cosiddetto ASCII (American Standard Code for
Information Interchanging) risale ai primi ’60. La necessità di un
codice in grado di garantire uno standard è determinato dal fatto che
gli elaboratori elettronici non conoscono lettere o numeri, ma solo
combinazioni degli unici due segni che compongono il sistema binario (uno e
zero). Le singole unità di informazioni che un elaboratore è in
grado di considerare sono chiamate “bit” e sono rappresentate
logicamente dai soli valori 1 e 0. Poiché la comunicazione richiede
l’uso di lettere e cifre, è emerso come necessario, da ormai un
cinquantennio, associare a ogni cifra, lettera, segno grafico o matematico in
genere un codice binario standard. Il primo, più celebre di questi
codici è stato il già menzionato ASCII, basato su una codifica
dei caratteri a 8 bit (7 bit per la codifica più un bit di
parità, usato per evitare errori nella trasmissione di dati).
L’ISO (International Standard Organization), nel 1972, fece
dell’ASCII il codice di riferimento e, nel corso degli anni incessanti
aggiornamenti arricchirono la tabella delle corrispondenze che inizialmente era
limitata all’alfabeto latino, ai numeri arabi e ad un certo numero di
segni grafici e aritmetici in uso nei paesi occidentali, per un totale di 128
combinazioni binarie a sette cifre. Tuttavia, nel mondo si affermarono
innumerevoli varianti nazionali del codice (volte a rispondere
all’esigenza di rappresentare accenti ed altri segni grafici peculiari di
ciascuna lingua) e si verificò una rilevantissima eccezione
nell’adozione dell’ASCII, costituita da IBM (fino ai primi anni
’90, il termine di paragone per i costruttori di computer, che non a
caso, quando non Macintosh, si distinguevano in «IBM» e «IBM
compatibili»). Questi elementi, contribuiscono a chiarire in modo
essenziale il perché la codifica adottata dall’Istituto di
Linguistica Computazionale, trent’anni or sono, rappresenti oggi un
limite insormontabile per la fruizione diretta di quel lavoro. All’inizio
degli anni ’70 mancava una rappresentazione ASCII, internazionalmente
accolta, per la lingua greca antica e segnatamente per la sua ricchissima
varietà di combinazioni tra accenti e spiriti. Oggi le cose sono assai
diverse, grazie all’affermarsi di uno standard che è rappresentato
dall’UNICODE, basato in effetti sul cosiddetto «ASCII esteso»
e, in origine, ideato per rappresentare i 256 caratteri sufficienti per le
necessità dell’Europa Occidentale e del Nord America. Introdotto
nel 1989 attualmente l’UNICODE subisce un aggiornamento all’anno,
anche se le richieste di revisione sono continue, e sebbene non rappresenti
ancora tutti i caratteri usati nel mondo, ha la potenzialità per farlo
(la sua codifica originaria, a 16 bit, permetteva di rappresentare 65536
caratteri, ma oggi si è arrivati a un milione) e sono già entrati
in questa «Babele telematica», anche gli alfabeti di molte lingue
morte, come quelli cuneiformi, runici, etruschi oltreché, naturalmente,
quello greco classico. Fino all’avvento di Unicode l’ortografia
politonica della classicità greca non poteva essere correttamente
rappresentata, dal momento che la precedente codifica dell’alfabeto ellenico
a 8 bit, nota con la sigla ISO 8859-7 e introdotta nel 1987, non era in grado
di rappresentare che i 69 caratteri usati nella moderna ortografia monotonica.
[6] I floppy disk nacquero, come noto, nel 1967 quando la IBM studiò un
sistema semplice e poco costoso per caricare microcodice sui suoi mainframe
System/370. Il risultato fu un disco di sola lettura, di 8 pollici (
[7] Il riferimento è al database
relativo ai Basilici ed agli scholia
agli stessi, realizzato a Frankfurt am Main, presso il Max-Plank-Institut
für Rechtsgeschichte e a buon diritto considerato (almeno sino alla
presentazione del lavoro di Yurij Vin e Anna Gridneva, descritto nel saggio The Byzantine Law Heritage and New Prospects
of Its Information Research: The DataBase "Byzantine Law", in Riv. Dir. Rom. 6 (2006), http://www.ledonline.it/rivistadirittoromano/)
come l’unico database, presente e consultabile in Europa, dedicato ai libri basilicorum. Per poter consultare
questo archivio, decine di ricercatori negli anni hanno dovuto recarsi nella
città tedesca, per utilizzare il programma di ricerca creato ad hoc per gestire la banca dati in
lingua greca, ovvero hanno dovuto richiedere estratti cartacei dei risultati di
ricerche condotte per loro dal personale del MPIER.
[8] Un sistema
operativo (all’inglese OS,
operating system) è il programma che controlla e gestisce
l’hardware,
che costituisce un computer, e le operazioni di base. Si occupa dei processi che vengono eseguiti e della gestione
degli accessi degli utenti. Compito del sistema operativo è inoltre
quello di virtualizzare le risorse hardware e software nei confronti dei
programmi applicativi. A partire dai primi anni ’80 si è affermata
la tendenza a prediligere computer dotati di una memoria di massa: per gestirla
occorre gestore di file system, cioè un insieme di funzioni, esercitate
da un unito software, che permetta di organizzare i dati sulla superficie dei
mezzi di memorizzazione secondo una struttura ben precisa. I sistemi operativi
che risiedono su disco (inizialmente si trattava di floppy, poi hard disk e,
negli ultimi anni, più evolute unità di massa) capaci di gestire
un file system sono detti genericamente Disk Operating Systems, cioè DOS
appunto. L’esemplare più famoso di questa categoria è
senz’altro il MS-DOS
della Microsoft.
MS-DOS è il sistema
operativo, prodotto da Microsoft, che fu abbinato al primo Personal Computer
IBM. Il nome deriva dalle iniziali della Microsoft, cioè MS,
e dall’acronimo
DOS ovvero Disk Operating System. Verso l'ottobre del 1980
[9] Ecco un esempio di codifica RTF tratta
dalla voce «RTF» di it.wikipedia.org:
{\rtf
Ciao!\par
Ecco del testo in
{\b grassetto}.\par
}
Un word processor in grado di interpretare i comandi RTF,
visualizzerà il seguente testo:
Ciao!
Ecco del testo in grassetto.
La presenza del simbolo di barra rovesciata (backslash) (\
) indica l’inizio di un codice di comando RTF. Il comando \par
introduce una nuova riga, e \b
attiva il testo in grassetto. Le parentesi graffe ({
e }
) definiscono un «gruppo»;
l’esempio di codice precedente utilizza un gruppo per limitare il raggio
d’azione del comando \b
. Tutto
il resto viene trattato come testo
semplice, o da «formattare». Un documento RTF valido
è a sua volta un gruppo il cui primo comando è \rtf
.
[10] La correzione del testo delle Novellae
ha evidenziato ancora un significativo numero di errori, che possono essere
ascritti ad alcune categorie più generali:
-
numerazione
delle Novellae mancante;
-
numerazione
dei paragrafi interni alle Novellae mancante (per la prima parte del corpus)
o scorretta (‘$’ laddove
ci si aspetterebbe ‘#’);
-
punteggiatura
scorretta o mancante;
-
vocaboli
mancanti (in rari casi);
-
suddivisione
tra Novellae mancante (in rari casi);
-
inscriptiones mancanti;
-
occorrenza
del carattere ‘c’ laddove ci dovrebbe essere ‘x’;
-
occorrenza,
all’interno di parola composta, del carattere sigma tondo (s) laddove avrebbe dovuto trovarsi un sigma
uncinato (j).