N. 6 – 2007 – Memorie//Scienza-giuridica

Università della Valle d’Aosta

Université de la Vallée d’Aoste

Il database delle 168 Novelle e la nuova edizione di BIA*

Sommario: 1. Premessa. – 2. Il materiale di partenza. – 3. Il database delle novelle greche prodotto dall’ILC-CNR: problemi e soluzioni adottate. – 4. Le fasi del lavoro di conversione e messa a punto del nuovo database. – 5. L’inserimento delle novelle latine e l’ulteriore revisione del prodotto. – 6. L’ultima fase del lavoro.

1. – Premessa

Al momento di redigere il programma di ricerca per il bando PRIN 2004, la scelta dell’argomento («L’esperienza giuridica giustinianea dopo la Compilazione: le Novelle e la loro interpretazione da parte dei giuristi») ha immediatamente reso evidente l’opportunità di svolgere un lavoro che – oltre ad esplorare, da un particolare angolo prospettico, la produzione normativa giustinianea, pervenutaci al di fuori del Codex repetitae praelectionis – poteva costituire un fondamentale arricchimento della banca di dati Bibliotheca Iuris Antiqui.

Grazie alla collaborazione, sfociata in una convenzione ad hoc, tra il gruppo PRIN guidato dal Prof. Francesco Sitzia e il gruppo di ricerca BIA del CNR, coordinato dal Prof. Nicola Palazzolo, è stato possibile procedere alla realizzazione di una base di dati contenente il testo delle 168 Novelle indicizzato ed organizzato secondo i criteri che caratterizzano quello strumento di ricerca, ormai quotidiano, che è BIA e, al tempo stesso, procedere all’elaborazione di una versione digitale utile ai fini del PRIN. Il risultato sarebbe stato un prodotto in grado di soddisfare due esigenze in una volta sola: l’implementazione significativa di BIA2000 cdrom con l’unica parte del cd. Corpus Iuris Civilis ancora non consultabile dai suoi utenti (le novelle in lingua greca e latina) e la produzione di un supporto informatico organizzato in modo tale da evidenziare, per la prima volta le corrispondenze tra i luoghi delle Novelle e le epitomi di Teodoro e Atanasio, che sono state digitalizzate presso la Casa Editrice “A. Valveri” di Cagliari, sotto la supervisione dell’unità di ricerca locale costituita presso l’Università del capoluogo sardo. L’uso del supporto informatico che consentirà la consultazione a video delle Novelle e delle Epitomi rimarrà circoscritto all’interno delle sedi coinvolte nel Prin 2004, sino alla pubblicazione della nuova edizione di Bibliotheca Iuris Antiqui CDRom.

2. – Il materiale di partenza

Per procedere nella direzione individuata, il gruppo BIA del CNR ha messo a disposizione del gruppo PRIN il testo digitale delle Novellae giustinianee greche e delle Appendices I e II, redatto dall’Istituto di Linguistica Computazionale (ILC-CNR)[1], affinché gli stessi fossero convertiti in un formato compatibile con gli usuali editor testuali moderni e con le specifiche di BIA (Bibliotheca Iuris Antiqui).

Il testo «base» era stato redatto grazie al lavoro di un gruppo di studiosi, guidati dalla professoressa Bartoletti Colombo, per essere poi utilizzato per realizzare il Vocabularium, relativo alla pars Graeca, delle Novellae Iustinianeae, pubblicato, a partire dal 1984 e fino al 1989, per i tipi della casa editrice Goliardica di Milano, moderatore il Prof. G.G. Archi. Com’è facile intuire, il materiale, pur abbondantissimo, non comprendeva il testo delle novelle in lingua latina.

Come si evince dalla prefazione del Vocabularium stessa, il gruppo coordinato dalla Bartoletti Colombo aveva lavorato sulla IV editio minor dell’opera di ricostruzione compiuta da Schoell e Kroll, all’incirca dieci anni prima della effettiva pubblicazione della pars Graeca[2] del Vocabularium, partendo dalla completa traslitterazione in caratteri latini dell’originale greco. Le ragioni per cui proprio quell’edizione venne preferita emergono con particolare evidenza dalle parole della stessa Bartoletti Colombo: «il testo assunto come base per lo spoglio è dunque quello dell’edizione Schoell-Kroll, di cui è stata preferita la ristampa del 1912, che è apparsa la più curata dal punto di vista tipografico, quasi immune da errori»[3]. Per quanto attiene alla scelta della traslitterazione, essa fu semplicemente resa obbligata dalla limitata disponibilità di caratteri codificati nei primi anni ’70[4] e dalla necessità di servirsi di macchine per la predisposizione di schede forate in grado di lavorare solo con caratteri latini.

All’atto di riprendere quello che fu un monumentale lavoro risalente ormai a oltre trent’anni, poiché la finalità era anche quella dell’implementazione di BIA, è stata adottata una scelta destinata a influenzare in modo significativo il lavoro successivo. Dal momento, infatti, che BIA2000 si basa, per quanto attiene al testo del Digesto e del Codex, su di una versione indicizzata della XII editio minor (1954, praefatio Kunkel, in realtà un’anastatica della V editio minor) dei volumi curati da Mommsen e Krüger, cui si aggiungono i testi indicizzati delle altre fonti giuridiche, derivati da un lavoro svolto presso l’università di Linz, al fine di garantire, in prospettiva, un risultato finale che offrisse la versione digitale il più possibile fedele ad un’unica edizione cartacea, la scelta è stata quella di procedere, in fase di revisione, all’«adeguamento» del database alla V editio minor delle Novellae di Schoell e Kroll.

3. – Il database delle novelle greche prodotto dall’ILC-CNR: problemi e soluzioni adottate

Il file originale (FILEST.NVG) del testo elettronico delle Novellae giustinianee greche era stato redatto dall’Istituto di Linguistica Computazionale del CNR (ILC-CNR) negli anni ’70 del secolo scorso, in un formato testuale di tipo DOS, con un linguaggio di marcatura non standardizzato[5] e quindi fruibile esclusivamente tramite un applicativo informatico dedicato (in grado cioè di attribuire alle singole sequenze di bit il corrispondente carattere greco corretto), ormai obsoleto per i moderni sistemi operativi. In pratica, un software era stato elaborato esclusivamente al fine di creare e gestire quel database: una scelta del tutto logica se si pensa alle capacità supporti di archiviazione disponibili all’epoca (i floppy disk da 5 pollici e 1/4)[6] ed ai costi dei computer, tali da non rendere verosimile una fruibilità diretta del database informatico prodotto, su larga scala. Analogamente a quanto accadde altrove in Europa[7], il ruolo dello strumento informatico era circoscritto ad un’esclusiva funzione ancillare rispetto al prodotto cartaceo tradizionale. Sarebbe stata necessaria un’inverosimile dose di preveggenza affinché potesse essere altrimenti.

Il software messo a punto negli anni settanta, era ovviamente già realizzato per computer funzionanti grazie ad un «Disc Operating System», ma non poteva risultare compatibile non solo con i computer attuali, che vengono usati mediante un’interfaccia grafica con l’utente (User Graphical Interface), ma nemmeno con i modelli prodotti a partire dagli anni ’80 e funzionanti grazie a sistemi operativi «di massa», come MS-DOS[8] o le sue principali alternative del tempo: OS/2 (prodotto dalla IBM), AmigaDOS (prodotto dalla Commodore) e MAC OS (prodotto dalla Apple).

Come già anticipato, tuttavia, il problema più rilevante, per l’impiego ai fini della presente ricerca del database realizzato presso il centro di linguistica computazionale del CNR, era la mancata standardizzazione del linguaggio utilizzato.

Per rendersi conto di che cosa significa che il testo greco originario era stato reso con una codifica non standard e per comprendere appieno le difficoltà che apparivano evidenti, sin dall’inizio del lavoro di recupero del pur imponente database degli anni ’70, è sufficiente un esempio. Basta prendere un frammento prelevato dall’originale, visualizzato con gli attuali editor di testo e constatare come si presenti in modo a dir poco confuso:

%NVG, 001 , RUBR.

$0001$ }<Per_ tw^n klhron¢mwn ka_

to– Falkid¡ou.

% NVG, 001 , INSCR.

Au6tokr twr I6oustinian•s Au6Ùgoustos I6w nnhj tw^j e6ndocot twj

e6p rxwj tw^n iùerw^n th^s EùÙw PRAETORIwn t• #B'@,

a6p• uùp twn ka_ patrik¡wj.&|

...

Dopo aver convertito il testo originariamente composto con caratteri occidentali ASCII in testo MS-DOS, esso assumeva un formato appena più intelligibile:

%NVG, 001 , RUBR.

$0001$ }<Perì tw^n klhronómwn kaì

toû Falkidíou.

% NVG, 001 , INSCR.

Au6tokrátwr I6oustinianòs Au6+goustos I6wánnhj tw^j e6ndocotátwj

e6párxwj tw^n i¨erw^n th^s E¨+w PRAETORIwn tò #B'@,

a6pò u¨pátwn kaì patrikíwj.&|

4. – Le fasi del lavoro di conversione e messa a punto del nuovo database

Com’è agevole immaginare il primo lavoro svolto dal tecnico incaricato, Giuliano Salerno, è stato quello di ricostruire la vecchia codifica dei caratteri greci usata dall'ILC-CNR, raffrontando il testo digitale con l’edizione cartacea di riferimento, individuata nell’edizione Schoell-Kroll (più precisamente, come ricordato, nell’editio stereotypa quinta del 1928), alla quale l’edizione digitale deve conformarsi, per le ragioni esposte supra.

La principale difficoltà consisteva nell’individuare correttamente quali segni, presenti della tabella occidentale ASCII al tempo della formazione delle schede forate, fossero stati usati per rendere gli spiriti, gli accenti, le iota sottoscritte e soprattutto la combinazione tra questi segni proprie della lingua greca antica, ma, come noto, non delle lingue moderne e segnatamente non della lingua inglese, sulla quale l’originario American Standard Code for Informations Interchange, per ovvie ragioni, era stato modellato.

Il linguaggio di marcatura scelto per rendere il prodotto finale della conversione è stato il Rich Text Format (RTF), sviluppato da Microsoft. La scelta è stata determinata dalla preferibilità di un formato multipiattaforma, che potesse pertanto essere consultato utilizzando la maggior parte degli editor di testo e dei word processor disponibili per diversi sistemi operativi quali quelli attualmente prodotti da Microsoft, Apple, oltre che per Linux[9].

Inoltre l’RTF è già lo standard usato dalla banca-dati BIA, nell’edizione 2000, attualmente in circolazione, che il testo delle Novellae giustinianee greche era destinato ad integrare, per quanto concerne l’archivio Fontes.

Sono state quindi ricostruite tutte le varie corrispondenze tra le codifiche utilizzate dal vecchio applicativo MS-DOS ed i valori esadecimali del formato RTF di BIA, relativi al font Greek.ttf utilizzato da BIA.

Prendendo per esempio l’estratto riportato supra, la codifica «u6+», nella parola «Au6+goustos» corrisponde al carattere «Ü», che a sua volta nel formato RTF di BIA ha, come codifica esadecimale «\’dc».

Nella tabella seguente sono riportati, per maggiore chiarezza alcuni esempi di conversione dalla codifica propria dell’applicativo MS DOS originario, alla codifica propria del BIA Editor Fontes, confrontati, infine, con i caratteri Greek.ttf che l’utente della banca dati vedrà visualizzati sullo schermo:

Codifica applicativo dos	Codifica BEF	Carattere visualizzato a video
A¨`j	\'95Ai	•Ai
w¨`j	\'f7	÷
u6^	\'e2	â
w+	\'e8	è

Una volta messe a punto e chiarite tutte le corrispondenze, si è potuti passare alla fase di conversione vera e propria, tramite diverse procedure automatizzate realizzate ad hoc dal tecnico informatico.

Sono state individuate, una ad una, le fonti presenti nel file originale ed in contemporanea alla conversione del testo sono stati inseriti i marcatori (tag) RTF.

A questo punto il testo è stato uniformato alle specifiche di BIA. In pratica ogni fonte è stata scomposta in rubrica, praefatio (ulteriormente ripartita in principium e §§, ove presenti), capita (ulteriormente ripartiti in principium e §§, ove presenti) ed epilogus (ulteriormente ripartito in principium e §§, ove presenti). Ognuna di queste partizioni in cui è stata suddivisa la fonte, è stata corredata dell’inscriptio (eventualmente abbreviata) e della subscriptio, proprie della costituzione imperiale, che nel file originale risultavano rispettivamente come primo ed ultimo record della lista di tutti i frammenti relativi a ciascuna novella. Inoltre, il testo è stato suddiviso in righe della lunghezza massima di 80 caratteri, già individuato come limite per il corpo del testo di tutte le fonti nelle precedenti edizioni di BIA.

In BIA, poi, il campo inscriptio prevede solo due righe di testo, ciascuna composta al massimo da 70 caratteri e poiché diverse inscriptiones delle novelle superavano tale spazio si è reso necessario l’inserimento dell’intera inscriptio nel primo frammento di testo per ogni fonte (usualmente il primo della praefatio, se presente), troncando automaticamente a due righe di testo il campo inscriptio di tutte le partizioni di testo di ogni novella. Ciò ha conservato una significativa porzione dell’inscriptio, nel campo omonimo di ogni frammento, che insieme alla ripetizione della subscriptio permette un utile, rapido e soprattutto costante richiamo visivo all’emanatore, al destinatario, al luogo e alla data di emissione.

Ogni «luogo fonte» è stato quindi riordinato secondo il sistema di codifica BIA: in particolare, la separazione tramite virgole adottata negli anni ’70 è stata sostituita dai punti, sono stati eliminati gli zeri che precedevano i numeri, l’indicazione delle rubriche da RUBR è stata convertita in R e le sigle delle tre collezioni di novelle sono state abbreviate nel modo seguente:

Titolo della raccolta		Abbreviazione ILC CNR	Abbreviazione BEF
Iustiniani Novellae		NVG	N.
Corporis CLXVIII novellarum Appendices	I. Iustiniani XIII edicta quae vocantur	EDG	E.Iu.
Corporis CLXVIII novellarum Appendices	II. Appendix constitutionum dispersarum	ADG	App.

Il lavoro così ultimato è stato suddiviso in tre files rtf con estensione “.bef” contenenti rispettivamente le novelle, gli edicta Iustiniani e l'Appendix II. I tre files sono stati messi a disposizione del gruppo PRIN 2004 insieme all’applicativo BEF – BIA Editor Fonti, che è in grado di modificare i file sorgenti in formato rtf senza inserire «tag» non necessari alla indicizzazione ed alla fruizione del testo tramite BIA. Modificando infatti i files con l’estensione «.bef» mediante un qualunque altro editor RTF (come MSWord, ad esempio) questi verrebbero inevitabilmente «sporcati», ovvero arricchiti di numerosi «tag», utili per l’applicativo impiegato, ma del tutto inutili ai fini della pubblicazione e dell’utilizzo di BIA. Ne consegue, che pur restando fruibili, i files sorgente, come file di testo RTF, verrebbero a presentare evidenti errori sia in fase di indicizzazione del testo ulteriore, che in fase di visualizzazione tramite BIA.

Il lavoro strettamente tecnico-informatico di conversione sin qui descritto è stato portato a termine nella primavera 2006.

L’unità di ricerca di Alessandria, insieme a quella di Torino, ha quindi assunto il compito di provvedere alla prima, generale revisione del testo prodotto dalla conversione, sulla base dell’edizione cartacea modello. Per fare ciò, l’intera collezione delle 168 novelle, in uno con le due appendix è stata stampata ed il cartaceo così realizzato è stato suddiviso tra quattro unità di ricerca locale, partners del progetto, per la correzione delle bozze. L’operazione è stata condotta presso le università di Modena e Reggio Emilia (dall’unità guidata dal Prof. Renzo Lambertini), Parma (dall’unità guidata dal Prof. Salvatore Puliatti), Genova (dall’unità guidata dalla Prof.ssa Maria Grazia Bianchini) e Sassari (dall’unità guidata dalla Prof.ssa Maria Rosa Cimma) nel corso dell’estate 2006.

Il lavoro, come i coordinatori e i loro collaboratori delle unità di ricerca locali sanno perfettamente, non è stato per nulla agevole, dal momento che le correzioni più scrupolose hanno evidenziato una media di difformità, nelle bozze rispetto all’edizione a stampa di riferimento, pari o superiore a venti per pagina. Si tratta ovviamente di un numero enorme, che si spiega riflettendo sui passaggi attraverso i quali si è giunti al prodotto che qui presentiamo, alle scelte del passato e del presente nonché, fondamentalmente, al fatto che la base di partenza è stata un archivio grezzo, costituito da un database realizzato mediante schede perforate, prodotte a seguito di una traslitterazione del greco antico in caratteri latini.

Al termine della correzione, ogni unità di ricerca locale ha rispedito le proprie bozze all’indirizzo del Dipartimento di Scienze Giuridiche di Torino, presso il quale si è provveduto all’inserimento delle correzioni mediante l’applicativo BEF, grazie alla collaborazione di un gruppo di ricercatori della scuola romanistica torinese: la collega Raffaella Siracusa e i giovani Pierfrancesco Arces ed Enrico Sciandrello.

La scelta di collazionare le bozze corrette per operare in un’unica sede le correzioni sui files sorgenti è dipesa dalla peculiarità dell’applicativo (che ha richiesto comunque l’acquisizione di una certa manualità) e dalla necessità di non produrre un numero di «spezzoni» potenzialmente in grado di minare la produzione di un unico, definitivo file corretto.

Dalla prima revisione erano emersi i numerosissimi errori stereotipati: la sostituzione sistematica della lettera «x» con la «c», in primo luogo e i frequenti casi in cui una «s» interclusa compariva in luogo di una «j», all’interno di parole composte quali ‘éjte’ o ‘projt£ttw’.

In quest’ultimo caso, il problema deriva da una scelta fatta, addirittura, al momento di scegliere i criteri di traslitterazione adottati negli anni ’70: in base ad essi, tutte le sigma intercluse erano state uniformate usando il codice corrispondente al segno «s». Per perseguire efficacemente l’obiettivo di un ampliamento dei fontes di BIA che fosse il più aderente possibile all’edizione cartacea di riferimento, si è provveduto, grazie all’opera delle unità locali e ad una seconda revisione mirata condotta a Torino e Alessandria, a reinserire le sigma uncinate all’interno delle parole composte, in aderenza al modello dell’edizione Schoell-Kroll.

Come anticipato supra, se si riflette sul fatto che il monumentale lavoro condotto negli anni Settanta era inevitabilmente passato per una traslitterazione, del tutto manuale, del testo greco e che il database oggetto di questa presentazione ha avuto come base una sorta di «riconversione» in greco di quel prodotto, ben si comprende come mai i files sorgenti corretti dalle singole unità locali e poi riesaminati dalle unità di Torino ed Alessandria abbiano presentato un numero davvero notevole di errori e refusi: dalle maiuscole divenute minuscole e viceversa, alle espressioni latine dell’originale impropriamente traslitterate in greco, ai già ricordati problemi di resa delle lettere ‘x’ e ‘s’.

In media, al momento di collazionare le bozze provenienti dalle singole unità locali, erano presenti quindici segnalazioni di errori per ognuna delle oltre 700 pagine a stampa e a queste se ne sono aggiunte altre, emerse all’occhio allenato dei membri dell’équipe torinese-alessandrina.

5. – L’inserimento delle novelle latine e l’ulteriore revisione del prodotto

Una volta terminato l’inserimento delle correzioni ai files relativi alle novelle greche, è stato pressoché naturale porsi il problema dell’eventuale aggiunta delle novelle in lingua latina al database, dal momento che per ovvie ragioni il gruppo coordinato dalla Bartoletti Colombo non aveva digitalizzato anche queste fonti. Non c’è stato alcun dubbio circa l’opportunità di una simile scelta, se non altro alla luce del criterio dirimente della massima aderenza all’edizione Schoell-Kroll assunta come riferimento. In questo modo, infatti, la futura edizione di BIA offrirà agli utenti la possibilità di consultare rapidamente il testo completo delle fonti pubblicate nei tre volumi della XII editio minor del Corpus Iuris Civilis.

Il lavoro di digitalizzazione, correzione e inserimento è stato curato dallo scrivente presso la sede torinese, insieme ai colleghi Raffaella Siracusa e Saverio Masuelli e ai dottori Enrico Sciandrello e Marco Antonio Fenocchio. In totale sono state aggiunte agli archivi interessati, all’incirca, 150 fonti, con un aumento di poco inferiore al 10% rispetto all’insieme di fonti già digitalizzate, in lingua greca.

Sebbene la mancanza dell’apparato critico nel database renda di fatto imprescindibile il raffronto con il testo a stampa, questa fondamentale integrazione, a completamento di un’opera di trasferimento su supporto elettronico ch’è certo tra le più rilevanti nel panorama giusantichistico, consentirà di svolgere con grandissima rapidità tutta una serie di confronti testuali, consultazioni e analisi statistiche che, viceversa, oggi richiedono una molteplicità di operazioni lunghe, laboriose e certamente più soggette al rischio dell’errore umano.

Proprio l’inserimento delle novelle in lingua latina, contenute nelle Novellae e nella Appendix II, rappresenta un apporto fondamentale in questo senso.

Se infatti la realizzazione del cdrom curato dall’unità di ricerca cagliaritana, contenente il testo delle Novelle e le epitomi di Teodoro e Atanasio, consentirà un rapido raffronto tra le diverse versioni di una medesima fonte, la pubblicazione nella nuova edizione di BIA delle novelle in lingua latina permetterà un’operazione semplicemente fondamentale, in chiave esegetica, anche con riguardo a testi del Digesto e del Codice. Lo strumento informatico, infatti, permette di verificare con grande velocità e affidabilità la ricorrenza di costruzioni sintattiche, eventualmente presenti in frammenti del Digesto o in novelle di lingua latina. Questa possibilità, lungi, dal rinverdire tout court uno dei filoni più noti della critica interpolazionistica, basata sulla verifica della «classicità» di determinate espressioni conservate nei testi ex inscriptione attribuibili ai giuristi romani, consente, oggettivamente, di ricavare delle evidenze preziose.

Il ricorrere di una espressione, di una particolare costruzione verbale, tanto in una costituzione di Giustiniano, quanto in un responso di Ulpiano, può, aprioristicamente, essere letta come una prova del classicismo dell’imperatore ovvero come un sintomo dell’intervento compilatorio su di un frammento inserito nel Digesto. Ciò che è però, obiettivamente, importante è la possibilità, rapida e automatizzata, del confronto, tale da mettere gli interpreti al riparo da possibili ricostruzioni teoriche viziate, in partenza, dalla mancata conoscenza, e fino ad oggi dalla non conoscibilità, di una particolare ricorrenza.

Naturalmente, lo strumento di per sé non basta: è non solo auspicabile, ma necessaria una generale evoluzione nell’approccio alle banche dati a disposizione dei giusantichisti, che peraltro alcuni lavori di giovani ricercatori lasciano presagire. In generale, infatti, continua ad essere prevalente un approccio alle fonti digitalizzate come comodo, sebbene assai pericoloso, sostituto della fonte edita su carta. Il cambio di prospettiva dovrebbe addirittura essere radicale: ogni studioso, con a disposizione la prossima edizione di BIA, non solo potrà, ma a parere dello scrivente, dovrà porsi una serie di domande che oggi non rientrano normalmente nei protocolli di ricerca solo perché lo strumento per rispondervi non esiste o, peggio, non è utilizzato che al 20% delle sue possibilità.

Basti un esempio a illustrare le ragioni di questa istanza. Il sostantivo ‘administrator’, secondo la versione in circolazione di BIA ricorre 34 volte nelle fonti ivi pubblicate. Trentun volte in costituzioni tardoantiche o giustinianee e tre volte in frammenti dei giuristi, rispettivamente Pomponio, Ulpiano e Paolo. Considerate le modalità con cui il segno è presente nei tre frammenti giusriprudenziali, si potrebbe ipotizzare una ipostatizzazione del sostantivo, che indica l’onerato dell’‘administratio’, piuttosto tarda ed un inserimento da parte dei compilatori anche in contesti ove non era originariamente presente. La consultazione delle novelle in lingua latina, consente di trovare due ulteriori ricorrenze del segno ‘administrator’, rispettivamente in Nov.52.praef.1 e Nov.114.1pr. D’altra parte, l’esame delle fonti letterarie, contenute nel Cdrom BTL2, permette di rinvenire una ricorrenza classica del segno, nel De oratore di Cicerone (1.210), mentre le sole altre quattro sono tutte appartenenti o successive al IV sec. d.C.

Com’è evidente non siamo alla messa a punto di un meccanismo automatizzato, tale da permettere di trarre dei dati interpretativi dalla linguistica computazionale, ma sembra intuibile che la possibilità di svolgere queste operazioni di verifica in pochi secondi possa legittimarne l’adozione, all’interno di un «protocollo di ricerca», come atto preliminare rispetto all’interpretazione di qualsivoglia fonte, utile per una prima, rapida verifica delle prime, fondamentali ipotesi circa la genuinità della stessa. Verificare le ricorrenze della costruzione linguistica su cui si basa l’ipotesi ricostruttiva, valutarne l’importanza statistica, può e deve rappresentare uno sforzo preliminare rispetto all’esegesi tradizionale perché può offrire degli spunti di riflessione estremamente utili e, soprattutto, ricavabili pressoché da ogni fonte scritta che conservi un frammento della sapienza giuridica romana. Non utilizzare in questo, che appare come il modo più appropriato, le novità tecniche già presenti sul mercato e ancora di più quelle future che questo lavoro ha inteso favorire, equivarrebbe a possedere una Ferrari e tenerla in garage ovvero limitarsi ad usarla per andare in edicola.

6. – L’ultima fase del lavoro

Dato l’alto numero di errori e refusi che sono stati riscontrati a seguito del lavoro svolto per l’inserimento delle novelle greche e latine all’interno del database FONTES di BIA, è apparso opportuno un ulteriore livello di verifica della rispondenza del testo digitale all’originale cartaceo. Non appare infatti verosimile che tutti gli errori siano stati individuati e corretti. Per tale ragione, con un apposito contratto, stipulato grazie a fondi di ricerca locale messi a disposizione dall’Università della Valle d’Aosta - Université de la Vallée d’Aoste, è stata individuata una nuova collaboratrice del progetto, Serena Teppa, dottoressa di ricerca in scienze storiche dell’antichità, con una specifica preparazione grecista. Alla dottoressa Teppa è stato affidato il controllo parola per parola del testo sin qui elaborato, al fine di offrire, entro l’estate 2007, un’integrazione di BIA che possa risultare di qualità soddisfacente. Il lavoro è stato regolarmente completato nei tempi stabiliti ed è così stato definitivamente messo a punto un database delle 168 novelle (cui si aggiungono le Appendices dell’edizione di riferimento), di eccellente livello qualitativo sotto il profilo della correttezza[10].

* La realizzazione del presente contributo è stata possibile seguendo le fasi del lavoro e utilizzando la relazione prodotti da Giuliano Salerno, tecnico che in collaborazione con l’unità di ricerca alessandrina, cui lo scrivente apparteneva, sotto la direzione del Prof. Paolo Garbarino, ha materialmente curato le operazioni informatiche di restituzione del database realizzato negli anni ’70, a partire dalla versione cartacea delle Novelle, degli edicta Iustiniani e dell’Appendix II, dal gruppo di lavoro coordinato dalla Prof. Campolunghi. Il supporto tecnico di Giuliano Salerno è stato reso possibile da un contratto ad hoc stipulato con il Dipartimento di Scienze Giuridiche ed Economiche dell’Università del Piemonte Orientale e finanziato dal PRIN 2004 “L’esperienza giuridica giustinianea dopo la Compilazione: le Novelle e la loro interpretazione da parte dei giuristi. Aspetto del lessico processuale civile”. Rispetto ad una semplice e sintetica descrizione dei procedimenti informatici eseguiti, il presente contributo punta ad offrire una più ampia disamina delle scelte operate a monte della materiale redazione del database oltre ad una cursoria presentazione dei principali concetti informatici richiamati nella descrizione ricordata, stante la possibile oscurità di alcuni di essi per la communitas dei giusantichisti. Sono d’obbligo sin d’ora, come intuibile, le scuse per quelle spiegazioni che, al lettore esperto, dovessero risultare pleonastiche.

[1] Le elaborazioni elettroniche prodromiche all’uscita della parte latina di G.G. Archi (mod.), A.M. Bartoletti Colombo (cur.), Legum Iustiniani Augusti Vocabularium, Novellae – Pars Latina, I, Milano 1977, IV, furono eseguite presso la divisione linguistica del CNUCE-CNR di Pisa, diretto da Antonio Zampolli, pioniere dell’elettronica applicata alla linguistica ed alla lessicografia in genere, e curate da E. Picchi e M. Sassi. La pars graeca, viceversa, richiedette un lavoro presumibilmente maggiore, che coinvolse sette studiosi nella fase di lemmatizzazione, preventiva rispetto alle elaborazioni elettroniche curate da Remo Bindi, presso quello che nel frattempo era divenuto l’ILC, diretto sempre da Antonio Zampolli: cfr. G.G. Archi (mod.), A.M. Bartoletti Colombo (cur.), Legum Iustiniani Augusti Vocabularium, Novellae – Pars Graeca, Indices, Milano 1984, s.n. ma IV.

[2] Un lasso di tempo obiettivamente enorme in campo informatico, se si pensa che, come dettagliatamente spiega la curatrice, il lavoro di trasferimento del testo dalla quarta edizione delle Novellae di Schoell e Kroll (1912) avvenne mediante schede perforate, intorno alla metà degli anni ’70, mentre nel 1984 (anno di realizzazione del volume degli indici della pars graeca) dopo questo strumento di archiviazione dati era già ampiamente caduto in disuso.

[3] A.M. Bartoletti Colombo, Introduzione, in G.G. Archi (mod.), A.M. Bartoletti Colombo (cur.), Legum Iustiniani Augusti Vocabularium, Novellae – Pars Latina, I, XIII. La stessa Autrice (nt. 15) chiarisce esplicitamente che «la quinta e ultima edizione stereotipa si presenta, sotto l’aspetto tipografico, meno corretta della quarta».

[4] Cfr. infra, testo e note.

[5] La standardizzazione del linguaggio in ambito informatico è una vicenda in continua evoluzione. Basti pensare che la prima versione del cosiddetto ASCII (American Standard Code for Information Interchanging) risale ai primi ’60. La necessità di un codice in grado di garantire uno standard è determinato dal fatto che gli elaboratori elettronici non conoscono lettere o numeri, ma solo combinazioni degli unici due segni che compongono il sistema binario (uno e zero). Le singole unità di informazioni che un elaboratore è in grado di considerare sono chiamate “bit” e sono rappresentate logicamente dai soli valori 1 e 0. Poiché la comunicazione richiede l’uso di lettere e cifre, è emerso come necessario, da ormai un cinquantennio, associare a ogni cifra, lettera, segno grafico o matematico in genere un codice binario standard. Il primo, più celebre di questi codici è stato il già menzionato ASCII, basato su una codifica dei caratteri a 8 bit (7 bit per la codifica più un bit di parità, usato per evitare errori nella trasmissione di dati). L’ISO (International Standard Organization), nel 1972, fece dell’ASCII il codice di riferimento e, nel corso degli anni incessanti aggiornamenti arricchirono la tabella delle corrispondenze che inizialmente era limitata all’alfabeto latino, ai numeri arabi e ad un certo numero di segni grafici e aritmetici in uso nei paesi occidentali, per un totale di 128 combinazioni binarie a sette cifre. Tuttavia, nel mondo si affermarono innumerevoli varianti nazionali del codice (volte a rispondere all’esigenza di rappresentare accenti ed altri segni grafici peculiari di ciascuna lingua) e si verificò una rilevantissima eccezione nell’adozione dell’ASCII, costituita da IBM (fino ai primi anni ’90, il termine di paragone per i costruttori di computer, che non a caso, quando non Macintosh, si distinguevano in «IBM» e «IBM compatibili»). Questi elementi, contribuiscono a chiarire in modo essenziale il perché la codifica adottata dall’Istituto di Linguistica Computazionale, trent’anni or sono, rappresenti oggi un limite insormontabile per la fruizione diretta di quel lavoro. All’inizio degli anni ’70 mancava una rappresentazione ASCII, internazionalmente accolta, per la lingua greca antica e segnatamente per la sua ricchissima varietà di combinazioni tra accenti e spiriti. Oggi le cose sono assai diverse, grazie all’affermarsi di uno standard che è rappresentato dall’UNICODE, basato in effetti sul cosiddetto «ASCII esteso» e, in origine, ideato per rappresentare i 256 caratteri sufficienti per le necessità dell’Europa Occidentale e del Nord America. Introdotto nel 1989 attualmente l’UNICODE subisce un aggiornamento all’anno, anche se le richieste di revisione sono continue, e sebbene non rappresenti ancora tutti i caratteri usati nel mondo, ha la potenzialità per farlo (la sua codifica originaria, a 16 bit, permetteva di rappresentare 65536 caratteri, ma oggi si è arrivati a un milione) e sono già entrati in questa «Babele telematica», anche gli alfabeti di molte lingue morte, come quelli cuneiformi, runici, etruschi oltreché, naturalmente, quello greco classico. Fino all’avvento di Unicode l’ortografia politonica della classicità greca non poteva essere correttamente rappresentata, dal momento che la precedente codifica dell’alfabeto ellenico a 8 bit, nota con la sigla ISO 8859-7 e introdotta nel 1987, non era in grado di rappresentare che i 69 caratteri usati nella moderna ortografia monotonica.

[6] I floppy disk nacquero, come noto, nel 1967 quando la IBM studiò un sistema semplice e poco costoso per caricare microcodice sui suoi mainframe System/370. Il risultato fu un disco di sola lettura, di 8 pollici (20 cm) di diametro, chiamato "memory disk". Da quella data fino alla fine degli anni ’90 il floppy disk ha subito un continuo sviluppo che lo ha portato a diventare sempre più piccolo e più capiente. La prima azienda ad incorporare un floppy disk drive in un personal computer fu la Olivetti, presentando alla fiera di Hannover nell'Aprile del 1975, il P6060. Cfr.: http://it.wikipedia.org/wiki/Floppy_disk.

[7] Il riferimento è al database relativo ai Basilici ed agli scholia agli stessi, realizzato a Frankfurt am Main, presso il Max-Plank-Institut für Rechtsgeschichte e a buon diritto considerato (almeno sino alla presentazione del lavoro di Yurij Vin e Anna Gridneva, descritto nel saggio The Byzantine Law Heritage and New Prospects of Its Information Research: The DataBase "Byzantine Law", in Riv. Dir. Rom. 6 (2006), http://www.ledonline.it/rivistadirittoromano/) come l’unico database, presente e consultabile in Europa, dedicato ai libri basilicorum. Per poter consultare questo archivio, decine di ricercatori negli anni hanno dovuto recarsi nella città tedesca, per utilizzare il programma di ricerca creato ad hoc per gestire la banca dati in lingua greca, ovvero hanno dovuto richiedere estratti cartacei dei risultati di ricerche condotte per loro dal personale del MPIER.

[8] Un sistema operativo (all’inglese OS, operating system) è il programma che controlla e gestisce l’hardware, che costituisce un computer, e le operazioni di base. Si occupa dei processi che vengono eseguiti e della gestione degli accessi degli utenti. Compito del sistema operativo è inoltre quello di virtualizzare le risorse hardware e software nei confronti dei programmi applicativi. A partire dai primi anni ’80 si è affermata la tendenza a prediligere computer dotati di una memoria di massa: per gestirla occorre gestore di file system, cioè un insieme di funzioni, esercitate da un unito software, che permetta di organizzare i dati sulla superficie dei mezzi di memorizzazione secondo una struttura ben precisa. I sistemi operativi che risiedono su disco (inizialmente si trattava di floppy, poi hard disk e, negli ultimi anni, più evolute unità di massa) capaci di gestire un file system sono detti genericamente Disk Operating Systems, cioè DOS appunto. L’esemplare più famoso di questa categoria è senz’altro il MS-DOS della Microsoft. MS-DOS è il sistema operativo, prodotto da Microsoft, che fu abbinato al primo Personal Computer IBM. Il nome deriva dalle iniziali della Microsoft, cioè MS, e dall’acronimo DOS ovvero Disk Operating System. Verso l'ottobre del 1980 la IBM stava cercando un sistema operativo per il suo nuovo prodotto, il PC IBM prossimo al lancio. Propose la realizzazione di questo alla Microsoft di Bill Gates e Paul Allen che allora produceva quasi solo linguaggi (come il ben noto Microsoft BASIC). Sulla base del lavoro realizzato dalla Seattle Computer Products, che aveva prodotto un sistema operativo chiamato 86-DOS, Microsoft realizzò il prodotto che soddisfò IBM. La Microsoft acquisì i diritti dell'86-DOS nel luglio 1981 e il mese dopo la prima versione di MS-DOS era sul mercato. L’MS-DOS è vissuto come prodotto a sé stante fino all’arrivo di Windows 95 che integrava per ragioni di compatibilità l’MS-DOS. Comunque da Windows 95 in poi l’MS-DOS non è stato più il sistema operativo principale dei personal computer, altresì detti IBM compatibili dal momento che negli anni 80 e (primi anni) 90 questa casa produttrice ha rappresentato lo standard di riferimento. Attualmente sopravvive solamente per mantenere la compatibilità con le datate applicazioni che lo utilizzano. L’ultima versione di MS/DOS è la 6.22 del 1994: dopo di allora non c’è stato ulteriore sviluppo per questo sistema operativo. Cfr.: http://it.wikipedia.org/wiki/sistemaoperativo e http://it.wikipedia.org/wiki/MS-DOS .

[9] Ecco un esempio di codifica RTF tratta dalla voce «RTF» di it.wikipedia.org:

{\rtf

Ciao!\par

Ecco del testo in {\b grassetto}.\par

}

Un word processor in grado di interpretare i comandi RTF, visualizzerà il seguente testo:

Ciao!

Ecco del testo in grassetto.

La presenza del simbolo di barra rovesciata (backslash) (\) indica l’inizio di un codice di comando RTF. Il comando \par introduce una nuova riga, e \b attiva il testo in grassetto. Le parentesi graffe ({ e }) definiscono un «gruppo»; l’esempio di codice precedente utilizza un gruppo per limitare il raggio d’azione del comando \b. Tutto il resto viene trattato come testo semplice, o da «formattare». Un documento RTF valido è a sua volta un gruppo il cui primo comando è \rtf.

[10] La correzione del testo delle Novellae ha evidenziato ancora un significativo numero di errori, che possono essere ascritti ad alcune categorie più generali:

- numerazione delle Novellae mancante;

- numerazione dei paragrafi interni alle Novellae mancante (per la prima parte del corpus) o scorretta (‘$’ laddove ci si aspetterebbe ‘#’);

- punteggiatura scorretta o mancante;

- vocaboli mancanti (in rari casi);

- suddivisione tra Novellae mancante (in rari casi);

- inscriptiones mancanti;

- occorrenza del carattere ‘c’ laddove ci dovrebbe essere ‘x’;

- occorrenza, all’interno di parola composta, del carattere sigma tondo (s) laddove avrebbe dovuto trovarsi un sigma uncinato (j).