Archivio Datini
CNR-Opera del Vocabolario Italiano
Guida ai contenuti


1 Lemmatizzazione

Il presente corpus raccoglie le lettere edite dell'ampio carteggio dell'Archivio Datini, lemmatizzate selettivamente (per la consistenza del corpus si veda la bibliografia). Sono state ricondotte ad un lemma, ossia alla forma base sotto cui convenzionalmente si registrano le varietà grafiche e morfologiche di un nome, un aggettivo, un verbo ecc., solo le occorrenze significative dei termini rilevanti ai fini di una ricostruzione della vita economica e giuridica, nonché dei rapporti sociali dell'epoca.

Sono stati inoltre lemmatizzati i nomi propri di persona, di luogo, di enti e istituzioni, di navi, di edifici, riconducendo in questo caso ad un lemma comune non solo le molteplici varietà linguistiche, ma anche le varie modalità espressive e di designazione del referente. Per i criteri seguiti per tali nomi vedi i §§ 1.2, 1.3, 1.4.

Al lemma è stata sempre assegnata una categoria lessicale (cfr. § 1.1), e talvolta si sono aggiunti un disambiguatore e un commento. Il campo denominato disambiguatore è deputato ad accogliere ulteriori informazioni in merito al lemma, in particolare con finalità di specificazione; tale campo è stato usato di frequente nei nomi propri, e spesso per distinguere i diversi tipi di singole unità merceologiche (cfr. gli ess. ai §§ 1.2, 1.3, 1.4, 1.5, 2).

Nel campo commento si sono inseriti rimandi alle note editoriali, qualora utili ai fini della comprensione delle scelte di lemmatizzazione, e osservazioni sugli usi di alcuni toponimi (cfr. § 1.3).

Alla maggior parte dei lemmi è stata associata una lemmatizzazione di secondo livello, i cosiddetti iperlemmi, per cui si veda il § 2.



1.1 Categorie lessicali

Tutti i lemmi sono accompagnati da una categoria lessicale, che ne specifica la funzione nel discorso ed il valore grammaticale. Sono state adoperate le seguenti categorie:

agg. = aggettivo;
antr. = nome di persona;
avv. = avverbio;
n.g. = nome di luogo;
n.p. = nome proprio;
s.f. (eventualmente s.f.pl.) = sostantivo femminile (sostantivo femminile plurale);
s.i. = sostantivo di genere incerto;
s.m. (eventualmente s.m.pl.) = sostantivo maschile (sostantivo maschile plurale);
v. = verbo.

In alcuni casi sono stati unificati lemmi attestati con due diverse funzioni grammaticali, ed è stata adoperata una categoria lessicale 'doppia', del tipo agg./s.m.



1.2Nomi di persona

Sono stati lemmatizzati con categoria lessicale antr. ('antroponimo') tutti i nomi di persona, eventuali soprannomi, e cariche specifiche nel caso in cui l'indicazione rimandi ad un preciso personaggio storico individuato (v. ad es. i lemmi luigi ii (duca d'angiò), o giangaleazzo visconti (conte di virtù),e le forme ad essi correlate). L’iniziale minuscola anche nei nomi propri è dovuta al software GATTO (che non distingue).

Quando non si è potuto identificare con certezza il personaggio, si è adoperata la formula del tipo:

lemma cardinale di padova
cat. less. s.m.
disambiguatore pers. non identificato.

Data la grande variazione grafica nei nomi propri, sono state effettuate alcune normalizzazioni grafiche:

1) le forme niccolaio, niccolò, nicolò, sono state ricondotte al lemma niccolò; le forme niccola, nicola, sono state ricondotte al lemma nicola;
2) l'alternanza buo- / bonsignore è stata ricondotta al lemma senza dittongo bonsignore;
3) le forme del tipo gabriello sono state ricondotte al lemma gabriele;
4) le forme del tipo ghirig- / greg- / grigoro (-orio) sono state ricondotte al lemma gregorio;
5) le forme del tipo guasparre (-o) sono state ricondotte a gaspare;
6) le forme del tipo ludovico (-a) sono state ricondotte a lodovico (-a);
7) nei lemmi è stata sempre adoperata la grafia iacopo (e non jacopo).

Quando possibile viene fornito il nome completo (nome + patronimico + cognome), sul modello di francesco di marco datini; in assenza del patronimico viene fornito solo il cognome (es. galeazzo salvagio), e in assenza di quest'ultimo o il solo patronimico o la provenienza e/o il mestiere (posposto, tra parentesi), come ad es. in betto da casale o in betto di giovanni (trombatore). Nel caso in cui di un personaggio si sappia soltanto che appartiene ad una compagnia, è stata adoperata la dicitura socio di seguita dal nome del titolare della filiale di appartenenza; es.: antonio (socio di salvestro barducci) antr.

Il patronimico è stato posposto al cognome (tra parentesi) nei casi in cui l'antroponimo in questione funga esso stesso da patronimico, per evitare rinvii lunghi; es. domenico di donato, ossia Domenico Bandini, è lemmatizzato domenico bandini (di donato), perché esistono i lemmi margherita di domenico bandini, bartolomeo di domenico bandini, isabetta di domenico bandini, ecc. (che altrimenti dovrebbero essere margherita (bartolomeo, isabetta) di domenico di donato bandini, ecc.).

I titoli tipo ser, messer sono stati inclusi nel lemma solo in assenza del cognome, per facilitare la distinzione di omonimi, posponendoli al nome (tra parentesi); ad es. un cristofano privo di ulteriori elementi di identificazione e preceduto dal titolo ser è stato lemmatizzato cristofano (ser), ma cristofano de bartolo preceduto dal titolo ser è stato lemmatizzato cristofano di bartolo carocci. Ancora solo in assenza del cognome si è accolto a lemma il titolo nei patronimici; es.: francesco di ser giovanni è stato ricondotto al lemma francesco di ser giovanni da vico, ma nanni di ser iacopo è stato ricondotto al lemma nanni di iacopo villani.

Secondo la medesima logica si sono accolti nei lemmi i titoli religiosi (frate, don, monaco, posposti al nome, tra parentesi) solo in assenza del cognome; ad es. francesco di iacopo pucci, frate, è stato lemmatizzato francesco di iacopo pucci, mentre un frate donnino dell'ordine francescano è stato lemmatizzato donnino (frate).

Nei casi in cui non è stato possibile reperire ulteriori informazioni, è stato adoperato il nome secco, e nei casi di omonimie i lemmi sono stati disambiguati aggiungendo al nome un numero posto tra parentesi tonde; eventuali ipotesi e proposte sono state registrate nel disambiguatore, secondo il seguente stile:


lemma bartolo (2)
cat. less. antr.
disambiguatore lo stesso che bartolo (1)?
oppure:
lemma negro (il)
cat. less. antr.
disambiguatore negro toscano (il)?

Gli antroponimi femminili sono stati trattati, quando possibile, come i maschili (es. lisa di ugolotto degli agli); solo in mancanza del cognome e/o del patronimico sono state date indicazioni del tipo donna di..., vedova di..., madre di..., serva di... o il semplice monna (o madonna) - riportando il titolo dal documento - posposti al nome, tra parentesi (es.: diana (donna di iacopo zarini)). Se è noto il nome della madre si è utilizzato un lemma del tipo sandra (figlia di leonarda panciatichi).

Nel caso di ginevra, g. di francesco, ecc., si è preferito lemmatizzare ginevra (figlia naturale di francesco datini) piuttosto che ginevra di francesco datini.

La categoria lessicale antr. è stata usata anche per i nomi di famiglia, segnalati come tali nel disambiguatore; il nome designa per lo più la famiglia intesa come nucleo parentale ed economico, ma in alcuni casi può rimandare ad una parte politica: si vedano ad es. i lemmi adorno o campofregoso (di), disambiguatore nome di famiglia, e le relative occorrenze.


1.3Nomi di luogo

Sono stati lemmatizzati come n.g. ('nome geografico') i nomi di città, paesi, contrade, località, vie, piazze, porte; sono stati lemmatizzati come n.g. anche specifici edifici, come chiese, monasteri, palazzi, ospedali. Per questi ultimi, così come per i nomi delle vie, delle piazze, delle porte, in disambiguatore è stata indicata la città in cui si trovano; allo stesso modo, per le località di minore importanza è stata indicata in disambiguatore la località nota più vicina. Per es.:


lemma romita (la)
cat. less. n.g.
disambiguatore presso prato.

In mancanza di una localizzazione del toponimo, in disambiguatore è stata adoperata la dicitura loc. non identificata.

Nei casi in cui un toponimo è strettamente legato ad un tipo di merce, tanto da essere adoperato in uso sostantivato per designarla, esso è stato legato all'iperlemma di pertinenza della merce stessa. È il caso ad esempio di san matteo, che indica lo specifico tipo di lana prodotta in San Matteo, a Valenza, che è stata lemmatizzata come segue:


lemma san matteo
cat. less. n.g.
disambiguatore a valenza
commento rif. alle lane ivi prodotte
iperlemma pelletteria e tessili.

Nei casi in cui il toponimo occorre anche autonomamente sono state distinte le singole occorrenze (si veda ad esempio il lemma romania).

I toponimi sono stati lemmatizzati secondo il nome odierno, a meno che questo non sia eccessivamente disforme dalle forme attestate; in quest'ultimo caso, così come per i toponomi stranieri 'italianizzati' nei testi, si è lemmatizzato adoperando il lemma desunto dalla documentazione, ma postponendo tra parentesi tonde la forma odierna. Per es. la forma Antona, ossia l'odierna Southampton, è stata lemmatizzata antona (southampton) n.g.



1.4Nomi propri

Sono stati lemmatizzati con categoria lessicale n.p. ('nome proprio') i nomi di ordini religiosi, di navi e di alcune istituzioni (per i primi due si è aggiunta in disambiguatore rispettivamente la dicitura ordine religioso e nome di nave, mentre per le istituzioni si è aggiunto - quando possibile o rilevante - il nome della città in cui esse operavano).



1.5 Sostantivi e aggettivi

Tutte le varianti linguistiche di sostantivi e aggettivi sono state ricondotte al lemma italiano. Nella lemmatizzazione dei sostantivi indicanti merci di diverse qualità si è adoperato il disambiguatore per distinguere le varie tipologie. Ad es., per i vari tipi di pelle, oltre al lemma pelle (non disambiguato) si trovano anche i lemmi pelle con disambiguatore pelle di camoscio, pelle con disambiguatore pelle di cervo, pelle con disambiguatore pelle di montone, ecc.; o ancora, oltre al lemma zafferano (non disambiguato) si trovano anche i lemmi zafferano con disambiguatore zafferano abruzzese, zafferano con disambiguatore zafferano belingeri, zafferano con disambiguatore zafferano monferrino, ecc.

Poiché nelle liste di merci spesso si menziona il prodotto solo alla prima occorrenza, richiamandolo successivamente tramite gli specifici attributi (siano essi aggettivi o sostantivi), in questi casi sarà opportuno integrare la ricerca per lemmi con una ricerca per disambiguatore; per gli esempi citati, infatti, il disambiguatore pelle di montone si ritrova anche in riferimento al lemma montone, il disambiguatore zafferano orta anche in relazione al lemma orta.

La categoria lessicale agg./s.m. è stata adoperata nei casi in cui gli aggettivi abbiano anche uso sostantivato; in alcuni di questi casi il lemma corrispondente è stato legato ad un iperlemma senza ulteriori specificazioni nel disambiguatore. Per es., i lemmi bianco, cilestrino, vermiglio agg./s.m., sono stati associati all'iperlemma pelletteria e tessili sia che si riferiscano a un panno in genere, alla lana, ad un fustagno sia che si riferiscano ad un capo confezionato.

Si tenga infine presente che sono stati esclusi dalla lemmatizzazione tutti i termini adoperati in accezione puramente figurata e gli etnici.



2 Gli iperlemmi

L'iperlemma è ciascuna delle 22 'categorie' entro le quali sono stati distribuiti i lemmi del corpus. Si tenga presente che non tutti i lemmi sono stati associati ad un iperlemma; sono stati soltanto lemmatizzati (e non iperlemmatizzati), oltre ai nomi di persona e di luogo, termini e verbi afferenti al campo religioso o all'agricoltura, le parti del corpo, i nomi della settimana, i termini generici mese e anno, ecc.

Gli iperlemmi sono distribuiti come segue:


1.    abbigliamento e arredi, che include i manufatti tessili o in pelle adoperati come arredi della casa (tipo tendaggi, tovaglie, coperte) o come capi d'abbigliamento o accessori.

2.      alimenti, che include cibi e bevande. Sono considerati 'alimenti' sia le pietanze già pronte che i vegetali e le carni crude, nonché gli animali vivi destinati all'alimentazione.

3.      animali, che include tutti gli animali che non siano destinati alla cucina né alla pelletteria.

4.      arti e mestieri, che include gli ordini artigiani e i diversi mestieri. Non include gli esercizi di attività di natura eminentemente giuridica (cfr. economia diritto politica).

5.      calendario, che include i nomi delle ore del giorno, dei mesi, delle calende, delle festività. I giorni in cui si festeggia un santo sono stati lemmatizzati come segue:

lemma san giovanni (giorno di)
cat. less. s.m.
iperlemma calendario.

6.       economia diritto politica, che include la vasta gamma di termini riguardanti il campo del diritto e quello dell'economia. Vi si trovano nomi di istituzioni, attori giuridici e funzionari (come giudici, notai, cancellieri, camerlenghi), operazioni economiche e giuridiche, termini con pregnanza economica, nomi di tasse e balzelli, operazioni commerciali, ecc.

7.      edilizia e architettura, che include gli edifici o le parti strutturali di una costruzione.

8.      materiali, che include le materie prime destinate a lavorazione (e non riconducibili né alla categoria metalli né a minerali), i vari tipi di legname, le vernici, i coloranti, le resine, ecc.

9.      medicina, che include sia i nomi di patologie che i rimedi (per lo più di tipo erboristico) per la cura; include i vegetali, le sostanze estratte dai vegetali, e i composti minerali con proprietà officinali. Accoglie anche termini veterinari.

10.  metalli, che include i metalli allo stato grezzo o intesi come materiale di fabbricazione di un oggetto.

11.  militare, che include tutti i termini riconducibili all'ambito militare, dall'abbigliamento alle armi, agli uomini impegnati in guerra.

12.  minerali, che include i minerali allo stato grezzo.

13.  monete, che include i nomi delle monete.

14.  navigazione, che include i nomi generici e propri delle navi, i funzionari marittimi e tutte le operazioni (tecniche e commerciali) riguardanti specificamente il commercio marittimo.

15.  parentele, che include i nomi designanti i rapporti di parentela.

16.  pelletteria e tessili, che include i termini dell'arte tessile e della pelletteria, dalle materie allo stato grezzo ai vari tipi di tessuto e di filati, di panni e di pelli.

17.  pesi e misure, che include i diversi tipi di pesi e di misurazione per le merci, inclusi i relativi imballaggi e i recipienti, qualora questi ultimi designino una quantità. I recipienti sono stati pertanto 'suddivisi' tra quest'ambito e il campo utensili e mobilio, a seconda se prevalga il loro ruolo di 'oggetto' o di 'contenitore-unità di misura' (si veda in proposito la distribuzione del lemma botte).

18.  preziosi, che include pietre preziose, oggetti di valore e sostanze pregiate quali l'incenso e la mirra.

19.  spezie, che include tutte le spezie, e le loro diverse qualità.

20.  tecnica, che include per lo più verbi, riguardanti un 'fare' specifico, operazioni artigianali e specifiche tecniche di lavorazione.

21.  utensili e mobilio, che include una vasta gamma di oggetti d'uso della vita quotidiana (sia di uso domestico che utili ad es. nelle cavalcature), numerosi manufatti e i nomi dei mobili casalinghi. È una delle categorie in cui si rivela molto utile controllare il disambiguatore per capire la logica dell'assegnazione di un lemma apparentemente estraneo a quest'ambito (v. ad es. il lemma giubbone, con disambiguatore aguglia da giubbone).

22.  vegetali, che include nomi generici di alberi o di semi privi di una specifica funzione (e pertanto non riconducibili né ad alimenti né a medicina).

Nota relativa alle pagine della Guida in Linea di GattoWeb
Quando si fa riferimento alle singole lettere dell'Archivio Datini intese come elementi costituenti il corpus testuale, queste possono essere citate indifferentemente come 'lettere' oppure come 'testi'.