Generatore di testi


Questo giochino deriva da una delle prime apparizioni su Le Scienze (N°185, gennaio 1984) di Brian Hayes, autore delle "(Ri)creazioni al calcolatore" a cavallo fra il 1983 ed il 1984.

Si tratta di far ricavare un testo (un elaborato, uno scritto...) da parte di uno stupido programma, sullo stile di un dato scrittore... Lo scopo è cioè di verificare se e quanto, tramite un programma software, sia possibile emulare la struttura sintattica (non semantica!!!!) di un autore... in qualsiasi lingua esso scriva...

E' particolarmente difficile rendere l'idea di cosa questo programma faccia in realtà; ci provo qui nel seguito. Per maggiore chiarezza rispetto a quanto io possa fornire, leggetevi l'articolo originale!

Supponiamo di avere un testo scritto da un dato Autore; a titolo di esempio scelgo il primo capitolo dei Promessi Sposi del Manzoni, quale classico incontestabile e volutamente asettico (cioè privo di connotazioni individualisticamente selezionate o politicamente ritenibili poco corrette). Non esprimo giudizi personali sul testo scelto, che potrei personalmente gradire molto, poco, o per niente; lo scelgo quale riferimento neutro.

Allora; partiamo dal primo parametro interessante del programma, che è la profondità di analisi; poniamola ad esempio uguale a 4 (è comunque selezionabile da 2 a 10 nel programma). Il programma legge il testo (il celebre "Lago di Como che volge a mezzogiorno...") e seleziona a caso 4 caratteri consecutivi dal testo stesso (tanti quanti la profondità di cui sopra). Supponiamo che scelga i 4 caratteri "conf"; questi 4 caratteri sono riportati pari pari nel testo di uscita che costituisce il risultato provvisorio del programma.

Poi il programma si chiede: ma il Manzoni, quello lì..., quando scriveva "conf", cosa faceva seguire a tali 4 lettere? Almeno di solito?

Analizzando il testo, si vede che l'Alessandro ha utilizzato, nel primo capitolo della sua opera primaria, la costruzione "conf" nelle seguenti 9 occasioni:

Cioè, ad un conf del Manzoni segue (almeno nel primo capitolo):

E allora, il programma sceglie, a caso, una di queste lettere (l, e, i, u, r), pesate secondo le probabilità di occorrenza, e la accoda nel testo di uscita.

Supponiamo che venga scelta la "e"; quindi il testo di uscita diviene "confe".

Adesso il processo si ripete; ma i 4 caratteri di cui tener conto sono adesso "onfe"; questo gruppo appare due volte nel testo originale del Manzoni:

e quindi, al 50%, dopo "onfe", il Manzoni usava scrivere una "s" o una "t" indifferentemente, almeno in base al 1° capitolo dei Promessi Sposi. Il programma poniamo scelga a caso la "s"; il nostro testo di uscita contiene adesso "confes".

E via discorrendo; se si procede come sopra, si finisce per costruire un testo "sullo stile del Manzoni del 1° capitolo dei Promessi Sposi", con profondità 4:

Confessi di nuovi sfogo, l'illustrissimo, taglian palazzo, don Abbondio, ci perso insiderava a tutto di sogliar per educa di contorno, guardo, - per toccasser voi in quel tutto peggia d'un difendentirà, per del lago che si e gran Conte, - ripieno... torno a liberi! l'anni di quiete, ognuno del monio ci vuol altro si pene, ch'io siam qui un burberi! l'acqua e nuove, esser dir la lo fisso. Ma una grida, a qua e ruberi! l'altro prendiamo; e, alla costati e parte due, per amor don mano accenne:

Maggiore la profondità prescelta, maggiore risulta l'aderenza al testo originale; qui sotto un testo a profondità 8; quasi identico all'originale non di certo come significati e contenuti, ma sicuramente come assonanza.

Non desiderava altro ch'egli v'entrò, con una gamba spenzolata al di fuori, il 5 decembre 1600, una nuova grida prese le sue esenzioni, prescrive:
"Che qualsivoglia persona, così di quelle che conduceva a cavalcioni s'era staccato dalle gride non toccavano, per prospetti più opportuni, per educazione, o anche la peggio. Non potere, a cui difficile, per così spesso ragioni contro que' suoi panni. Se la cosa avesse peccato consigliere e capricciose, con un taglio così stravolto, che fino a un...

Quindi si può dire che la procedura seguita sembra cogliere il suono, lo stile dell'autore, pur naturalmente non riuscendo a ripeterne le creazioni.

Vediamo un altro esempio, costruito stavolta sul 1° canto dell'Inferno dantesco, stavolta con profondità 6:

Ch'i' fui per patria ambedui.
Nacqui sub Iulio, ancor che l'avrà rimessa ne la sua città e l'altezza.
E qual era è cosa dura
esta selva selvaggia diserto,
«Miserere di me degna:
con lei ti lascerò nel mio cammino,
e 'l superbo Ilión fu combusto.
Ma poi ch'i' v'ho scorte.
Io non sì che 'l piè d'un colle giunto,
là onde 'nvidia prima quella valle
che tu sii, od omo certo!».
Rispuose poi che 'l sol montava 'n sù con quella fonte
che tu sii, od omo certo!».
Rispuos'io lui con tanta pietà

La cosa è particolarmente interessante se il testo originale è in una lingua a noi sconosciuta, come per me il tedesco; partendo da un testo di circa 3000 caratteri (una recensione del Siddharta di Hesse), viene fuori il seguente brano (di profondità 7). Se mi capitasse davanti qualcosa di simile, non avrei esitazioni a dire che si tratta di un brano in lingua tedesca, e non sospetterei minimamente di nulla...

Von der Reden Buddhas, sondern nur durch eigene Erfahrung erworben werden kann. In bedächtiger, ja schon kunstvoller Sprache verpackt, bestätigt, daß es auf einen weiten Weg, den Weg des Schülers, des Asketen, Lebemann und daß die Weisheit. Doch diesem Ziel zu nahen ist sondern WIE. Den Weg muß jeder selber ankommt und nicht nur stilistisch in den asiatischen Diktion der Sonne des Flußufer, beim Bade, bei den heiligen Opfern. Schatten des Feigenbaumes wuchs Siddhartha ist sein Vorname - und ergründet, was von jedem einzelnen geglaubt werden, sondern auch wirkungsgeschichtlich durch die millionenfache Verbreitung, die das Buch in der rhythmischen Ländern gefunden hat.Hermann Hesse, am 2. Juli 1877 in Calw/Württemberg als Sohn eines jungen Mensch bestätigt Hesse unseren Verdacht, daß Glücklich- und Zufriedesein sehr viel mit Augen öffnen, sehen und menschlichen Formen der Frömmigkeit gemeinsam ist, was über allen nationalen Verschiedenheiten steht, was allen nationalen Verschiedenheiten steht, was über allen Konfessionen und menschlichen Formen der Frömmigkeit gemeinsam ist, was allen Konfessionen und staunen zu tun hat. Siddhartha auf, daß die Weisheit

Il programma allegato contiene alcuni brani da cui partire, fra cui quelli sopra menzionati. Se ne possono aggiungere altri a piacimento nel formato txt.

Scarica qui il programma GenTesti!


   14 novembre 2002, Bruno Davide     Scrivi a Bruno DAVIDE


Vai alla genealogia  Torna a home page  Invia informazioni  Legge sulla privacy  Copyrights ©