Generatore di testi
Questo giochino deriva da una delle prime apparizioni su Le Scienze (N°185, gennaio 1984) di Brian Hayes, autore delle "(Ri)creazioni al calcolatore" a cavallo fra il 1983 ed il 1984.
Si tratta di far ricavare un testo (un elaborato, uno scritto...) da parte di uno stupido programma, sullo stile di un dato scrittore... Lo scopo è cioè di verificare se e quanto, tramite un programma software, sia possibile emulare la struttura sintattica (non semantica!!!!) di un autore... in qualsiasi lingua esso scriva...
E' particolarmente difficile rendere l'idea di cosa questo programma faccia in realtà; ci provo qui nel seguito. Per maggiore chiarezza rispetto a quanto io possa fornire, leggetevi l'articolo originale!
Supponiamo di avere un testo scritto da un dato Autore; a titolo di esempio scelgo il primo capitolo dei Promessi Sposi del Manzoni, quale classico incontestabile e volutamente asettico (cioè privo di connotazioni individualisticamente selezionate o politicamente ritenibili poco corrette). Non esprimo giudizi personali sul testo scelto, che potrei personalmente gradire molto, poco, o per niente; lo scelgo quale riferimento neutro.
Allora; partiamo dal primo parametro interessante del programma, che è la profondità di analisi; poniamola ad esempio uguale a 4 (è comunque selezionabile da 2 a 10 nel programma). Il programma legge il testo (il celebre "Lago di Como che volge a mezzogiorno...") e seleziona a caso 4 caratteri consecutivi dal testo stesso (tanti quanti la profondità di cui sopra). Supponiamo che scelga i 4 caratteri "conf"; questi 4 caratteri sono riportati pari pari nel testo di uscita che costituisce il risultato provvisorio del programma.
Poi il programma si chiede: ma il Manzoni, quello lì..., quando scriveva "conf", cosa faceva seguire a tali 4 lettere? Almeno di solito?
Analizzando il testo, si vede che l'Alessandro ha utilizzato, nel primo capitolo della sua opera primaria, la costruzione "conf" nelle seguenti 9 occasioni:
confluente
confessi
confidati
confuso
confraternite
confratelli
confidenza (2 volte)
confetti
Cioè, ad un conf del Manzoni segue (almeno nel primo capitolo):
1 volta su 9 una "l" (11,1%)
2 volte su 9 una "e" (22,2%)
3 volte su 9 una "i" (33,3%)
1 volta su 9 una "u" (11,1%)
2 volte su 9 una "r" (22,2%)
E allora, il programma sceglie, a caso, una di queste lettere (l, e, i, u, r), pesate secondo le probabilità di occorrenza, e la accoda nel testo di uscita.
Supponiamo che venga scelta la "e"; quindi il testo di uscita diviene "confe".
Adesso il processo si ripete; ma i 4 caratteri di cui tener conto sono adesso "onfe"; questo gruppo appare due volte nel testo originale del Manzoni:
confessi
confetti
e quindi, al 50%, dopo "onfe", il Manzoni usava scrivere una "s" o una "t" indifferentemente, almeno in base al 1° capitolo dei Promessi Sposi. Il programma poniamo scelga a caso la "s"; il nostro testo di uscita contiene adesso "confes".
E via discorrendo; se si procede come sopra, si finisce per costruire un testo "sullo stile del Manzoni del 1° capitolo dei Promessi Sposi", con profondità 4:
Confessi di nuovi sfogo, l'illustrissimo, taglian palazzo, don Abbondio, ci perso insiderava a tutto di sogliar per educa di contorno, guardo, - per toccasser voi in quel tutto peggia d'un difendentirà, per del lago che si e gran Conte, - ripieno... torno a liberi! l'anni di quiete, ognuno del monio ci vuol altro si pene, ch'io siam qui un burberi! l'acqua e nuove, esser dir la lo fisso. Ma una grida, a qua e ruberi! l'altro prendiamo; e, alla costati e parte due, per amor don mano accenne: |
Maggiore la profondità prescelta, maggiore risulta l'aderenza al testo originale; qui sotto un testo a profondità 8; quasi identico all'originale non di certo come significati e contenuti, ma sicuramente come assonanza.
Non desiderava altro ch'egli v'entrò, con una gamba spenzolata al di fuori, il 5 decembre 1600, una nuova grida prese le sue esenzioni, prescrive: |
Quindi si può dire che la procedura seguita sembra cogliere il suono, lo stile dell'autore, pur naturalmente non riuscendo a ripeterne le creazioni.
Vediamo un altro esempio, costruito stavolta sul 1° canto dell'Inferno dantesco, stavolta con profondità 6:
Ch'i' fui per patria ambedui. |
La cosa è particolarmente interessante se il testo originale è in una lingua a noi sconosciuta, come per me il tedesco; partendo da un testo di circa 3000 caratteri (una recensione del Siddharta di Hesse), viene fuori il seguente brano (di profondità 7). Se mi capitasse davanti qualcosa di simile, non avrei esitazioni a dire che si tratta di un brano in lingua tedesca, e non sospetterei minimamente di nulla...
Von der Reden Buddhas, sondern nur durch eigene Erfahrung erworben werden kann. In bedächtiger, ja schon kunstvoller Sprache verpackt, bestätigt, daß es auf einen weiten Weg, den Weg des Schülers, des Asketen, Lebemann und daß die Weisheit. Doch diesem Ziel zu nahen ist sondern WIE. Den Weg muß jeder selber ankommt und nicht nur stilistisch in den asiatischen Diktion der Sonne des Flußufer, beim Bade, bei den heiligen Opfern. Schatten des Feigenbaumes wuchs Siddhartha ist sein Vorname - und ergründet, was von jedem einzelnen geglaubt werden, sondern auch wirkungsgeschichtlich durch die millionenfache Verbreitung, die das Buch in der rhythmischen Ländern gefunden hat.Hermann Hesse, am 2. Juli 1877 in Calw/Württemberg als Sohn eines jungen Mensch bestätigt Hesse unseren Verdacht, daß Glücklich- und Zufriedesein sehr viel mit Augen öffnen, sehen und menschlichen Formen der Frömmigkeit gemeinsam ist, was über allen nationalen Verschiedenheiten steht, was allen nationalen Verschiedenheiten steht, was über allen Konfessionen und menschlichen Formen der Frömmigkeit gemeinsam ist, was allen Konfessionen und staunen zu tun hat. Siddhartha auf, daß die Weisheit |
Il programma allegato contiene alcuni brani da cui partire, fra cui quelli sopra menzionati. Se ne possono aggiungere altri a piacimento nel formato txt.
Scarica qui il programma GenTesti!
14 novembre 2002, Bruno Davide
Vai alla genealogia Torna a home page Invia informazioni Legge sulla privacy Copyrights ©