mercoledì 25 marzo 2020

Curiosità

Entropia delle traduzioni

Cosa ha a che fare la termodinamica con le traduzioni? Che legame c’è tra Google e l’entropia? Per rispondere è necessario innanzitutto tener conto che qualsiasi traduzione per essere affidabile deve far si che una frase non cambi significato da una lingua all’altra. Per cui tradurre in una lingua e poi tornare alla lingua originaria dovrebbe poter fornire la stessa frase da cui si era partiti. Ebbene questo ciclo, se effettuato con un servizio di traduzione on-line come Google, non fornisce i risultati sperati, e questo piccolo ciclo di traduzione non è sempre molto efficiente.

Per rendere rigoroso il ragionamento consideriamo un ciclo termodinamico.
Tecnicamente un ciclo termodinamico è una serie di trasformazioni eseguite da un motore termico di modo che un fluido passi attraverso una serie di stati fisici per poi tornare allo stato iniziale. Nel motore a scoppio di una automobile accade proprio questo: il gas che è formato da una miscela di aria e carburante, che viene compresso, fatto “scoppiare” (e quindi fatto riespandere). A partire dall’energia estraibile in teoria da una certa quantità di carburante, e misurando l’energia effettivamente estratta (che mette in movimento l’automobile e, ad esempio, accende i fari) si può calcolare il rendimento termodinamico. Un’auto a benzina raggiunge un rendimento del 28%, in un diesel si arriva al 38%. Ma questo solo nel migliore dei casi, cioè a velocità costante. Nell’uso tipico di città il rendimento di un benzina scende al 14-16% e di un diesel al 21-22%.
Per chi è ha qualche conoscenza di termodinamica o di teoria dell’informazione, sottolineamo che il rendimento è un buon indice dell’entropia di un sistema, e quindi dell’aumento del disordine (provocato dalla dissipazione di calore) con conseguente diminuzione di ordine ed informazione (per esempio la forma delle molecole complesse del carburante viene irrimediabilemente persa, diciamo anche “dimenticata”, una volta trasformato questo in ossidi di carbonio, di azoto, polveri sottili e quant’altro si disperda dal tubo di scappamento di un’auto).
Ed è così che un ciclo termodinamico non è altro che qualcosa che ci fornisce un lavoro (ad esempio ci sposta da una parte all’altra di una città) consumando energia e favorendo la perdita di informazione. Il motore di un’automobile è solo un esempio di questo tipo di macchine, ma per analogia possiamo immaginare che di qualsiasi “motore” che comporti una certa trasformazione di un qualche oggetto in qualcos’altro, comportando una variazione nel contenuto informazionale, possa essere messo in relazione con un rendimento.
Prendiamo ad esempio la traduzione di un testo da una lingua, ad esempio l’italiano, ad un’altra, l’inglese. Quanto sarà la variazione di contenuto informazionale se, chiudendo il ciclo, applichiamo la traduzione inversa, dall’inglese all’italiano?
Proviamo con qualche traduttore automatico on-line, come il servizio di Altavista (http://world.altavista.com/) o quello di Google (http://www.google.it/language_tools?hl=it).
Una volta scelta la frase ed eseguito il ciclo ITALIANO – INGLESE- ITALIANO , possiamo valutare il rendimento del “motore” semplicemente vedendo quanta informazione della frase sia andata perduta.
In un semplice esempio usiamo la frase “Questa è una frase di prova per testare l’entropia generata da una traduzione multipla.” che viene tradotta da Google in “This is one phrase of test in order to test the entropy generated from one multiple translation.” Indipendentemente dalla correttezza o meno della frase, andiamo ad applicare la traduzione inversa ed otteniamo: “Ciò è una frase della prova per verificare l’entropia generata da una traduzione multipla.”. Ed ecco che confrontando le frasi inziale e finale, abbiamo delle parole differenti: Questa–> Ciò; di–> della; testare –> verificare. Il computo totale delle lettere originali andate perduta fornisce un rendimento dell’80%, mentre se consideriamo che nel contesto considerato le parole “testare” e “verificare” sono sinonimi, allora il rendimento sale al 90%.
Ovviamente si può fare lo stesso gioco applicando alla frase un ciclo di traduzioni più ampio, ad esempio ITALIANO – INGLESE – TEDESCO – FRANCESE – INGLESE – ITALIANO, con il seguente risultato: “Questo è una frase della prova, per cui l’entropia da esaminare che è prodotta tramite una traduzione multipla.”
Qui il rendimento è diminuito fino al 67% senza aver tenuto conto dei caratteri generati in surplus e l’ordine non esatto delle parole.

Insomma, la traduzione diventa abbastanza scandente, ma la vostra automobile fa comunque di peggio!

Articolo di Davide Troise

Nessun commento:

Posta un commento