ULTIMA ORA:
Post title marquee scroll
Caso Ariston, ambasciatore russo: "Nostra risposta ad azioni ostili". Farnesina: "Forte disappunto"-Truffati per 'presunti' figli in Brasile, complice italiano per la setta?-Stupro di gruppo a Palermo, processo con rito ordinario: prima udienza il 15 maggio-Indagine Altroconsumo, 'liste d’attesa Ssn incubo per 9 italiani su 10'-Incidente a Pescara, perde il controllo della moto e si schianta a terra: morto giovane-Presta-Amadeus, Fiorello questa volta rinuncia a fare battute-Porti, Adsp Mtcs è definitivamente riconosciuta come porto Core-Energia, Emanuela Trentin (Siram Veolia): "Transizione e decarbonizzazione processi necessari e irreversibili"-Burioni contro Susanna Tamaro: "Ragionamenti identici a quelli dei somari antivaccinisti"-Sostenibilità, Arcobaleno Cial dà benvenuto ai 175mila visitatori di Comicon-Energia, Pulsee Luce e Gas entra nel fotovoltaico domestico con Green+-Montenero (Polizia stradale): "Prevenzione e cooperazione contro furti d'auto"-Cardinali (Unrae): "Auto più connesse, più servizi ma anche più esposte a cyber attack"-Ghinolfi: "Noleggio nel mirino dei truffatori"-Iperti: "Dietro furti reti internazionali, fanno gola le dotazioni hi-tech"-Equo compenso: Int, risposta a Mimit su decreto attuazione per professionisti ex lege 4/2013-Elezioni europee, social promuovono candidatura Giorgia Meloni: sì per il 60%-Ascolti tv, Rai1 vince prima serata con 'Makari'-Kenya, crolla diga nel sud: circa 40 morti e decine di dispersi-Il fisico Vincenzo Schettini ospite alla Lum

Il nostro DNA culturale e’ nei libri, e ora e’ online

Condividi questo articolo:

Per la sua affinità alla genomica, i ricercatori lo hanno denominato ’culturomics’, vale a dire genoma culturale. Ora, dopo quattro anni di lavoro, i frutti di questo ambizioso progetto, nato dalla collaborazione tra Università di Harvard, Google, Encyclopaedia Britannica e American Heritage Dictionary, sono stati descritti in un articolo apparso sull’ultimo numero di Science. Si tratta di un set di dati estremamente potente, costruito a partire da 5,2 milioni di volumi e ben 500 miliardi di parole: pari a circa il 4% dei libri ad oggi pubblicati.
“Questo patrimonio digitale – spiegano gli autori – verrà utilizzato secondo criteri quantitativi ripresi, appunto, dalla genomica: servirà per studiare l’evoluzione di una serie di fenomeni culturali e storici, sulla base dei cambiamenti nella frequenza dei termini usati nel corso di secoli e decenni”. Con una metafora, è possibile paragonarlo a un “reperto fossile” della cultura umana, riportato in vita grazie alla digitalizzazione dei testi.

“L’interesse per gli approcci computazionali alle scienze umane e sociali risale agli anni Cinquanta”, ha detto Jean-Baptiste Michel, ricercatore presso il Dipartimento di Psicologia e Programmazione per le Dinamiche Evoluzionare di Harvard. “Finora, però, i tentativi di utilizzare i metodi quantitativi nello studio della cultura sono stati ostacolati dalla mancanza di dati appropriati. Adesso, grazie a questo lavoro, abbiamo un grande set di dati, disponibile tramite una interfaccia che è al tempo stesso facile da usare e disponibile gratuitamente a tutti”.

A realizzare questo strumento sono stati gli ingegneri di Google: essenzialmente si tratta di un’interfaccia che consente agli utenti di digitare una parola o una frase, per poi vedere come è cambiata la sua frequenza durante i secoli. “La culturomica estende i confini dell’indagine quantitativa a un ampio spettro di nuovi fenomeni nelle scienze umane e sociali”, ha aggiunto Erez Lieberman Aiden, l’altro autore dell’articolo. “Navigare tra questo patrimonio di dati è un’esperienza affascinante per chiunque sia interessato a capire ciò che ha interessato le persone nei secoli. Inoltre, speriamo che gli accademici delle discipline umanistiche lo trovino uno strumento utile ed efficiente”.

L’insieme dei dati digitali è migliaia di volte più grande rispetto a ogni altro corpus storico collezionato finora. Circa il 72 per cento del testo è in inglese, il resto si divide tra francese, spagnolo, tedesco, cinese, russo ed ebraico. Messe insieme, tutte le lettere compongono una sequenza 1.000 volte più lunga del genoma umano. Se tutti i caratteri venissero disposti in linea retta, si otterrebbe una linea pari a dieci volte la distanza tra il nostro pianeta e la Luna. “Ora che una frazione significativa dei libri del mondo è stata digitalizzata, è possibile per i programmi di analisi computerizzata rivelare trend nascosti in campi come la storia, la cultura, il linguaggio e il pensiero filosofico”, ha concluso Jon Orwant, ingegnere e manager di Google Books.

Questo articolo è stato letto 4 volte.

Comments (4)

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.

Ecoseven è un prodotto di Ecomedianet S.r.l. Direzione e redazione: Lungotevere dei Mellini n. 44 - 00193 Roma
Registrazione presso il Tribunale di Roma n° 482/2010 del 31/12/2010.redazione@ecoseven.net