Questo blog partecipa a questa iniziativa con una piccola provocazione. Questa foto mi è sembrata emblematica di come a volte si fanno le cose con tanta buona volontà, poche risorse e errori marchiani.
Va detto che c’era l’ascensore nel palazzo.
Lasciare le cose come stanno è meglio di fare una legge fessa. Anche questo blog si augura che il governo ci ripensi.
Passo davanti al televisore mentre il programma di Minoli parla del libro di Dan Brown e sento una voce che legge una frase che lamenta il fatto che albe e tramonti si siano ridotti a lunghezze d’onda e che la complessità dell’universo si riduca a un insieme di equazioni.
Com’è ingenuo questo modo di ragionare, solo a chi non ha nessuna comprensione per la matematica e per la fisica può sfuggire il fatto che queste equazioni, se esistono, hanno la stessa meravigliosa ricchezza di sfaccettature di quello che rappresentano.
Eppure questa cosa semplice sfugge a tutti gli uomini di cultura che non hanno comprensione per la scienza: che chi ama la matematica la venera per l’eleganza e la bellezza che proietta sull’universo, un concetto affine, chissà forse isomorfo, allo stupore di chi vede il disegno di Dio nel tessuto delle cose.
Per uno come me, che si è formato sui canoni della Internet prima del browser, è sempre interessante fare dei confronti fra le forme di comunicazione nelle diverse fasi evolutive.
La internet dei blog ha visto un’esplosione della pubblicazione, ma, stranamente, anche un peggioramento della discussione per lo meno sotto certi punti di vista, vediamo come.
Nel 1985 non c’erano molte scelte e i canali di comunicazione erano sostanzialmente tre: la posta per le comunicazioni da persona a persona, le mailing list per le discussioni da fare in pubblico fra un gruppo ristretto di persone, per esempio i membri di un team di progetto, magari distribuiti geograficamente sulle sponde di due oceani.
L’ultima forma di discussione, la discussione pubblica a tema avveniva sulle Usenet news.
Le news, che adesso sono più note come parte di Google Groups, erano una specie di forum di discussione realizzati riciclando in larga parte il formato dei messaggi di posta e aggiungendo una directory globale di argomenti, mutuata dall’allora nascente domain name system.
I gruppi di discussione avevano nomi come comp.lang.c++, comp.lang.c o alt.guitar.bass. Ogni gruppo di discussione era dedicato a un argomento specifico. Le uscite dal seminato erano poco tollerate.
C’erano almeno tre cose notevoli di quel periodo che francamente mancano adesso.
In primo luogo l’elemento portante della discussione era un formato dati definito in uno standard pubblico, come è oggi HTML. Il trasporto dei messaggi si basava su un protocollo definito in uno standard pubblico. Grazie a NNTP i server che partecipavano alla discussione, sostanzialmente tutti i grandi server aziendali, si collegavano punto a punto e si scambiavano gli elenchi dei messaggi per stabilire cosa copiare da uno all’altro. I documenti presenti a un capo e non all’altro venivano trasmessi in modo da aggiornare lo stato di entrambi i server partecipanti a uno scambio.
Così, di scambio in scambio, con questo meccanismo detto store and forward (conserva e inoltra) i messaggi si propagavano – lentamente – per tutta la rete.
Gli archivi di quei messaggi sono stati conservati e Google possiede sostanzialmente tutto quello di cui si è dibattuto dagli anni ’80 ad ora, quindi quelle discussioni sono state persistenti e sono sopravvissute alla nascita del PC IBM, a MS-DOS, a Windows. Perché l’organizzazione era estesa oltre i computer.
Le news erano più aperte, più persistenti, più organizzate dei forum e dei blog di oggi e la discussione era più organizzata e navigabile.
Oggi le tue parole sono dentro facebook o Friendfeed, o sparse per i vari blog senza garanzie di persistenza nel caso che qualche sito chiuda, di consistenza fra siti diversi, di indicizzabilità e reperibilità. In ultima analisi non sono più le tue parole ma il content offerto da servizi di relazione di massa o dal blog in cui hai iniziato una discussione.
L’unico strumento che cerca di dare una visione unitaria di ciò che viene detto in contesti diversi è Friendfeed, che però viene – purtroppo – utilizzato solo per veloci chat, come IRC. Non è un problema di Friendfeed, che permette anche interventi più lunghi di Twitter, ma un problema di come ci si mette in relazione su Friendfeed.
(segue)
Il grafico di correlazione fra la frequenza di certe ricerche su Google e un fenomeno sociale, come l’influenza, che si può osservare su google.org, è un esempio folgorante di come si può sfruttare l’enorme mole di dati che raccoglie Google per fini del tutto diversi dalla ricerca sul web.

La correlazione fra le ricerche su Google legate all'influenza e i dati dell'agenzia governativa di controllo e prevenzione delle malattie
Le interrogazioni che contengono parole chiave legate all’influenza sono legate all’insorgenza di casi di influenza in modo diretto, come è mostrato dall’animazione dei dati. L’analisi di questi dati, è temporalmente avanti di due settimane ai dati clinici del Center for Disease Control and Prevention (CDC), un dato straordinario.
Detto in termini semplici, Google predice l’andamento dell’influenza con due settimane di anticipo rispetto ai dati clinici.
L’animazione sul sito, che vi invito a guardare, è anche un’illustrazione eccellente del concetto di correlazione statistica.
I medici cercano, per esempio, la correlazione fra l’assunzione di un farmaco sperimentale e la guarigione dei pazienti, o fra certe abitudini alimentari e certe malattie. Spesso c’è uno sfasamento temporale fra un fenomeno, come fumare quaranta sigarette al giorno, e un altro fenomeno, come ammalarsi di tumore. In ogni caso si cerca la correlazione.
In marketing si cerca la correlazione fra canali e campagne e risultati economici o di immagine misurabili.
Che ci sia una correlazione fra le interrogazioni a Google e l’influenza è molto interessante: significa anche che si chiede a Google molto prima che al medico e anche prima di un ricovero o una richiesta di terapia, dati che arrivano due settimane più tardi, per l’appunto.
Va anche aggiunto che in pratica è molto difficile trovare a priori ricerche utili per creare indicatori sociali utilizzabili, mentre naturalmente a posteriori si può tracciare il percorso di un’epidemia sul motore di ricerca scegliendo le parole chiave giuste.