Social

Twitter ci dice come è bella la sua ricerca in tempo reale, e come fa i soldi

di Alessandro Moretti

La ricerca in tempo reale è molto difficile. Con il vecchio stile web-crawling, la ricerca su desktop, produce una serie di risultati stabili, forte grazie alle relazioni in rete che aiutano a verificare i risultati, e ci sono un sacco di dati. È necessario disporre di algoritmi intelligenti per poter avere dei risultati il più velocemente possibile, classificarli correttamente, e rilevare eventuali errori nel sistema.

La ricerca in tempo reale funziona in un’altro modo, ha bisogno di trovare dei dati in movimento, con un sacco di piccole parte che si trovano un po’ ovunque.

Un posto sul blog di ingegneria di Twitter, pubblicato da Edwin Chen e Alpa Jain, pongono due problemi fondamentali nella ricerca in tempo reale:

Il popolo esegue delle query che molto probabilmente nessuna ha mai visto, quindi è impossibile sapere il contesto specifico e che cosa significhino. Come si fa a sapere se #bindersfullofwomen si riferisca alla politica, e non ad accessori per ufficio, o che le persone che cercano “cavalli e le baionette” sono interessati a dibattiti presidenziali?

Dal momento che questi picchi di query di ricerca sono di durata breve, c’è una sola piccola finestra di opportunità per imparare il loro significato.

Ma ecco il colpo oscuro del genio dietro all’uso delle enormi masse di persone che aiutano a risolvere il significato delle ricerche su Twitter: parte del compito dei giudici e anche quello di abbinare termini di ricerca spiking con immagini, eventi e altre categorie che possono aiutare Twitter a servire la relativa pubblicità. “Per esempio, si supponga che i nostri valutatori ci dicono [Big Bird] è legato alla politica, la prossima volta che qualcuno esegue questa ricerca, sappiamo che gli annunci sono indirizzati alla politica”.

fonte | The Verge