di Simone Cosimi

Come si addestra – o sarebbe meglio dire, alleva – un’intelligenza artificiale? Come noto agli algoritmi di machine learning, che stando alle ultime scoperte di Google-DeepMind possono perfino lanciarsi nel mondo dell’immaginazione, occorre una gigantesca quantità di dati per funzionare in modo efficace. Per questo, secondo molti osservatori, dalla qualità dei big data – cioè della loro origine, dalla conservazione, dal trattamento e dalla modifica – dipende buona parte del successo di questo promettente settore. D’altronde, tra le leggi non scritte del mondo informatico e tecnologico ce n’è una, esiziale e valida ancora di più oggi, che dice più o meno “trash in, trash out”. Con l’intelligenza artificiale questo assunto da combattimento ha un’importanza ancora più centrale: senza istruire in modo efficiente le macchine non ci sarà nulla di buono da attendersi da esse.

In fondo questi sistemi, che stanno rivoluzionando pressoché ogni ambito umano (dalla previsione delle malattie alla guida autonoma non solo su strada ma anche di aeromobili, com’è già da tempo, e imbarcazioni fino all’intrattenimento) non sono esenti da errori. Spesso anche banali. Il più delle volte imputabili al tipo di informazioni che sono state fornite per il training di un certo gruppo di algoritmi. Uno dei modi che si stanno affermando, anzi dei “metodi” per così dire, è il crowdsourcing. Di sistemi in cui i big data raccolti dalle fonti più varie, per esempio dai sensori racchiusi nei ånostri smartphone, siano stati utilizzati per allenare gli algoritmi ce ne sono molti. La missione di Mighty AI, invece, è in parte diversa.

Si tratta di una startup di Seattle, già nota come Spare5, che punta a sviluppare una visione diffusa del training delle intelligenze artificiali. Dall’esterno il business appare abbastanza semplice: dopo essersi iscritti gli utenti si vedono assegnati dei semplici compiti, ciascuno dei quali ricompensato con una piccola somma. Le assegnazioni possono essere davvero di ogni genere: possono per esempio includere il ritaglio di un’immagine, la descrizione sintetica di una scena di un film o una classificazione, cioè l’attribuzione di un voto a una serie di oggetti. Fra i microtask c’è davvero di tutto. Sono azioni che solitamente una rete neurale artificiale, per quello che è l’attuale stadio di sviluppo, può effettuare in completa autonomia. Ma solo – questa l’importanza del contributo umano – dopo un allenamento di qualità. Proprio come un giocatore di calcio, che ha in serbo la tecnica ma senza la quale non ottiene nulla senza un periodo di ritiro e di corretta alimentazione, un algoritmo necessita di un adeguato periodo di esercizio per perfezionare le proprie qualità.

Il meccanismo ricorda in parte quello di Mechanical Turk, la piattaforma messa in piedi da Amazon anche per questo tipo di obiettivi: “Il meccanismo si basa sull’idea che ci sono ancora moltissime cose che gli esseri umani sanno fare meglio e in modo più efficiente dei computer come identificare gli oggetti in una foto o in un video, eliminare duplicazioni di dati, trascrivere registrazioni audio o ricercare dati specifici” si legge nella presentazione della piattaforma. Più o meno lo stesso tipo di mansioni richieste a chi sceglie di aderire a Mighty AI.

Non è un caso che la società sia spuntata dai laboratori di Madrona Venture, principale rivale mobile di Mechanical Turk, nel 2014. Così come non è casuale che siano entrati alcuni mesi fa tre nuovi investitori estremamente pesanti nel capitale della startup per un totale di 14 milioni di dollari. Sono Intel Capital, Google Ventures e Accenture Ventures. Con la prima e l’ultima sigla, fra l’altro, ci sono anche delle partnership operative.

C’è tuttavia una differenza. La forza lavoro che Mighty AI cerca e propone alle sue società è spesso qualificata o comunque di un certo genere, ritagliata cioè su misura di una certa necessità. Come racconta un servizio di Bloomberg, fra i diversi esempi ci sono esperti di golf per Ibm, persone in grado di descrivere immagini per Getty Images o radiologi e tecnici per analizzare scansioni, tac e altri documenti alla ricerca di tumori. Ma ci sono anche altri tipi di compiti, come istruire il sistema di un’auto autonoma sul tipo di ostacoli da evitare durante la corsa con una maschera di segmentazione semantica degli scenari proposti.

“C’è una corsa alle armi per quanto riguarda il cosiddetto training data” ha spiegato a Bloomberg il Ceo Matt Bencke che ha appunto spiegato qualche esempio di lavori già svolti. Ibm, ovviamente per la sua suite di supercomputer Watson, voleva creare un chatbot che interagisse con gli spettatori di un importante torneo di golf dello scorso anno. Tramite tablet in loco o i propri smartphone il pubblico ha potuto chiacchierare con l’assistente e chiedere informazioni. Il problema? Non c’erano abbastanza informazioni relative a quello sport sufficienti per addestrare un chatbot e renderlo spontaneo nella conversazione. Mighty AI è intervenuta e ha pagato le persone, selezionate fra chi avesse una minima esperienza nel golf, per scremare una grande massa di dati forniti da Ibm. Su quella base di dna informativo è nato il chatbot che ha fatto compagnia agli spettatori.

“Ciò che ci piace di Mighty AI è che per un sacco di nostri clienti il primo passo è spesso accumulare dati, ancora prima che possano utilizzare i nostri hardware e i nostri software di intelligenza artificiale – spiega Ken Elefant, managing director di Intel Capital per i programmi e la sicurezza – con Mighty AI tutta questa raccolta avviene molto più velocemente e quindi sostenendo i nostri clienti a sviluppare più rapidamente le loro soluzioni”.

Se alcune compagnie tentano spesso di risolvere questo enorme problema – riassumendo: dati di pessima qualità, pochi dati per settori specifici, dati aggiuntivi necessari per allenare a dovere un sistema di intelligenza artificiale – in completa autonomia, altre passano appunto da piattaforme come Mechanical Turk o CrowdFlower. Mighty AI porta invece l’offerta di allenamento in crowdsourcing un passo più avanti. Puntando molto sulla professionalità: 200mila utenti in 155 Paesi lavorano sul sito e la startup li valuta, cioè analizza il loro lavoro. Se l’utente funziona bene, cioè svolge i compiti in modo molto utile alle macchine, viene pagato di più e gli vengono proposti più task. Se funziona male, è destinato a essere escluso dal programma.

Fra l’altro, Bencke ha di recente dichiarato a Wired Usa che la piattaforma, in un capolavoro di metaintelligenza, utilizza proprio il machine learning per capire gli ambiti in cui ciascun utente in carne e ossa sia più esperto. Di conseguenza finirà per assegnargli compiti sempre in quei settori. Un lavoro con cui ovviamente non ci si arricchisce, al contrario. Ma che dà l’idea delle gigantesche necessità dell’intelligenza artificiale e dei margini di manovra che intorno ad essa si sviluppano.