Non appena sono entrato nel reparto di ricerca e sviluppo di General Intuition presso l’ufficio di New York, il cofondatore e amministratore delegato trentunenne dell’azienda, Pim de Witte, ha indirizzato la mia attenzione su un monitor appollaiato su una scrivania. Sembrava che qualcuno stesse giocando a qualcosa come Fortnite. Non era una persona.
“Il nostro agente ha giocato per 100 ore di fila”, ha detto raggiante Kent Rollins, il responsabile della produzione della società.
Prima che potessi immergermi nello spettacolo di un’intelligenza artificiale che navigava nell’ambiente virtuale del gioco, ho sentito i passi elettronici di un grande robot quadrupede che si avvicinava.
“Lo stesso cervello che alimenta l’agente che gioca sta alimentando il robot”, mi ha detto de Witte. Josh Duplantis, un analista di dati che trasportava un laptop che trasmetteva in streaming un feed live dalla singola telecamera del robot, è intervenuto per spiegare che la modalità predefinita del bot era “esplorazione”.
Facendo affidamento su quella telecamera, sul suo occhio singolare, il gigantesco robot simile a un insetto si è avvicinato a me, mi ha girato intorno e ha continuato nell’ufficio. Di tanto in tanto tagliava le gambe delle sedie o sbatteva contro un bidone della spazzatura vagante, proprio come un bambino che non ha ancora imparato come il suo corpo si relaziona con il mondo che lo circonda. Duplantis ha affermato che sono bastati solo otto minuti di dati robotici del mondo reale per mettere a punto un modello di intelligenza artificiale per il quadrupede. Inoltre, i dati sono stati raccolti per strada, non all’interno dell’ufficio in cui il bot si stava attualmente spostando.
Un modello agente che può generalizzarsi dal gameplay alla simulazione fino all’incarnazione è la ragion d’essere di General Intuition. E la capacità di quel modello di capire il suo posto nel mondo si è assicurata il sostegno di alcuni pezzi grossi.
Giovedì, General Intuition ha dichiarato di aver raccolto 320 milioni di dollari per una valutazione di 2,3 miliardi di dollari, confermando il precedente rapporto di TechCrunch. Il round porta il finanziamento totale dichiarato di General Intuition a 454 milioni di dollari, dopo il round di 134 milioni di dollari raccolto al momento del lancio lo scorso ottobre.
La startup è stata creata dall’altra società di de Witte, Medaglia, che consente ai giocatori di caricare e condividere clip di videogiochi. Le centinaia di milioni di ore di gioco caricate hanno fornito il set di dati iniziale per addestrare il modello di General Intuition al ragionamento spazio-temporale o alla comprensione di come muoversi nello spazio e nel tempo.
Ma l’ingrediente chiave non erano le riprese del gameplay; erano le etichette delle azioni incorporate in quelle clip: registrazioni di esattamente quali pulsanti un giocatore ha premuto e quando. La maggior parte dei concorrenti, afferma de Witte, cercano di dedurre le azioni solo dal video, cosa che secondo lui non è sufficiente.
“Consideriamo questo solo come la fase successiva della futura pre-formazione”, ha detto de Witte. “Abbiamo un unico modello in grado di rispondere alle informazioni di Fortnite sullo schermo e agire, ma anche alle dinamiche del mondo reale in un modo che un LLM non potrebbe mai.”
A un certo punto, de Witte mi ha messo a disposizione un laptop che eseguiva il modello mondiale di General Intuition, un ambiente simulato generato fotogramma per fotogramma anziché renderizzato da un motore di gioco tradizionale. Come faccio spesso quando collaudo i modelli del mondo, sono entrato direttamente in una serie di muri. In altre demo che ho provato, gli agenti che controlli a volte passano attraverso, ma questa no. Dai milioni di ore di gioco, in qualche modo ha imparato che i muri sono muri, le scale servono per scalare e le ombre si allungano man mano che il sole si muove.
Per General Intuition, questo modello mondiale non è il prodotto; è l’ambiente di allenamento (denominato internamente “la palestra”). L’azienda alla fine vuole vendere il modello agente stesso, e de Witte sostiene che i dati di azione incorporati nel gameplay aiutano il modello a discernere il “sé” dall’“ambiente” in un modo che gli fornisce una comprensione più ricca della causalità.
Per quanto impressionante sia la tecnologia di General Intuition che appare nelle demo, l’azienda non è l’unica a cercare di risolvere questo problema. Inoltre, non è ancora stato fatto in modo che un modello del genere possa reggere nel mondo fisico, su larga scala. La maggior parte degli approcci di questo tipo richiedono enormi quantità di dati del mondo reale, raccolti lentamente e in modo costoso. La scommessa di General Intuition è che il gameplay è una scorciatoia scalabile.
Anche i suoi investitori sono d’accordo con questa scommessa. L’ultimo round di General Intuition è stato guidato da Khosla Ventures, con la partecipazione di General Catalyst, Jeff Bezos, Eric Schmidt, Nico Rosberg e ricercatori di Google DeepMind e MIT.
La stragrande maggioranza del round sarà destinata al ridimensionamento della capacità di elaborazione. General Intuition ha un accordo con CoreWeave e prevede di concentrarsi sul pre-addestramento della prossima versione del modello. Una parte è stata destinata a rendere la sua API più ampiamente disponibile entro la fine dell’estate.
Vinod Khosla, la cui azienda ha guidato il round, afferma di essere stato attratto dalla visione di de Witte e dalla posizione dei dati proprietari dell’azienda.
“Se guardi agli LLM, quando è emerso il ragionamento, è stato un salto di qualità”, mi ha detto Khosla in un’intervista telefonica. “Nei modelli del mondo, penso che il salto quantico sia l’emergere dell’intuizione nell’intelligenza artificiale, una capacità simile all’intuizione umana. I dati sulle azioni umane e i dati sulle reazioni che abbiamo nei giochi sono la parte fondamentale per l’emergere dell’intuizione.”
La visione è un’azienda generazionale

General Intuition non è l’unica azienda a notare che i dati sulle azioni umane di Medaglia sono un pezzo chiave del puzzle della costruzione di modelli dinamici del mondo e di agenti generali. Brianna Martin, capo dello staff della startup, ha affermato che la società è nata, in parte, dopo che Medaglia ha rifiutato un’offerta di acquisizione da parte di un importante laboratorio. Da allora ci sono state anche altre offerte.
De Witte e i suoi co-fondatori, Eloi Alonso, Adam Jelley e Vincent Micheli, non sono interessati ad essere acquisiti, e nemmeno gli investitori della startup stanno ancora cercando un’uscita. La quantità e la qualità dei dati proprietari che General Intuition ha tramite Medaglia è uno dei motivi per cui Khosla è convinto che la startup sia una scommessa generazionale, non un obiettivo di M&A; che potrebbe diventare la spina dorsale per agenti generalizzati e modelli mondiali nella simulazione e nel mondo reale.
“A questo punto, si tratterebbe di un’acquisizione di dati, il che è poco interessante”, ha detto Khosla.
Parte di questa scommessa implica anche la fiducia nei valori di de Witte.
L’imprenditore ha lavorato per tre anni nel campo umanitario, anche con Medici Senza Frontiere. Pertanto, ha tracciato una linea chiara su come verrà utilizzata la tecnologia di General Intuition: nessun agente sarà impiegato per danneggiare gli esseri umani.
“Non vogliamo essere una parte integrante del sistema”, ha detto de Witte. “Diciamo che dovessi uscire allo scoperto e dire: ‘Stiamo facendo un’autonomia letale.’ Cosa pensi che accadrebbe in altri paesi?”
Questo limite ai casi di utilizzo militare arriva mentre la Silicon Valley sta diventando sempre più ottimista nei confronti della guerra, anche se De Witte afferma di essere felice che i suoi modelli vengano utilizzati per missioni di ricerca e salvataggio.
De Witte è olandese e gran parte del suo team è europeo, il che plasma l’identità dell’azienda. Dice di aver coinvolto Martin in parte a causa della sua decisione di farlo lasciare pubblicamente Palantir sul suo lavoro con l’Immigration and Customs Enforcement degli Stati Uniti.
“Non so perché la Silicon Valley fa quello che fa”, ha detto. “C’è una ragione per cui non sono lì.”
L’etica di De Witte non limita semplicemente ciò che i modelli non faranno. Essendo un giocatore che ha guadagnato 1,5 milioni di dollari costruendo e ospitando un server RuneScape privato da adolescente, de Witte sta anche pensando a cosa succede alle persone che rimangono indietro rispetto a ciò che possono fare i modelli di intelligenza artificiale.
General Intuition ha recentemente lanciato una piattaforma chiamata Nerve, un mercato del lavoro che consente ai giocatori di guadagnare denaro utilizzando le configurazioni esistenti. Coloro che si iscrivono iniziano con l’etichettatura dei dati e possono eventualmente passare alla teleoperazione robotica e ad altre attività. La base utenti di Medaglia, ha osservato de Witte, è proprio la generazione più esposta allo spostamento guidato dall’intelligenza artificiale, e vuole che abbiano un interesse in ciò che verrà dopo.
Un volano di dati
De Witte vuole che General Intuition sia un abilitatore dell’ecosistema, come Anthropic o OpenAI, un fornitore di modelli che consenta ad altri di sfruttare la sua tecnologia. Oggi, la startup ha una manciata di clienti nel settore dei giochi, della simulazione e della robotica.
“Non costruiremo un’azienda di auto a guida autonoma”, ha detto de Witte. “Renderemo 10 volte più semplice per il prossimo individuo costruire un’azienda automobilistica a guida autonoma.”
L’azienda afferma che una volta che avrà messo la sua API nelle mani di più clienti, sarà in grado di mettere alla prova il suo coraggio con una varietà di casi d’uso, come testare un robot in un gemello digitale di una fabbrica, alimentare un bot simile a quello umano all’interno di uno studio di gioco o inviare un quadrupede a navigare in ambienti pericolosi.
Sebbene un quadrupede sia la prima incarnazione fisica che General Intuition ha provato nel mondo reale, ha anche provato droni e altri dispositivi, incluso testare il modello nei giochi di guida.
“Funziona su tutto ciò che puoi controllare utilizzando un controller di gioco o un mouse con tastiera”, ha affermato de Witte.
Uno degli obiettivi è la possibilità di costruire un volano dati.
“Sceglieremo i clienti in cui possiamo diversificare le incarnazioni per le quali questo modello di fondazione generalizzato funge da spina dorsale”, ha affermato de Witte. “Quindi daremo priorità alla scelta dei clienti in base alla loro capacità di offrire dati del mondo reale che saranno interessanti e utili per spostare l’ago della ricerca. E se disporranno di un team interno agile in cui possiamo essere veri partner integrati e imparare gli uni dagli altri.”
Khosla ha affermato che i dati proprietari di General Intuition sono ciò che ha permesso di arrivare fin qui, e la sua capacità di continuare a raccogliere dati che nessun altro possiede sarà essenziale. Soprattutto perché, nonostante le dimostrazioni impressionanti, se il trasferimento dalla simulazione al mondo reale possa reggere su larga scala è una questione aperta a cui nessuno ha ancora risposto completamente.
Correzione: il titolo in precedenza indicava erroneamente quanto General Intuition ha raccolto in questo round. L’errore è stato corretto.
Quando acquisti tramite i link presenti nei nostri articoli, potremmo guadagnare una piccola commissione. Ciò non pregiudica la nostra indipendenza editoriale.