Venerdì, il creatore di Claude Code, Boris Cherny, è apparso alla conferenza @Scale di Meta e, sorprendentemente, la prima domanda del pubblico riguardava i loop.
“I loop sono il prossimo ciclo di hype”, ha chiesto l’interrogante, “o sono reali?”
La risposta di Cherny è stata un deciso “sì, sono veri”, ha detto.
“Due anni fa, abbiamo scritto il codice sorgente a mano. Abbiamo iniziato la transizione in modo che gli agenti scrivessero il codice. E ora stiamo passando al punto in cui gli agenti chiedono agli agenti di scrivere il codice”, ha continuato. “Per quanto grande sia stato il passaggio dal codice sorgente agli agenti, i loop sono altrettanto importanti e un passo altrettanto grande.”
Più avanti nel discorso (intorno alle 32:00 nel video di YouTube pubblicato sopra), Cherny è entrato nei dettagli sui cicli che continua a eseguire nel suo lavoro. Un agente è continuamente alla ricerca di modi per migliorare l’architettura del codice, mentre un altro cerca astrazioni duplicate che possano essere unificate. Inviano richieste pull come qualsiasi altro programmatore e, poiché il codice cambia costantemente, non smettono mai di funzionare.
È un’idea potente, soprattutto con una figura significativa come Cherny alle spalle. Con il passaggio all’intelligenza artificiale degli agenti, l’attenzione della maggior parte degli utenti è stata quella di gestire i propri agenti nel miglior modo possibile: stabilire obiettivi chiari, verificare unità discrete di progresso e non lasciare che si allontanino troppo dal prompt. Il ciclo fa un ulteriore passo avanti autorizzando uno sciame di agenti a lavorare continuamente in background, all’infinito. C’è molta fiducia da riporre nell’intelligenza artificiale, ma con il rapido miglioramento dei modelli, potrebbe essere il passo successivo per consentire all’intelligenza artificiale di gestire il lavoro reale.
La prima cosa da riconoscere è che questa non è del tutto nuova. I cicli ricorsivi – funzioni che richiamano se stesse per ripetere un’azione, insieme a una condizione che interrompe il ciclo – sono un pilastro dei corsi introduttivi di informatica. Questi cicli seguono una logica non deterministica – cioè è un sub-agente che sceglie quando fermare il ciclo invece di una condizione chiara – ma è all’opera lo stesso approccio di base. Non appena i programmatori iniziarono a utilizzare l’intelligenza artificiale per completare le attività, era destinata a emergere una versione del ciclo ricorsivo, con l’intelligenza artificiale che supervisionava l’intelligenza artificiale.
A differenza dell’informatica classica, i loop degli agenti possono essere incredibilmente semplici. Uno dei trucchi più popolari è il Ralph Loop (dal nome di Ralph Wiggum), che sostanzialmente riassume tutto il lavoro svolto dal modello e chiede se ha raggiunto il suo obiettivo. È un modo per gestire i modelli di intelligenza artificiale che si perdono perché corrono troppo a lungo, essenzialmente facendo rimbalzare il modello avanti e indietro fino al completamento dell’attività.
Un altro modo di pensare ai loop è come parte della spinta generale verso un maggiore calcolo del tempo di test. Come ha osservato il ricercatore OpenAI Noam Brown all’inizio di questo mesei modelli contemporanei possono risolvere quasi tutti i problemi se si utilizzano abbastanza calcoli. Ciò significa che un modo per garantire che un problema venga risolto è continuare a utilizzare il calcolo finché non viene risolto. Ciò è particolarmente vero per i problemi in salita come il miglioramento di una base di codice, in cui il modello può semplicemente continuare ad apportare miglioramenti incrementali fino a raggiungere una determinata soglia. Oppure, come nell’esempio di Cherny, può semplicemente continuare ad apportare miglioramenti incrementali finché c’è spazio di calcolo da spendere su di esso.
Se sembra costoso, dovrebbe. Come l’intelligenza artificiale degli agenti prima, i cicli di intelligenza artificiale bruciano i token molto più velocemente dei semplici chatbot di domande e risposte – e poiché il punto è mantenere il ciclo sempre attivo, non c’è un limite a quanto puoi spendere. Va bene per Anthropic, che in definitiva opera nel settore della vendita di token, ma per tutti gli altri potrebbe essere un modo costoso di lavorare.
Tuttavia, a seconda del problema che il circuito degli agenti sta cercando di risolvere e della giusta configurazione che consente la supervisione della spesa dei token, della deriva e di altri classici problemi dell’IA, i benefici potrebbero essere abbastanza sconcertanti da superare i costi.
Quando acquisti tramite i link presenti nei nostri articoli, potremmo guadagnare una piccola commissione. Ciò non pregiudica la nostra indipendenza editoriale.