Un gruppo composto da decine di esperti di sicurezza informatica, tra cui diversi noti veterani del settore, ha pubblicato una lettera aperta al governo degli Stati Uniti chiedendogli di revocare l’ordine di controllo delle esportazioni sui modelli Fable e Mythos di Anthropic.
Secondo la lettera aperta, “questa azione ha portato via i migliori modelli ai difensori (della sicurezza informatica)” che ora non possono utilizzare i modelli per trovare vulnerabilità e rendere i loro software e prodotti più sicuri.
“Togliere le migliori capacità ai difensori senza una buona ragione quando i nostri avversari stanno avanzando rapidamente è pericoloso”, si legge nella lettera.
Venerdì, il governo degli Stati Uniti ha ordinato ad Anthropic di limitare l’esportazione di Fable e Mythos, citando preoccupazioni per la sicurezza nazionale, senza spiegare le ragioni specifiche dietro l’ordine. secondo Anthropic. In risposta, l’azienda ha sospeso l’accesso ai modelli a tutti gli utenti in tutto il mondo.
Al momento della stesura di questo documento, la lettera è firmata da 76 esperti di sicurezza informatica, tra cui Alex Stamos, ex capo della sicurezza di Facebook; Casey Ellis, il fondatore della piattaforma bug bounty Bugcrowd; Jon Callas, famoso crittografo ed ex responsabile della progettazione e dell’architettura della sicurezza Apple; Paul Vixie, informatico; Dino Dai Zovi, ex capo dell’ingegneria della sicurezza applicata presso Block; Katie Moussouris, fondatrice di Luta Security; e Rachel Tobac, CEO della società di formazione sulla sensibilizzazione alla sicurezza SocialProof Security.
Quando Mythos è stato lanciato in anteprima ad aprile, Anthropic ha affermato che era così potente nell’individuare vulnerabilità di sicurezza che l’azienda aveva bisogno di limitare strettamente l’accesso per impedire a hacker malintenzionati o avversari stranieri di utilizzarlo per causare caos su Internet. In pratica, ciò significava che Anthropic ha dato a circa 50 aziende l’accesso iniziale a Mythos, ampliando recentemente quel gruppo per includere circa 150 organizzazioni in 15 paesi.
La settimana scorsa, Anthropic ha rilasciato Fable, una versione pubblica di Mythos che, secondo la società, presenta rigide barriere per bloccarne l’uso nei campi della biologia, della chimica e della sicurezza informatica, nonché per impedire ad altri di distillare il modello per ricrearlo. I guardrail di Fable erano così rigidi che molti esperti di sicurezza informatica hanno scoperto che sostanzialmente bloccavano qualsiasi richiesta relativa alla sicurezza informatica.
Anthropic ha affermato che l’ordine di controllo delle esportazioni della Casa Bianca potrebbe essere basato su un rapporto secondo cui esisteva un metodo per aggirare (o jailbreak) Fable per sbloccare le sue potenti funzionalità a livello di Mythos.
Contattaci
Hai maggiori informazioni sul documento Amazon che ha portato al divieto? Ci piacerebbe sentire la tua opinione. Da un dispositivo e da una rete non di lavoro, puoi contattare Lorenzo Franceschi-Bicchierai in modo sicuro su Signal al numero +1 917 257 1382, oppure tramite Telegram e Keybase @lorenzofb, o e-mail.
Secondo Katie Moussouris, una delle firmatarie della lettera aperta, il metodo è stato dimostrato dai ricercatori di Amazon in un articolo non pubblico ma da lei revisionato.
Obiettivo Moussouris detto in un post sul blog che il documento in realtà non dimostrava un vero jailbreak. Invece, ha scritto, i ricercatori hanno semplicemente chiesto a Fable di correggere il codice open source con vulnerabilità pubbliche e note insieme a “vulnerabilità deliberatamente installate”, dopo che il modello inizialmente si era rifiutato di “rivedere il codice per problemi di sicurezza”.
“Il comportamento descritto nel documento non può essere corretto in modo significativo, e qualsiasi tentativo non farebbe altro che indebolire il modello di difesa”, ha scritto Moussouris. “I difensori devono essere in grado di chiedere all’intelligenza artificiale di correggere i bug in un file, spiegare perché la correzione è importante e scrivere test che confermino il funzionamento della patch. Questo non è un bypass del guardrail. È la cosa più preziosa che un modello di intelligenza artificiale può fare per la sicurezza difensiva: eseguire il ciclo di ricerca, correzione e test che i difensori eseguono ogni giorno. “
La critica di Moussouris è stata ripresa nella lettera aperta, in cui si afferma anche che il gruppo di esperti ritiene che le capacità del modello nel documento di Amazon “possano essere replicate” su GPT-5.5 di OpenAI, su Claude Opus 4.8 e Sonnet di Anthropic, disponibili al pubblico, “e persino su modelli cinesi come Kimi 2.7.”
Moussouris ha dichiarato a TechCrunch che “i bug utilizzati per dimostrare le tecniche nel documento possono essere trovati utilizzando gli altri modelli. Il metodo nel documento è una tecnica di bypass del guardrail. Altri modelli che non dispongono dei guardrail Fable spesso non rifiutano la semplice richiesta di cercare bug di sicurezza, quindi non hanno bisogno di un bypass.”
La lettera richiedeva anche norme applicate in modo trasparente ed equo, create da “un processo di regolamentazione democratica” basato sulla ricerca scientifica condotta da esperti del settore e accademici e “utilizzate solo nella misura minima necessaria per garantire la sicurezza del pubblico americano”.
Quando acquisti tramite i link presenti nei nostri articoli, potremmo guadagnare una piccola commissione. Ciò non pregiudica la nostra indipendenza editoriale.