Anthropic herstelt Claude Fable 5 nadat de VS de aan jailbreak gekoppelde exportcontroles heeft opgeheven

Antropisch is zetten Claude-fabel 5 weer wereldwijd online. Op 30 juni hief het Amerikaanse ministerie van Handel de exportcontroles op die het ongeveer tweeënhalve week eerder had opgelegd aan Fable en zijn strenger gecontroleerde broertje Mythos 5.

Fable 5 keert op woensdag 1 juli terug naar gebruikers op Claude.ai, het Claude Platform, Claude Code en Claude Cowork.

Exportcontroles beperken wie een technologie kan ontvangen of gebruiken. Het bevel van 12 juni vertelde Anthropic om beide modellen stop te zetten voor elke buitenlandse staatsburger, binnen of buiten de Verenigde Staten, inclusief het eigen niet-burgerpersoneel.

De regel werd meteen van kracht en het bedrijf had geen betrouwbare manier om de nationaliteit van elke gebruiker in realtime te controleren, dus schakelde het beide modellen voor iedereen uit.

De trigger was een jailbreak: een prompt die een model ertoe aanzet zijn veiligheidsregels te omzeilen. Amazon-onderzoekers hebben er een gevonden in Fable 5. Volgens het verslag van Anthropic kreeg het model de opdracht een paar softwarefouten te signaleren en, in één geval, code te schrijven die liet zien hoe een fout kon worden misbruikt.

Anthropic bagatelliseerde de bevinding. Het zegt dat dezelfde verzoeken ook werken op veel zwakkere modellen, waaronder de eigen Claude Opus 4.8, OpenAI’s GPT-5.5 en de Chinese Kimi K2.7. Het bedrijf noemt het gemarkeerde gedrag routinematig defensief veiligheidswerk en geen verborgen supercapaciteit.

De regering en de partner die de ontsnapping uit de gevangenis rapporteerde, beschouwden de ontsnapping als ernstig genoeg om noodcontroles te rechtvaardigen.

Om dit probleem weg te nemen, heeft Anthropic een nieuw veiligheidsfilter getraind, genaamd a classificatordie let op de exacte techniek in het rapport en deze blokkeert. Het bedrijf zegt dat het deze techniek nu bij meer dan 99% van de pogingen stopt, volgens het artikel van 30 juni. Geblokkeerde verzoeken worden in plaats daarvan overgedragen aan het zwakkere Opus 4.8 en de gebruiker wordt op de hoogte gesteld. De wisselwerking is meer vals alarm bij normale codering en foutopsporing.

Mythos 5, hetzelfde onderliggende model met minder veiligheidsleuningen, blijft aan een kortere lijn. Access keerde op 26 juni terug voor ongeveer 100 Amerikaanse bedrijven en federale instanties die kritieke infrastructuur verdedigen. Anthropic zegt dat het nog steeds samenwerkt met de overheid om de toegang te verbreden.

Minister van Handel Howard Lutnick, die de omkering ondertekende, zei dat zijn afdeling twee weken lang de modellen met Anthropic had beoordeeld. In zijn brief stemde het bedrijf ermee in om zelf op zoek te gaan naar beveiligingsproblemen, toekomstige lanceringen te coördineren en elk kwaadwillig gebruik ervan te melden.

De onderhandelingen werden naar verluidt geleid door medeoprichter Tom Brown en niet door CEO Dario Amodei, die een groot deel van het jaar in botsing is gekomen met de regering.

De strijd verliep vanaf het begin rommelig. Meerdere rapporten, waaronder die van The Wall Street Journal, zeggen dat het onderzoek van Amazon en de zorgen van CEO Andy Jassy hebben bijgedragen aan de oorspronkelijke order. Voormalig AI-tsaar David Sacks beschuldigde Anthropic ervan “voorrang te hebben gegeven aan het voortdurende aanbod van het consumentenmodel boven veiligheid”. Anderen lezen het als een overcorrectie.

Francesco Bailo, onderzoeker op het gebied van AI-bestuur van de Universiteit van Sydney, vertelde Al Jazeera dat de ommekeer leek alsof de regering toegaf dat ze te ver was gegaan, en dat een groep veiligheidsleiders een open brief had ondertekend met het verzoek om de controles op te heffen.

Eroverheen hing concurrentie. De pauze kwam net op het moment dat goedkope, capabele Chinese open-sourcemodellen terrein wonnen, en verschillende leidinggevenden waarschuwden dat het bevriezen van Amerikaanse modellen rivalen vrije tijd gaf om hun achterstand in te halen.

Anthropic stelt ook iets voor dat de industrie nog niet heeft: een gedeelde manier om te beoordelen hoe gevaarlijk een jailbreak werkelijk is. Met Amazon, Microsoft, Google en andere partners wil het elk op vier punten scoren:

Vermogenswinst: hoeveel verder de jailbreak een gebruiker verder brengt dan de tools die hij al heeft.
Breedte: hoeveel verschillende aanvallen dezelfde truc ontgrendelt.
Gemak van bewapening: hoeveel vaardigheid en moeite het kost om er een echte aanval van te maken.
Vindbaarheid: hoe gemakkelijk het is om te vinden of te kopiëren.

Voor de ergste gevallen, zoals een jailbreak die aanvallen op elektriciteitsnetwerken of banken mogelijk maakt, zegt Anthropic dat het oplossingen zal gaan inzetten zodra de ernst wordt bevestigd, en dat het een team opstelt om de jailbreakrapporten 24 uur per dag te bekijken.

Het opende ook een HackerOne-programma voor onderzoekers om nieuwe Fable 5-jailbreaks te rapporteren, en beloofde de Amerikaanse regering eerdere toegang om toekomstige grensmodellen te testen voordat ze werden vrijgegeven.

Anthropic is niet het enige laboratorium in deze positie. Dagen eerder gaf OpenAI een preview van GPT-5.6 aan een kleine, door de overheid goedgekeurde groep in plaats van aan het publiek, daarbij verwijzend naar dezelfde zorgen over tweeërlei gebruik: een model dat goed genoeg is om verdedigers te helpen bugs te patchen, is ook goed genoeg om aanvallers te helpen ze te vinden.

Het risico is niet hypothetisch. Eerder dit voorjaar testte Anthropic een eerder Mythos-model dat zero-day bugs in elk groot besturingssysteem en browser op commando vond en exploiteerde, inclusief een 27 jaar oude fout in OpenBSD. Het rode team heeft nieuw ontdekte bugs binnen een dag omgezet in werkende exploits.

De onmiddellijke crisis is voorbij. De grotere vraag is dat niet. Een uitvoerend bevel van 2 juni creëerde een vrijwillig pad voor bedrijven om grensmodellen te laten beoordelen voordat ze werden vrijgegeven. Het heeft ook een geheime benchmark opgezet om te beslissen welke modellen als “gedekt” gelden, terwijl elke verplichte vergunning om er een te verzenden wordt uitgesloten. Fabel 5 heeft dat pad nooit gevolgd.

De regering greep in plaats daarvan naar exportcontroles. Dat is de boodschap: als Washington snel vooruitgang wil boeken op het gebied van een grensmodel, heeft het nog steeds geen bindend proces, alleen maar geïmproviseerde processen.