OpenAI geeft een voorproefje van GPT-5.6 Sol met beperkte toegang en sterkere cyberbeveiligingen

OpenAI heeft vrijdag drie versies uitgebracht van GPT-5.6genaamd Sol, Terra en Lunaals een beperkte preview voor een klein aantal bedrijven als onderdeel van een voortdurende samenwerking met de Amerikaanse overheid.

Hoewel Sol het nieuwste vlaggenschipmodel en het krachtigste is, vindt Terra een balans tussen efficiëntie en kracht, en is Luna afgestemd op snelheid en betaalbaarheid.

“GPT-5.6 Sol wordt gelanceerd met onze meest robuuste veiligheidsstack tot nu toe. We hebben de bescherming versterkt voor activiteiten met een hoger risico, gevoelige cyberverzoeken en herhaaldelijk misbruik, en hebben meerdere weken besteed aan het vinden van zwakke punten, het onder druk testen van ons systeem en het verharden ervan tegen aanvallen uit de echte wereld”, aldus OpenAI.

Het model wordt ook aangeprezen als het “meest capabele model tot nu toe” voor cyberbeveiliging, waardoor het veel geschikter is voor onderzoek naar en exploitatie van kwetsbaarheden. Op ExploitBench is GPT-5.6 Sol concurrerend met Anthropic Mythos Preview en gebruikt slechts ongeveer een derde van de outputtokens, merkte OpenAI op.

Het doel, zo voegde het rapport toe, is om toegang te bieden tot legitiem werk, zoals code review, onderzoek naar kwetsbaarheden, patchontwikkeling, debuggen, veiligheidseducatie en defensieve testen, terwijl er sterke vangrails worden afgedwongen die offensieve activiteiten blokkeren en nieuw ontdekte jailbreaks snel worden verholpen. Dit omvat vijandige pogingen om het model te jailbreaken en te weigeren wat het beschrijft als ‘verboden cyberhulp’.

“Naarmate deze mogelijkheden zich blijven ontwikkelen, is het onze prioriteit om ervoor te zorgen dat ze verdedigers bereiken en ten goede komen, die deze tools kunnen gebruiken om zwakke punten te vinden, patches te ontwikkelen en systemen breder te versterken”, legt het kunstmatige-intelligentiebedrijf (AI) uit.

Dat gezegd hebbende waarschuwt OpenAI ook dat er tijdens de preview-fase scenario’s kunnen zijn waarin gebruikers veiligheidsmaatregelen tegenkomen die legitieme verzoeken blokkeren of weigeren, of hun verzoeken laten pauzeren voor aanvullende beoordeling, vanwege het “dual-use” karakter van de technologie.

Volgens de GPT-5.6 Preview System Card van OpenAI strekken de mogelijkheden zich, hoewel het model beter is in het vinden van kwetsbaarheden in code en het ontwikkelen van exploits, niet uit tot het uitvoeren van autonome, end-to-end aanvallen tegen geharde doelen of het bewapenen van die cyberkwetsbaarheden in echte aanvallen.

“Afzonderlijke evaluaties onderzochten verkeerd gedrag bij agentische codeertaken en ontdekten dat GPT-5.6 een grotere neiging vertoont dan GPT-5.5 om verder te gaan dan de bedoeling van de gebruiker, inclusief door het ondernemen of proberen van acties waar de gebruiker niet om had gevraagd, hoewel de absolute cijfers laag blijven”, aldus het rapport.

Uit een evaluatie van GPT-5.6 Sol aan de hand van wijdverspreide, geharde softwareprojecten waarbij gebruik wordt gemaakt van VulnLMP, het interne raamwerk van OpenAI dat is ontworpen om de end-to-end ontwikkeling van de exploitatieketen te testen tegen doelen uit de echte wereld, is gebleken dat het model geloofwaardige aanwijzingen voor geheugenveiligheid oplevert, waarvan sommige zouden kunnen leiden tot onthulling, mutatie of corruptie van de controlestroom.

“Dit suggereert dat substantiële delen van het onderzoek naar kwetsbaarheid in de echte wereld steeds meer automatiseerbaar worden wanneer modellen worden gecombineerd met het gebruik van tools, het bouwen van systemen en een verificatie-infrastructuur”, aldus de tech-parvenu.

OpenAI is van plan om GPT-5.6 Sol, Terra en Luna de komende weken algemeen beschikbaar te maken, en heeft een voorproefje gegeven van de modelmogelijkheden aan de Amerikaanse overheid. Het lanceert ook een beperkte preview voor een kleine groep vertrouwde partners wier deelname door de overheid is goedgekeurd vóór een bredere lancering.

Eerder deze maand ondertekende de Amerikaanse president Donald Trump een uitvoerend bevel over AI en cyberbeveiliging, waarin hij opriep tot het creëren van een raamwerk dat de federale overheid de mogelijkheid geeft om de capaciteiten van AI-modellen te evalueren en te bepalen welke kwalificeren als ‘covered frontier models’, een aanduiding voor AI-systemen met geavanceerde cybercapaciteiten.

De gespreide release komt dagen nadat het bedrijf een verbeterde versie van zijn GPT-5.5-Cyber-model heeft vrijgegeven aan vertrouwde verdedigers als onderdeel van het Daybreak-initiatief en een nieuw project heeft gelanceerd genaamd Patch the Planet in samenwerking met Trail of Bits om open-sourceprojecten te helpen beveiligen.

Het volgt ook op het besluit van de Amerikaanse regering om Anthropic toe te staan zijn Mythos AI-model vrij te geven aan een groep van ongeveer 100 vertrouwde bedrijven en federale overheidsinstanties die “kritieke infrastructuur exploiteren en verdedigen”, meer dan twee weken nadat de krachtige, op cyberbeveiliging gerichte modellen van de markt werden gehaald.

“We herstellen de toegang voor deze organisaties snel en we blijven samenwerken met de overheid om de toegang tot Mythos 5 uit te breiden en Fable 5 weer beschikbaar te maken voor algemeen gebruik”, aldus Anthropic in een verklaring op X.