Hoe blootgestelde eindpunten het risico in de LLM-infrastructuur vergroten

Naarmate meer organisaties hun eigen Large Language Models (LLM’s) gebruiken, zetten ze ook meer interne services en Application Programming Interfaces (API’s) in om deze modellen te ondersteunen. Moderne beveiligingsrisico’s worden minder geïntroduceerd door de modellen zelf en meer door de infrastructuur die het model bedient, verbindt en automatiseert. Elk nieuw LLM-eindpunt vergroot het aanvalsoppervlak, vaak op manieren die gemakkelijk over het hoofd worden gezien tijdens snelle implementatie, vooral wanneer eindpunten impliciet worden vertrouwd. Wanneer LLM-eindpunten overmatige machtigingen verzamelen en inloggegevens met een lange levensduur worden blootgesteld, kunnen ze veel meer toegang bieden dan bedoeld. Organisaties moeten prioriteit geven aan het beheer van eindpuntprivileges, omdat blootgestelde eindpunten een steeds vaker voorkomende aanvalsvector zijn geworden voor cybercriminelen om toegang te krijgen tot de systemen, identiteiten en geheimen die LLM-workloads aansturen.

Wat is een eindpunt in de moderne LLM-infrastructuur?

In de moderne LLM-infrastructuur is een eindpunt elke interface waar iets – of het nu een gebruiker, applicatie of dienst is – met een model kan communiceren. Simpel gezegd maken eindpunten het mogelijk dat verzoeken naar een LLM worden verzonden en dat antwoorden worden geretourneerd. Veel voorkomende voorbeelden zijn onder meer inferentie-API’s die aanwijzingen afhandelen en output genereren, modelbeheerinterfaces die worden gebruikt om modellen bij te werken en administratieve dashboards waarmee teams de prestaties kunnen volgen. Veel LLM-implementaties zijn ook afhankelijk van eindpunten voor het uitvoeren van plug-ins of tools, waardoor modellen kunnen communiceren met externe services, zoals databases die de LLM met andere systemen kunnen verbinden. Samen bepalen deze eindpunten hoe de LLM verbinding maakt met de rest van zijn omgeving.

De grootste uitdaging is dat de meeste LLM-eindpunten zijn gebouwd voor intern gebruik en snelheid, en niet voor beveiliging op de lange termijn. Ze worden doorgaans gemaakt ter ondersteuning van experimenten of vroege implementaties en blijven vervolgens draaien met minimaal toezicht. Als gevolg hiervan worden ze vaak slecht gecontroleerd en krijgen ze meer toegang dan nodig is. In de praktijk wordt het eindpunt de beveiligingsgrens, wat betekent dat de identiteitscontroles, de verwerking van geheimen en de reikwijdte van de bevoegdheden bepalen hoe ver een cybercrimineel kan gaan.

Hoe LLM-eindpunten zichtbaar worden

LLM’s komen zelden aan het licht door één mislukking; vaker gebeurt de blootstelling geleidelijk door kleine aannames en beslissingen die tijdens de ontwikkeling en implementatie worden genomen. In de loop van de tijd transformeren deze patronen interne diensten in extern bereikbare aanvalsoppervlakken. Enkele van de meest voorkomende blootstellingspatronen zijn:

Openbaar toegankelijke API’s zonder authenticatie: Interne API’s worden soms publiekelijk openbaar gemaakt om het testen of de integratie te versnellen. Authenticatie wordt uitgesteld of volledig overgeslagen, en het eindpunt blijft toegankelijk lang nadat het bedoeld was om te worden beperkt.
Zwakke of statische tokens: Veel LLM-eindpunten zijn afhankelijk van tokens of API-sleutels die hardgecodeerd zijn en nooit worden gerouleerd. Als deze geheimen uitlekken via verkeerd geconfigureerde systemen of opslagplaatsen, kunnen ongeautoriseerde gebruikers voor onbepaalde tijd toegang krijgen tot een eindpunt.
De veronderstelling dat intern veilig betekent: Teams behandelen interne eindpunten vaak standaard als vertrouwd, ervan uitgaande dat ze nooit door ongeautoriseerde gebruikers zullen worden bereikt. Interne netwerken zijn echter vaak bereikbaar via VPN’s of verkeerd geconfigureerde bedieningselementen.
Tijdelijke testeindpunten die permanent worden: Eindpunten die zijn ontworpen voor foutopsporing of demo’s worden zelden opgeschoond. In de loop van de tijd blijven deze eindpunten actief, maar worden ze niet gecontroleerd en zijn ze slecht beveiligd, terwijl de omringende infrastructuur zich ontwikkelt.
Misconfiguraties in de cloud die services blootleggen: Verkeerd geconfigureerde API-gateways of firewallregels kunnen onbedoeld interne LLM-eindpunten blootstellen aan internet. Deze verkeerde configuraties ontstaan vaak geleidelijk en blijven onopgemerkt totdat het eindpunt al zichtbaar is.

Waarom blootgestelde eindpunten gevaarlijk zijn in de LLM-infrastructuur

Blootgestelde eindpunten zijn bijzonder gevaarlijk in LLM-omgevingen, omdat LLM’s zijn ontworpen om meerdere systemen binnen een bredere technische infrastructuur met elkaar te verbinden. Wanneer cybercriminelen een enkel LLM-eindpunt compromitteren, kunnen ze vaak toegang krijgen tot veel meer dan het model zelf. In tegenstelling tot traditionele API’s die één functie vervullen, worden LLM-eindpunten doorgaans geïntegreerd met databases, interne tools of cloudservices om geautomatiseerde workflows te ondersteunen. Daarom kan één gecompromitteerd eindpunt ervoor zorgen dat cybercriminelen zich snel en zijdelings kunnen verplaatsen tussen systemen die de LLM standaard al vertrouwen.

Het echte gevaar vloeit niet voort uit het feit dat de LLM te krachtig is, maar eerder uit het impliciete vertrouwen dat vanaf het begin in het eindpunt wordt gesteld. Zodra een LLM-eindpunt zichtbaar is, kan het fungeren als een krachtvermenigvuldiger; Cybercriminelen kunnen een gecompromitteerd eindpunt gebruiken voor verschillende geautomatiseerde taken in plaats van handmatig systemen te verkennen. Blootgestelde eindpunten kunnen LLM-omgevingen in gevaar brengen door:

Prompt-gestuurde data-exfiltratie: Cybercriminelen kunnen aanwijzingen creëren die ervoor zorgen dat de LLM gevoelige gegevens waartoe zij toegang heeft, samenvat, waardoor het model wordt omgezet in een geautomatiseerde tool voor gegevensextractie.
Misbruik van machtigingen voor het aanroepen van tools: Wanneer LLM’s interne tools of services aanroepen, kunnen blootgestelde eindpunten worden gebruikt om deze tools te misbruiken door bronnen aan te passen of geprivilegieerde acties uit te voeren.
Indirecte snelle injectie: Zelfs als de toegang beperkt is, kunnen cybercriminelen gegevensbronnen of LLM-invoer manipuleren, waardoor het model indirect schadelijke acties uitvoert.

Waarom NHI’s vooral gevaarlijk zijn in LLM-omgevingen

Niet-menselijke identiteiten (NHI’s) zijn inloggegevens die door systemen worden gebruikt in plaats van door menselijke gebruikers. In LLM-omgevingen zorgen serviceaccounts, API-sleutels en andere niet-menselijke inloggegevens ervoor dat modellen toegang krijgen tot gegevens, kunnen communiceren met cloudservices en geautomatiseerde taken kunnen uitvoeren. NHI’s vormen een aanzienlijk veiligheidsrisico in LLM-omgevingen omdat modellen er voortdurend op vertrouwen. Uit gemak geven teams de NHI’s vaak brede machtigingen, maar slagen ze er niet in om de toegangscontroles later opnieuw te bekijken en aan te scherpen. Wanneer een LLM-eindpunt wordt gecompromitteerd, erven cybercriminelen de toegang van de NHI achter dat eindpunt, waardoor ze kunnen werken met vertrouwde inloggegevens. Verschillende veelvoorkomende problemen verergeren dit veiligheidsrisico:

Geheimen verspreiden zich: API-sleutels en serviceaccountreferenties zijn vaak verspreid over configuratiebestanden en pipelines, waardoor ze moeilijk te volgen en te beveiligen zijn.
Statische referenties: Veel NHI’s gebruiken inloggegevens met een lange levensduur die zelden of nooit worden gerouleerd. Zodra deze inloggegevens openbaar worden gemaakt, blijven ze voor langere tijd bruikbaar.
Overmatige rechten: Vaak wordt brede toegang verleend aan NHI’s om vertragingen te voorkomen, maar dit wordt onvermijdelijk vergeten. Na verloop van tijd verzamelen NHI’s meer bevoegdheden dan wat feitelijk nodig is voor hun taken.
Identiteitswildgroei: Groeiende LLM-systemen produceren grote aantallen NHI’s in verschillende omgevingen. Zonder goed toezicht en goed beheer vermindert deze uitbreiding van identiteiten de zichtbaarheid en vergroot het aanvalsoppervlak.

Hoe u het risico van blootgestelde eindpunten kunt verminderen

Het verminderen van de risico’s van blootgestelde eindpunten begint met de veronderstelling dat cybercriminelen uiteindelijk de blootgestelde diensten zullen bereiken. Beveiligingsteams moeten er niet alleen naar streven toegang te voorkomen, maar ook te beperken wat er kan gebeuren zodra een eindpunt is bereikt. Een gemakkelijke manier om dit te doen is door zero-trust-beveiligingsprincipes toe te passen op alle eindpunten: de toegang moet in alle gevallen expliciet worden geverifieerd, voortdurend geëvalueerd en streng gecontroleerd. Beveiligingsteams moeten ook het volgende doen:

Dwing toegang met de minste rechten af voor menselijke en machinegebruikers: Eindpunten mogen alleen toegang hebben tot wat nodig is om een specifieke taak uit te voeren, ongeacht of de gebruiker menselijk of niet-menselijk is. Het verminderen van de machtigingen beperkt hoeveel schade een cybercrimineel kan aanrichten met een gecompromitteerd eindpunt.
Gebruik Just-in-Time (JIT)-toegang: Bevoorrechte toegang mag niet altijd op welk eindpunt dan ook beschikbaar zijn. Met JIT-toegang worden rechten alleen verleend wanneer dat nodig is en worden ze automatisch ingetrokken nadat een taak is voltooid.
Bevoorrechte sessies bewaken en opnemen: Door bevoorrechte activiteiten te monitoren en vast te leggen, kunnen beveiligingsteams misbruik van bevoegdheden opsporen, beveiligingsincidenten onderzoeken en begrijpen hoe eindpunten daadwerkelijk worden gebruikt.
Geheimen automatisch roteren: Tokens, API-sleutels en serviceaccountreferenties moeten regelmatig worden gerouleerd. Geautomatiseerde rotatie van geheimen vermindert het risico op langdurig misbruik van inloggegevens als geheimen worden onthuld.
Verwijder indien mogelijk langlevende inloggegevens: Statische inloggegevens vormen een van de grootste beveiligingsrisico’s in LLM-omgevingen. Door deze te vervangen door kortstondige inloggegevens wordt beperkt hoe lang gecompromitteerde geheimen bruikbaar blijven in de verkeerde handen.

Deze beveiligingsmaatregelen zijn vooral belangrijk in LLM-omgevingen omdat LLM’s sterk afhankelijk zijn van automatisering. Omdat modellen continu werken zonder menselijk toezicht, moeten organisaties de toegang beschermen door deze in de tijd beperkt te houden en nauwlettend in de gaten te houden.

Geef prioriteit aan het beheer van eindpuntrechten om de beveiliging te verbeteren

Blootgestelde eindpunten vergroten het risico snel in LLM-omgevingen, waar modellen diep geïntegreerd zijn met interne tools en gevoelige gegevens. Traditionele toegangsmodellen zijn onvoldoende voor systemen die autonoom en op schaal opereren. Daarom moeten organisaties heroverwegen hoe zij toegang verlenen en beheren in de AI-infrastructuur. Endpoint privilege management verschuift de focus van het voorkomen van inbreuken op eindpunten naar het beperken van de impact door permanente toegang te elimineren en te controleren wat zowel menselijke als niet-menselijke gebruikers kunnen doen nadat een eindpunt is bereikt. Oplossingen zoals Keeper ondersteunen dit zero-trust beveiligingsmodel door organisaties te helpen onnodige toegang te verwijderen en kritische LLM-systemen beter te beschermen.

Opmerking: Dit artikel is zorgvuldig geschreven en bijgedragen voor ons publiek door Ashley D’Andrea, Content Writer bij Keeper Security.