Claude Sonnet 4.5 van Anthropic kan maximaal 30 uur rechte coderen

Het AI -landschap zet zijn snelle groei voort met de lancering van Claude Sonnet 4.5, het nieuwste mainstream grote taalmodel van Anthropic. Het bedrijf heeft een gedurfde claim ingediend en beschrijft het nieuwe model als het ‘beste coderende model ter wereld’. Een van de grootste hoogtepunten is het vermogen om maximaal 30 uur non -stop te coderen.

Claude Sonnet 4.5 arriveert slechts enkele maanden na zijn voorganger, Sonnet 4. Het toont echter een aanzienlijke sprong in de mogelijkheid, vooral voor ontwikkelaars. Het model scoort een gerapporteerde 77,2% op de SWE-Bench-geverifieerde benchmark. De laatste test het vermogen van een AI om Real-World GitHub-pull-aanvragen af te handelen. Naar verluidt kan met deze score Sonnet 4.5 beter presteren dan concurrerende modellen van OpenAI en Google in coderingstaken.

Bovendien leidt het model nu de OSWORLD-benchmark-een test die real-world computergebruikstaken meten-met een slagingspercentage van 61,4%. Dit is een aanzienlijke toename ten opzichte van eerdere versies van Claude.

Anthropic’s Claude Sonnet 4.5: The Agent of Endurance

Wat echt Sonnet 4.5 scheidt van zijn concurrentie en eerdere Claude -modellen is het vermogen tot duurzaam werk. Anthropic meldt dat het model nu maximaal 30 uur autonoom kan worden uitgevoerd, waardoor focus en prestaties overal kunnen worden gehandhaafd. Dit is een dramatische toename ten opzichte van de limiet van zeven uur die wordt gezien in het vorige vlaggenschip, Claude Opus 4.

https://www.youtube.com/watch?v=oxfvkbb7mcg

Dit uithoudingsvermogen transformeert het model van een eenvoudige assistent in een capabele agent. Tijdens vroege proeven heeft Sonnet 4.5 naar verluidt de mogelijkheid aangetoond om meer te doen dan alleen een applicatie te schrijven. Het zou ook complexe, multi-step-projecten kunnen uitvoeren, zoals het implementeren van databaseservices. Het registreerde domeinnamen en voerden zelfs SOC 2 beveiligingsaudits uit – allemaal zonder menselijk toezicht.

Om deze verschuiving naar autonomie te ondersteunen, heeft Anthropic het model toegang gegeven tot nieuwe functies. De lijst bevat virtuele machines en geheugen en beter contextbeheer voor langlopende processen.

Een ecosysteem voor AI -agenten

Naast de kernmodelupdate introduceerde Anthropic verschillende tools die zijn ontworpen om ontwikkelaars in staat te stellen Claude te gebruiken:

Claude -code -updates: Anthropic’s toegewijde coderingsagent ontvangt het Sonnet 4.5 -model. Nieuwe functies omvatten een Visual Studio-code-extensie voor het bekijken van realtime wijzigingen, verbeterde statuszichtbaarheid in de terminal en controlepunten waarmee gebruikers gemakkelijk codewijzigingen kunnen terugdraaien als het model fouten maakt.

Claude -agent SDK: Ontwikkelaars kunnen nu hun eigen aangepaste AI -agenten bouwen met dezelfde kerninfrastructuur die Claude Code aandrijft. De SDK bevat tools voor agentorkestratie, geheugen en beheer van context over uitgebreide taken.

Stel je voor dat Claude: Anthropic lanceerde dit tijdelijke, high-end experiment om de mogelijkheden van het model te presenteren. Hiermee kunnen Max -abonnees met Claude communiceren, omdat het software en gebruikersinterfaces meteen genereert, zonder geschreven code of vooraf bepaalde functionaliteit.

Anthropic beweert dat Sonnet 4.5 het “meest uitgelijnde” model tot nu toe is. Het beschikt over belangrijke veiligheidsverbeteringen die zijn ontworpen om snelle injectieaanvallen te weerstaan en te verminderen met betrekking tot gedragingen zoals sycofancy. Sonnet 4.5 is toegankelijk via de Claude API en de Web -app Claude.ai, met prijzen die consistent blijven met het vorige Sonnet 4 -model.

https://www.youtube.com/watch?v=oz-alrj0ovg