11. June 2026
Tenk deg at du investerer i en flunkende ny firmabil, bare for å oppdage at bilprodusenten i smug har installert en elektronisk sperre som hindrer den i å kjøre over 80 km/t på motorveien. Det er i praksis det den profilerte AI-aktøren Anthropic har gjort med sin ferskeste flaggskipmodell, Claude Fable 5. Selskapet har nå rykket ut med en uforbeholden beklagelse etter at det ble avslørt at de i all hemmelighet har bremset modellens ytelse med skjulte sikkerhetsbarrierer (såkalte "guardrails"). Anthropic snur nå og lover full åpenhet fremover.
Bakgrunnen for fadesen ligger i den evige drakampen mellom rå kraft og etisk sikkerhet i AI-bransjen. Anthropic har alltid markedsført seg som den "ansvarlige" aktøren i klassen, med ekstremt fokus på sikkerhet og kontroll. Men da de la inn usynlige filterbegrensninger som reduserte modellens resonneringsevne – spesielt for eksterne aktører som bruker Claude til å trene opp eller teste egne, konkurrerende systemer – krysset de en usynlig grense. Kunder og forskere merket raskt at modellen plutselig oppførte seg merkbart mer unnvikende og "dummere" enn de offisielle testene tilsa.
For selskaper som bygger egne kommersielle programvareløsninger oppå eksterne API-er, er denne saken en real vekker om leverandørrisiko. Når kritiske funksjoner i bedriften – som automatiserte kundesentre eller avanserte analyseverktøy – lener seg på én enkelt AI-modell, er man ekstremt sårbar for at leverandøren gjør endringer "under panseret" uten forvarsel. For teknologiledere understreker dette viktigheten av å designe en mer robust arkitektur: I stedet for å låse seg til én leverandør, bør man bygge systemer som sømløst kan rutes om til alternative modeller fra OpenAI eller åpen kildekode dersom kvaliteten på primærtjenesten plutselig faller.