Anthropic poinformował, że na polecenie rządu USA musi zawiesić dostęp do modeli Fable 5 i Mythos 5. Decyzja została uzasadniona względami bezpieczeństwa narodowego i ma charakter dyrektywy kontroli eksportu. Ograniczenie dotyczy wszystkich cudzoziemców, niezależnie od tego, czy znajdują się poza Stanami Zjednoczonymi, czy na ich terytorium. Firma podkreśla, że obejmuje to także zagranicznych pracowników Anthropic.
W praktyce oznacza to, że Anthropic musi nagle wyłączyć Fable 5 i Mythos 5 dla wszystkich klientów, aby mieć pewność, że nie narusza decyzji administracji USA. Firma zapewnia, że dostęp do pozostałych modeli Claude nie został objęty tym ograniczeniem.
Według Anthropic pismo od rządu USA dotarło 12 czerwca. Firma twierdzi, że dokument nie zawierał szczegółowego opisu zagrożenia. Z jej interpretacji wynika, że obawy władz mogą dotyczyć metody obchodzenia zabezpieczeń, czyli jailbreakingu modelu Fable 5. Anthropic przekonuje jednak, że pokazana technika prowadziła jedynie do wykrycia niewielkiej liczby wcześniej znanych, prostych podatności, które mogą być identyfikowane także przez inne publicznie dostępne modele.
Spółka broni swoich zabezpieczeń. W oświadczeniu przypomina, że przed uruchomieniem Fable przeprowadziła tysiące godzin testów z udziałem amerykańskiego rządu, brytyjskiego AISI, zewnętrznych organizacji oraz własnych zespołów. Według Anthropic testy wykazały, że zabezpieczenia Fable są skuteczniejsze niż w przypadku wcześniej wdrożonych modeli. Firma przyznaje jednocześnie, że pełna odporność na jailbreaki najprawdopodobniej nie jest dziś możliwa u żadnego dostawcy modeli AI.
Najmocniejszy spór dotyczy skali ryzyka. Anthropic twierdzi, że nie otrzymał dowodu na uniwersalny jailbreak, który szeroko odblokowywałby zakazane możliwości modelu. Według firmy przekazane informacje dotyczą wąskiego scenariusza, polegającego w uproszczeniu na poproszeniu modelu o analizę kodu i poprawienie błędów. Anthropic uważa, że taki poziom możliwości jest dostępny również w innych modelach i jest codziennie wykorzystywany przez zespoły cyberbezpieczeństwa do ochrony systemów.
Decyzja USA jest ważna nie tylko dla użytkowników Claude. To jeden z najmocniejszych dotąd przykładów przeniesienia kontroli eksportu z układów AI i infrastruktury obliczeniowej na same modele. Reuters opisuje sprawę jako znaczące zaostrzenie amerykańskiego podejścia do ograniczania zagranicznego dostępu do zaawansowanej sztucznej inteligencji.
Anthropic podporządkował się decyzji, ale wyraźnie się z nią nie zgadza. Firma napisała, że rząd powinien mieć możliwość blokowania niebezpiecznych wdrożeń AI, ale taki proces powinien być przejrzysty, sprawiedliwy, jasny i oparty na technicznych faktach. Zdaniem Anthropic obecna decyzja tych warunków nie spełnia. Spółka przeprosiła klientów za zakłócenia i zapowiedziała działania na rzecz jak najszybszego przywrócenia dostępu.