Why the US government shut down Anthropic’s latest Claude AI model

Politics & Society, Science & Technology

Mengapa pemerintah AS menangguhkan model AI terbaru Claude dari Anthropic

Why the US government shut down Anthropic’s latest Claude AI model

17 Juni 2026

Francesco Bailo, Senior Lecturer in Data Analytics in the Social Sciences, Deputy Director of the Centre for AI, Trust and Governance, University of Sydney

Show

Hide

EN – ID

ID – EN

An “export control directive” for Anthropic’s Fable and Mythos models highlights the chaotic, fast-changing state of AI regulation.

“Arahan kontrol ekspor” untuk model Fable dan Mythos milik Anthropic menyoroti kondisi regulasi AI yang kacau dan berubah cepat.

On June 12, artificial intelligence (AI) lab Anthropic suspended access to its latest Claude models, Fable 5 and Mythos 5, which had been released three days earlier.

Pada 12 Juni, laboratorium kecerdasan buatan (AI) Anthropic menangguhkan akses ke model Claude terbarunya, Fable 5 dan Mythos 5, yang telah dirilis tiga hari sebelumnya.

The move came in response to an “export control directive” from the US government prohibiting use of the models by anyone who is not a US national.

Langkah ini diambil sebagai respons terhadap “arahan kontrol ekspor” dari pemerintah AS yang melarang penggunaan model tersebut oleh siapa pun yang bukan warga negara AS.

Mythos is Anthropic’s most powerful, or “frontier”, model. When first announcing the model in April, the company said it was too good at hacking to release immediately. Instead, Mythos was made available to a handful of organisations (mostly US tech corporations) to use to patch weaknesses in essential digital systems.

Mythos adalah model Anthropic yang paling kuat, atau “frontier”. Ketika pertama kali mengumumkan model ini pada bulan April, perusahaan tersebut mengatakan bahwa model itu terlalu bagus dalam meretas untuk dirilis segera. Sebaliknya, Mythos disediakan untuk segelintir organisasi (kebanyakan korporasi teknologi AS) untuk digunakan menambal kelemahan dalam sistem digital penting.

Fable is the same basic model, but with added safeguards meant to stop it being used for cybersecurity purposes. This is what was released to the public last week – and almost immediately shut down.

Fable adalah model dasar yang sama, tetapi dengan perlindungan tambahan yang dimaksudkan untuk menghentikannya digunakan untuk tujuan keamanan siber. Inilah yang dirilis kepada publik minggu lalu – dan hampir segera dinonaktifkan.

Anthropic and the Trump administration at loggerheads

Anthropic dan pemerintahan Trump berseteru

Since early 2025, Anthropic and the Trump administration have been in escalating conflict. The administration has accused Anthropic of making “woke AI” and called chief executive Dario Amodei an “ideological lunatic”.

Sejak awal 2025, Anthropic dan pemerintahan Trump berada dalam konflik yang meningkat. Pemerintahan tersebut menuduh Anthropic membuat “AI woke” dan menyebut kepala eksekutif Dario Amodei sebagai “orang gila ideologi”.

Early disagreements concerned AI regulation and semiconductor export policy. The dispute sharpened when Anthropic declined to let the Pentagon use its models for domestic surveillance and fully autonomous weapons systems.

Perbedaan pendapat awal berkaitan dengan regulasi AI dan kebijakan ekspor semikonduktor. Perselisihan ini semakin tajam ketika Anthropic menolak membiarkan Pentagon menggunakan modelnya untuk pengawasan domestik dan sistem senjata otonom penuh.

The Department of Defense responded by threatening to designate Anthropic a “supply chain risk”, a classification that would have required military contractors to sever ties.

Departemen Pertahanan merespons dengan mengancam untuk menetapkan Anthropic sebagai “risiko rantai pasokan”, sebuah klasifikasi yang akan mengharuskan kontraktor militer untuk memutuskan hubungan.

Jailbreaks

The US government has not yet publicly stated the reason for last week’s directive, but Anthropic it says it believes the government became aware of a jailbreak: a method for circumventing the safeguards in Fable that prevent using its most powerful features for nefarious purposes.

Pemerintah AS belum secara publik menyatakan alasan di balik arahan minggu lalu, tetapi Anthropic mengatakan bahwa mereka percaya pemerintah menyadari adanya jailbreak: sebuah metode untuk mengakali pengamanan dalam Fable yang mencegah penggunaan fitur paling kuatnya untuk tujuan jahat.

These safeguards classify user requests as safe or unsafe before passing them to the AI model. When triggered, the safeguards redirect the request to a less powerful model.

Pengamanan ini mengklasifikasikan permintaan pengguna sebagai aman atau tidak aman sebelum meneruskannya ke model AI. Ketika terpicu, pengamanan tersebut akan mengalihkan permintaan ke model yang kurang kuat.

The government’s concern, according to Anthropic, was that the safeguards could be bypassed to extract information useful for cyberattacks.

Kekhawatiran pemerintah, menurut Anthropic, adalah bahwa pengamanan tersebut dapat dilewati untuk mengekstrak informasi yang berguna untuk serangan siber.

Guardrails for large language models aren’t bulletproof. They mostly depend on the model’s own capacity to interpret the user’s intentions in making a request.

Pengaman (guardrails) untuk model bahasa besar tidak kebal. Pengaman ini sebagian besar bergantung pada kemampuan model sendiri untuk menafsirkan niat pengguna saat membuat permintaan.

Beyond the inherent difficulty of this task, a large online community (which my colleagues and I call the Undersphere) is working hard to circumvent AI guardrails. Anthropic acknowledges that “perfect jailbreak resistance is not achievable for any current model provider”.

Di luar kesulitan inheren dari tugas ini, komunitas daring yang besar (yang rekan-rekan saya dan saya sebut Undersphere) bekerja keras untuk mengakali pengaman AI. Anthropic mengakui bahwa “ketahanan jailbreak yang sempurna tidak dapat dicapai oleh penyedia model mana pun saat ini.”

Anthropic says the research behind the government directive appears to have been produced by engineers at Amazon, which is both a rival to Anthropic and a significant investor.

Anthropic mengatakan penelitian di balik arahan pemerintah tersebut tampaknya diproduksi oleh insinyur dari Amazon, yang merupakan saingan sekaligus investor signifikan bagi Anthropic.

But this was not the only relevant jailbreak. Within 48 hours of Fable’s release, a researcher using the pseudonym “Pliny the Liberator” published what they identified as Fable 5’s full system prompt to X and GitHub repository.

Namun, ini bukan satu-satunya jailbreak relevan. Dalam waktu 48 jam setelah rilis Fable, seorang peneliti menggunakan nama samaran “Pliny the Liberator” menerbitkan apa yang mereka identifikasi sebagai system prompt lengkap Fable 5 ke X dan repositori GitHub.

The system prompt is a hidden set of instructions that helps determine an AI model’s behaviour. It’s unclear exactly how knowledge of Fable’s system prompt could be used in practice, but it has drawn attention in the Undersphere.

System prompt adalah serangkaian instruksi tersembunyi yang membantu menentukan perilaku model AI. Tidak jelas bagaimana pengetahuan tentang system prompt Fable dapat digunakan dalam praktik, tetapi hal itu telah menarik perhatian di Undersphere.

A surprise – and an ongoing mystery

Sebuah kejutan – dan misteri yang berkelanjutan

The deepest problem of making large language models such as Fable secure is that we don’t fully know how they work. According to Oxford University economist and machine learning expert Maximilian Kasy, they work much better than they “should”.

Masalah terdalam dalam membuat model bahasa besar seperti Fable menjadi aman adalah bahwa kita tidak sepenuhnya tahu cara kerjanya. Menurut ekonom Universitas Oxford dan ahli pembelajaran mesin Maximilian Kasy, model-model tersebut bekerja jauh lebih baik dari yang “seharusnya”.

Large language models have billions of internal parameters and are trained on unimaginably vast piles of data using machine learning methods. According to Kasy, we would expect such systems to be “overfitted”: good at reproducing patterns in their training data, but bad at generalising to new situations.

Model bahasa besar memiliki miliaran parameter internal dan dilatih menggunakan tumpukan data yang tak terbayangkan luasnya dengan metode pembelajaran mesin. Menurut Kasy, kita akan mengharapkan sistem semacam itu bersifat “overfitted”: bagus dalam mereproduksi pola dalam data latihannya, tetapi buruk dalam menggeneralisasi ke situasi baru.

However, modern systems such as Claude and ChatGPT do seem to be able to generalise. Kasy likens modern AI development to alchemy: successful through trial and error, not yet grounded in systematic theory.

Namun, sistem modern seperti Claude dan ChatGPT tampaknya mampu melakukan generalisasi. Kasy menyamakan pengembangan AI modern dengan alkimia: berhasil melalui coba-coba (trial and error) , namun belum didasarkan pada teori yang sistematis.

As a result, the behaviour of AI models is partly opaque even to their builders.

Akibatnya, perilaku model AI sebagian bersifat tidak transparan bahkan bagi para pembangunnya sendiri.

Hard to regulate

Sulit diatur

The opacity of the technology is one key reason it’s so hard to regulate. Governments lack independent access to the data, infrastructure and expertise they would need to evaluate proprietary frontier models.

Ketidakjelasan teknologi adalah salah satu alasan utama mengapa sulit untuk diatur. Pemerintah tidak memiliki akses independen ke data, infrastruktur, dan keahlian yang mereka butuhkan untuk mengevaluasi model mutakhir milik swasta.

The US administration’s recent executive order on AI security, published two weeks ago, reflects this realisation. As the administration has realised the power of frontier AI models, it has moved from an initial hands-off posture to asking developers to share their models for review before release.

Perintah eksekutif administrasi AS baru-baru ini tentang keamanan AI, yang diterbitkan dua minggu lalu, mencerminkan kesadaran ini. Karena administrasi telah menyadari kekuatan model AI mutakhir, ia beralih dari sikap awal yang pasif menjadi meminta pengembang untuk membagikan model mereka untuk ditinjau sebelum dirilis.

That demand is an implicit admission that the administration does not trust the companies to evaluate, fully and comprehensively, what their own models can do and how they might be misused. The public sees even less, and the consequence is measurable: a survey taken across 25 countries last year found people are, on balance, more than twice as concerned about AI as they are excited about it.

Tuntutan itu adalah pengakuan tersirat bahwa administrasi tidak mempercayai perusahaan-perusahaan tersebut untuk mengevaluasi, secara penuh dan komprehensif, apa yang dapat dilakukan oleh model mereka sendiri dan bagaimana hal itu mungkin disalahgunakan. Masyarakat bahkan melihat lebih sedikit, dan konsekuensinya terukur: survei yang dilakukan di 25 negara tahun lalu menemukan bahwa orang-orang, secara keseluruhan, lebih dari dua kali lebih khawatir tentang AI daripada gembira karenanya.

The future of AI safety

Masa depan keamanan AI

AI is a hugely hyped technology. But there is no doubt it is also extremely powerful and unpredictable. Understandably, this combination is very dangerous.

AI adalah teknologi yang sangat digembar-gemborkan. Namun tidak diragukan lagi bahwa ia juga sangat kuat dan tidak terduga. Wajar jika kombinasi ini sangat berbahaya.

We cannot rely on regulations, as technology will develop more quickly than they can adapt. Nor can we rely on guardrails, as they will be bypassed.

Kita tidak bisa mengandalkan regulasi, karena teknologi akan berkembang lebih cepat daripada kemampuan mereka untuk beradaptasi. Kita juga tidak bisa mengandalkan pagar pengaman (guardrails) , karena itu akan dilewati.

We need a governance framework built for that eventuality: one that can predict and address the consequences of failure.

Kita membutuhkan kerangka tata kelola yang dibangun untuk kemungkinan itu: satu yang dapat memprediksi dan mengatasi konsekuensi kegagalan.

Such a framework must be global, participatory, and founded on reciprocal trust. These are things the current US administration has shown little capacity to generate.

Kerangka kerja semacam itu harus bersifat global, partisipatif, dan didasarkan pada kepercayaan timbal balik. Ini adalah hal-hal yang belum menunjukkan kapasitas besar dari pemerintahan AS saat ini untuk menghasilkannya.

Francesco Bailo has received funding from Meta (2019) and from Australia’s Department of Defence (2023) .

Francesco Bailo telah menerima pendanaan dari Meta (2019) dan dari Departemen Pertahanan Australia (2023) .

Education, Environment & Energy, Science & Technology

Dari mencari fosil hingga menjadi juara bagi kehidupan di Bumi: Sir David Attenborough di usia 100

From fossicking for fossils to a champion for life on Earth: Sir David Attenborough at 100
Economy, Politics & Society

Setelah gencatan senjata, merundingkan kesepakatan yang langgeng dengan Iran akan memerlukan mengatasi rivalitas regional dan inkonsistensi strategis

After ceasefire, negotiating a lasting deal with Iran would require overcoming regional rivalries and strategic incoherence

Mengapa pemerintah AS menangguhkan model AI terbaru Claude dari Anthropic

Anthropic and the Trump administration at loggerheads

Anthropic dan pemerintahan Trump berseteru

Jailbreaks

Jailbreaks

A surprise – and an ongoing mystery

Sebuah kejutan – dan misteri yang berkelanjutan

Hard to regulate

Sulit diatur

The future of AI safety

Masa depan keamanan AI

Read more

Dari mencari fosil hingga menjadi juara bagi kehidupan di Bumi: Sir David Attenborough di usia 100

Setelah gencatan senjata, merundingkan kesepakatan yang langgeng dengan Iran akan memerlukan mengatasi rivalitas regional dan inkonsistensi strategis