Anthropic AI Safety 2026: Ketenangan Ini Bukan Tanda Aman
By Ali Sadikin Ma · · Updated
Category: Technology
Anthropic menyembunyikan AI paling kuatnya dari seluruh dunia.
Bukan karena strategi bisnis. Bukan karena belum siap diluncurkan. Mereka bilang model itu terlalu berbahaya.
Dan hampir semua orang membacanya sebagai kabar baik — sebagai tanda tanggung jawab, sebagai bukti bahwa setidaknya satu perusahaan AI masih punya rem yang bekerja. Akhirnya ada yang dewasa di ruangan ini.
Mereka salah. Dan memahami kenapa adalah kunci dari seluruh debat Anthropic AI safety 2026 yang sebenarnya.
Keputusan Anthropic itu bukan melegakan. Itu pengakuan — bahwa AI yang mereka buat sudah melampaui apa yang siapapun tahu cara mengendalikannya dengan aman. Dan kalau lo baca lebih dalam ke apa yang terjadi di Anthropic sepanjang awal 2026, gambaran yang muncul jauh lebih mengkhawatirkan dari yang kebanyakan media ceritakan.
Ada tiga hal yang hampir tidak pernah dihubungkan secara terbuka. Setelah lo memahami semuanya, lo tidak akan pernah membaca berita tentang Anthropic AI safety 2026 dengan cara yang sama lagi. Dan satu pertanyaan akan terus ada di kepala lo: kalau perusahaan paling bertanggung jawab di industri ini sudah sampai di sini — kita sebenarnya ada di mana?
Cerita yang Bikin Kita Semua Percaya: Kenapa Anthropic Dianggap “Pihak Baik”
Kalau lo baru mengenal dunia AI, Anthropic terasa seperti orang dewasa di ruangan itu.
Didirikan oleh Dario Amodei bersama tim yang sebelumnya di OpenAI — bukan keluar karena konflik internal biasa, tapi karena mereka merasa perusahaan lama itu bergerak terlalu cepat tanpa cukup serius soal risiko keamanan. Mereka membangun Responsible Scaling Policy (RSP) dari nol: sebuah komitmen keras bahwa kalau AI mereka menjadi terlalu berbahaya sebelum ada cara yang terbukti untuk menjaminnya aman, mereka akan berhenti melatihnya. Bukan menunda. Berhenti.
Hasilnya terlihat dari angka-angkanya.
Per Maret 2026, Anthropic mencatatkan annual revenue run rate sebesar $30 miliar — melampaui OpenAI yang dilaporkan berada di angka $25 miliar (Fortune, 2026). Valuasi mereka mendekati $380 miliar saat mempersiapkan IPO. Lebih dari 300.000 bisnis menggunakan produk mereka setiap hari, dari startup hingga korporasi Fortune 500.
Di mata industri dan publik luas, Anthropic adalah argumen paling kuat bahwa AI bertanggung jawab dan AI yang sukses secara bisnis bisa berjalan bersamaan.
Dan narasi itu sangat nyaman untuk dipercaya.
Tapi ada satu detail kecil dalam cerita Anthropic AI safety 2026 ini yang mengubah segalanya. Dan detail itu tidak ada di headline berita manapun yang lo baca.
Yang Tidak Pernah Diceritakan ke Lo: Bukti yang Membongkar Narasi “Aman”
Februari 2026. Dalam waktu tiga minggu, tiga hal terjadi di dalam Anthropic yang mendefinisikan ulang arah Anthropic AI safety 2026 — dan hampir tidak ada yang menghubungkannya secara terbuka.
Hal pertama:
Anthropic merilis RSP v3 — kebijakan keamanan terbaru mereka. Di dalamnya, mereka diam-diam menghapus sesuatu yang kritis: hard stop. Kewajiban untuk berhenti melatih AI jika keamanannya belum bisa dijamin. Sebagai gantinya, mereka memperkenalkan “Frontier Safety Roadmaps” yang mereka sendiri deskripsikan sebagai “ambitious but non-binding” (Semafor, 2026).
Ambisius. Tapi tidak mengikat.
Baca lagi kalimat itu perlahan.
Hal kedua:
Mrinank Sharma — kepala tim Safeguards Research di Anthropic, orang yang bertanggung jawab langsung atas keamanan sistem AI mereka — mengundurkan diri pada 9 Februari 2026. Pesan perpisahannya tidak berbicara soal “kesempatan baru” atau “petualangan berikutnya.” Dia menulis bahwa dunia dalam bahaya, dan menggambarkan karyawan yang terus-menerus menghadapi tekanan untuk mengesampingkan apa yang paling penting (Time, 2026).
Kepala tim keamanan AI. Keluar. Dengan peringatan keras bahwa dunia dalam bahaya.
Hal ketiga:
Chris Painter, Direktur Kebijakan di METR — lembaga independen paling kredibel untuk evaluasi keamanan AI — menyebut RSP v3 sebagai “sinyal bearish untuk manajemen risiko bencana” (Time, 2026). Bukan perubahan netral yang perlu dipantau. Bukan langkah mundur yang kalkulatif. Sinyal negatif, dari evaluator luar paling dipercaya di bidang ini.
Dan satu tambahan yang datang beberapa minggu setelahnya:
SaferAI menurunkan skor keamanan Anthropic dari 2,2 menjadi 1,9 — menempatkan mereka di kategori “lemah” bersama OpenAI dan Google DeepMind (SaferAI via Creati.ai, 2026). Perusahaan yang selama ini dianggap pemimpin AI safety kini berada di kategori yang sama dengan kompetitor yang mereka tinggalkan OpenAI justru untuk dihindari.
Tapi ini semua masih bagian permukaan. Apa yang sebenarnya terjadi di baliknya jauh lebih mengejutkan.

Gambar Nyatanya: Saat Perusahaan AI Safety Sendiri Ketakutan, Itu Adalah Sinyal Paling Jelas
Berikut yang jarang dikatakan dengan lugas:
Ketenangan Anthropic bukan bukti bahwa AI sudah aman. Ketenangan Anthropic adalah bukti bahwa AI sudah terlalu berbahaya untuk dilepas — dan bahkan pembuatnya tidak tahu harus berbuat apa selanjutnya.
Dua kalimat ini berbeda. Dan perbedaannya penting sekali.
Claude Mythos — model AI paling canggih yang pernah dibuat Anthropic — tidak dirilis ke publik bukan karena mereka sedang menyiapkan peluncuran besar atau menjaga eksklusivitas pasar. Mereka sendiri menilai model itu terlalu berbahaya untuk konsumsi umum. Akses dibatasi hanya untuk sekitar 40 organisasi keamanan siber defensif melalui program bernama Project Glasswing. Anthropic bahkan menanggung sendiri biaya akses hingga $100 juta pertama (Fortune, 2026).
Pikirkan implikasinya:
Sebuah perusahaan dengan revenue run rate $30 miliar dan valuasi mendekati $380 miliar memilih untuk tidak menjual produk paling canggih mereka ke pasar terbuka. Mereka membayar ratusan juta dolar dari kantong sendiri untuk memastikan model itu hanya berada di tangan yang mereka nilai cukup aman — dan di tangan itu pun, hanya untuk satu bidang spesifik: keamanan siber defensif.
Itu bukan altruisme. Itu manajemen risiko dari sesuatu yang bahkan penciptanya tidak yakin bisa dikendalikan. Dan inilah inti sesungguhnya dari seluruh perdebatan Anthropic AI safety 2026.
Lalu ada Pentagon.
Awal Maret 2026, militer Amerika Serikat mengancam akan melabeli Anthropic sebagai “supply chain risk to national security” — setelah Anthropic menolak menghapus guardrail keamanan AI mereka untuk keperluan militer (ASIS Online, 2026). Departemen Pertahanan AS ingin mengakses AI tanpa batasan keamanan. Anthropic menolak. Sebagai respons, Pentagon mengancam reputasi dan kelangsungan bisnis mereka di level federal.
Ini bukan narasi dari film distopia. Ini terjadi di 2026, di dunia nyata.
Dan sementara semua ini berlangsung, mereka mengganti komitmen keras RSP dengan “Frontier Safety Roadmaps” yang “ambitious but non-binding” — dengan argumen bahwa berhenti secara unilateral tidak efektif kalau semua kompetitor terus berlari tanpa berhenti (Anthropic/Semafor, 2026).
Di sinilah tiga hal yang lo pegang sejak awal artikel ini akhirnya terhubung:
Pertama — apa yang salah dengan ketenangan? Ketenangan adalah sinyal bahwa kemampuan AI sudah melampaui apa yang bisa dijamin aman oleh siapapun. Bukan tanda keamanan — tanda bahwa ketidakpastian dikelola, bukan diselesaikan.

Kedua — apa itu Claude Mythos? Model paling berbahaya yang pernah ada, tersembunyi bukan karena strategi pasar, tapi karena bahkan pembuatnya tidak berani melepasnya ke dunia.
Ketiga — apa yang diketahui orang dalam yang memilih keluar? Bahwa tekanan untuk mengabaikan keamanan sudah merambah ke dalam perusahaan yang seluruh identitasnya dibangun di atas keamanan itu sendiri.
Sekarang lo tahu. Dan pengetahuan itu mengubah cara lo membaca setiap headline AI yang lo temukan.
Apa Artinya Ini untuk Lo — dan Kita Semua yang Tidak Masuk Project Glasswing
Kalau lo bukan bagian dari 40 organisasi yang mendapat akses Claude Mythos, ini mungkin terasa seperti masalah orang lain.
Tapi perhatikan pola yang lebih besar:
Keputusan yang diambil Anthropic bukan hanya soal satu model AI atau satu perusahaan. Ini soal norma industri yang sedang dibentuk secara global. Ketika perusahaan paling konservatif dalam hal AI safety memutuskan bahwa hard stop tidak bisa lagi dipertahankan, itu memberikan sinyal kepada seluruh industri bahwa perlombaan harus terus berlanjut tanpa rem mutlak.
Dan perlombaan itu sedang berlangsung. Tidak pelan.
Per Maret 2026, perusahaan-perusahaan AI secara luas melonggarkan guardrail mereka di tengah tekanan persaingan AS-China yang semakin intens (Axios, 2026). Bukan karena mereka semua tiba-tiba tidak peduli keamanan. Tapi karena dalam perlombaan teknologi geopolitik, tidak ada yang mau berhenti sendirian sementara pihak lain terus melaju.
Lo tidak perlu bekerja di industri AI untuk terdampak dari dinamika ini. AI yang dilatih tanpa batasan keras yang mengikat akan membentuk tools yang lo gunakan setiap hari, konten yang lo konsumsi, dan keputusan yang diambil sistem yang lo percaya — dari algoritma kredit sampai moderasi konten sampai sistem diagnosis medis.
Saat ini, tidak ada satu pun perusahaan AI besar yang punya komitmen yang benar-benar mengikat untuk berhenti jika sesuatu menjadi terlalu berbahaya. Inilah realitas Anthropic AI safety 2026 yang harus lo pahami — termasuk perusahaan yang paling terkenal karena memiliki janji itu.
Jalan ke Depan: Apa Arti “Ambitious but Non-Binding” dan Apa yang Benar-Benar Kita Butuhkan
Empat kata paling penting dari RSP v3 Anthropic adalah: “ambitious but non-binding.”
Hampir tidak ada yang memperhatikannya dalam setiap diskusi publik tentang Anthropic AI safety 2026. Sebagian besar liputan fokus pada apa yang ada di dalam dokumen baru itu — Frontier Safety Roadmaps, sistem monitoring yang diperbarui, komitmen evaluasi baru. Yang krusial justru apa yang hilang: kewajiban yang bisa ditegakkan secara hukum. Konsekuensi nyata jika mereka melanggar janji yang mereka buat sendiri.

Yang Anthropic katakan sekarang pada dasarnya: kami punya rencana keamanan yang ambisius. Tapi kami tidak terikat untuk mengikutinya jika situasinya berubah.
Itu bukan kebijakan keamanan. Itu keinginan baik tanpa mekanisme penegakan.
Apa yang benar-benar dibutuhkan bukan hanya perusahaan yang berniat baik. Yang dibutuhkan adalah regulasi internasional yang mengikat, standar industri dengan konsekuensi konkret, dan badan pengawas lintas negara yang punya wewenang nyata — bukan hanya kemampuan menerbitkan laporan dan rekomendasi.
Pertanyaan yang harus lo bawa pulang setelah membaca ini:
Kalau perusahaan yang paling khawatir soal AI di dunia baru saja memutuskan bahwa batas keamanan yang mengikat tidak bisa dipertahankan — kita sebenarnya sudah ada di tahap mana dalam perkembangan teknologi ini?
FAQ: Pertanyaan Lo soal Anthropic AI Safety 2026, Dijawab
Apakah ini berarti Anthropic tidak aman dibanding kompetitor?
Tidak persis begitu. Anthropic masih memiliki kebijakan AI safety yang lebih ketat dari banyak perusahaan AI besar lain. Tapi perubahan RSP v3 menunjukkan bahwa bahkan standar tertinggi pun sedang ditekan oleh dinamika perlombaan AI global. Ini bukan soal Anthropic saja — ini soal arah seluruh industri yang bergerak bersamaan ke bawah ambang keamanan yang sebelumnya dijaga ketat.
Apakah kita harus panik soal AI safety 2026?
Panik tidak produktif. Tapi kewaspadaan yang tepat itu perlu. Reputasi “perusahaan AI bertanggung jawab” bukan lagi jaminan yang cukup untuk semua orang. Situasi Anthropic AI safety 2026 harus dibaca cermat — bukan sebagai bukti bahwa semuanya terkendali, tapi sebagai indikator bahwa kondisinya sudah cukup serius sehingga ketenangan menjadi pilihan yang tersisa, bukan pilihan yang ideal.
Kalau Anthropic sendiri kewalahan, siapa yang mengawasi perkembangan AI?
Saat ini, jawabannya tidak memuaskan. Tidak ada badan global yang punya wewenang eksekutif untuk menghentikan pengembangan AI ketika melewati ambang berbahaya. Regulasi nasional ada, tapi perlombaan AI bersifat lintas batas negara dan tidak bisa dikendalikan oleh satu pemerintah saja. Ini salah satu celah tata kelola teknologi terbesar dalam sejarah modern — dan belum ada konsensus global tentang cara menutupnya.
Share artikel ini kalau lo pikir lebih banyak orang perlu memahami apa yang sebenarnya disinyalkan ketenangan Anthropic — bukan hanya narasi permukaan tentang “perusahaan AI yang bertanggung jawab.”
Simpan artikel ini sebelum pengumuman Anthropic berikutnya. Lo akan butuh konteksnya untuk membaca antara baris-baris setiap press release yang mereka keluarkan.