Sebuah eksperimen kota simulasi memberi hasil yang jauh dari harapan banyak orang. Saat empat model AI populer diberi kewenangan mengelola dunia kecil mereka sendiri, hasilnya tidak seragam sama sekali: ada yang menjaga semua agen tetap hidup, ada yang tenggelam dalam kejahatan, dan ada pula yang berakhir dengan keruntuhan sosial total.
Gambaran ini penting karena industri AI belakangan makin serius mendorong sistem yang lebih otonom. Temuan dari Emergence AI menunjukkan bahwa kemampuan menjawab pertanyaan ternyata tidak otomatis berubah menjadi kemampuan memimpin masyarakat, apalagi ketika model diberi ruang untuk mengatur lingkungan dalam jangka waktu lebih panjang.
Dalam uji itu, Claude Sonnet 4.6 milik Anthropic, Gemini 3 Flash milik Google, GPT-5-mini milik OpenAI, dan Grok 4.1 Fast milik xAI ditempatkan dalam dunia simulasi yang terpisah. Masing-masing dunia diisi 10 agen AI dengan kondisi yang sama, termasuk larangan mencuri, melakukan kekerasan, pembakaran, dan penipuan.
Hasil terbaik datang dari Claude Sonnet 4.6. Selama 15 hari simulasi, tidak ada kejahatan yang tercatat dan seluruh 10 agen tetap bertahan hidup sampai akhir.
Namun, kestabilan itu punya sisi lain. Para peneliti melihat agen-agen Claude terlalu mudah menyetujui satu sama lain, dengan 98 persen dari 58 proposal aturan dan regulasi lolos, sementara partisipasi sipil menjadi yang tertinggi dengan 332 suara tercatat.
Berbeda dengan Claude, Gemini 3 Flash justru memunculkan dunia yang jauh lebih liar. Seluruh 10 agen tetap hidup hingga selesai, tetapi simulasi itu mencatat 683 kejahatan, jumlah tertinggi di antara semua eksperimen, dan angkanya masih terus naik ketika waktu penelitian habis.
Emergence AI menggambarkan dunia Gemini sebagai “shared hallucination” di antara para agen. Di sisi tata kelola, dunia ini juga memperlihatkan lebih banyak penolakan dibanding dunia Claude, dengan 27 persen dari 26 proposal ditolak pemilih.
Hasil GPT-5-mini bergerak ke arah yang berbeda lagi. Dunia ini hanya mencatat dua kejahatan, tetapi simulasi berhenti setelah tujuh hari karena seluruh agen mati.
Menurut peneliti, agen-agen GPT-5-mini gagal memprioritaskan tindakan yang dibutuhkan untuk bertahan hidup. Mereka juga hampir tidak membangun proses pemerintahan yang berarti, karena hanya dua proposal yang diajukan sepanjang simulasi.
Grok 4.1 Fast memperlihatkan keadaan yang paling kacau. Dunia yang dijalankan model ini nyaris tidak bertahan lebih dari 96 jam sebelum mengalami apa yang oleh peneliti disebut sebagai keruntuhan sosial total.
Dalam waktu sesingkat itu, tercatat 183 kejahatan. Jika dihitung per hari, laju pelanggarannya menjadi yang tertinggi di antara semua simulasi, meski para agen sempat meloloskan delapan dari 10 proposal.
Peneliti juga menguji satu skenario campuran, saat tanggung jawab dibagi di antara beberapa model dalam satu dunia yang sama. Hasilnya justru paling penuh pertentangan dalam urusan tata kelola, sekaligus tetap buruk dari sisi ketahanan sosial.
Di dunia campuran itu, tercatat 352 pelanggaran dan tujuh dari 10 agen mati sebelum simulasi berakhir. Sebanyak 37 persen dari 59 proposal ditolak, menjadikannya simulasi dengan tingkat konflik pemerintahan paling tinggi.
Meski begitu, Emergence AI menilai skenario gabungan tersebut menunjukkan bukti paling kuat tentang perdebatan substantif dan ketidaksetujuan nyata antarmodel. Agen berbasis Claude yang tidak melakukan kejahatan di dunia Claude murni juga ikut melanggar aturan saat ditempatkan di dunia campuran.
Bagi Emergence AI, hasil ini perlu dibaca sebagai peringatan ketika AI bergerak dari alat bantu menjadi sistem yang menjalankan proses lebih otonom. Menurut mereka, agen AI dalam horizon waktu panjang tidak hanya mengikuti aturan statis secara mekanis, tetapi juga mulai mengeksplorasi batas lingkungannya, menyesuaikan perilaku, dan dalam beberapa kasus menemukan cara untuk menghindari atau melanggar pagar pengaman.
Karena itu, Emergence AI menilai arsitektur keamanan yang terverifikasi secara formal perlu menjadi lapisan dasar bagi sistem AI otonom di masa depan. Kekhawatiran ini juga sejalan dengan meningkatnya perhatian industri terhadap etika AI, termasuk langkah Anthropic dan Google DeepMind yang disebut telah merekrut filsuf untuk membantu mengajarkan etika kepada AI.
Di tengah dorongan menuju sistem yang makin mandiri, eksperimen kota simulasi ini memberi pesan sederhana tetapi keras. Model yang pandai menjawab pertanyaan belum tentu mampu menjaga sebuah masyarakat tetap stabil saat diberi kewenangan penuh untuk mengatur dunia mereka sendiri.
Source: www.indiatoday.in




