Perbedaan Versi Model AI Maverick Meta Memicu Kekhawatiran di Kalangan Pengembang

BIZNIS.COM, Jakarta – Kecerdasan buatan terbaru Meta (AI), Maverick, dikatakan menunjukkan perbedaan antara versi yang diuji arena yang diuji dan versi yang tersedia untuk pengembang.

Maverick mengumumkan Laporan TechCrunch, pada hari Senin (07.07.2025), arena LM lainnya yang berpartisipasi dalam penilaian manusia yang berpartisipasi dalam penilaian manusia untuk membandingkan eliminasi model bahasa yang berbeda. Dalam tes, tujuan menggunakan versi diskusi Maverick.

Namun, serangkaian peneliti AI pada platform KS mengungkapkan bahwa versi Maverick yang digunakan untuk menguji arena LM berbeda dari versi publik yang dapat diunduh oleh pengembang. Mereka memperhatikan bahwa pengujian arena LM melewati Llallama 4 Maverick, yang dioptimalkan terutama untuk diskusi.

Perbedaannya dapat dilihat dari perilaku model. LM adalah kecenderungan untuk memberikan jawaban yang lebih lama dan lebih rinci dan mengikuti banyak smiley. Sebaliknya, versi publik menunjukkan kinerja dan fitur yang signifikan.

TechCrunch juga menulis sebelumnya bahwa LM Arena bukan pengukuran perbandingan yang sepenuhnya dapat diandalkan untuk mengukur kinerja dan model. Namun, banyak perusahaan biasanya tidak membuat perubahan spesifik pada model mereka untuk mendapatkan skor tinggi dalam tes.

Adaptasi langkah -langkah spesifik dapat menyebabkan masalah, termasuk kesulitan pengembang untuk memprediksi perilaku model di luar lingkungan pengujian. Selain itu, dapat menciptakan kesan palsu yang terkait dengan kemampuan sebenarnya dari model.

Meta -dan Chatbot Arena, sebuah organisasi yang dikelola oleh kontak LM Arena untuk menanggapi dugaan perbedaan antara Maverick. Sejauh ini tidak ada pernyataan resmi yang diberikan.

Periksa berita dan artikel lainnya di Google News dan VA Channel

Related Posts

Leave a Reply Cancel reply