Laporan LM Arena: Model AI Maverick Standar Meta Tertinggal dari Kompetitor

Model Holiday Intelligence Cerdas di Dunia,) Meta, Llam-4 Maverick belum optimal dengan pesaing tertinggi

Mulai dari TechCrunch, Minggu (2013.2025). Ditemukan setelah versi Maverick yang diperoleh di bawah ini tanpa modifikasi daripada pesaing dalam percakapan umum dengan tolok ukur di LM Arena.

Hasil yang tidak memuaskan ini muncul setelah perselisihan awal minggu ini, ketika Meta dikenal sebagai versi Llama-4-Maverick-03-26-eksperitotal untuk mendapatkan arena LM. Sebenarnya model yang tidak dirilis secara publik

Tindakan ini menyebabkan kritik bagi orang-orang publik dan mengundang pemimpin arena arena untuk memeriksa kebijakan dan mengevaluasi Maverick dengan versi default LAM-4-Maverirm-17b-128e.

Akibatnya, model standar meta adalah utama seperti OpenA GPT-4O, Claude 3.5 soneta antropik dan Gemini 1.5 Pro, yang dibuat oleh Google.

Menurut Meta, versi eksperimental Maverick terutama dioptimalkan untuk skenario percakapan, yang lebih baik di arena LM, yang menggunakan sistem evaluasi berdasarkan manusia.

Namun, kustomisasi model untuk mencetak titik dalam tolok ukur tertentu dianggap menyesatkan, karena itu tidak mencerminkan kinerja model dalam berbagai konteks.

Dalam klaim, Technalk berbicara menjelaskan bahwa perusahaan secara aktif diuji oleh berbagai model varian, termasuk yang dirancang khusus untuk kinerja optimal dalam skenario tertentu.

Menurutnya, Eksperimen LMB-4-Maverick-03-26 adalah versi yang dioptimalkan dari percakapan dan benar-benar dioptimalkan dan dapat digunakan di Arena LM

“Sekarang kami telah merilis versi terbuka dari kode terbuka dan antusiasme tentang pengembang akan beradaptasi dengan 4 untuk kebutuhan Anda sendiri,” kata Meta Spokes.

Sebelumnya dilaporkan, perusahaan, teknologi Mark Zuckerberg, baru saja merilis model Mark terbaru pada koleksi ke -4 koleksi ke -4, The Behemoth Llam, Religius dan Llam Scout.

Dikatakan bahwa ketiganya lebih sulit daripada model AI, adalah salah satu Google Gemini.

“Kami memperkenalkan model pertama dalam seri ke -7, yang membuat orang membuat lebih banyak pengalaman multimoda pribadi,” Meta Writing di blog, dikutip pada minggu ini (4 Januari 2012).

Meta menyatakan bahwa tiga model terbaru memiliki laba yang lebih tinggi dibandingkan dengan model sebelumnya.

Tex

Lihat berita lain di Google News dan WA

Related Posts

Leave a Reply Cancel reply