Dalam tolok ukur matematika lainnya, MATH-500, model DeepSeek-R1 mencapai akurasi 93 persen, melampaui sebagian besar tolok ukur.
Codeforces, sebuah tolok ukur untuk pemrograman, mencatat model ini meraih peringkat pada persentil ke-96,3 dari peserta manusia.
Hal ini menunjukkan kemampuan pemrograman tingkat ahli dalam model ini.
Pada pengetahuan umum, DeepSeek-R1 mencatatkan akurasi 90,8 persen untuk tolok ukur MMLU dan 71,5 persen dalam penilaian GPQA Diamond.
Dalam AlpacaEval 2.0, sebuah tolok ukur yang menguji kemampuan menulis dan menjawab pertanyaan model AI, DeepSeek-R1 meraih tingkat kemenangan 87,6 persen.
Apakah anda tertarik untuk mencoba kemahiran DeepSeek-R1 ini? Silahkan mencobanya melalui tautan berikut
(Tribunnews.com/Bobby)
Baca tanpa iklan