วันอังคารที่ 9 มิถุนายน พ.ศ. 2569
Measuring Massive Multitask Language Understanding (MMLU)
a popular
benchmark
for evaluating the capabilities of
large language models
.
‹
›
หน้าแรก
ดูเวอร์ชันสำหรับเว็บ