วันอังคารที่ 9 มิถุนายน พ.ศ. 2569

Measuring Massive Multitask Language Understanding (MMLU)

 a popular benchmark for evaluating the capabilities of large language models.