วันอังคารที่ 9 มิถุนายน พ.ศ. 2569
Measuring Massive Multitask Language Understanding (MMLU)
a popular
benchmark
for evaluating the capabilities of
large language models
.
บทความใหม่กว่า
บทความที่เก่ากว่า
หน้าแรก