An approach to machine learning that combines a small amount of labeled data with a large amount of unlabeled data during training.
ในส่วนของ unlabeled data จะถูกสร้าง label ให้โดยเทียบเคียงจาก labeled data โดยวิธี เช่น cluster assumption คืออยู่ใน cluster เดียวกันก็น่าจะมี label เดียวกัน