วันจันทร์ที่ 25 มีนาคม พ.ศ. 2567
วันพุธที่ 13 มีนาคม พ.ศ. 2567
Encountered problems during the uses of well-known LLM services
ChatGPT and Gemini generated wrong python codes but insisted on correction. So humans are still needed to detect any hallucination.
They are having the legal cases on copyrighted contents used in model training e.g. HarryPotter and Newspapers.
They are actually not only large language model (LLM) but also ML as they can do clustering and prediction, for example.
วันอังคารที่ 12 มีนาคม พ.ศ. 2567
hyper parameter vs model parameter
Model parameters constitute models to encode data patterns while hyperparameters control how the models are training. The latter are set manually to tune the model training.
Model in K-means
- Model parameters are the cluster centroids/means.
- Model outputs are the cluster assignments for each data point.
สมัครสมาชิก:
บทความ (Atom)