半教師あり学習

半教師あり学習（semi-supervised learning）は、機械学習における学習手法の一つであり、少量の人手によるラベル付きデータ（通常は教師あり学習でのみ使用され、高コストかつ時間がかかる）と、大量のラベルなしデータ（通常は教師なし学習で使用）を組み合わせて使用する手法である。すなわち、学習データの一部にのみ出力ラベルが与えられ、それ以外はラベルなし、もしくは曖昧なラベルである。特に大規模言語モデル（LLM）の登場により、大量の学習データが必要となったことで、その重要性と注目度が高まっている。

直感的には、試験を受ける前に教師がいくつかのサンプル問題を解いて見せるようなものである。帰納的学習ではそれらは練習問題に、推論的学習ではそれらが実際の試験問題に対応する。