在该类学习中,提供给算法的包含所需解决方案的训练集称为标签,分类任务和回归问题是典型的有监督学习。有一些重要的有监督学习算法:


无监督学习的训练数据都是未经标记的,有以下重要算法:


由于通常给数据做标记是非常耗时和昂贵的,因此会有很多未标记的数据而很少有已经标记的数据。这称为半监督学习。大部分半监督学习算法是无监督算法和有监督算法的结合。
其学习系统能够观察环境、做出选择,执行动作并获得回报。所以必须自行学习什么是最好的策略,从而随着时间的推移获得最大的回报。

在批量学习中,系统无法进行增量学习——即必须使用所有可用数据进行训练。因此通常都是离线完成:先训练系统然后投入其生产环境。
如果希望批量学习系统学习新数据,只能在之前的训练数据集的基础上加上新数据重新训练系统的新版本,然后取代旧系统。
可用循序渐进的给系统提供训练数据,逐步累积学习成果,这种提供数据的方式可以是单独的,也可以是小批量的小组数据进行训练。在线学习中,模型经过训练并投入生产环境,然后随着新数据的进入而不断学习。

在线学习系统的一个重要参数是其适应不断变化的数据的速度,即学习率。如果学习率过高,系统会迅速适应新数据,但同时会更快忘记旧数据。反过来如果学习率过低,系统会有更高的惰性,面对新数据中的噪声和离群值更不敏感。
系统用心学习给好的示例,然后通过使用相似度度量来比较新实例和已经学习的实例(或其子集),从而泛化新实例。

从一组示例集中实现泛化的另一种方法就是构建这些示例的模型,然后使用该模型进行预测。
