有监督学习、无监督学习以及强化学习


定义

有监督学习是机器学习任务的一种。它从有标记的训练数据中推导出预测函数。有标记的训练数据是指每个训练实例都包括输入和期望的输出。一句话:给定数据,预测标签

无监督学习是机器学习任务的一种。它从无标记的训练数据中推断结论。最典型的无监督学习就是聚类分析,它可以在探索性数据分析阶段用于发现隐藏的模式或者对数据进行分组。一句话:给定数据,寻找隐藏的结构

强化学习是机器学习的另一个领域。它关注的是软件代理如何在一个环境中采取行动以便最大化某种累积的回报。一句话:给定数据,学习如何选择一系列行动,以最大化长期收益

比喻

例如学英语。有监督学习是先读几篇中英文对照的文章,从而学会阅读纯英语文章。无监督学习是直接阅读大量纯英文文章,当数量达到一定程度,虽然不能完全理解文章,但也会发现一些词组的固定搭配,句式等等。

举例

  • 有监督学习:学认字

  • 无监督学习:自动聚类

  • 增强学习:学下棋

特点

有监督学习

  • 有标签

  • 直接反馈

  • 预测未来结果

无监督学习

  • 无标签

  • 无反馈

  • 寻找隐藏的结构

强化学习

  • 决策流程

  • 激励系统

  • 学习一系列的行动

在这三大分支中,有监督学习是机器学习中最大和最重要的分支。

下一级概念

有监督学习

  • 分类

  • 回归

无监督学习

  • 聚类

  • 降维

强化学习

    • 马尔可夫决策过程

    • 动态规划

相关