【强化学习】强化学习规划


从这篇博客开始开个新坑——强化学习,之前一直对这个概念很感兴趣,因为我玩原神,然后在b站上看到了这个视频:
[原神]AI全自动钓鱼,完全解放双手(开源)!DQN+YOLOX+OpenCV+迁移学习。
这种功能就是基于强化学习实现的,因此也想自己在原神上实现一个,故而这篇博客就对强化学习进行一下学习规划

参考:

强化学习入门学习路线(精心整理)
强化学习路线图

看书:

  • 《强化学习:原理与Python实现》作为入门学习
  • 《强化学习》:前6章

机器学习方法:

  • 监督学习(Supervised learning):每一个样本都有明确的标签,最后需要总结出这些训练样本向量与标签的映射关系
    • 分类(classification)
    • 回归(regression)
  • 无监督学习(Unsupervised learning):在获得的向量数据后在没有标签的情况下尝试找出其内部蕴含关系的一种挖掘工作
  • 强化学习(Reinforcement learning):不要求预先给定任何数据,而是通过接收环境对动作的奖励(反馈)获得学习信息并更新模型参数