【强化学习】强化学习规划

从这篇博客开始开个新坑——强化学习，之前一直对这个概念很感兴趣，因为我玩原神，然后在b站上看到了这个视频：
[原神]AI全自动钓鱼，完全解放双手(开源)！DQN+YOLOX+OpenCV+迁移学习。
这种功能就是基于强化学习实现的，因此也想自己在原神上实现一个，故而这篇博客就对强化学习进行一下学习规划

参考：

强化学习入门学习路线（精心整理）
强化学习路线图

看书：

《强化学习：原理与Python实现》作为入门学习
《强化学习》：前6章

机器学习方法：

监督学习(Supervised learning)：每一个样本都有明确的标签，最后需要总结出这些训练样本向量与标签的映射关系
- 分类(classification)
- 回归(regression)
无监督学习(Unsupervised learning)：在获得的向量数据后在没有标签的情况下尝试找出其内部蕴含关系的一种挖掘工作
强化学习(Reinforcement learning)：不要求预先给定任何数据，而是通过接收环境对动作的奖励(反馈)获得学习信息并更新模型参数

强化学习

相关

DQN（Deep Q-learning）入门教程（一）之强化学习介绍

DQN（Deep Q-learning）入门教程（一）之强化学习介绍

强化学习系列（一）：强化学习简介

强化学习系列（一）：强化学习简介

强化学习系列（一）：强化学习简介

强化学习实战 | 自定义Gym环境之显示字符串

如何使用自对弈强化学习训练一个五子棋机器人Alpha Gobang Zero

强化学习入门知识与经典项目分析1.1

【强化学习】强化学习的笔记1——基本概念

【强化学习玩转超级马里奥】01-超级马里奥环境安装

强化学习读书笔记 - 10 - on-policy控制的近似方法

有监督学习、无监督学习以及强化学习

标签