Matplotlib基础
Matplotlib提供了python绘图的类库,可以便捷地将数据图形化
一、模块导入
Matplotlib其功能涵盖范围较广,在机器学习中一般只需调用其pyplot模块
二、图形绘制
1.折线图
plot方法用于绘制折线图
参数color可以指定线的颜色
参数linestyle可以指定线的样式
方法xlim和ylim可以分别设置x轴和y轴的区间范围
或者调用方法axis传入x、y轴区间的数组
使用xlabel、ylabel方法设置x、y轴标题
传入label参数并调用legend方法,为线添加样式说明
调用title方法设置标题
2.散点图
scatter用于绘制散点图
参数alpha设置散点的透明度(数据越密集,颜色越深)
三、简单的数据探索
使用sklearn中的datasets数据集进行简单演示,其中就包含之前提到的iris鸢尾花数据集
可以发现加载的数据是以字典的形式存储的,具体属性信息如下:
其中一共包含150行数据,每行数据四列
现在截取前两列(萼片的长宽),并绘制长宽的散点图
如果要为每一类鸢尾花绘制散点图,可以按target进行分类
可以发现target为0的鸢尾花与另外两类在(萼片长,萼片宽)这个维度上有明显区分
现在分析鸢尾花的花瓣长宽与其种类的关系,如下绘制散点图:
可以发现target为0的依旧明显区分于另外两类,且target为1和2的数据也出现了明显的分区
若在四个维度上进行分析,便有可能找出这三种鸢尾花的区分方式,从而实现机器学习的分类任务。