Matplotlib基础


Matplotlib提供了python绘图的类库,可以便捷地将数据图形化

一、模块导入

Matplotlib其功能涵盖范围较广,在机器学习中一般只需调用其pyplot模块

二、图形绘制

1.折线图

plot方法用于绘制折线图

参数color可以指定线的颜色

参数linestyle可以指定线的样式

方法xlimylim可以分别设置x轴和y轴的区间范围

或者调用方法axis传入x、y轴区间的数组

使用xlabelylabel方法设置x、y轴标题

传入label参数并调用legend方法,为线添加样式说明

调用title方法设置标题

2.散点图

scatter用于绘制散点图

参数alpha设置散点的透明度(数据越密集,颜色越深)

三、简单的数据探索

使用sklearn中的datasets数据集进行简单演示,其中就包含之前提到的iris鸢尾花数据集

可以发现加载的数据是以字典的形式存储的,具体属性信息如下:

其中一共包含150行数据,每行数据四列

现在截取前两列(萼片的长宽),并绘制长宽的散点图

如果要为每一类鸢尾花绘制散点图,可以按target进行分类

可以发现target为0的鸢尾花与另外两类在(萼片长,萼片宽)这个维度上有明显区分

现在分析鸢尾花的花瓣长宽与其种类的关系,如下绘制散点图:

可以发现target为0的依旧明显区分于另外两类,且target为1和2的数据也出现了明显的分区

若在四个维度上进行分析,便有可能找出这三种鸢尾花的区分方式,从而实现机器学习的分类任务。

ml