Pandas boxplot(箱型图),Python pandas.DataFrame.boxplot详解及示例(21)

作者 : 慕源网 本文共2568个字,预计阅读时间需要7分钟 发布时间: 2021-12-2 共169人阅读

Pandas boxplot(箱型图),Python pandas.DataFrame.boxplot详解及示例(21)

Pandas 箱线图简介

Pandas boxplot 工作用于从数据帧段制作板条箱图。箱线图是一种以图形方式描绘通过四分位数收集的数字信息的技术。容器从数据的 Q1 到 Q3 的四分位数值延伸,中间的线为(Q2)。晶须从盒子的边缘延伸,以显示数据的范围。晶须的位置默认设置为从盒子边缘开始的1.5 * IQR(IQR = Q3 – Q1)。

本文是Python Pandas教程系列的一部分,您可以点击Python Pandas使用教程查看所有。

Pandas boxplot 的语法

下面给出的是 Pandas boxplot 的语法:

pandas.boxplot(by=None,column=None, fontsize=None,ax=None, grid=True, rot=0, layout=None,figuresize=None, return_type=None, **kwds)
参数: column : str或str的列表,可选

列名或名称列表或向量。

可以是任何有效的输入pandas.DataFrame.groupby()

by : str或array-like,可选

DataFrame中的列pandas.DataFrame.groupby()。

一箱线图将每列的值来完成的。

ax : 类matplotlib.axes.Axes的对象,可选

boxplot使用的matplotlib轴。

fontsize : floatstr

以标记或字符串(例如,大)标记标签字体大小。

rot : intfloat,默认为0

标签的旋转角度(以度为单位)相对于屏幕坐标系。

grid : 布尔值,默认为True

将此设置为True将显示网格。

figsize : 以英寸为单位的元组(宽度,高度)

matplotlib中创建的图形的大小。

layout : 元组(行,列),可选

例如,(3,5)将从左上角开始使用3列和5行显示子图。

return_type : {'axes','dict','both'}None,默认'axes'

要返回的那种对象。默认是axes

'axes'返回绘制boxplotmatplotlib轴。

'dict'返回一个字典,其值是boxplotmatplotlib行。

'both'返回一个带有轴和dictnamedtuple

分组时by,return_type返回一系列映射列 。

如果return_typeNone

layout则返回具有相同形状的NumPy轴阵列。

** kwds

要传递给所有其他绘图关键字参数 matplotlib.pyplot.boxplot()。

返回 result

返回类型取决于return_type参数:

'axes':类matplotlib.axes.Axes的对象

'dict'matplotlib.lines.Line2D对象的字典

'both':一个带结构的命名元组(axlines

对于分组的数据by:

Series

array(用于)return_type = None

如何在 Pandas 中创建和使用箱线图?

下面给出了这些 boxplot 函数如何在 Pandas 中工作的各种示例:

示例#1

创建和使用箱线图。

代码:

import pandas as pd
import numpy as np
np.random.seed(1234)
df = pd.DataFrame(np.random.randn(15,4),
columns=['A1', 'A2', 'A3', 'A4'])
boxplot = df.boxplot(column=['A1', 'A2', 'A3'])

输出:

Pandas boxplot(箱型图),Python pandas.DataFrame.boxplot详解及示例(21)

在上面的程序中,我们首先将pandas和numpy库分别导入为pd和np。导入这些库后,我们创建一个随机种子数组的数据框,然后通过给出字符串的坐标来定义然后绘制这个随机种子。现在,我们定义数据框的参数并添加列,最后使用 boxplot 函数选择数据框应考虑哪些列。程序已执行,结果如上图所示。

示例#2

使用 boxplot 函数创建由第三个变量组织的分布。

代码:

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(15, 2),
columns=['A1', 'A2'])
df['S'] = pd.Series(['E', 'E', 'E', 'E', 'E',
'F', 'F', 'F', 'F', 'F'])
boxplot = df.boxplot(by='S')

输出

Pandas boxplot(箱型图),Python pandas.DataFrame.boxplot详解及示例(21)

在这里,我们和以前一样分别将 pandas 和 numpy 库作为 pd 和 np 导入。然后我们创建随机种子数据框并分配坐标,最后定义列。现在,我们分配另一个变量“S”并将箱线图值与列值一起分配。这样就实现了程序,输出如上面的快照所示。

示例 #3

使用 boxplot 函数我们可以看到两个字符串的分布。

代码:

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(15,3),
columns=['A1', 'A2', 'A3'])
df['S'] = pd.Series(['E', 'E', 'E', 'E', 'E',
'F', 'F', 'F', 'F', 'F'])
df['R'] = pd.Series(['E', 'E', 'E', 'E', 'E',
'F', 'E', 'F', 'E', 'F'])
boxplot = df.boxplot(column=['A1', 'A2'], by=['S', 'R'])

输出:

Pandas boxplot(箱型图),Python pandas.DataFrame.boxplot详解及示例(21)

在上面的程序中,我们看到在导入了 pandas 和 numpy 库之后,我们创建了一个带有随机种子的数据框并添加了箱线图的坐标。在这里,我们定义两个字符串 ‘S’ 和 ‘R’ 并最后添加列。现在,我们使用 boxplot 函数将这些列与字符串一起分布和组织。该程序已实施,因此输出如上面的快照所示。

箱线图提供了基于四分位数的数据透视图。它是利用一个箱子在拨款的下四分位数和上四分位数限制的情况下绘制的。中间的价值在板条箱内分开。

结论

因此,我们想得出结论,Pandas 中的箱线图是通过四分位数描绘数字信息的集合的视觉描绘。箱线图还用于区分信息索引中的异常。boxplot 总结了一个使用 25th、50th 和 75th 百分位数的数据示例。这些百分位数也称为下四分位数、中四分位数和上四分位数。


慕源网 » Pandas boxplot(箱型图),Python pandas.DataFrame.boxplot详解及示例(21)

常见问题FAQ

程序仅供学习研究,请勿用于非法用途,不得违反国家法律,否则后果自负,一切法律责任与本站无关。
请仔细阅读以上条款再购买,拍下即代表同意条款并遵守约定,谢谢大家支持理解!

发表评论

开通VIP 享更多特权,建议使用QQ登录