DataFrame.mean函数,Pandas DataFrame.mean()详解及使用示例(8)
Pandas DataFrame.mean() 简介
本文主要介绍一下Pandas中pandas.DataFrame.mean方法的使用。在 Python 编程的 Pandas 中,可以使用 Pandas DataFrame.mean() 函数确定均值的值。此函数可以应用于series 或数据框,并且可以跨特定访问确定给定实体的平均值。
语法和参数
这是 Pandas DataFrame.mean() 的语法:
语法:
DataFrame.mean(self, axis=None, skipna=None, level=None, numeric_only=None, **kwargs)
Pandas DataFrame.mean() 的参数
下面是参数说明:
参数 | 描述 |
axis | 此参数表示需要应用均值函数的列或轴。此参数中指定的值表示数据框中的列、位置或位置。为了实现这种在数据框上灵活移动的能力,轴值框定在下面的方法中,{index (0), columns (1)}。这里提到 0 到轴参数的值给出了数据框中每一行的平均值,而提到数据框中的 1 值给出了数据框中所有列的平均值。 |
skip | 跳skip是 mean() 确定函数中的另一个主要参数。作为参数名称提到的跳过它有助于确定数据框中的特定列是否包含空值,如果需要在平均值计算过程中跳过这些值,则需要设置此列。设置此列或翻转此列的过程可以通过将列值设为“False”来实现。因此,当为该列分配值“None”时,数据框中的所有无值列或行将不会被考虑用于平均值计算。跳过参数的默认值为 True。 |
level | 如果轴是 MultiIndex(分层),则与特定级别一起计数,折叠成一个Series。 |
numeric_only | 在大多数情况下,pandas series 或数据框对象的值可能不一定是数字格式。这意味着可能存在这样的实例,其中panda’s 的对象(如系列或数据框)可能是字母数字实例的组合,因此panda’s 对象中可能存在字符串值。在这些情况下,仅数字选项起作用。所以这是另一个布尔选项以及 skip a ,其中默认值将为 none 并将其设置为 true 将跳过series 或数据框中的所有字符串值,考虑均值计算。像这样的选项使panda为数据分析过程建立了一个非常乐观的选择。numeric_only 不适用于series 对象。 |
实现 Pandas DataFrame.mean() 的示例
以下是提到的一些示例:
示例#1
代码:
import pandas as pd
Core_Series = pd.Series([ 10, 20, 30, 40, 50, 60])
print(" THE CORE SERIES ")
print(Core_Series)
Mean_value_series = Core_Series.mean()
print("")
print(" THE MEAN VALUE: ",Mean_value_series)
输出:
说明: 这里最初导入的是panda’s 的库,导入的库用于创建series。series中的值以这样的方式制定,即它们是 10 到 60 的series。 mean() 方法用于确定series的平均值并将其打印到控制台。因此,在当前给定的series上,我们可以注意到平均值已生成并精确打印。
示例#2
代码:
import pandas as pd
Core_Dataframe = pd.DataFrame({'A' : [ 1, 6, 11, 15, 21, 26],
'B' : [2, 7, 12, 17, 22, 27],
'C' : [3, 8, 13, 18, 23, 28],
'D' : [4, 9, 14, 19, 24, 29],
'E' : [5, 10, 15, 20, 25, 30]})
print(" THE CORE DATAFRAME ")
print(Core_Dataframe)
print(type(Core_Dataframe.A[0]))
Core_Dataframe_mean_row_level = Core_Dataframe.mean(axis= 0)
Core_Dataframe_mean_column_level = Core_Dataframe.mean(axis= 1)
print("")
print(" THE CORE DATAFRAME MEAN ROW LEVEL:",Core_Dataframe_mean_row_level)
print("")
print(" THE CORE DATAFRAME MEAN COLUMN LEVEL:",Core_Dataframe_mean_column_level)
输出:
解释: 这里最初导入了panda’s 的库,导入的库用于创建形状(6,6)的数据框。数据框中的所有列都分配有按字母顺序排列的标题。数据框中的值以这样的方式表示,即它们是 1 到 n 的序列。这里创建的数据帧被通知为核心数据帧。这里以两种不同的方式确定核心数据帧的平均值。使用 mean() 方法中的轴参数来实现平均值确定的这种差异化。因此,在第一个实例中,通过将轴值设置为 0 来生成行级平均值。而在第二个实例中,通过将轴值设置为 1 来确定列级平均值。这两个实例的平均值都被精确打印到控制台。
示例#3
代码:
import pandas as pd
Core_Dataframe = pd.DataFrame({'A' : [10, 20, 'String_Value'],
'B' : [10, 20, 40],
'C' : [10, 20, 50],
'D' : [10, 'string_value', 50],
'E' : [10, 20, None]})
print(" THE CORE DATAFRAME ")
print(Core_Dataframe)
Normal_Mean = Core_Dataframe.mean()
Mean_when_numeric_turned_on = Core_Dataframe.mean(numeric_only = True)
Mean_when_None_skipped = Core_Dataframe.mean(skipna = False)
print("")
print(" MEAN VALUE OF DATAFRAME A ")
print(Normal_Mean)
print("")
print(" MEAN VALUE WHEN NON NUMERIC SKIPPED ")
print(Mean_when_numeric_turned_on)
print("")
print(" MEAN VALUE WHEN NONE ROWS ARE SKIPPED ")
print(Mean_when_None_skipped)
输出:
说明:上面例子中的整个初始操作集在这里再次重复,一旦声明了核心数据帧,数据帧中每一列的数据类型就会打印到控制台中,核心数据帧的平均值这里以三种不同的方式计算。在第一种情况下,整个数据框的平均值是在没有任何参数的情况下计算的。在第二种情况下,计算平均值时将数字设置为“true”,而在第三种情况下,计算平均值时将跳过 a 设置为false。以下过程的结果打印到控制台。
结论
pandas 中的 mean() 方法显示了以最优化的方式对数据框中的每个值应用均值运算的灵活性。它还描述了可以与 python pandas 编程的 mean() 方法相关联的分类参数集。
常见问题FAQ
- 程序仅供学习研究,请勿用于非法用途,不得违反国家法律,否则后果自负,一切法律责任与本站无关。
- 请仔细阅读以上条款再购买,拍下即代表同意条款并遵守约定,谢谢大家支持理解!