pandas index设置索引(pandas 多重索引)33

作者 : 慕源网 本文共2505个字,预计阅读时间需要7分钟 发布时间: 2021-12-8 共595人阅读

Pandas Index索引

Pandas中的索引对象Index用于存储轴标签和其它元数据。索引对象是不可变的,用户无法修改它。

本文是Python Pandas教程系列的一部分,您可以点击Python Pandas使用教程查看所有。

例子:

import pandas as pd
idx = pd.Index([value 1, value 2, value 3, …value n])
print(idx)
output = idx.values
print(output)

在这里,我们首先将 pandas 作为 pd 导入,然后我们创建一个名为“idx”的索引并键入字符串值,然后打印索引 idx。现在,我们使用 idx.values 将数组返回给索引对象并最终打印出结果。

  • Pandas 索引也称为 Pandas dataframe索引,其中数据结构是二维的,意味着数据按行和列排列。
  • 对于行,必须使用的索引,如果没有使用索引,则会有一个 Default np.arrange(n) 。

如何在 Pandas 中创建索引?

在 Pandas Dataframe 中有一个结构化的模板来创建索引,也就是,

import pandas as pd
data = {
column one : [‘value one’, ‘value two’, ‘value three’,……],
column two : [‘value one’, ‘value two’, value three’,……],
column three : [‘value one’, ‘value two’, ‘value three’,……],
…….
}
df = pd.Dataframe (data, columns = [‘column one’, ‘column two’, ‘column three’,…], index = [‘A1’, ‘A2’, ‘A3’, …])

例子:

import pandas as pd
lux = {'Brand': ['Armani','Valentino','Prada','Gucci'],
'Price': [15000,16000,17000,18000] }
df = pd.DataFrame(lux, columns = ['Brand','Price'], index=['p_1','p_2','p_3','p_4'])
print (df)

输出:

从上面的例子中,我们有关于名为“lux”的奢侈品牌的数据。我们想在 Python Dataframe 中使用 Pandas 索引打印这些品牌的名称和价格。首先,我们将 Pandas 导入为 pd,然后我们开始向索引添加值;也就是说,我们创建一个名为 lux 的变量,然后添加我们希望以行和列格式表示的品牌及其价格。之后,我们将dataframe定义为df,访问奢侈品牌的数据并添加产品的索引值,分别用p_1,p_2,p_3,p_4表示。因此,系统从 0 开始为这些索引值编号并识别行和列,最后打印输出。

Pandas 多重索引

多索引或多行索引只不过是多行行和列的制表。在这里可以添加、删除和替换索引。

例子:

import pandas as pd
df = pd.DataFrame ({'Brand': ['Armani', 'Valentino', 'Prada', 'Gucci', 'Dolce Gabbana'],
'Price': [15000, 16000, 17000, 18000, 19000]})
df = df.set_index(['Brand', 'Price'])
print(df)

输出:

在上面的程序中,我们在多行中添加相同的行和列,最后调用 set index 函数,从而给出输出。

如何在 Pandas 中设置和重置索引?

在 Pandas 中设置和重置索引如下:

1.Set_index():

Pandas set_index() 是一个内置的 Pandas 工作,用于将 List、Series 或 DataFrame 设置为 Data Frame 的记录。它使用可用列在 DataFrame 中设置索引。该命令基本上可以替换或扩展现有的索引列。

例子:

import pandas as pd
df = pd.DataFrame ({'Brand': ['Armani', 'Valentino', 'Prada', 'Gucci', 'Dolce Gabbana'],
'Price': [15000, 16000, 17000, 18000, 19000]})
df = df.set_index('Brand')
print(df)

输出:

在这里,我们导入Pandas 并将值添加到索引中。之后,我们定义了 set_index 函数,并将Brand名称作为一个单独的列,最后将其分配给 DataFrame。因此,在输出中,如我们所见,“Brand”有一个单独的列。

2.Reset_index():

我们可以通过使用语法来使用重置命令,

df.reset_index(drop=True)

例子:

import pandas as pd
lux = {'Brand': ['Armani', 'Valentino', 'Prada', 'Gucci', 'Dolce Gabbana'],
'Price': [15000, 16000, 17000, 18000, 19000] }
df = pd.DataFrame(lux, columns= ['Brand', 'Price'])
df = df.drop([0, 2])
df = df.reset_index(drop=True)
print(df)

输出:

第一阶段是收集各种奢侈品牌及其价格的数据。

Brand Price
Armani 15000
Valentino 16000
Prada 17000
Gucci 18000
Dolce Gabbana 19000
  • 下一步是使用 Python 代码创建一个 DataFrame。因此,我们得到所有索引号的输出,这些索引号以从 0 到 4 的顺序格式分配给所有值。
  • 下一阶段是创建 drop 函数,因为如果没有这个函数,我们将很难输入 reset_index() 命令。一旦我们与相应的索引号实现这种下降函数,索引将不连续了.
  • 最后,我们添加 reset_index 命令,索引变成连续的并打印在输出中。

结论

这是 Pandas 索引的指南。这里我们还讨论了介绍以及如何在熊猫中创建和工作索引?以及不同的示例及其代码实现。


慕源网 » pandas index设置索引(pandas 多重索引)33

常见问题FAQ

程序仅供学习研究,请勿用于非法用途,不得违反国家法律,否则后果自负,一切法律责任与本站无关。
请仔细阅读以上条款再购买,拍下即代表同意条款并遵守约定,谢谢大家支持理解!

发表评论

开通VIP 享更多特权,建议使用QQ登录