Pandas 面试题

作者 : 慕源网 本文共2181个字,预计阅读时间需要6分钟 发布时间: 2021-12-10 共541人阅读

Pandas 面试题介绍

Pandas Interview Questions and Answers 帮助许多人面试,并帮助您学习这种 Python 编程语言的基本和高级概念。它使您的计算更容易和稳健。

第 1 部分 – Pandas 面试问题(基础)

第一部分涵盖了基本的面试问题

1.解释和定义Python Pandas?

回答:

Pandas 的特点是一个开源库。Pandas 的名字来源于 Panel Data 这个词,它意味着一个来自多维信息的计量经济学。它倾向于用于 Python 中的信息调查,由 Wes McKinney 于 2008 年创建。 它可以执行处理和检查信息所需的五个巨大进步,即负载、控制、计划、模型,并剖析。

2. 描述Pandas 中的 DataFrame

回答:

DataFrame是一种表格型数据结构,它含有一组有序的列,每列可以是不同的值。DataFrame既有行索引,也有列索引,它可以看作是由

Series组成的字典,不过这些Series公用一个索引。DataFrame的创建有多种方式,不过最重要的还是根据dict进行创建,以及读取csv或者txt文件来创建

语法是:

s = pd.Series(data, index=index)
where,
data = integer, floating point number, string, or dictionary.

3. 解释可以在 Pandas 中创建 Dataframe 的不同方式?

回答:

可以通过 3 种不同的方法创建DataFrame:

  • 通过使用Lists:
d = [[‘a’, 5], [‘b’, 6], [‘c’, 7]]
  • 创建 Pandas DataFrame:
df = pd.DataFrame(d, columns = [‘Strings’, ‘Integer’])
print(df)
  • 通过使用列表dictionary :

要从列表的dictionary 中生成 DataFrame,所有数组的长度必须相同。在这种情况下,列表通过了,那么长度列表应该与显示的长度成正比。如果没有文件被传递,那么按照正常程序,记录将是一个范围(n),其中 n 是显示长度。

  • 通过使用数组:
import pandas as pd
d = {‘Name’:[‘Span’, ‘Vet’, ‘Such’, ‘Sri’], ‘marks’:[85, 80, 75, 70]}
df = pd.DataFrame(d, index =[‘first’, ‘second’, ‘third’, ‘fourth’])
print(df)

 4.解释 Pandas 时间序列?

回答:

时间序列是一组排列好的数据,它本质上说明了一段时间后某些数量的变化情况。Pandas 包含处理所有区域的时间安排信息的广泛能力和亮点。Pandas 支持以下属性,

  • 解析来自不同来源和组织的时间序列数据。
  • 创建连续的固定重复日期和时间范围。
  • 使用时区数据控制和更改日期时间。
  • 重新采样或改变一个时期的安排到一个特定的重复。
  • 使用完全或相对时间增加执行日期和时间数学。

第 2 部分 – Pandas 面试问题(高级)

现在让我们来看看高级面试问题

5. 如何在 Pandas 中复制series?

回答:

复制series 的标准语法是

pandas.Series.copy
Series.copy(deep=True)

如果 deep 设置为 False,则该命令不会复制数据。相反,它会删除它。

6. 如何在 Pandas 中创建一个空的 Dataframe?

回答:

import pandas as pd
empty=pd.Dataframe()
print(empty)

7. 解释在 Pandas 的 Dataframe 中添加行和列?

回答:

我们使用 .loc() 和 .iloc() 函数向 Dataframe 添加行和列。

要仅显示特定行中的特定数据,

import pandas as pd
data={‘country’=[‘Canada’, ‘India’, ‘Switzerland’, ‘Belgium’],
‘continent’=[‘America’, ‘Asia’, ‘Europe’, ‘Europe’]}
df=pd.Dataframe(data,columns=[‘country’,’continent’])
df.iloc[0] print(df.iloc[1])

要在列中显示特定数据,

import pandas as pd
data={‘country’=[‘Canada’, ‘India’, ‘Switzerland’, ‘Belgium’],
‘continent’=[‘America’, ‘Asia’, ‘Europe’, ‘Europe’]}
df=pd.Dataframe(data,columns=[‘country’,’continent’])
df.iloc[:,1] print(df.iloc[:,1])

8. 什么是多重索引?

回答:

多重索引的特点是基本索引,因为它管理数据检查和控制,特别是用于处理更高维度的数据。它还使我们能够在低维数据结构(如 Series 和 DataFrame)中存储和控制具有任意数量的测量值的数据。

结论

由于我们已经研究了所有可能的重要 Pandas 面试问题,因此必须注意我们应该始终记住这些概念,以便在编码时实现。这些概念使我们对 Python 和 Pandas 的基础知识非常感兴趣。

推荐文章

本文是Python Pandas教程系列的一部分,您可以点击Python Pandas使用教程查看所有。

 


慕源网 » Pandas 面试题

常见问题FAQ

程序仅供学习研究,请勿用于非法用途,不得违反国家法律,否则后果自负,一切法律责任与本站无关。
请仔细阅读以上条款再购买,拍下即代表同意条款并遵守约定,谢谢大家支持理解!

发表评论

开通VIP 享更多特权,建议使用QQ登录