pandas join函数详解与示例,pandas join merge区别(24)

作者 : 慕源网 本文共1895个字,预计阅读时间需要5分钟 发布时间: 2021-12-2 共155人阅读

pandas join函数详解与示例,pandas join merge区别(24)

python中的join函数的用法,join操作是关系型数据库中最核心没有之一的操作,实际中最容易出问题,经常需要优化的点也是join操作。如果我们将dataframe类比为一张表,自然也会涉及到join操作,而且非常非常常见。下面我们就来仔细看看pandas中的join用法。

本文是Python Pandas教程系列的一部分,您可以点击Python Pandas使用教程查看所有。

语法和参数

pandas dataframe.join() 的语法和参数如下:

DataFrame.join(other, on=None, how='left', lsuffix='', rsuffix='', sort=False)
参数: other:DataFrame,具有名称字段集的Series,或DataFrame列表

索引,应该类似于此列中的一列。如果传递了Series,则必须设置其name属性,

并将其用作生成的连接DataFrame中的列名

on:name,tuple / names 列表或array-like

调用者中的列或索引级别名称,用于连接其他索引,

否则加入index-on-index。如果给定多个值,则另一个 DataFrame,

必须具有MultiIndex。如果数组尚未包含在调用DataFrame中,

则可以将数组作为连接键传递。像Excel VLOOKUP操作一样

How:{‘left’,’right’,’outer’,’inner’},默认:’left’

如何处理这两个对象的操作。

1)left:使用调用框架的索引(如果指定了on,则使用列)

2)right:使用其他框架的索引

3)outer:调用框架索引的形式联合(或指定的列)与其他框架的索引,

并按字典顺序对其进行排序

4)inner:调用框架索引(或指定的列)与其他框架索引的形式交集,

保留调用框架的索引顺序

lsuffix:string

使用左框架重叠列的后缀

rsuffix:string

使用右框架重叠列的后缀

sort:布尔值,默认为False

通过联接键按词法对结果Dataframe进行排序。如果为False,

则连接键的顺序取决于连接类型(关键字)

返回: 连接的DataFrame

Dataframe.join() 函数如何在 Pandas 中工作?

现在我们看例子并解释这个 join() 函数在 Pandas 中是如何工作的。

示例 #1 – Join() 函数的使用

import pandas as pd
info1 = pd.DataFrame({'Reg_no': ['11', '12', '13', '14', '15', '16'],
'Result1': ['77', '79', '96', '38', '54', '69']})
print(info1)
info2 = pd.DataFrame({'Reg_no': ['11', '12', '13'],
'Result2': ['72', '82', '92']})
print(info2)\
final_info = info1.join(info2.set_index('Reg_no'), on="Reg_no")
print(final_info)

输出:

pandas join函数详解与示例,pandas join merge区别(24)

在上面的程序中,我们首先将pandas导入为pd,然后我们根据学生的注册号创建两个单独的学生分数数据框。在这里,我们看到我们想使用 join() 函数连接两个数据帧。因此,我们使用 Dataframe.join() 来显示上述程序中的结果,最后,该命令将其作为输出打印最终结果。

Merge() 函数和 Join() 函数的区别

现在我们看到了 merge() 函数和 join() 函数之间的区别。

join()函数 merge()函数
根据需要使用 Join() 函数来合并依赖于它们单独列表的两个数据帧。如果有覆盖部分,连接将需要您从左侧数据框中向覆盖段名称添加一个附加项。join只是简化了merge的行拼接的操作 可以说merge包含了join操作,支持两个df间行方向或列方向的拼接操作,默认列拼接,取交集

结论

最后,我们总结说,Pandas已经充分突出显示了在内存中具有优势的连接活动,通俗地说,基本上与SQL等数据库相同。datafframe .join()策略将段与文件上或关键部分上的其他DataFrame放在一起。通过传递一个rundown,有效地在double上按文件连接多个DataFrame对象。我们可以垂直地或相邻地加入数据帧。通过垂直,连接数据帧段,一个接一个地标识顺序。因此,它是一种非常有用的方式,将两个不同归档的数据帧的部分连接到一个独立的数据帧中,该数据帧依赖于常规属性。同样,我们可以通过向信息传递一个概要来连接信息。


慕源网 » pandas join函数详解与示例,pandas join merge区别(24)

常见问题FAQ

程序仅供学习研究,请勿用于非法用途,不得违反国家法律,否则后果自负,一切法律责任与本站无关。
请仔细阅读以上条款再购买,拍下即代表同意条款并遵守约定,谢谢大家支持理解!

发表评论

开通VIP 享更多特权,建议使用QQ登录