7赞

Pandas:合并多个数据帧和控制列名？

作者：喜生-Da | 2023-09-09 19:47

如何解决《Pandas:合并多个数据帧和控制列名？》经验，为你挑选了1个好方法。

我想将九个Pandas数据帧合并到一个数据帧中,在两列上进行连接,控制列名.这可能吗？

我有九个数据集.所有这些都有以下列:

org, name, items,spend

我想将它们加入到包含以下列的单个数据框中:

org, name, items_df1, spend_df1, items_df2, spend_df2, items_df3...

我一直在阅读有关合并和加入的文档.我现在可以合并两个数据集,如下所示:

ad = pd.DataFrame.merge(df_presents, df_trees,
                        on=['practice', 'name'],
                        suffixes=['_presents', '_trees'])

这很好用,print list(aggregate_data.columns.values)给我看了以下几列:

[org', u'name', u'spend_presents', u'items_presents', u'spend_trees', u'items_trees'...]

但是我如何为九列做到这一点？merge似乎每次只接受两个,如果我按顺序执行,我的列名最终会变得非常混乱.

1> unutbu..：

您可以使用functools.reduce迭代方式应用于pd.merge每个DataFrame:

result = functools.reduce(merge, dfs)

这相当于

result = dfs[0]
for df in dfs[1:]:
    result = merge(result, df)

要传递on=['org', 'name']参数,可以使用functools.partialdefine merge函数:

merge = functools.partial(pd.merge, on=['org', 'name'])

由于指定suffixes参数functools.partial只允许一个固定的后缀选择,并且因为这里我们需要为每个pd.merge调用使用不同的后缀 ,我认为在调用之前准备DataFrames列名称是最容易的pd.merge:

for i, df in enumerate(dfs, start=1):
    df.rename(columns={col:'{}_df{}'.format(col, i) for col in ('items', 'spend')}, 
              inplace=True)

例如,

import pandas as pd
import numpy as np
import functools
np.random.seed(2015)

N = 50
dfs = [pd.DataFrame(np.random.randint(5, size=(N,4)), 
                    columns=['org', 'name', 'items', 'spend']) for i in range(9)]
for i, df in enumerate(dfs, start=1):
    df.rename(columns={col:'{}_df{}'.format(col, i) for col in ('items', 'spend')}, 
              inplace=True)
merge = functools.partial(pd.merge, on=['org', 'name'])
result = functools.reduce(merge, dfs)
print(result.head())

产量

   org  name  items_df1  spend_df1  items_df2  spend_df2  items_df3  \
0    2     4          4          2          3          0          1   
1    2     4          4          2          3          0          1   
2    2     4          4          2          3          0          1   
3    2     4          4          2          3          0          1   
4    2     4          4          2          3          0          1   

   spend_df3  items_df4  spend_df4  items_df5  spend_df5  items_df6  \
0          3          1          0          1          0          4   
1          3          1          0          1          0          4   
2          3          1          0          1          0          4   
3          3          1          0          1          0          4   
4          3          1          0          1          0          4   

   spend_df6  items_df7  spend_df7  items_df8  spend_df8  items_df9  spend_df9  
0          3          4          1          3          0          1          2  
1          3          4          1          3          0          0          3  
2          3          4          1          3          0          0          0  
3          3          3          1          3          0          1          2  
4          3          3          1          3          0          0          3

推荐阅读

程序员
表中是否始终需要主键自动增量？

如何解决《表中是否始终需要主键自动增量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
当我无法访问CLI工具时,如何关闭JBoss Wildfly？

如何解决《当我无法访问CLI工具时,如何关闭JBossWildfly？》经验，为你挑选了1个好方法。 ... [详细]
程序员
循环python的多个变量

如何解决《循环python的多个变量》经验，为你挑选了1个好方法。 ... [详细]
程序员
PySpark和广播连接示例

如何解决《PySpark和广播连接示例》经验，为你挑选了1个好方法。 ... [详细]
程序员
onEndEditing和onBlur之间的区别？

如何解决《onEndEditing和onBlur之间的区别？》经验，为你挑选了2个好方法。 ... [详细]
程序员
以kdb +为单位的微秒条数据汇总

如何解决《以kdb+为单位的微秒条数据汇总》经验，为你挑选了0个好方法。 ... [详细]
程序员
找到版本号最高的标签

如何解决《找到版本号最高的标签》经验，为你挑选了1个好方法。 ... [详细]
程序员
javax.xml.ws.WebServiceException:java.io.IOException:写入服务器Tomcat 8时出错

如何解决《javax.xml.ws.WebServiceException:java.io.IOException:写入服务器Tomcat8时出错》经验，为你挑选了0个好方法。 ... [详细]
程序员
哪个数据库用于iOS和Android

如何解决《哪个数据库用于iOS和Android》经验，为你挑选了1个好方法。 ... [详细]
程序员
JAX-RS/Jersey路径参数regex用于简单字符串

如何解决《JAX-RS/Jersey路径参数regex用于简单字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Sourcetree中创建分支组

如何解决《在Sourcetree中创建分支组》经验，为你挑选了1个好方法。 ... [详细]
程序员
替代https://ajax.googleapis.com/ajax/services/search/images？v = 1.0

如何解决《替代https://ajax.googleapis.com/ajax/services/search/images？v=1.0》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何获得Laravel中所有型号的列表？

如何解决《如何获得Laravel中所有型号的列表？》经验，为你挑选了1个好方法。 ... [详细]
程序员
了解静态constexpr成员变量

如何解决《了解静态constexpr成员变量》经验，为你挑选了1个好方法。 ... [详细]
程序员
引导时间选择器不显示时间选择器选项

如何解决《引导时间选择器不显示时间选择器选项》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Relay调度即席查询？

如何解决《如何使用Relay调度即席查询？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在js.erb Ruby on Rails中渲染部分后,资产中的Javascript无法正常工作

如何解决《在js.erbRubyonRails中渲染部分后,资产中的Javascript无法正常工作》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用NUnit 3在Atlassian Bamboo中运行NUnit Runner？

如何解决《如何使用NUnit3在AtlassianBamboo中运行NUnitRunner？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在没有毫秒和Z的情况下在ISO 8601中的javascript中输出日期

如何解决《如何在没有毫秒和Z的情况下在ISO8601中的javascript中输出日期》经验，为你挑选了4个好方法。 ... [详细]
程序员
UI Bootstrap uib-tabs面板右侧

如何解决《UIBootstrapuib-tabs面板右侧》经验，为你挑选了1个好方法。 ... [详细]

喜生-Da

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章