7赞

透视包含字符串的Pandas Dataframe - "没有要聚合的数字类型"错误

作者：N个小灰流_701 | 2023-09-09 12:51

如何解决《透视包含字符串的PandasDataframe-"没有要聚合的数字类型"错误》经验，为你挑选了2个好方法。

关于这个错误有很多问题,但在环顾四周之后,我仍然无法找到/解决问题.我正在尝试使用字符串来转动数据框,以使某些行数据成为列,但到目前为止还没有成功.

我的df的形状


Int64Index: 515932 entries, 0 to 515931
Data columns (total 5 columns):
id                 515932 non-null object
cc_contact_id      515932 non-null object
Network_Name       515932 non-null object
question           515932 non-null object
response_answer    515932 non-null object
dtypes: object(5)
memory usage: 23.6+ MB

样本格式

id  contact_id  question    response_answer
16  137519  2206    State   Ca
17  137520  2206    State   Ca
18  137521  2206    State   Ca
19  137522  2206    State   Ca
20  137523  2208    City    Lancaster
21  137524  2208    City    Lancaster
22  137525  2208    City    Lancaster
23  137526  2208    City    Lancaster
24  137527  2208    Trip_End Location   Home
25  137528  2208    Trip_End Location   Home
26  137529  2208    Trip_End Location   Home
27  137530  2208    Trip_End Location   Home

我想转向什么

id  contact_id      State   City       Trip_End Location
16  137519  2206    Ca      None       None None
20  137523  2208    None    Lancaster  None None
24  137527  2208    None    None       None Home
etc. etc.

如果问题值成为列,则response_answer位于其对应的列中,并保留ID

我试过了什么

unified_df = pd.DataFrame(unified_data, columns=target_table_headers, dtype=object)

pivot_table = unified_df.pivot_table('response_answer',['id','cc_contact_id'],'question')
# OR
pivot_table = unified_df.pivot_table('response_answer','question')

DataError:无需聚合的数字类型

使用字符串值转动数据框的方法是什么？

1> cwharland..：

默认aggfunc的pivot_table是np.sum,它不知道如何处理字符串做,你有没有指定的指数应该是什么正常.尝试类似的东西:

pivot_table = unified_df.pivot_table(index=['id', 'contact_id'],
                                     columns='question', 
                                     values='response_answer',
                                     aggfunc=lambda x: ' '.join(x))

这明确地为每id, contact_id对设置一行并在该组上创建response_answer值question.在aggfunc刚刚确保如果您有多个答案中的原始数据相同的问题,我们只是用空格串联在一起.语法pivot_table可能因您的熊猫版本而异.

这是一个简单的例子:

In [24]: import pandas as pd

In [25]: import random

In [26]: df = pd.DataFrame({'id':[100*random.randint(10, 50) for _ in range(100)], 'question': [str(random.randint(0,3)) for _ in range(100)], 'response': [str(random.randint(100,120)) for _ in range(100)]})

In [27]: df.head()
Out[27]:
     id question response
0  3100        1      116
1  4500        2      113
2  5000        1      120
3  3900        2      103
4  4300        0      117

In [28]: df.info()

Int64Index: 100 entries, 0 to 99
Data columns (total 3 columns):
id          100 non-null int64
question    100 non-null object
response    100 non-null object
dtypes: int64(1), object(2)
memory usage: 3.1+ KB

In [29]: df.pivot_table(index='id', columns='question', values='response', aggfunc=lambda x: ' '.join(x)).head()
Out[29]:
question        0        1    2        3
id
1000      110 120      NaN  100      NaN
1100          NaN  106 108  104      NaN
1200      104 113      119  NaN      101
1300          102      NaN  116  108 120
1400          NaN      NaN  116      NaN

2> 小智..：

有几种方法.

df1 = df.groupby(["id","contact_id","Network_Name","question"])['response_answer'].aggregate(lambda x: x).unstack().reset_index()
df1.columns=df1.columns.tolist()
print (df1)

df1 = df.set_index(["id","contact_id","Network_Name","question"])['response_answer'].unstack().reset_index()
df1.columns=df1.columns.tolist()
print (df1)

df1 = df.groupby(["id","contact_id","Network_Name","question"])['response_answer'].aggregate('first').unstack().reset_index()
df1.columns=df1.columns.tolist()
print (df1)

df1 = df.pivot_table(index=["id","contact_id","Network_Name"], columns='question', values=['response_answer'], aggfunc='first')
df1.columns = df1.columns.droplevel()
df1 = df1.reset_index()
df1.columns=df1.columns.tolist()
print (df1)

同样的.

    id  contact_id  Network_Name       City State Trip_End_Location
0   16      137519          2206       None    Ca              None
1   17      137520          2206       None    Ca              None
2   18      137521          2206       None    Ca              None
3   19      137522          2206       None    Ca              None
4   20      137523          2208  Lancaster  None              None
5   21      137524          2208  Lancaster  None              None
6   22      137525          2208  Lancaster  None              None
7   23      137526          2208  Lancaster  None              None
8   24      137527          2208       None  None              Home
9   25      137528          2208       None  None              Home
10  26      137529          2208       None  None              Home
11  27      137530          2208       None  None              Home

推荐阅读

程序员
为什么节点服务器必须在文件更改时重新启动？

如何解决《为什么节点服务器必须在文件更改时重新启动？》经验，为你挑选了1个好方法。 ... [详细]
程序员
需要帮助计算得分的胜负

如何解决《需要帮助计算得分的胜负》经验，为你挑选了0个好方法。 ... [详细]
程序员
我不能从已经使用GROUP BY的表中循环记录

如何解决《我不能从已经使用GROUPBY的表中循环记录》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Swift中添加UICollectionView的页眉和页脚视图

如何解决《如何在Swift中添加UICollectionView的页眉和页脚视图》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么我需要将模型传递给视图？

如何解决《为什么我需要将模型传递给视图？》经验，为你挑选了1个好方法。 ... [详细]
程序员
RegEx匹配M/YYYY,MM/YYYY,M/YY或MM/YY格式但不匹配MM/DD/YYYY

如何解决《RegEx匹配M/YYYY,MM/YYYY,M/YY或MM/YY格式但不匹配MM/DD/YYYY》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android Studio 1.5.1在APK META-INF/NOTICE.txt中复制的重复文件commons-codec-1.9.jar ...？

如何解决《AndroidStudio1.5.1在APKMETA-INF/NOTICE.txt中复制的重复文件commons-codec-1.9.jar？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从Google Places API中的位置ID中获取位置详细信息

如何解决《如何从GooglePlacesAPI中的位置ID中获取位置详细信息》经验，为你挑选了0个好方法。 ... [详细]
程序员
启动模拟器时出错

如何解决《启动模拟器时出错》经验，为你挑选了4个好方法。 ... [详细]
程序员
箭头不能处理输入类型="数字"

如何解决《箭头不能处理输入类型="数字"》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么这个正则表达式查询没有返回任何结果？

如何解决《为什么这个正则表达式查询没有返回任何结果？》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么Number('')返回0而parseInt('')返回NaN

如何解决《为什么Number('')返回0而parseInt('')返回NaN》经验，为你挑选了0个好方法。 ... [详细]
程序员
打印第二个命令行参数

如何解决《打印第二个命令行参数》经验，为你挑选了1个好方法。 ... [详细]
程序员
javax.xml.stream.XMLStreamException:不允许使用DOCTYPE

如何解决《javax.xml.stream.XMLStreamException:不允许使用DOCTYPE》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么逗号,地址,逻辑AND和逻辑OR运算符不应该在c ++中重载？

如何解决《为什么逗号,地址,逻辑AND和逻辑OR运算符不应该在c++中重载？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用ArrayBlockingQueue会使进程变慢

如何解决《使用ArrayBlockingQueue会使进程变慢》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用mysql-python执行Select语句给出None

如何解决《使用mysql-python执行Select语句给出None》经验，为你挑选了0个好方法。 ... [详细]
程序员
当页面滚动到达特定ID时添加类

如何解决《当页面滚动到达特定ID时添加类》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么是rowID&rowNum(ROWID vs ROWNUM)

如何解决《什么是rowID&rowNum(ROWIDvsROWNUM)》经验，为你挑选了1个好方法。 ... [详细]
程序员
Laravel使用JSON发送URL

如何解决《Laravel使用JSON发送URL》经验，为你挑选了1个好方法。 ... [详细]

N个小灰流_701

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章