我正在尝试通过从另一个列中减去现有的dataframe列列来创建新的pandas dataframe列.但是,如果结果为负数,则新列值应设置为零.
import pandas as pd data = {'A': [1,2,3], 'B': [3,2,1]} df = pd.DataFrame(data) In [4]: df Out[4]: A B 0 1 3 1 2 2 2 3 1
如果我通过从'A'中减去'B'来创建一个新的数据帧列'C',我会得到正确的结果.
df['C'] = df['A'] - df['B'] In[8]: df Out[7]: A B C 0 1 3 -2 1 2 2 0 2 3 1 2
但是,如果我利用max()
函数来避免带负数的结果,我会得到"ValueError:系列的真值是模棱两可的".
>>> df['C'] = max(df['A'] - df['B'], 0) ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
预期的产出是:
A B C 0 1 3 0 1 2 2 0 2 3 1 2
我究竟做错了什么?
您需要使用np.maximum
以元素方式进行最大比较:
>>> np.maximum(df['A'] - df['B'], 0) 0 0 1 0 2 2 dtype: int64
问题是max
它本质上是检查(df['A'] - df['B']) > 0
.这将返回一个布尔值数组(不是布尔值),因此返回错误.