我有一个数据框,其值如
A B 1 4 2 6 3 9
我需要通过添加A列和B列的值来添加新列,例如
A B C 1 4 5 2 6 8 3 9 12
我相信这可以使用lambda函数完成,但我无法弄清楚如何做到这一点.
非常简单:
df['C'] = df['A'] + df['B']
最简单的方法是使用DeepSpace答案.但是,如果您真的想使用匿名函数,可以使用apply:
df['C'] = df.apply(lambda row: row['A'] + row['B'], axis=1)
您可以使用sum
函数来实现,如注释中提到的@EdChum:
df['C'] = df[['A', 'B']].sum(axis=1) In [245]: df Out[245]: A B C 0 1 4 5 1 2 6 8 2 3 9 12
在Anton的答案上建立更多内容,您可以添加如下所有列:
df['sum'] = df[list(df.columns)].sum(axis=1)
从Pandas版本0.16.0开始,您可以使用assign
如下:
df = pd.DataFrame({"A": [1,2,3], "B": [4,6,9]}) df.assign(C = df.A + df.B) # Out[383]: # A B C # 0 1 4 5 # 1 2 6 8 # 2 3 9 12
您可以通过以下方式添加多个列:
df.assign(C = df.A + df.B, Diff = df.B - df.A, Mult = df.A * df.B) # Out[379]: # A B C Diff Mult # 0 1 4 5 3 4 # 1 2 6 8 4 12 # 2 3 9 12 6 27
您可以这样做:
df['C'] = df.sum(axis=1)
如果只想做数值:
df['C'] = df.sum(axis=1, numeric_only=True)