我终于摆脱了SPSS的束缚,正在陶醉于Pandas和Python的自由(喜欢它).但是,我试图更清楚地了解python Lambda函数如何在Pandas中进行交互.它似乎突然出现了很多.这是一个例子,我希望能消除这种模糊.
从字符串拆分创建新数据框后:
bs = fh['basis'].str.split(',',expand = True)
我想通过在数字标题中添加"b"来重命名所有变量.这有效:
n = list(bs) for x in n: bs.rename(columns={x : 'b' + str(x)},inplace = True)
但我有一种潜在的怀疑,一个lambda函数会更好.但是,这不起作用:
bs.rename(columns=lambda x: x = 'b' + str(x), inplace=True)
我认为lambda是一个函数,所以如果我传入一个列标题,我可以附加一个'b'.但是"="会引发错误.任何快速观察将非常感激.干杯!
我使用add_prefix():
In [5]: bs = pd.DataFrame(np.random.rand(3,5)) In [6]: bs Out[6]: 0 1 2 3 4 0 0.521593 0.088293 0.623103 0.099417 0.983149 1 0.009741 0.465654 0.414261 0.024086 0.039543 2 0.476219 0.918162 0.900815 0.126549 0.112388 In [7]: bs.add_prefix('b') Out[7]: b0 b1 b2 b3 b4 0 0.521593 0.088293 0.623103 0.099417 0.983149 1 0.009741 0.465654 0.414261 0.024086 0.039543 2 0.476219 0.918162 0.900815 0.126549 0.112388
您可以通过'b'
在转换后str
使用以下列添加列来更轻松地完成此操作astype
:
In [2]: df = pd.DataFrame(columns=np.arange(5)) df Out[2]: Empty DataFrame Columns: [0, 1, 2, 3, 4] Index: [] In [4]: df.columns = 'b' + df.columns.astype(str) df.columns Out[4]: Index(['b0', 'b1', 'b2', 'b3', 'b4'], dtype='object')