我想从通过'append'生成的类列表的属性填充pandas数据帧.(不确定这是描述下面'allFoo'的正确术语这是一个精简的示例代码:
class foo(object): def __init__(self,input): self.val=input #in real life, there will be many more attributes in this class allFoo=[]; for i in range(10): allFoo.append(foo(i))
现在我想定义一个新的pandas数据框'df',它从allFoo.val(而不是任何其他属性)填充
这样的事情:
df[0]=foo[0].val df[1]=foo[1].val
等等
我来自matlab,我会尝试这样的事情:dataFrame = allFoo [:].val
我怎么能在python/pandas中实现这一点?
对于您的"精简"示例,以下代码可以完成这项工作:
pd.DataFrame([f.val for f in allFoo], columns=['val'])
在稍微更一般的情况下,如果您确定可以从对象中获取所有字段值,则以下内容也应该起作用:
pd.DataFrame([vars(f) for f in allFoo])
在更一般的情况下,当您的对象可能包含数据框中需要的某些字段以及您不需要的其他字段时,无法指定此字段列表.以下代码可能有助于:
fields = ['val', 'other_field'] pd.DataFrame([{fn: getattr(f, fn) for fn in fields} for f in allFoo])
道德:每当你不知道某种东西的"内置方法"时,列表理解就是你的第一选择.