12赞

在文件循环中连接pandas数据帧

作者：虎仔球妈_459 | 2023-09-08 18:21

如何解决《在文件循环中连接pandas数据帧》经验，为你挑选了0个好方法。

我正在尝试编写一个脚本,通过某个模式/变量循环文件,然后它连接文件的第8列,同时保留所有文件通用的前4列.如果我使用以下命令,该脚本可以工作:

reader = csv.reader(open("1isoforms.fpkm_tracking.txt", 'rU'), delimiter='\t') #to read the header names so i can use them as index. all headers for the three files are the same
header_row = reader.next() # Gets the header
df1 =  pd.read_csv("1isoforms.fpkm_tracking.txt", index_col=header_row[0:4], sep="\t") #file #1 with index as first 5 columns
df2 = pd.read_csv("2isoforms.fpkm_tracking.txt", index_col=header_row[0:4], sep="\t") #file #2 with index as first 5 columns
df3 = pd.read_csv("3isoforms.fpkm_tracking.txt", index_col=header_row[0:4], sep="\t") #file #3 with index as first 5 columns

result = pd.concat([df1.ix[:,4], df2.ix[:,4]], keys=["Header1", "Header2", "Header3"], axis=1) #concatenates the 8th column of the files and changes the header
result.to_csv("OutputTest.xls", sep="\t")

虽然这有效,但我一个接一个地输入文件名是不实际的,因为我有时会有100个文件,因此无法输入df ...函数.相反,我试图使用for循环来做到这一点,但我无法弄明白.这是我到目前为止:

k=0
for geneFile in glob.glob("*_tracking*"):
    while k < 3:
         reader = csv.reader(open(geneFile, 'rU'), delimiter='\t')
         header_row = reader.next()
         key = str(k)
         key = pd.read_csv(geneFile, index_col=header_row[0:1], sep="\t")
   result = pd.concat([key[:,5]], axis=1)
   result.to_csv("test2.xls", sep="\t")

但是,这不起作用.

我面临的问题如下:

我怎样才能迭代输入文件并为每个输出文件生成不同的变量名称,然后我可以在pd.concat函数中依次使用它们？

如何使用for循环生成一个字符串文件名,该文件名是df一个整数和一个整数的组合

如何修复上面的脚本获取我想要的项目.

一个小问题是关于我使用col_index函数的方式:有没有办法使用列#而不是列名？我知道它适用于index_col=0任何单一的#.但是我无法使用整数来进行> 1列索引.

请注意,所有文件都具有完全相同的结构,索引列是相同的.

非常感谢您的反馈.

推荐阅读

程序员
C和C++中几乎完全相同的代码之间的执行时间差异很大(x9)

如何解决《C和C++中几乎完全相同的代码之间的执行时间差异很大(x9)》经验，为你挑选了3个好方法。 ... [详细]
程序员
Twitter API返回401(未授权),无效或过期令牌

如何解决《TwitterAPI返回401(未授权),无效或过期令牌》经验，为你挑选了0个好方法。 ... [详细]
程序员
没有数据收到ERR_EMPTY_RESPONSE webpack

如何解决《没有数据收到ERR_EMPTY_RESPONSEwebpack》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用webpack预加载资产

如何解决《使用webpack预加载资产》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用pandas读取带有时间戳列的csv

如何解决《使用pandas读取带有时间戳列的csv》经验，为你挑选了2个好方法。 ... [详细]
程序员
[Odoo] [Qweb]字典foreach,print key和value

如何解决《[Odoo][Qweb]字典foreach,printkey和value》经验，为你挑选了2个好方法。 ... [详细]
程序员
为什么在JavaScript中可以引用调用者中的参数？

如何解决《为什么在JavaScript中可以引用调用者中的参数？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用数组初始化List <>

如何解决《使用数组初始化List<>》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Kotlin中获取泛型参数类

如何解决《如何在Kotlin中获取泛型参数类》经验，为你挑选了3个好方法。 ... [详细]
程序员
Mac OS上的日期命令

如何解决《MacOS上的日期命令》经验，为你挑选了1个好方法。 ... [详细]
程序员
要求标识不是由Racket中的模块提供的

如何解决《要求标识不是由Racket中的模块提供的》经验，为你挑选了2个好方法。 ... [详细]
程序员
Vue.js从子组件访问父/根数据

如何解决《Vue.js从子组件访问父/根数据》经验，为你挑选了1个好方法。 ... [详细]
程序员
将<f:all />标记替换为自定义模板grails上的普通字段

如何解决《将<f:all/>标记替换为自定义模板grails上的普通字段》经验，为你挑选了0个好方法。 ... [详细]
程序员
带有转义引用的Scala字符串插值失败

如何解决《带有转义引用的Scala字符串插值失败》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#lambda变量初始化

如何解决《C#lambda变量初始化》经验，为你挑选了3个好方法。 ... [详细]
程序员
JQuery DataTables - 行分组,求和,可折叠,导出

如何解决《JQueryDataTables-行分组,求和,可折叠,导出》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在C中将变量写入文件？

如何解决《如何在C中将变量写入文件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将Ceylon Sequential或数组转换为具有适当类型的通用元组？

如何解决《如何将CeylonSequential或数组转换为具有适当类型的通用元组？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Perl - 日期计算

如何解决《Perl-日期计算》经验，为你挑选了1个好方法。 ... [详细]
程序员
在应用程序上下文之外工作 - Flask

如何解决《在应用程序上下文之外工作-Flask》经验，为你挑选了2个好方法。 ... [详细]

虎仔球妈_459

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章