20赞

在snakemake中使用多个参数

作者：mobiledu2402852357 | 2023-09-06 18:52

如何解决《在snakemake中使用多个参数》经验，为你挑选了2个好方法。

我刚刚开始使用snakemake并且想知道在同一个文件上运行一组参数的"正确"方法是什么以及这对于规则的链接有什么作用？

因此,例如,当我想要多个规范化方法时,接下来让我们说一个具有不同数量的k个聚类的聚类规则.这样做的最佳方法是什么,以便运行所有组合？

我开始这样做:

INFILES = ["mytable"]

rule preprocess:
input:
    bam=expand("data/{sample}.csv", sample=INFILES, param=config["normmethod"])

output:
    bamo=expand("results/{sample}_pp_{param}.csv", sample=INFILES, param=config["normmethod"])

script:
    "scripts/preprocess.py"

然后通过以下方式调用脚本:

snakemake --config normmethod =中位数

但是,在工作流程的后期,这并没有真正扩展到更多选项.例如,我如何自动合并这些选项？

normmethods= ["Median", "Quantile"]
kclusters= [1,3,5,7,10]

Pereira Hugo.. 6

你在规则中使用expand()函数做得很好.

对于参数,我建议使用包含所有参数的配置文件.Snakemake适用于YAML和JSON文件.在这里,您可以获得有关这两种格式的所有信息:

YAML:http://docs.ansible.com/ansible/YAMLSyntax.html

JSON:http://json.org/example.html

在你的情况下,你只需要在YAML文件中写这个:

INFILES : "mytables"

normmethods : ["Median", "Quantile"] 
or
normmethods : - "Median"
              - "Quantile"

kclusters : [1,3,5,7,10]
or
kclusters : - 1
            - 3
            - 5
            - 7
            - 10

像这样写下你的规则:

rule preprocess:
input:
    bam = expand("data/{sample}.csv",
                 sample = config["INFILES"])

params :
    kcluster = config["kcluster"]

output:
    bamo = expand("results/{sample}_pp_{method}_{cluster}.csv",
                  sample = config["INFILES"],
                  method = config["normmethod"],
                  cluster = config["kcluster"])

script:
    "scripts/preprocess.py {input.bam} {params.kcluster}"

那你只需要像这样吃午饭:

snakemake --configfile  path/to/config.yml

对于与其他参数一起运行,您将不得不修改配置文件,而不是修改snakefile(减少错误),这对于可读性和代码美感更好.

编辑:

  rule preprocess:
    input:
      bam = "data/{sample}.csv"

只是为了纠正我自己的错误,你不需要在输入上使用expand,因为你只想运行规则一个文件.csv一个.所以只要把通配符放在这里,Snakemake就会尽力而为.

1> Pereira Hugo..：

你在规则中使用expand()函数做得很好.

对于参数,我建议使用包含所有参数的配置文件.Snakemake适用于YAML和JSON文件.在这里,您可以获得有关这两种格式的所有信息:

YAML:http://docs.ansible.com/ansible/YAMLSyntax.html

JSON:http://json.org/example.html

在你的情况下,你只需要在YAML文件中写这个:

INFILES : "mytables"

normmethods : ["Median", "Quantile"] 
or
normmethods : - "Median"
              - "Quantile"

kclusters : [1,3,5,7,10]
or
kclusters : - 1
            - 3
            - 5
            - 7
            - 10

像这样写下你的规则:

rule preprocess:
input:
    bam = expand("data/{sample}.csv",
                 sample = config["INFILES"])

params :
    kcluster = config["kcluster"]

output:
    bamo = expand("results/{sample}_pp_{method}_{cluster}.csv",
                  sample = config["INFILES"],
                  method = config["normmethod"],
                  cluster = config["kcluster"])

script:
    "scripts/preprocess.py {input.bam} {params.kcluster}"

那你只需要像这样吃午饭:

snakemake --configfile  path/to/config.yml

对于与其他参数一起运行,您将不得不修改配置文件,而不是修改snakefile(减少错误),这对于可读性和代码美感更好.

编辑:

  rule preprocess:
    input:
      bam = "data/{sample}.csv"

只是为了纠正我自己的错误,你不需要在输入上使用expand,因为你只想运行规则一个文件.csv一个.所以只要把通配符放在这里,Snakemake就会尽力而为.

2> Shiping..：

好像你没有将params传递给你的脚本.怎么样以下的东西？

import re
import os
import glob
normmethods= ["Median", "Quantile"] # can be set from config['normmethods']    
kclusters= [1,3,5,7,10]             # can be set from config['kclusters']
INFILES = ['results/' + re.sub('\.csv$', '_pp_' + m + '-' + str(k) + '.csv', re.sub('data/', '', file)) for file in glob.glob("data/*.csv") for m in normmethods for k in kclusters]

rule cluster:
    input: INFILES

rule preprocess:
    input:
        bam="data/{sample}.csv"
    output:
        bamo="results/{sample}_pp_{m}-{k}.csv"
    run:     
        os.system("scripts/preprocess.py %s %s %s %s" % (input.bame, output.bamo, wildcards.m, wildcards.k))

推荐阅读

程序员
具有相等参数类型的可变参数模板函数

如何解决《具有相等参数类型的可变参数模板函数》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法从Google官方网页获取Google Analytics配置文件

如何解决《无法从Google官方网页获取GoogleAnalytics配置文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
只有CSS发生变化时,Gulp livereload会重新加载整个页面

如何解决《只有CSS发生变化时,Gulplivereload会重新加载整个页面》经验，为你挑选了1个好方法。 ... [详细]
程序员
基于UIlabel行计数扩展tableviewcell

如何解决《基于UIlabel行计数扩展tableviewcell》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Eclipse时,Maven编译失败并显示"找不到符号",它编译

如何解决《使用Eclipse时,Maven编译失败并显示"找不到符号",它编译》经验，为你挑选了0个好方法。 ... [详细]
程序员
数组初始化需要括号括起的初始化列表lambda

如何解决《数组初始化需要括号括起的初始化列表lambda》经验，为你挑选了1个好方法。 ... [详细]
程序员
Firefox:"此页面的某些部分不安全,例如图片." 什么算不安全？

如何解决《Firefox:"此页面的某些部分不安全,例如图片."什么算不安全？》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用Chart.js设计条形图和线条

如何解决《使用Chart.js设计条形图和线条》经验，为你挑选了2个好方法。 ... [详细]
程序员
ASP.NET成员资格HashAlgorithmType默认为HMACSHA256,密码哈希键是否也是如此？

如何解决《ASP.NET成员资格HashAlgorithmType默认为HMACSHA256,密码哈希键是否也是如此？》经验，为你挑选了1个好方法。 ... [详细]
程序员
TSQL中的日期比较

如何解决《TSQL中的日期比较》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android RecyclerView StaggeredGrid项在滚动顶部时更改位置

如何解决《AndroidRecyclerViewStaggeredGrid项在滚动顶部时更改位置》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用python/django进行日期时间本地化

如何解决《使用python/django进行日期时间本地化》经验，为你挑选了0个好方法。 ... [详细]
程序员
newScheduledThreadPool（）方法的参数“ corePoolSize”是什么意思？

如何解决《newScheduledThreadPool（）方法的参数“corePoolSize”是什么意思？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在PHP 7中键入提示 - 对象数组

如何解决《在PHP7中键入提示-对象数组》经验，为你挑选了3个好方法。 ... [详细]
程序员
为什么此导航栏上方有空格

如何解决《为什么此导航栏上方有空格》经验，为你挑选了2个好方法。 ... [详细]
程序员
是否可能在一个反应组件中有两个状态

如何解决《是否可能在一个反应组件中有两个状态》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在R包传单中添加比例尺？

如何解决《如何在R包传单中添加比例尺？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Plivo红宝石宝石类冲突

如何解决《Plivo红宝石宝石类冲突》经验，为你挑选了1个好方法。 ... [详细]
程序员
比较C#对象

如何解决《比较C#对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
简单的ASP经典程序不起作用

如何解决《简单的ASP经典程序不起作用》经验，为你挑选了1个好方法。 ... [详细]

mobiledu2402852357

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章