我试图对同一生长季节在2个地点建造的田间试验进行一些统计分析.
在两个站点(Site
,水平:HF | NW),实验设计是具有4个(n = 4)块的RCBD(Block
每个水平:1 | 2 | 3 | 4 Site
).有4种处理--3种不同形式的氮肥和对照(无氮肥)(Treatment
水平:AN,U,IU,C).在田间试验期间,有3个不同的时期开始添加肥料,最后收获草.在这个因素下,这些时期被赋予了1 | 2 | 3的水平N_app
.
有一系列测量我想测试以下零假设H0:
Treatment
(H0)对测量没有影响
我特别感兴趣的两项测量是:草产量和氨排放量.
从这里Dry_tonnes_ha
显示的grass yield()开始,一个很好的平衡数据集
可以使用以下代码在R中下载数据:
library(tidyverse) download.file('https://www.dropbox.com/s/w5ramntwdgpn0e3/HF_NW_grass_yield_data.csv?raw=1', destfile = "HF_NW_grass_yield_data.csv", method = "auto") raw_data <- read.csv("HF_NW_grass_yield_data.csv", stringsAsFactors = FALSE) HF_NW_grass <- raw_data %>% mutate_at(vars(Site, N_app, Block, Plot, Treatment), as.factor) %>% mutate(Date = as.Date(Date, format = "%d/%m/%Y"), Treatment = factor(Treatment, levels = c("AN", "U", "IU", "C")))
我使用以下方法对此运行ANOVA:
model_1 <- aov(formula = Dry_tonnes_ha ~ Treatment * N_app + Site/Block, data = HF_NW_grass, projections = TRUE)
我对此有一些顾虑.
首先,测试假设的最佳方法是什么?对于简单的单向ANOVA,我将使用shapiro.test()
和bartlett.test()
依赖变量(Dry_tonnes_ha
)来评估方差的正态性和异质性.我可以在这里使用相同的方法吗?
其次,我担心这N_app
是一个重复测量,因为同一测量是在3个不同时期从同一个图中获取的 - 将这种重复测量建立到模型中的最佳方法是什么?
第三,我不知道的筑巢的最佳途径Block
内Site
.在两个站点的水平为Block
1:4.我需要Block
为每个站点设置唯一级别吗?
我在这里有另一个NH3排放数据集.R代码下载:
download.file('https://www.dropbox.com/s/0ax16x95m2z3fb5/HF_NW_NH3_emissions.csv?raw=1', destfile = "HF_NW_NH3_emissions.csv", method = "auto") raw_data_1 <- read.csv("HF_NW_NH3_emissions.csv", stringsAsFactors = FALSE) HF_NW_NH3 <- raw_data_1 %>% mutate_at(vars(Site, N_app, Block, Plot, Treatment), as.factor) %>% mutate(Treatment = factor(Treatment, levels = c("AN", "U", "IU", "C")))
为此,我有上述所有问题,并补充说数据集是不平衡的.在HF
用于N_app
1 n = 3的,但对于N_app
2和3 n = 4时,在NW
n = 4的所有N_app
水平.在NF
测量上只做出Treatment
水平U
,并IU
在NW
measuremnts上作了Treatment
水平AN
,U
和IU
我不知道如何应对这种复杂程度.我很想分析为两个独立的站点(N_app
每个站点的时段不同可能会鼓励这种方法).我可以在这里使用iii型方差分析吗?
有人向我建议,线性混合建模方法可能是前进的方法,但我不熟悉使用它们.
我欢迎您对以上任何一点的看法.谢谢你的时间.
罗里