分析

在比较实验中,统计分析被用来估计效应大小和确定证据的权重相对于原假设。

内容:

在EDA图中,一个分析节点应该从至少一个结果度量中接收输入,并且至少一个感兴趣的变量应该被包含在分析中作为感兴趣的因素。

如果麻烦变量包含在分析中,例如作为阻塞因素或协变量,那么它们应该使用适当的链接连接到分析节点。

在只包含记录数据子集的分析中,例如,如果在几个时间点测量响应时,在选定的时间点(参见下面示例中的分析2)进行分析,则变量类别(而不是变量本身)应该直接连接到分析节点,以表明分析仅对来自该类别的数据进行。

分析节点的属性中要提供的信息包括分析的方法,是否事后测试而且多个测试修正是否使用了盲法分析(见眩目的部分)。如果盲法没有实现,则原因还应指定。

如果对实验数据进行多次分析,则每个分析应包含一个分析节点。的主要分析,这是用来计算样本量应该识别。

回到顶部

方法的分析

应该仔细选择统计分析策略,以确保从数据中得出有效的结论。选择合适的检验方法取决于结果度量的数量、这些结果度量的性质、感兴趣的自变量,以及在分析中是否需要考虑任何额外的可变性来源(即讨厌变量)。它还取决于所收集的数据是否满足参数假设。

一旦完成了一个实验的图表,并且处理了来自评论的反馈,系统就可以生成与实验设计兼容的统计测试的建议。在这个阶段,系统不知道数据是否满足执行参数分析所需的参数假设,用户必须评估这些假设,例如检查数据是否正态分布,以便选择使用哪种方法。

在实验进行之前,有一个计划分析方法可以从分析节点属性中的下拉菜单中选择。一旦收集到数据,有时就会有偏离计划方法的理由。例如,数据不满足参数假设,数据转换不能解决这个问题,因此非参数分析方法似乎更合适。在这种情况下,可以更新图表和所用的分析方法,连同不使用计划方法的原因可以表示。

无论数据是否满足参数假设,如何假设是评估应该在分析节点的属性中标明。

回到顶部

参数检验和非参数检验

只要满足参数假设,参数检验比非参数检验具有更强的统计力。当数据不满足这些假设时,非参数检验更有效。然而,重要的是要注意,在许多情况下,参数假设可以通过使用数据转换。在考虑非参数数据分析方法之前,应该尝试这种方法。

在评估假设时,应该注意到需要考虑分析的残差,以及数据本身。对于数据集中的每个观测:

观测值=预测值+残差

其中“预测值”是通过将统计模型与数据(例如组均值)拟合而预测的值,“残差”是观测值与预测值之间的差值。

如果数据满足以下假设,则认为该数据适合进行参数分析:

  • 数据应该是连续的,而不是绝对的或二进制的
  • 响应应是独立的,即一旦考虑到所有的变化来源,每一观测结果不应受到任何其他观测结果的影响。
  • 分析的残差应该是正态分布的
  • 不同组有相似的方差(方差齐性假设)

回到顶部

正态分布

参数检验,如t检验、ANOVA和ANCOVA,假设您的响应,或者更准确地说,分析的残差,近似正态分布。许多生物反应都遵循这种分布。如果重复测量一个正态分布的响应,在相同的实验条件下,你会期望大多数响应靠近分布的中心,当你远离中心时,观察到的响应越来越少。在中心上方和下方观察到的响应数量大致相同,这就给出了一个对称分布。

对正常情况有各种各样的检验,例如夏皮罗-威尔克检验和科尔莫戈洛夫-斯米尔诺夫检验。然而,如果样本量小,这些测试很难检测出非正常性,就像动物实验中经常出现的情况一样。另一种方法是绘制正常的概率图。这涉及到将残差(每个观察值减去组的平均值)与正态分布时的情况进行绘制。如果图上的点沿着一条直线,那么这很好地表明正态性假设成立。

有关生成正常概率图的更多信息,请单击在这里

回到顶部

方差齐性

这是大多数参数检验的关键假设之一,它意味着响应的可变性不依赖于响应的大小。例如,组内的可变性并不取决于组均值的大小。这是因为要检验的零假设是,这些组是来自同一群体的样本,因此任何均值或方差的差异都是由于偶然。

在生物反应中,变异常常随着反应的增加而增加。在这种情况下,方差同质性的假设可能不成立。

有几种检验可用于评估方差的齐性,包括Brown-Forsythe检验和Levene 's检验。然而,就像正式的正态性测试一样,当样本量很小的时候,不建议这样做,动物实验经常是这样。另一种方法是生成残差与预测图。如果这个图上的点的散点是随机的,没有扇形效应(表示残差随着预测值的增加而增大)这样的模式,那么方差的同质性假设成立。更多关于剩余和预测图的信息可以在Bate和Clark(2014)中找到。

回到顶部

数据转换

如果数据不是正态分布和/或方差齐性假设不成立,则a数据转换可以帮助研究者满足参数假设,从而使他们能够使用更敏感的参数检验。数据转换涉及用该变量的函数替换该变量。

如果转换了结果度量,可以通过将其连接到数据转换节点来表示。数据转换节点与结果相关;即使两个结果以相同的方式转换,也不能将两个不同的结果度量连接到同一个数据转换节点。数据转换产生用于分析的输出。

常见的变换包括“数学”变换(例如log,平方根或arcsin)或秩变换:

日志e和日志10转换

当反应呈指数增长时(例如细菌细胞计数),这种转化是有用的。这可能是应用于生物数据的最常见的转换,涉及到每次观察的对数值。这可以在任何一个日志上执行10或日志e规模。

应用对数转换的一个缺点是零响应或负响应不能转换。如果正在分析的结果测量包含零或负值,则有必要在所有响应中添加一个小的偏移量,以便所有数据都为正。

平方根变换

平方根变换包括对每个响应取平方根。平方根变换的缺点是它不能应用于负数。因此,如果有任何回答是否定的,应在所有数字上加一个常数,以确保它们都是正数。

如果响应是计数响应,那么在分析之前值得考虑平方根变换。

反正弦转换

这包括取一个数的反正弦的平方根。对于以1为上界,以0为下界的比例响应,反正弦变换可能是合适的。对于上面和下面有边界的响应,当响应接近这些边界时,其可变性有减少的趋势。反正弦变换有效地增加了边界处响应的可变性,并减少了中间范围内响应的可变性。

任何有上下界的响应都可以使用此方法进行转换,但如果响应不包含在0到1的范围内,则需要首先缩放以适应该范围。

秩转换

当参数假设不成立时,即使在进行了数学变换之后,也可以使用秩变换,以便(对秩变换后的数据)应用参数检验。

秩变换包括按大小对响应进行排序,最大的观测值给出秩1,第二大的观测值给出秩2,依此类推。

注意,对数据进行秩变换会丢失信息,并可能降低实验的威力。排序技术还意味着统计分析的结果不太可能受到任何异常值的影响。例如,在原始尺度上,数据集中最大的观测值可能看起来是一个离群值,但不管实际数值如何,它都被赋予第1级。这个观察结果将被给予相同的级别,不管它有多极端。

关于这些转变的更多信息可以在Bland和Altman (1996), Conover和Iman(1981)和Bate和Clark(2014)中找到。使用时可以应用上述所有转换InVivoStat并可从参数分析模块中的“转换”下拉菜单中获得。

回到顶部

多个测试修正

在许多与生物学相关的领域中,检验多个假设并因此在一个实验中进行多个比较是比较常见的。例如,如果测量了几种行为,或者实验是高通量的,或者是基因组学/蛋白质组学实验。在这种情况下,重要的是纠正那些错误地看起来很重要的随机事件。新利体育网页版

在只有一个假设的实验中,显著性水平(α)设为0.05意味着当原假设为真时,获得真阴性结果的概率为95%,偶然获得显著结果(假阳性)的概率为5%(1 - 0.95)。

在相同显著性水平下,对于3个假设的实验,得到假阳性结果的概率提高到14% (1 - 0.95)3.),有25个假设,提高到72% (1 - 0.95)25),有50个假设,达到92% (1 - 0.95)50).多重比较程序的目的是将这个概率降低到5%。看到Bonferroni调整下面描述。

回到顶部

事后测试

如果一个实验是用方差分析方法分析的,零假设被拒绝,这意味着在组的平均数之间有差异,但它不表明哪些组是不同的。为了确定具体的差异所在,可以执行后续的事后测试。

有几个事后检验可以选择,这取决于事后比较是否事先计划好,以及是否需要全成对比较,还是只需要与对照组比较。每个实验只应该运行一个事后测试。

测试调整为多次比较

Dunnett测试

Dunnett检验是比较组与对照组时的一个很好的选择,它提供了多次比较的校正,从而减少假阳性结论(I型错误)的可能性。

Tukey HSD(诚实显著性差异)

Tukey HSD测试在对所有事物进行比较时非常有用。它计算所有可能的成对比较,并为多次比较提供足够的补偿。然而,对于选定的两两比较,这种事后检验过于严格,因此增加了假阴性结论的可能性(第二类错误)。

Bonferroni测试

Bonferroni检验可用于组子集之间的计划比较,并同时调整显著性水平,以说明多个比较。该测试被认为是高度保守的,因此与较高的假阴性(第二类错误率)相关。

为了执行Bonferroni校正,通过将显著性水平除以比较数来重新调整显著性水平。因此,3个比较的显著性分界点设为0.017 (α/n = 0.05/3), 25个比较的显著性分界点设为0.002 (α/n = 0.05/25)。这种修正操作简单,但非常保守;当处理大量的比较时,它大大降低了获得假阳性的风险,但增加了获得假阴性的风险。

步进式测试

除了上述所有测试同时对所有测试应用单一调整之外,还有一些测试以逐步的方式应用调整,例如Hochberg、Hommel和Holm测试。这些测试已被证明是更传统方法的有效替代方案,详见Bate和Clark(2014)。

未经调整的测试

费雪LSD(差异最小)

Fisher的LSD在选定的均值对中执行一系列t检验,其中所有计算中使用的可变性估计是从方差分析表(均方误差)中提取的更可重复的估计。这就是为什么LSD测试被认为比简单地进行许多单独的t检验更可靠的原因之一。然而,它不能纠正多次比较,因此它与较高的假阳性率(I型错误)相关,使更有可能检测到不真实的差异。

回到顶部

感兴趣因素的数量

当研究人员有许多不同的自变量,这些自变量可能会影响反应,也可能不会,他们希望在一个实验中评估它们时,析因设计(即有多个感兴趣的因素的实验)是有用的。进行多个实验,每个实验中单个感兴趣的因素是不同的,这可能不能最有效地利用动物,也不允许评估因素之间的相互作用。对病情建模通常需要不止一个因素来解释结果测量的变化,而析因设计可用于同时测试多个因素的影响。

析因设计可用于评估感兴趣的自变量(如性别、年龄和剂量)的水平,以最大化观察治疗效果的“机会之窗”。例如,一项研究评估了dba和balb c菌株小鼠的炎症反应。这个实验允许科学家选择最敏感的菌株,这样在未来的实验中,当测试新的化合物时,就会有最大的机会窗口,从而意味着所需的动物数量可以减少。当建立一个新的动物模型时,虽然在实验过程的开始阶段进行这样的试点研究似乎是浪费资源,但长期的收益很容易超过最初的成本。

Bate和Clark(2014)区分了两种类型的阶因设计。

当研究人员想要调查许多因素的影响以及它们如何相互作用时,就会采用“大型”析因设计。研究人员可能还想找出那些可以忽略的对反应没有显著影响的因素。这些设计特别有用,例如,在建立一个新的动物模型时。大型析因设计必然涉及许多个体组,但因为我们只对总体效应感兴趣,不需要在组之间进行两两比较,所以个体样本量可能很小。

在动物研究中常用的“小”因子设计通常不超过两三个因子。目的是用适当的统计检验比较一组和另一组的平均数。因此,实验应该有足够的动力(每组都有合适的样本量),以便对因素组合进行两两比较。

回到顶部

参考资料和进一步阅读

奥特曼和布兰德,2009年。数据分析的参数非参数方法。现年338岁的BMJ a3167。doi:10.1136 / bmj.a3167

贝特,s. t . &克拉克,r. a . 2014。动物实验的设计与统计分析,英国,剑桥大学出版社。

布兰德,j.m,奥特曼,1996。转换数据。BMJ, 312, 770。doi:10.1136 / bmj.312.7033.770

康诺夫和伊曼,1981。秩变换作为参数统计和非参数统计之间的桥梁。美国统计学家,35,124-129。doi:10.2307 / 2683975

费斯汀m.f &奥特曼d.g. 2002。使用实验动物的实验设计和统计分析指南。中国科学(d辑:自然科学版)。doi:10.1093 / ilar.43.4.244

马里诺,2014年。药理学研究中统计方法的使用和误用。生物化学药理学,87,78-92。doi:10.1016 / j.bcp.2013.05.017

中川,s . & cuthill, i.c. 2007。效应量、置信区间和统计显著性:生物学家的实用指南。生物Rev Camb Philos Soc, 82,591 -605。doi:10.1111 / j.1469 - 185 x.2007.00027.x

http://www.3rs-reduction.co.uk/html/12__statisticanalysis.html

http://www.3rs-reduction.co.uk/html/11_regression.html

有关生成正态概率图的更多信息:http://www.youtube.com/watch?v=1Ts2lYrXenE

Baidu
map