700字范文,内容丰富有趣,生活中的好帮手!
700字范文 > 卡方检验的统计量推导_解释相关性的卡方检验的所有统计量 - Minitab

卡方检验的统计量推导_解释相关性的卡方检验的所有统计量 - Minitab

时间:2021-08-08 15:34:50

相关推荐

卡方检验的统计量推导_解释相关性的卡方检验的所有统计量 - Minitab

请查找定义和解释指导,了解随相关性卡方检验提供的每个统计量。

实测计数和预期计数

实测计数是样本中属于某个类别的实际观测值个数。

预期计数是预期的平均单元格频率(如果变量之间相互独立)。Minitab 通过将总行数和总列数的乘积除以观测值总数来计算预期计数。

解释

您可以比较输出表格中每个单元格的实测值和预期值。在这些结果中,实测单元格计数是每个单元格中的第一个数字,预期计数是每个单元格中的第二个数字。

如果两个变量相关,则一个变量的观测值的分布是否会因另一个变量的类别而异。如果两个变量不相关,则一个变量的观测值的分布将类似于另一个变量的所有类别的分布。在此例中,表格的第 1 列、第 2 行显示,观测计数为 76,预期计数为 60.78。如果变量之间不相关,则实测计数似乎比预期计数大得多。

列表统计量: 机器 ID, 工作表列

行: 机器 ID 列: 工作表列

第 1 第 2 第 3

个偏移 个偏移 个偏移 全部

1 48 47 48 143

56.08 46.97 39.96

2 76 47 32 155

60.78 50.91 43.31

3 36 40 34 110

43.14 36.13 30.74

全部 160 134 114 408

单元格内容

计数

期望计数

所有行和列计数

Minitab 会显示行和列的边际计数。

行计数

每个表格行中的计数和。

列计数

每个表格列中的计数和。

合计

所有单元格的计数和。所有行计数的和等于所有列计数的和。

解释

可以使用边际计数了解计数在类别之间是如何分布的。

在这些结果中,行 1 的总数为 143,行 2 的总数为 155,行 3 的总数为 110。所有行的总和为 408。列 1 的总数为 160,列 2 的总数为 134,列 3 的总数为 114。所有列的总和为 408。

列表统计量: 机器 ID, 工作表列

行: 机器 ID 列: 工作表列

第 1 第 2 第 3

个偏移 个偏移 个偏移 全部

1 48 47 48 143

56.08 46.97 39.96

2 76 47 32 155

60.78 50.91 43.31

3 36 40 34 110

43.14 36.13 30.74

全部 160 134 114 408

单元格内容

计数

期望计数

卡方的贡献

Minitab 会显示每个单元格的卡方统计量贡献,从而量化每个单元格差异队总卡方统计量的贡献。

Minitab 通过将单元格的观测值与预期值的差值平方除以该单元格的预期值,来计算每个单元格的卡方统计量的贡献。卡方统计量是所有单元格的这些值的总和。

解释

在这些结果中,每个单元格的卡方总和就是 Pearson 卡方统计量,该值为 11.788。最大贡献来自第 1 个班次和第 3 个班次使用的机器 2。最小贡献来自使用机器 1 和 2 的第 2 个班次。

相关性的卡方检验: 机器 ID, 工作表列

行: 机器 ID 列: 工作表列

第 1 第 2 第 3

个偏移 个偏移 个偏移 全部

1 48 47 48 143

56.08 46.97 39.96

1.1637 0.0000 1.6195

2 76 47 32 155

60.78 50.91 43.31

3.8088 0.2998 2.9530

3 36 40 34 110

43.14 36.13 30.74

1.1809 0.4151 0.3468

全部 160 134 114 408

单元格内容

计数

期望计数

对卡方的贡献

卡方检验

卡方 自由度 P 值

Pearson 11.788 4 0.019

似然比 11.816 4 0.019

Pearson 卡方和似然比卡方

Minitab 执行 Pearson 卡方检验和似然比卡方检验。每个卡方检验都可用于确定变量之间是否关联(相关)。

Pearson 卡方检验

Pearson 卡方统计量 (χ2) 涉及实测频率与预期频率的平方差。

似然比卡方检验

似然比卡方统计量 (G2) 基于实测频率与预期频率的比值。

解释

使用卡方统计量检验变量之间是否关联。在这些结果中,两个卡方统计量都非常相似。可使用 p 值来评估卡方统计量的显著性。

卡方检验

卡方 自由度 P 值

Pearson 11.788 4 0.019

似然比 11.816 4 0.019

当预期计数较少时,您的结果可能有误导性。有关更多信息,请参见相关性的卡方检验的数据注意事项

自由度

自由度 (DF) 是有关统计量的独立信息的条数。表格的自由度为(行数 – 1)乘以(列数 – 1)。

解释

Minitab 使用自由度来确定与检验统计量相关的 p 值。

在这些结果中,自由度 (DF) 为 4。

卡方检验

卡方 自由度 P 值

Pearson 11.788 4 0.019

似然比 11.816 4 0.019

P 值

p 值是一个概率,用来度量否定原假设的证据。概率越低,否定原假设的证据越充分。

使用 p 值来确定可以否定还是无法否定原假设,以表明两个类别变量之间不存在关联。

Minitab 使用卡方统计量确定 p 值。

注意

当任何预期计数小于 1 时,Minitab 不会显示 p 值,因为这些结果可能无效。

解释

要确定变量之间是否相互独立,可将 p 值与显著性水平进行比较。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 表明变量之间在实际上不存在关联时断定存在关联的风险为 5%。

P 值 ≤ α:变量之间的关联在统计上显著(否定 H0)

如果 p 值小于或等于显著性水平,则可以否定原假设并断定变量之间的关联在统计上显著。

P 值 > α:无法断定变量之间存在关联(无法否定 H0)

如果 p 值大于显著性水平,则无法否定原假设,因为没有足够的证据可以断定变量之间存在关联。

在这些结果中,p 值 = 0.019。由于 p 值小于 α,因此您可以否定原假设。您可以断定变量之间是关联的。

卡方检验

卡方 自由度 P 值

Pearson 11.788 4 0.019

似然比 11.816 4 0.019

原始残差

原始残差是实测计数和预期计数之间的差值。

实测计数

实测计数是样本中属于某个类别的实际观测值个数。

期望计数

预期计数是预期的平均单元格频率(如果变量之间相互独立)。Minitab 通过将总行数和总列数的乘积除以观测值总数来计算预期计数。

解释

您可以比较输出表格中的实测值和预期值。

在这些结果中,单元格计数是每个单元格中的第一个数字,预期计数是每个单元格中的第二个数字,原始残差是每个单元格中的第三个数字。机器 2、第 1 个班次的原始残差最大,这表示在第 1 个班次使用的机器 2 上发现的预期缺陷和实际缺陷之间的差值最大。

行: 机器 ID 列: 工作表列

第 1 第 2

个偏移 个偏移 第 3 个偏移 全部

1 48 47 48 143

56.08 46.97 39.96

-8.078 0.034 8.044

2 76 47 32 155

60.78 50.91 43.31

15.216 -3.907 -11.309

3 36 40 34 110

43.14 36.13 30.74

-7.137 3.873 3.265

全部 160 134 114 408

单元格内容

计数

期望计数

残差

标准化残差更适用于比较实测计数和预期计数。

标准化残差

标准化残差等于原始残差(或实测计数与预期计数的差值)除以预期计数的平方根。

解释

您可以比较输出表格中的标准化残差,以确定哪些变量类别在相对于样本数量的预期计数和实际计数之间存在的差异最大,并且似乎相关。例如,您可以评估输出表格中的标准化残差,以确定产生缺陷的机器和班次之间的关联。

在这些结果中,单元格计数是每个单元格中的第一个数字,预期计数是每个单元格中的第二个数字,标准化残差是每个单元格中的第三个数字。正标准化残差表示不合格把手的数量比预期多。负标准化残差表示不合格把手的数量比预期少。

Rows: Machine ID Columns: Worksheet columns

1st shift 2nd shift 3rd shift All

1 48 47 48 143

56.08 46.97 39.96

-1.0788 0.0050 1.2726

2 76 47 32 155

60.78 50.91 43.31

1.9516 -0.5476 -1.7184

3 36 40 34 110

43.14 36.13 30.74

-1.0867 0.6443 0.5889

All 160 134 114 408

Cell Contents: Count

Expected count

Standardized residual

调整残差

调整残差就是原始残差(即实测计数和预期计数之间的差值)除以标准误的估计值。调整残差可用于解释因样本数量产生的变异。

解释

您可以比较输出表格中的调整残差以确定哪些类别在相对于样本数量的预期计数和实际计数之间的差异最大。例如,您可以确定哪个机器或班次的预期缺陷品数量和实际缺陷品数量之间的差异最大。

在这些结果中,单元格计数是每个单元格中的第一个数字,预期计数是每个单元格中的第二个数字,调整残差是每个单元格中的第三个数字。调整残差为正数时,表示有缺陷的把手比预期多(已根据样本数量调整)。调整残差为负数时,表示有缺陷的把手比预期少(已根据样本数量调整)。

行: 机器 ID 列: 工作表列

第 1 个偏移 第 2 个偏移 第 3 个偏移 全部

1 48 47 48 143

56.08 46.97 39.96

-1.7169 0.0076 1.8602

2 76 47 32 155

60.78 50.91 43.31

3.1788 -0.8485 -2.5707

3 36 40 34 110

43.14 36.13 30.74

-1.6309 0.9199 0.8117

全部 160 134 114 408

单元格内容

计数

期望计数

调整残差

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。