请点击阅读原文,在语雀中查看
/alipayqgthu1irbf/sharkfin/enrzni
翻译自
/statistical-hypothesis-tests-in-python-cheat-sheet/
应用机器学习中需要的17种统计假设检验的快速参考指南,并提供Python中的示例代码。
虽然有数百种统计假设检验可以使用,但只有一小部分子集可能需要在机器学习项目中使用。
在这篇文章中,你将看到一个机器学习项目中最流行的统计假说检验的手册,其中有使用Python API的例子。每一个统计检验的表述方式都是一致的,包括。检验的名称
检验的内容。
检验的关键假设。
测试结果如何解释。
使用测试的Python API。
注意,当涉及到数据的预期分布或样本大小等假设时,如果违反了某个假设,某个测试的结果很可能会优雅地退化,而不是立即变得不可用。
一般来说,数据样本需要具有领域的代表性,并且足够大,以暴露其分布进行分析。
在某些情况下,可以对数据进行修正以满足假设,例如通过去除离群值将近似正态分布修正为正态分布,或者当样本具有不同的方差时,在统计测试中使用对自由度的修正,这是两个例子。
最后,对于一个给定的关注点