Warning: Undefined array key "page" in /www/wwwroot/nownexts.com/wp-content/plugins/batch-cat/admin.php on line 147

互联网人必学的统计分析常识: 如何提出和检验假说

统计假设检验有时被称为验证性数据分析。这是一种从数据中得出推论的方法。在这个过程中,你对你在研究中可能看到的东西发展出一个假设或理论。然后用你收集的数据来验证这个假设。

假设检验通常用于比较两个群体,或者比较一个群体与一个理想化的位置。

在你可以做任何类型的社会科学领域的研究,如管理,你需要一个研究问题或假设。研究的目的通常是要么回答一个研究问题,要么考虑一个研究假设。这两者是紧密联系的,通常使用一个或另一个,而不是两者都使用。

一个研究问题是你的研究要回答的问题。例如:

  • 男人和女人一样喜欢冰淇淋吗?

  • 男人和女人喜欢相同口味的冰淇淋吗?

  • 冰淇淋市场的主要问题是什么?

  • 冰淇淋市场如何分割和定位?

研究假设是你相信你会在研究中发现的陈述。

然后在研究过程中对这些数据进行统计检验,看看你的信念是否正确。例如:

  • 男人和女人对冰淇淋的喜爱程度不同。

  • 男人和女人喜欢不同口味的冰淇淋。

  • 男性比女性更喜欢薄荷冰淇淋。

  • 女性比男性更喜欢巧克力冰淇淋。

  • 男人和女人都喜欢草莓冰淇淋而不是香草冰淇淋。

关系 vs 差异


研究假设可以用群体之间的差异或变量之间的关系来表示。然而,这些都是同一枚硬币的两面: 几乎任何假设都可以以任何一种方式提出。

例如:

性别和喜欢吃冰淇淋或者是有关系的

男人比女人更喜欢冰淇淋。

检验研究假设

统计假设检验的目的是利用样本对总体进行推断。

检验研究假设需要一些步骤:

第一步: 确定你的研究假设

任何假设检验的第一步是确定你的假设,然后你将继续进行检验。你如何定义你的假设可能会影响你所做的统计检验的类型,所以弄清楚它是很重要的。特别是,考虑一下你是否会简单地假设两人之间存在某种关系,或者推测这种关系的走向。

使用上面的例子:

  • 性别和喜欢冰淇淋之间存在关系,这是一个无向性的假设。你只是简单地说明了这是一种关系,而不是男人或女人是否更喜欢冰淇淋。

  • 然而,男性比女性更喜欢冰淇淋: 你已经明确了哪个性别更喜欢冰淇淋。

一般来说,最好不要指定方向,除非你对它有一定的把握。

第二步: 定义无效假设

无效假设基本上是你希望反驳的陈述: 与你对这段关系的猜测相反。例如,在上面的假设中,零假设是:

  • 男人和女人一样喜欢冰淇淋,或者

  • 性别和冰淇淋之间没有关系。

这也定义了你的“替代假设”,也就是你的“测试假设”(男人比女人更喜欢冰淇淋)。你的原假设通常是没有差异,因为这是最简单的位置。

假设检验的目的是推翻无效假设。如果你不能反驳零假设,你必须假设它是正确的。

第三步: 为你想比较的每个群体制定一个描述你感兴趣的变量的总结方法

我们的简单统计分析页面描述了几个概括性指标,包括两个最常见的指标,平均值和中位数。

假设检验的下一步是为每个小组开发一个概括的度量方法。例如,为了测试性别差异对冰淇淋的喜爱程度,你可以问人们对冰淇淋的喜爱程度,从1到5打分。或者,你可能有数据显示在夏季的几个月里,每个星期冰淇淋被消耗的次数。

然后你需要为每个组制定一个概要的测量方法,通常是平均值和标准差。这些可能是相似的每一组,或相当不同。

选择一个参考分布并计算一个测试统计量

为了确定两组之间是否存在真正的差异,必须使用参考分布来衡量两组的值。

参考分布最常见的来源是标准分布,如正态分布或 t- 分布。这两者是相同的,除了 t 分布的标准差是由样本估计的,而且正态分布的 t 分布是已知的。在我们的统计分布页面中有更多关于这个的信息。

然后,通过使用这两组来计算测试统计数据,比较来自两组的摘要数据。每个检验统计量和参考分布都有一个标准公式。测试和引用分布取决于您的数据和测试的目的(见下文)。



什么测试?

用于比较群组的测试将取决于您拥有多少个群组、收集的数据类型以及数据的可靠性。一般来说,比较两个组时,你会使用不同的测试,而不是比较三个或三个以上。

我们的页面调查和调查设计解释,有两种类型的答案尺度,连续和分类。例如,年龄是一个连续的尺度,尽管它也可以被分类。你也可能会发现阅读我们的数据类型页面很有帮助。

性别是一个分类尺度。

  • 对于连续刻度,可以使用所比较的两组的平均值。

  • 对于分类标尺,您需要使用中位数值。

目的 数据比例 平均数 测试 测试统计 参考分布
比较两组 连续的 刻薄 – 测试 t t
类别 中位数 Mann-Whitney u 检验 U 统计量 所有等级的组合
比较三组或更多组 连续的 刻薄 方差分析 – 比率 F
类别 中位数 Kruskal-Wallis 测试 W 统计量 所有等级的组合

来源: Easterby-Smith,Thorpe and Jackson,Management Research 4th Edition

单尾测验或双尾测验

另一件你必须决定的事情是,你是否使用所谓的“单尾”或“双尾”测试。

这允许您比较组之间在一个方向或两个方向上的差异。

实际上,这可以归结为你的研究假设是否表示为‘ x 可能大于 y’,或者‘ x 可能与 y 不同’。如果你对距离的方向有信心(也就是说,你确信唯一的选择是‘ x 可能大于 y’或者‘ x 和 y 是相同的’) ,那么你的测试将是单尾的。如果没有,它将是双尾的。

如果有任何疑问,最好使用双尾检验。

只有当你确定差异的方向时,你才应该使用单尾测试,即使你错了也没关系。

步骤5下的图显示了一个双尾检验。

警告!


如果你对收集到的数据的质量不是很有信心,例如因为输入的速度快而且便宜,或者因为数据没有被检查,那么你可能更喜欢使用中位数,即使数据是连续的,以避免任何异常值的问题。这使得测试更加健壮,结果更加可靠。

我们关于相关性的页面建议,在进行任何进一步的分析之前,你可能也想要绘制一个散射图。这还将帮助您识别数据中的任何异常值或潜在问题。

计算测试统计量

对于每种类型的测试,都有一个测试统计量的标准公式。例如,对于 t 测试,它是:

(M1-M2)/SE (ff)

M1是第一组的平均值

M2是第二组的平均值

SE (diff)是差异的标准误差,它是根据标准差和每组样本量计算出来的。

计算平均数之间差额的标准误差公式如下:

在哪里

  • Sd2 = 源总体标准差的平方(即方差) ;
  • Na = 样本 a 的大小; 及
  • 样本 b 的大小。

第五步: 确定接受和拒绝区域

测试的最后一部分是看看你的测试统计数据是否重要ー换句话说,你是否会接受或拒绝你的零假设。您需要首先考虑需要什么级别的重要性。这告诉你你偶然得到结果的概率。

显著性(或 p 值)通常要求为5% 或1% ,这意味着你有95% 或99% 的信心,你的结果不是偶然实现的。

注意: 显著性水平有时表示为 p < 0.05或 p < 0.01。

关于意义的更多信息,您可以阅读我们关于意义和置信区间的页面。

下面的图表显示了一个参考分布(这个分布可以是正态分布,也可以是 t 分布) ,标记了接受和拒绝区域。它还显示了临界值。Μ 是平均值。关于这一点,你可以阅读我们的统计分布页面。

互联网人必学的统计分析常识: 如何提出和检验假说插图

关键值是从已发布的统计表中确定的,以供参考分布使用,这些表可用于不同级别的显著性。

如果您的测试统计数据落在两个拒绝区域中的任何一个(也就是说,它大于较高的临界值,或小于较低的临界值) ,那么您将拒绝零假设。因此,你可以接受你的另一种假设。

第六步: 得出结论和推论

最后一步是得出结论。

如果你的测试数据落入拒绝区域,并且你拒绝了无效假设,那么你就可以得出结论,使用上面的例子,在喜欢冰淇淋方面存在性别差异。

错误类型

统计检验有四种可能的结果(见表) :

  • 这些组是不同的,你得出的结论是它们是不同的(正确的结果)

  • 这些组是不同的,但是您得出的结论是它们不是(Type II 错误)

  • 这些组是相同的,但是您得出的结论是它们是不同的(类型 i 错误)

  • 这些组是相同的,并且您认为它们是相同的(正确的结果)。

实际职位
根据数据得出的结论 群体是相同的 群体是不同的
数据显示两组之间没有差异 得出正确的结论 类型 II 错误
数据显示了不同组之间的差异 第一类错误 得出正确的结论

来源: Easterby-Smith,Thorpe and Jackson,Management Research 4th Edition

第一类错误通常被认为比第二类错误更重要,因为它们有可能改变现状。

例如,如果你错误地认为一种新的治疗方法是有效的,医生们可能会转而提供这种治疗方法。患者可能会接受治疗,而不是一种可能有较少副作用的替代疗法,制药公司可能会停止寻找替代疗法。


互联网人必学的统计分析常识: 如何提出和检验假说插图1

进一步阅读你需要的技能


数据处理和代数部分的技能,你需要指导的计算

这本电子书涵盖了基本的数据处理,数据可视化,基本的统计分析和代数。这本书包含了大量的工作例子,以提高理解,以及真实世界的例子,向您展示这些概念是如何有用的。

无论你是想温习基础知识,还是帮助你的孩子学习,这本书都是为你准备的。


一句忠告

有统计软件包可以为您执行所有这些测试。然而,如果你从来没有学过统计学,而且你对你正在做的事情不是很有信心,你最好还是和统计学家讨论一下,或者查阅一下详细的统计学教科书。

执行不力的统计分析会使很好的研究失效。找个人来帮助你要好得多。不过,这个网页将帮助你了解你的友好统计员!


原文链接:https://nownexts.com/statistical-analysis-knowledge-that-internet-people-must.html,转载请注明出处。
0
没有账号?注册  忘记密码?
在线客服
我们将24小时内回复。
2024-04-26 06:53:26
您好,有任何疑问请与我们联系!
您的工单我们已经收到,我们将会尽快跟您联系!
需登录后才可留言。
您尚未登录网站账户,

选择聊天工具: