我们的页面简单的统计分析,发展和测试的假设和显著性和置信区间解释一些简单的技术用于统计分析。本页讨论一些更高级的技术,涉及多个变量,而不仅仅是一个或两个。

在现实生活中,与实验室研究相反,你可能会发现你的数据受到许多其他因素的影响,而不是你想要测试的变量。你从未考虑过的事情之间存在着相关性,这个世界是复杂的。

高级统计分析的目的是简化一些关系,同时为你所看到的建立一个更有效的模型。


1. 设计

你可以设计你的研究,使因果因素相互独立。例如,如果你认为年龄和薪水之间可能存在联系,那么随机抽样的员工将冒险将两者的影响结合起来。然而,如果你将人口按年龄分组,然后随机从每个组中抽取相等的数字,你就使年龄和薪水独立了。

2. 使用子样本

在这里,您选择您的样本是相等的任何潜在的混淆因素。例如,工作类型可能会影响薪酬,所以如果你想研究另一个因素对薪酬的影响,你只能选择做同样工作的人。

3. 使用统计控制

如果您怀疑三个变量可能是相关的,您可以控制其中一个来测试其他两个之间的相关性。实际上,您可以将控件的统计值调整为常数,并测试其他两个变量之间是否仍然存在关系。你可能会发现被观察到的关系仍然很高(它是真实的) ,或者大大降低(可能没有真正的关系)。还有第三种情况: 在你控制第三个变量之前没有关系,这意味着控制变量掩盖了另外两个变量之间的关系。

4. 多变量分析

多变量分析包括许多统计方法,这些方法可以让你包括多个变量,并检查每个变量的贡献。

你在多变量分析中包含的因素仍然取决于你想学什么。一些研究将会着眼于某些因素的贡献,而另一些研究将这些因素控制为(或多或少)令人讨厌的东西。

两种类型的变量

在21多变量分析,首先要决定的是变量的作用。

有两种可能性:

  • 该变量导致一个结果: 预测变量
  • 变量受到影响: 因变量

这是你的模型的函数,而不是变量本身,同一个变量可能在不同的研究中。

变量之间的关系通常用带箭头的图片来表示:

互联网人必学的统计分析常识:多变量分析法插图

你也可以直接观察变量,或者从正在发生的事情中推断出它们。

例子: 在学校的成功


“在学校的成功”是很难衡量的: 它是一个潜在的变量。

你可能会认为,“学业成功”包括学业成功、社交成功(可能是友谊的平均持续时间,或者“友谊小组”的规模)以及付出的努力(你可以用学生或老师的看法来衡量)。这些是你观察到的变量。

测量模型检查观察和潜在变量之间的关系。

主观和客观变量


无论何时你做研究,都可能涉及不同类型的数据。例如,这里既有客观数据(学业成绩、友谊的平均持续时间) ,也有主观数据(感知努力)。你选择的数据类型将会影响到你研究的质量,也会影响到你可以得出的结论。

在我们的数据类型页面中有更多关于这个的信息。

这些模型背后的想法是观察变量和潜在变量之间存在相关性(为了了解更多,你可能会喜欢阅读我们关于相关性的页面)。

这些相关性被认为是由公共因素引起的。共同因素(因子负荷)的影响越大,潜在变量和观察变量之间的相关性越高。因此,您需要测量这些相关性来评估可靠性,您可以通过几种方式来做到这一点。最常见的一种是使用一种称为 Cronbach’s alpha 的构造(大多数统计软件包都会为您计算)。这可以评估你的观察变量是否实际测量了潜在的兴趣变量,也就是说,观察变量是否是潜在变量的可靠测试。0.70或更高的值可以很好地保证模型的可靠性。

克朗巴赫的阿尔法是用来衡量变量之间的相关性。0.70或更高的值可以很好地保证模型的可靠性。


多变量分析中的测量模型分析

对于这样的测量模型,有多种分析方法。它们包括验证性因素分析和因子分析分析,通常由计算机进行。

如何执行每个变量的细节超出了本页面的范围,但是基本的思想是,它们衡量整个构造中有多少变量是由每个因素造成的。

因果模型

因果模型研究变量之间的相互关系。虽然无法证明毫无疑问的因果关系,因果模型允许你说出建议的关系是否符合数据,以及如何。

任何因果模型的优缺点都取决于变量的选择。如果你忽略了一个主要的因果关系因素,那么你的结论将是有限的或不正确的。因此,花时间尽可能仔细地定义您的模型是值得的。

有一个平衡之间的简单性和包括更多的变量,以获得一个更好的适合。显然,你不想错过一个主要的因果变量,包括更多的变量总是会给一个更好的拟合。但是,您需要考虑为了提高模型的质量,额外的复杂性是否值得。

因果模型的合适分析方法往往是所谓的广义线性模型,其中包括 Logit模型分析,多重回归分析分析,多变量分析协方差分析和多变量分析方差分析。

所有这些方法都可以测量因变量中有多少变化是由预测器引起的,从而判断模型是否有用。

同样,有一些计算机软件包可以为你做这些分析,但是一定要确保你明白你在做什么,并且正确地解释结果。

结构方程模型集测量模型和因果模型于一身。这是一种计算机建模技术,适合一个结构方程的模型。这种技术很复杂,但本质上是比较可能的模型并确定最适合数据的模型。

复杂区域

这个世界是一个复杂的地方,有时理解正在发生的事情的唯一方法就是使用先进的统计技术来建模。

然而,这些也是复杂的,你不应该在没有了解基本知识的情况下就开始着手。如果你不知道,那么最好咨询一下知道的人,通常是统计学家。即使你以前用过这个方法,让统计学家看看你计划做什么,然后检查结果,以防出现明显的错误,这仍然是一个好主意。

糟糕的分析会很快破坏好的研究。

声明:部分内容来自互联网,如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。