我们在《观察研究》和《第二手数据》上的页面描述了两个主要的数据来源(你自己的研究和以前发表的数据)。然而,也有许多不同类型的数据ー而且数据可以用几种不同的方式进行分类。数据的类型将影响您使用它的方式,以及可以进行哪些统计分析。它也会影响你可以得出的结论和推论。

因此,数据类型的选择非常重要。本页描述了数据类型的一些区别,以及对研究方法和结果的影响。

定量数据 vs 定性数据

第一个也是最明显的区别是定量和定性数据之间的区别:

  • 定量数据是数字化的: 它们可以被收集并以数字的形式呈现;

  • 定性数据不是数字。

我们关于定性和定量研究的页面更详细地解释了这种区别,并列出了两者的优点和缺点。

客观数据 vs 主观数据

数据也可以分为客观和主观。

  • 客观数据是可观察和可测量的。它们包括诸如身高、体重或元素数量之类的东西。它们通常是通过观察或直接测量来收集的。

  • 主观数据是从个人交流中收集的。这可能是口头或书面的,但也可以采取其他形式。例如,肢体语言可以提供主观信息(“她静静地躺着,闭着眼睛,紧闭着嘴巴[客观地] ,就像她处于痛苦[主观地]”)。

客观数据和主观数据都可以是定性的和定量的。例如,你可以观察(客观的)颜色变化(定性的) ,你可以要求人们用数字尺度(定量的)表达他们对一个问题(主观的)的意见。

这两种类型都有优点和缺点。例如,主观数据可以提供更广泛的信息,因为许多事情是无法衡量的。这些变量包括痛苦的程度,每个人都有自己的解释。即使使用1到10的等级,使数据定量化,也不意味着个人之间可以直接比较。

然而,主观数据也取决于人们能否准确地记住和评估事物。因此,当人们不得不记住更久以前的事件时,主观数据可能更不可靠。

因此,在可能的情况下,最好使用客观数据,但人们普遍认为有时只能使用主观数据。



纵向数据与横向数据

纵向和横向数据之间的区别实际上在研究设计上比数据类型更加明显。

  • 纵向研究随着时间的推移对同一组人进行研究,因此可以显示随着时间的推移而发生的变化,并确定其原因。

  • 横断面研究可以在不同的时间点收集数据,但来自不同的群体。因此,它们只能在时间上显示一个快照或一系列快照。

这两种类型的研究和数据之间的关键区别在于,纵向数据可以证明因果关系。

通常认为不可能从横断面数据证明因果关系,因为你只有关于某一时刻的信息。因此,我们不可能改变某些事物,看看它会产生什么影响(即,如果存在因果关系)。

然而,横断面研究要方便得多。你只需要进行一项调查或一项研究,而不是随着时间的推移跟随一个队列。纵向研究可以提供非常高质量的数据,并显示原因,但遭受的问题,如辍学的队列。长期的、高质量的纵向研究也很难获得资金。

实例: 横断面研究与纵向研究的结合


萨里交流与语言教育研究(SCALES)就是一个很好的例子,它包含了一些跨部门的追踪研究。

这项研究的第一项内容是对萨里郡180所小学接收年的儿童进行大规模调查。通过班主任为每个儿童完成的调查,对人口中的所有儿童在入学时进行语言能力筛查。他们被问及行为、语言和社交技巧。这给出了入学时语言能力的快照,使研究人员能够评估课程是否与能力相匹配,并确定年龄较小的儿童更有可能有语言问题。

第二阶段从那些被筛选的儿童中选择了590个样本,使用第一阶段的发现进行分层,以给出一系列的语言能力。一年级的研究人员和三年级的研究人员分别观察了他们,并对他们的语言技能进行了评估。家长们也被要求提供关于语言和行为的信息。

接下来的阶段是对第6年和第8年的原始量表队列进行跟踪,以评估他们的社会、情绪和精神健康状况。

研究人员对儿童早期的语言发展和青春期的社会和情感发展之间的联系很感兴趣。这种信息根本不可能从横向研究或者不同年龄段的不同研究中收集到。你可以要求参与者和父母回想过去,但是时间的差距使得回忆不太可靠。

分类、连续、离散和排序数据

另一个区别是分类数据、连续数据、离散数据或排序数据:

  • 范畴数据分为不同的组或类别。

    因此,它们包括,比如,性别,你是否喜欢冰淇淋,以及你是否曾经访问过某个特定的国家。如果把年龄分为十年或五年,他们也可以包括年龄。

  • 连续数据被定义为可以在任意两个值之间取无限个值的数据。

    这听起来很复杂,但实际上很简单。这些数据包括体重或身高,可以是在可能的体重和身高范围内的任何值,而不是固定值,或者是喜欢冰淇淋的类别的百分比(任何值在0-100% 范围内)。每个数据点都是一个独立的数字,不属于一个组。例如,如果你非常精确地用一年的几天或几分之一来衡量年龄,而不是用整年来衡量,那么年龄就会包括在内。

  • 离散数据定义为在任意两个值之间有一定数量的可能值的数据

    因此,离散数据包括客户投诉的数量,或者喜欢冰淇淋的人的数量,也就是说,你不能有一半的投诉,或者三分之一的人。另一个例子是整年的年龄。为了便于分析,离散数据被认为与连续数据非常相似。

  • 排名数据已经被分类和排序,然后按照他们的排名顺序编号

    例如,如果您有四个值为4、6、3和7的数据位,您可以按升序对它们进行排序,即3、4、6和7。然后他们按照等级排序,3是1(1) ,4是2(2) ,以此类推。当你感兴趣的是顺序而不是绝对值时,数据通常会被排序。这通常是两个变量一起变化,但没有直线关系(也就是说,它们以不同的速率变化)的情况。例如,下面的图表显示了这种类型的关系(在本例中是指数关系)。

    互联网人必学的统计分析常识: 数据类型插图

     

    警告!


    重要的是要记住,当您对数据进行排名时,您将丢失信息。

    因此,只有当你真正需要这样做的时候,才应该这样做。

 

这四种类型的数据适用于不同类型的分析ーー你需要对每种数据使用不同的统计测试和分析形式。

要了解更多关于使用不同类型的数据进行分析的信息,您可以查看我们关于相关性的页面。

总结

 

作为研究的一部分,你可以收集许多不同类型的数据。数据类型的选择通常取决于你的研究方法,而研究方法又取决于你的研究问题和研究的一般方法。然而,数据类型的选择对分析的类型以及您可以得出的结论也有影响。

 

 

 

声明:部分内容来自互联网,如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。