数据结构论坛

首页 » 分类 » 分类 » 管理心理学之统计1背景知识
TUhjnbcbe - 2023/6/5 20:19:00

统计学一直是相关专业学生的噩梦。值得庆幸的是心理学专业并不需要接触非常艰深的统计学知识。Excel表格等辅助工具的广泛应用也大大降低了对数学计算的要求。我们所要掌握的是自上而下的理解统计学的相关知识,将统计知识清晰的整合到实际的行为科学研究中去。了解不同的数据结构和研究方法,为将来实验室研究和数据分析打下基础。

1.什么是统计

统计是一个数学过程,是一个整理和总结信息,或根据结果来确定结论的过程。无论是心理学还是其他领域的研究,都需要收集信息。当研究者完成了收集信息的任务之后,如何理解这些信息,从数字中解读出内在的模式和秩序,这就是统计需要达到的目的。

2.总体与样本

科学研究通常始于研究对象的寻找。例如研究者想知道离婚会对十三岁以下的儿童造成哪些影响,那么所有未满十三岁的儿童都属于研究对象。我们将所有未满十三岁的儿童称为总体,即研究的整个组别。虽然研究的问题是关于所有十三岁以下儿童的,但是研究者不可能考察地球上所有未满十三岁的儿童。通常的做法是从总体中选取一部分儿童进行观测,希望他们能够代表总体的情况。这些被选择出来的个体,我们称之为样本。总体和样本直接的关系如下图:

我们通常会用数字来代表总体或样本的某一特性。其中代表总体的某一特性的数字值我们称之为参数,而代表样本某一特性的数字值我们称之为统计量。参数和统计量之间呈对应关系。

3.数据结构

在确定好样本并进行试验之后,我们会收集到一系列的信息,具体表现为一组组数字。这些数字被称为数据。数据分为计数数据和测量数据。具有以下的特点:

A.数字形式(量化)

B.随机性和变异性

C.规律性

D.通过部分数据可以推测总体特征。

按照不同的类别,数据又可以分为:

A.类别数据(命名数据)

例如上面提到的研究,离婚会对十三岁以下的儿童造成哪些影响。可以通过数字将样本分类,具体操作为所有男性用1表示,女性用0表示。类别数据用于进行分类,无法进行运算。

B.顺序数据

顺序数据用于排序,可以比较大小,但无法进行运算。比如一个班期末考试的名次就是一组顺序数据,用以表示该班级学生成绩的排序。

C.等距数据

等距数据具有相等的单位,拥有相对零度。只能进行加减运算。最典型的等距数据是温度。比如2℃和4℃。我们可以说2℃比4℃高两个摄氏度单位,但是由于0℃并不代表没有温度(绝对零度是零下.15℃),它只是指在1标准大气压下,纯净的冰水混合物的温度,所以我们不能说2℃是4℃的两倍。因此等距数据不能进行乘除运算。

D.等比数据

等比数据具有相等的单位,拥有绝对零度,可以进行加减乘除运算。例如身高,体重,这些都属于等比数据。

4.研究方法

在讨论具体的研究方法之前,我们首先要来明确两个概念:变量和常量。变量是针对不同个体具有不同值的特性或条件,通常用X,Y表示。而常量是对总体中每一个个体而言都不会改变的特性或条件。例如实验者在同一个房间对10岁的儿童进行统一考试。那么被试的年龄,房间的温度等都是常量,而考试成绩则是变量。根据变量间的关系,得到的测量结果可以归入两种数据结构中,用来区分不同的研究方法和统计技术。

4.1相关法

一些研究只是简单描述了个体变量间的自然状态。这种观察每个个体两个变量间自然存在状态的研究,我们称之为相关法。例如研究大学生睡眠时间与学习成绩之间的关系。

4.2实验法或非实验法

另一种数据结构是比较两组或多组数据,其中一个变量被用来定义组别。例如研究者研究学习成绩与是否吃早餐之间的关系。其中一个变量(吃早餐/不吃早餐)被用来将学生分成两个组别,早餐组与非早餐组。第二个变量学习成绩则是用来得到每个组的数据。

A.实验法

实验法是通过操纵一个变量和观测另一个变量来建立起两个变量间的因果关系。同时试验需要控制其他无关变量,防止其对实验结果产生影响。需要掌握的术语包括:

a.自变量操纵的变量

b.因变量观测的变量

c.无关变量被控制的无用变量

d.控制条件个体不接受实验处理,或接受中立的,安慰剂性质的处理,用以得到试验数据的基准。

e.试验条件个体接受实验处理

B.非实验法与准实验法

很多研究设计并不是真正的试验,但也通过比较不同组的数据来检验变量间的关系,我们称之为非实验法。它与实验法的不同点在与被试变量是之前已经存在的特性。例如性别,研究者没有办法通过操纵和控制来将研究对象分成等价的两组,只能按照性别分为女性组和男性组。

在弄明白什么是变量以及变量间可能存在的数据结构之后,我们还需要了解怎样测量变量。很多被心理学家研究的变量实际上只是帮助描述或解释行为的假设的概念,比如智力,自尊等等。我们将这些假设的概念称之为构念。构念是一种内部的特性,不能被直接观察到。要研究构念,我们需要通过外部可见的行为来观察和测量构念。这种测量外部行为,并用测量结果来定义构念的过程我们称之为操作定义。给一个实验下操作定义的目的在于明确操作程序和测量指标。例如冬季增加室内照明强度是否导致沮丧程度的显著降低,在这里沮丧就是一个需要测量的构念。而我们可以通过SDS抑郁量表来测量沮丧的程度,这个量表就称为操作性定义。

最后我们来了解一下变量的分类。变量可以分为离散变量和连续变量,区分标准在于是否能在两个数间无限取值。例如一组家庭中孩子的数量,A家庭有2个孩子,B家庭有3个孩子,不可能出现2.5个孩子这种数据。2和3之间不能再取值,因此这是一组离散变量。而如果测量的是一组桌子的长度,A桌长2米,B桌长2.3米,只要测量工具的精密度足够高,理论上我们可以在2米到2.3米间取无数个更精确的数据,因此这是一组连续变量。

5.统计符号

变量或者说数据是一些数字值。这些数字组成了统计分析计算的基础。在统计的过程中,有一套标准的符号系统用以表示公式和数学运算中的概念。

5.1分数

在研究中,最初得到的,没有经过任何改变的数据,我们称之为原始分数。特定变量的数值一般用X表示。比如你的测验成绩是80分,我们说X=80。如果观察的是两个变量,则每个被试将会有两列变量,我们用X和Y表示。例如身高(变量X)和体重(变量Y),每组X和Y就代表了对一个个体的测量。

5.2数据个数

确定一组里有多少个数据是必不可少的程序。我们用N表示总体的数据个数,n表示样本的数据个数。

5.3求和符号

很多统计计算需要将数据相加。我们使用希腊字母Σ代表一组数据的总和。ΣX就表示变量X的所有数据总和。

介绍完学习统计学必备的背景知识之后,接下来我们将会逐一讨论如何针对具体数据进行统计学分析,包括描述性统计,推论性统计,平均数与平均数差异的谈论,相关与非参数检验等。

参考书目:行为科学统计,现代心理与教育统计学

1
查看完整版本: 管理心理学之统计1背景知识