结构方程模型再现(测量模型)

对于结构方程这样复杂的模型而言,倘若对研究者报告的分析与结论于统计分析上有不满意、甚至更好的作法,再现其模型并进一步作分析就是必不可免的一件事。

本文将借一份已发表paper上的数据与模型阐述如何初级地完成结构方程模型再现,以其中测量模型为例。使用结构方程软件为Amos 20。

*使用数据及模型来自Orth, Berking, Burkhardt在Society for Personality and Social Psychology上的报告(2006).详见Reference.

 

PART1 Data Simulation

圖片 3

研究者给出了12个观测变量的均值(M),标准差(SD),一致性系数(alpha)以及变量的相关矩阵。

有两种方式得到所需数据。

 

  • 方法一:

直接在SPSS或Excel或其他能够被Amos读取数据的程序中输入样本量(N)、均值(M)、标准差(SD)以及相关矩阵。

以SPSS为例——

圖片 6

依次输入样本量、均值、标准差以及相关矩阵。黄色部分为相关矩阵。注意相关矩阵必须是完全的(即不能只有对角线以上或以下的一半,虽然它们是对称的),否则Amos会跑死出不了结果。

之后在Amos的模型中拖入各观测变量即可。

Excel数据(来自.sav转.xls,可直接导入xls文件为数据来源):

ROWTYPE_ VARNAME_ x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12
N 149 149 149 149 149 149 149 149 149 149 149 149
MEAN 1.11 0.95 0.85 1.38 0.92 0.84 1.3 0.9 0.79 0.91 0.86 0.97
STDDEV 1.21 1.27 1.23 1.19 1.1 1.08 0.89 0.88 0.8 0.82 0.72 0.73
CORR x1 1 0.79 0.77 0.72 0.68 0.66 0.5 0.47 0.47 0.48 0.52 0.47
CORR x2 0.79 1 0.82 0.53 0.74 0.7 0.45 0.45 0.43 0.45 0.53 0.46
CORR x3 0.77 0.82 1 0.53 0.58 0.74 0.44 0.43 0.43 0.47 0.53 0.51
CORR x4 0.72 0.53 0.53 1 0.72 0.66 0.39 0.33 0.32 0.33 0.34 0.28
CORR x5 0.68 0.74 0.58 0.72 1 0.82 0.45 0.44 0.36 0.35 0.43 0.32
CORR x6 0.66 0.7 0.74 0.66 0.82 1 0.42 0.39 0.34 0.4 0.44 0.39
CORR x7 0.5 0.45 0.44 0.39 0.45 0.42 1 0.78 0.75 0.53 0.6 0.53
CORR x8 0.47 0.45 0.43 0.33 0.44 0.39 0.78 1 0.73 0.46 0.51 0.49
CORR x9 0.47 0.43 0.43 0.32 0.36 0.34 0.75 0.73 1 0.59 0.64 0.62
CORR x10 0.48 0.45 0.47 0.33 0.35 0.4 0.53 0.46 0.59 1 0.85 0.84
CORR x11 0.52 0.53 0.53 0.34 0.43 0.44 0.6 0.51 0.64 0.85 1 0.86
CORR x12 0.47 0.46 0.51 0.28 0.32 0.39 0.53 0.49 0.62 0.84 0.86 1

 

  • 方法二:

通过R制造符合此均值、标准差以及相关矩阵三个约束条件的数据,之后将完整的数据文件导入Amos。

R中,MASS包含有mvrnorm函数,定义其参数(样本量N,均值序列m,协方差矩阵Sigma,可定义empirical=T)后将模拟出符合此参数的数据。在本例中,即模拟出149(样本)*12(观测变量)的数据矩阵。

因此可以发现,参数所需的协方差矩阵是需要通过已知数据求得的——

 



导出的csv文件可直接作为Amos数据来源。

*部分代码网页运行不能,可拷贝后在R软件上运行。

 

 

PART2 Measurement Model

圖片 5

这是一个比较简单的4因子模型。以Guilt为因子F1,Shame为F2,Rumination为F3,Depression为F4。可见因子两两之间有双向箭头,F1与F2的观测变量误差项之间有一一对应的双向箭头。

注意研究者表明计算时将因子方差固定为1(p1613,第2段)。

在Amos中画出该模型。导入数据,将观测变量按顺序拖入。

圖片 7

 

用方法一做出的数据:

圖片 8

 

用方法二做出的数据:

圖片 10

 

为何再现出的模型参数与paper中相差如此之多,我也很想知道为什么....

 

 

Reference:

Orth, U., Berking, M., & Burkhardt, S. (2006). Self-conscious emotions and depression: rumination explains why shame buy not guilt is maladaptive. Society for Personality and Social Psychology, 32, 1608-1696. doi: 10.1177/0146167206292958

R数据包探索~trees篇

一般实验设计的时候已经有明确目标了,收集的数据是为了验证实验假设

但是...纯粹探索一下R里面那些数据包不也很很有意思吗(不要浪费它们呀~

顺便也许还能发现不少神奇的规律~

 

那么本次的target是——trees!

 

trees数据包包含31份砍下来的黑樱桃树树干的三围(...) 树干周长(Girth) 高度(Height)以及体积(Volume)

看来适合检验圆柱体体积公式

Volume = S × Height

在这里,只有周长Girth,没有底面积S,通过以下公式:

S= pi × r²

Girth = 2 × pi × r

得到本数据适合的圆柱体体积公式 

Volume = Girth² / 4 / pi × Height

也即:log(Volume)与Girth应呈线性关系,Volume与Height应呈线性关系

 

先验证第一部分:log(Volume)与Girth应呈线性关系



接下来是第二部分:Volume与Height应呈线性关系

验证方法和验证第一部分相似



 

————————————————验证时间结束——————————————————

看来数据里这些黑樱桃树树干还是很标致很符合数学的~

做完预定目标以后来点其它有意思的东西吧

————————————————乱入时间开始——————————————————

我们拿数据来做的是验证,并且是比较客观的公式确立的验证

这一点与很多不确定的东西不一样,比如天气预测,是通过观测到的数据来推测总体规律。

现在先把脑袋里的公式擦掉……

刚才做的两步验证表明数据符合log(Volume)与Girth呈线性关系,Volume与Height呈线性关系

那么数据是否还符合别的公式呢?

在不知道适用于总体的确定公式的情况下,样本数据符合的公式不等价于真正的确定公式,而样本数据符合的公式也可能不只一个。这一点需要大量数据和多次独立重复实验来确定。从这个角度来说,也表明了实验设计前文献资料翻阅的重要性。

下面来证明这个观点



对于这些数据来说,Volume和Girth的关系不仅极为符合log(Volume)与Girth呈线性关系,同样极为符合Volume与Girth呈线性关系