因子分析适用于哪种数据 什么数据适合因子分析


验证性因子分析(什么数据适合因子分析)创2021-06-09 11:07·Codewar
快一个月没更新文章啦,今天收到好几个粉丝的催更私信,好的吧,实在对不住大家期待的眼神,看样子不能再拖啦,想想写啥好呢,大家咨询比较多的,混合模型算一个,今天就继续给大家写写混合模型如何做吧 。
混合模型一般都可以用lme4这个包解决,lme4既可以做线性混合模型,也可以做广义线性混合模型还可以做非线性混合模型,大家有需要可以只研究这一个包就行 。

因子分析适用于哪种数据 什么数据适合因子分析

文章插图
所谓混合模型就是既有固定效应又有随机效应的模型: “mixedeffects”, denotes a model that incorporates both fixed- and random-effects terms in a linear predictor expression from which the conditional mean of the response can be evaluated
第一部分 线性混合模型
直接上例子,数据是来自一篇研究睡眠剥夺的文献,整个数据大概长下图这样,其中我们的受试者在day0的时候可以睡到自然醒,在之后的日子里所有的受试者就只能睡3个小时了,我们的响应变量是Reaction,就是对受试者做的测验的响应时间,我现在关心睡眠剥夺后,响应时间的变化情况:
对于这么一个纵向数据,
我们来捋一捋:我们只有18个人受试者,每个受试者随访10次,我们需要明白的是,此时我们的每一次测量是嵌套在人的水平上的,我们可以认为,不同人自己的10次测量是有强烈的相关性的,而不同人之间的这种关系又不一定是相同的 。
直观一点,我们可以画出来每一天所有人响应时间和睡眠剥夺的变化,画出来就是下图:
可以看到我们上面的这个大图是由很多个小图组成的,每一个小图中横轴就是睡眠剥夺的时间,纵轴是反应时间 。每个小图就代表着我们要研究的睡眠剥夺和反应时间的关系(具体到人),但是我们也应该注意到这种关系在不同的人上是不同的,体现在:关系的斜率不同和截距不同 。(这个关系的不同可以很明显的在图中看出来)
所以我们就可以拟合一个带有随机效应的混合模型: fm1 <- lmer(Reaction ~ Days + (Days | Subject), sleepstudy)
运行代码后得到下面的结果:
结果中有随机效应的标准差和固定效应的β估计,我得到的截距是251.4,斜率是10.5,这两个系数就是我们研究的总体关系的表示,通常需要在文献中汇报,就意味着睡眠不剥夺的时候人的反应时间是251.4,而睡眠每剥夺多一天反应时间增长10.5 。
上面这个是最简单的混合模型 。我们继续看:
lme4包高水平设置介绍 混合模型公式
对于一个常见的混合模型,我们可以在lme4包中写出来如下差不多的混合模型公式: resp ~ FEexpr + (REexpr1 | factor1) + (REexpr2 | factor2) + ...
这个公式中FEexpr就是固定效应,(REexpr1 | factor1)and(REexpr2 | factor2)都是随机效应,理论上你可以弄很多个随机效应但是实际操作中我们不会关心那么多 。理解混合模型公式
我们看到每一个随机效应在公式中的表达都是(expr | factor)这样的 。竖杠前面的expr就是一个常规的回归公式,竖杠后面的factor就是一个常规的因子,你可以把竖杠想象成回归公式和因子的交互: One way to think about the vertical bar operator is as a special kind of interaction betweenthe model matrix and the grouping factor 。This interaction ensures that the columns of themodel matrix have different effects for each level of the grouping factor.
这种交互的意思就是在因子的不同水平,我们的回归是不一样的,这也正好和我们前面的解释相对应,就是在不同的人的水平睡眠剥夺和响应时间的关系不一样 。


特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。