因子分析适用于哪种数据 什么数据适合因子分析( 二 )


【因子分析适用于哪种数据 什么数据适合因子分析】写到这,希望大家能记住下面这张表:
这个表就给我们展示了常见的随机效应的设置,比如(1 | g),就是说在因子g的不同水平,我们响应变量的截距都不一样 。表中的第二行有个offset,表示没有固定效应 。如果我们的数据是一个三层嵌套数据,我们可以用第三行的设定来表示随机截距;如果你的数据没有直接嵌套但是在g1和g2的不同水平上存在相关,那么可以用第四行的设定,这个在项目反应理论中比较常见 。
在lme4中,默认认为同一个模型的截距和斜率是存在相关的,如果你确定截距和斜率无关那么设定随机效应的时候就可以用两个竖杠,或者把截距和斜率分开来写,就是说(x || g)和x +(1 | g) + (0 + x | g)表达的随机效应都是一样的 。
比如如果我认为睡眠剥夺和反应时间随机效应的截距和斜率无关,我便可以做如下设定: fm2 <- lmer(Reaction ~ Days + (Days || Subject), sleepstudy)#截距和斜率无关的设定
有时候我们拟合一个后又想尝试对模型进行改变,但又不想重写,此时就可以直接对相似的模型基础上进行更新: 模型的更新
比如我想在fm1的基础上去掉随机斜率只留随机截距,我就可以用updata写出如下代码: fm3 <- update(fm1, . ~ . - (Days | Subject) + (1 | Subject))#模型的更新
到底哪一个模型更好呢?
可以用anova方法进行模型间的比较: anova(fm1, fm2, fm3)
运行代码会输出比较的结果:
其中,从模型比较的结果可以看出,给模型增加一个截距和斜率无关的随机效应相比会使得模型的deviance变小,进一步将随机效应设定为相关,并不能够显著地减小deviance,从而我们就可以知道fm2才是对数据拟合最好的模型 。
第二部分 非线性混合模型
非线性混合模型就是通过一个连接函数将线性模型进行拓展,并且同时再考虑随机效应的模型 。The fixed-effects parameters describe the general patterns of the data and random-effects parameters describe specific clusters. If the model is nonlinear in the parameters,it is called a nonlinear mixed-effects model (Davidian &Giltinan, 2003)
非线性混合模型常常在生物制药领域的分析中会用到,因为很多剂量反应并不是线性的,如果这个时候数据再有嵌套结构,那么就需要考虑非线性混合模型了 。
看下面这个图,这个图描绘了不同人用了茶碱过后的反应,时间是横轴,残留是纵轴,和开篇线性模型中睡眠剥夺和反应时间的例子一样,我们把每个人的关系都做了图出来,不过从图中可以明显看出这种关系并不是简单线性的 。
其实这种不是线性的关系存在的情况很多 。
比如渐进回归:
再比如逻辑增长:
此时我们要注意到像这两非线性关系模型的参数都不是简单的一个斜率加个截距了 。都有φ1,φ2,φ3三个额外参数 。
这儿先给大家写一个逻辑增长的实际例子:我现在有一个关于树木周径的数据集,每棵树随访了7次,每次随访记录数的年龄age,和周径,我现在想研究在所有树木中时间和周径的关系 。
很自然,我们可以想到不同的树这个关系应该是不一样的,我们想探求的一定是考虑了树水平的变异之后的总体关系,所以不妨先画出来每个树的关系:
从图中可以看到我们总共有5棵树,基本关系是一致的,但存在些许变异相关(所以考虑混合模型),而且这个关系并不是线性的(时间越大周径基本不改变了),所以我们应该考虑非线性的混合模型 。
具体地,我们可以用nlmer方法来拟合非线性混合模型,方法参数包括3部分:首先是响应变量,然后是非线性函数,然后是混合效应公式: The formula argument fornlmeris in three parts: the response, the nonlinear model function depending on covariates and a set of nonlinear model (nm) parameters, and the mixed-effects formula.


特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。