数据格式分为固定和自由格式,一般社会科学中样本量不是很大,一般采用自由格式,而当数据量较大时可以采用固定格式,提高运行速度。自由格式可以通过如下列图所示在spss中得到,注意将下面是否包含变量名去掉。
mplus还可以采用协方差矩阵以及相关矩阵的汇总数据进行分析。这个时候需要加上\"nobservations=\"来表示样本量的大小。如下列图所示为两种相关矩阵的数据结构〔相关矩阵需要加上平均数和标准差用来得到协方差矩阵,协方差矩阵不需要〕。同时data命令下加上\"TYPE IS CORRELATION MEANS STDEVIATIONS; \"命令。假设采用协方差矩阵,在data命令下加上“TYPE is covariance\". 1.1 模型表述 1.1.1 测量模型 1.1.2 结构模型 1.1.3 模型表达方程 1.2 模型识别 1.3 模型估计 1.4 模型评估 1.5 模型修正
附录 1.1 将总体方差/协方差表达为模型参数的函数 附录 1.2 结构方程模型的最大似然函数 第二章 验证性因子分析模型
2.1 验证性因子分析模型根底知识
2.2 连续观察标识的验证性因子分析模型
2.3 非正态与删截连续观察标识的验证性因子分析模型 2.3.1 非正态性检验
2.3.2 非正态数据的验证性因子分析模型 2.3.3 删截标识的验证性生因子分析模型 2.4 分类观察标识的验证性因子分析模型 2.5 高阶验证性因子分析模型 附录 2.1 BSI-18 量表 附录 2.2 条目可靠度 附录 2.3 Cronbacha系数
附录 2.4 分类结局测量的连接函数和概率计算 第三章 结构方程模型 3.1 MIMIC模型 3.2 结构方程模型
3.3 单标识变量中测量误差的校正 3.4 检验涉及潜变量的交互作用 附录3.1 测量误差的影响
.
第四章 潜开展模型 4.1 线性潜开展模型 4.2 非线性潜开展模型
4.3 多结局测量开展过程的线性潜开展模型 4.4 两部式潜开展模型
4.5 分类结局测量的潜开展模型 第五章多组模型
5.1 多组验证性因子分析模型
5.1.1 多组一阶验证性因子分析模型 5.1.2 多组二阶验证性因子分析模型 5.2 多组结构方程模型 5.3 多组潜开展模型
第六章结构方程建模的样本量估计
6.1 结构方程模型样本量估计的经验法那么 6.2 satorra-Saris法估计样本量
6.2.1 应用satorra-Saris法估计CFA模型的样本量 6.2.2 应用satorra-Saris法估计LGM模型的样本量 6.3 蒙特卡罗模拟法估计样本量
6.3.1 蒙特卡罗模拟法估计CFA模型的样本量 6.3.2 蒙特卡罗模拟法估计LGM模型的样本量
6.3.3 蒙特卡罗模拟法估计具有协变量的LGM模型样本量
6.3.4 蒙特卡罗模拟法估计具有协变量和缺失值的LGM模型样本量 6.4 基于模型拟合统计量/指标的SEM样本量估计
本文来自: 人大经济论坛 LISREL、AMOS等结构方程模型分析软件 版,详细出处参考:
2.1 M plus 简介
Mplus是一款功能强大的多元统计分析软件其综合了数个潜变量分析方
法于一个统一的一般潜变量分析框架内。Mplus主要处理如下模型探索性因 素分析(Exploratory factor analysis)、验证性因素分析与结构方程模型(Structural equation modeling)、工程反响理论(Item response theory analysis)、潜类别分析 (Latent class analysis)、潜在转换分析(Latent transition analysis)、生存分析
(Survival analysis)、增长模型(Growth modeling)、多水平模型(Multilevel analysis)、 复杂数据(Complex survey data analysis)和蒙特卡洛模拟(Monte Carlo simulation) 等。
Mplus 软件的前身是Bengt O. Muthén教授开发的结构方程建模软件
LISCOMP(1988)。Mplus的第一版发布于1998年底经过10多年的完善最 近一次升级为2021年发布的第6版最新版本。当前的Mplus 6提供了 多个操作系统版(Windows, Mac OS X, 和Linux)。
图2-1为Mplus的界面非常简洁。图2-2为Mplus的工作界面所有的
建模过程均呈现在工作界面上。Mplus默认命令符为蓝色字体其他为黑色字 注释通过感慨号“〞引导开始为草绿色字体。
.
2.4 Mplus常用命令
Mplus有十个命令群分别为标题(TITLE)数据(DATA)变量 (VARIABLE)定义(DEFINE)分析(ANALYSIS)模型(MODEL)输出
(OUTPUT)保存数据(SAVEDATA)绘图(PLOT)和蒙特卡洛(MONTECARLO)。 其中DATAVARIABLE和ANALYSIS是所有分析必要的命令其他命令那么
为非必要命令。请注意这里的必要是指一个分析缺少这些命令将无法执行 其他非必要命令的缺失不会影响到分析的执行。然而有些非必要命令对于有 效的分析仍然是不可缺少的。执行一个分析的目的是为了得到有用的结果如 果不使用OUTPUT结果输出命令整个分析可以执行但并不报告任何结果 这样的分析也是无效的。
十个命令群中除了TITLE标题命令较为单一外其他命令群均包含多个子命令Mplus强大的分析功能就是通过这些子命令实现的。限于篇幅下面仅对各命令群中最常用的子命令进行介绍其他子命令可在Mplus手册第15-20章获得详细介绍。 2.4.1 标题TITLE
标题命令用于为程序起个标题不是Mplus必须的命令。标题可以是英文
也可以是中文。注意标题中尽量不要出现Mplus的命令字符以免产生不必 要的错误。
2.4.2 数据DATA
数据命令是Mplus必须的命令用于指定数据文件存放的路径。 1数据准备
心理学及社会科学研究者经常使用SPSS作为数据管理和统计分析的工
具。使用SPSS的一个好处是可以通过SPSS将数据转换成与其他统计分析软 件对接的数据格式或自由格式。具体通过SPSS的“FILE〞下拉菜单中的“SAVE AS〞来实现。不像其他结构方程软件可以读取多种数据文件Mplus只能读取 ASCII格式文件。
Mplus可以识别自由和固定两种格式数据。由于心理学研究的样本量通
常不是很大涉及的变量也不是很多所以使用自由格式数据比拟普遍。当样 本量和变量很多时使用固定格式的数据读取速度更快。Mplus通过DATA命 令指定与数据相关的信息。FILE语句用于指定数据文件的存储路径和文件名。 例如上述指令提示文件名为存储路径为C盘Mplus文件夹。在自由
格式数据文件中每列为一个变量变量之间用空格、逗号或制表符进行限定 缺省值必须用“.〞或其它数值代替如9或99否那么会发生读取错误。Mplus 对变量数是有限制的变量数的上限是500字符的长度是5000。也就是说 数据文件中最多能包含500个10位数的变量。 2数据格式 固定格式
在固定格式文件中每个变量所占字符数必须相等FORTRAN式的定义
是可以被Mplus接受的。常用的FORTRAN的描述符有“F〞“x〞“t〞“/〞。其 中F用于指定变量的格式其后可以跟整数也可以跟小数。整数表示变量是 没有小数点的整数值整数是几就表示是几位数如果是小数那么说明数据含有 小数点小数点前的数值代表数据包含几个数字小数点后的数字是几就表示 数据包含几位小数。例如可写成的形式为1236。F前也可以有整 数值表示多少个F例如可缩写为。x
字符用于表示跳过多少列不读取如25x表示跳过25列不读。t字符用于指
.
定具体读取某列变量如t30表示读取第30列。下面的语句 FORMAT IS 5F4.1, 5x, t30, 5F5.2;
第一个是5个F4.1 的缩写形式即表示
。第2个5x表示跳过5列数据不读取。t30表示直接读取第30列的数据 最后的与一样表示5个保存2个小数点的5位数。整个数据文 件为55位数。
2.4.3 VARIABLE (变量)
变量命令是Mplus必须的命令之一通过变量命令才可以对数据文件进行 有意义的处理。对于初学者来说最大的困难便是如何整理数据和使用变量命 令来定义变量。一般情况下最根本的变量命令有三个①定义数据文件中的 变量②选择分析使用的变量③定义变量的类型或尺度。 1VARIABLE定义数据文件中的变量
前面提到过数据文件中除了数字之外不允许其它变量名称的字符存在
所以在分析数据之前需要给数据文件中出现的数据命名或者说给每列变量取 个名字。由于数据文件的格式已通过DATA命令定义所以这里只需要给每列 变量指定一个标签即可所有变量都要有名称否那么程序读取时会出现错误 变量名最多允许8个字符。例如VARIABLE IS/ARE/= y1 y2 y3 y4 y5; 说明数 据文件包含5个变量名称分别为y1-y5。 2USEVARIABLES 选择分析使用的变量
一个数据文件可能包含很多变量但某项分析可能只涉及到局部变量所 以在某个具体分析之前要对所使用的变量进行选择使用USEVARIABLES来 定义。例如USEVARIABLES ARE/= y1 y2 y3 y4 y5; 或缩写成
USEVARIABLES ARE/= y1-y5。数据文件包含y1-y10十个变量而本研究只 使用其中的前五个变量。
3定义变量的类型或尺度
定义变量的类型或尺度很重要因为在Mplus中不同的变量类型对应着 不同的参数估计方法也就是说程序使用不同的统计方法是根据指定的变量类 型进行的。例如在回归分析中连续型因变量对应线性回归二分因变量对 应logistic回归等等。变量的尺度有连续、类别、计数、名义、截尾这些数 据需要不同的字符来定义分别对应CONTINUOUSCATEGORICAL COUNTNOMINAL和CENSORED。在Mplus中默认的数据类型是连续的 所以连续变量不需要定义或者说非连续性变量不定义程序会当作连续型变 量处理。
心理学和社会科学研究中常用的量表多采用李克特式问卷如李克特5点
计分1=非常同意2=同意3=中立4=不同意5=非常同意。从心理测量 学角度来说李克特5点式数据为类型数据并没有到达等距水平因为从1= 非常同意到2=同意之间的距离并不等同与从3=中立到4=不同意之间的距离 然而在心理学研究中多数研究者将5点李克特量表视作连续性变量来近似处理。 需要提醒读者的是这种做法只是处理数据上的方便和得到近似估计而非5点 李克特量表为连续型数据。在研究过程中也常会遇到二分变量如MMPIEPQ 和CPI等人格量表或临床评估工具。在定义顺序变量ordered categorical或 二分变量(binary)时需要使用CATEGORICAL指令。用COUNT、NOMINAL 和CENSORED分别指定计数、名义和结尾尺度数据。
除了上述3种常用的功能之外Mplus如下几个重要的数据定义功能
.
USEOBSERATIONS用于选择符合特定条件的样本。例如
USEOBSERVATIONS = gender EQ 1 AND GRADE EQ 1; 选择所有符合性别为
1年级也为1的样本。EQ为逻辑符表示“等于〞除此之外还有如下逻 辑符AND和OR或者NOT否NE不等于或“/=〞GE大于等 于“>=〞LE小于等于或“<=〞GT大于或“>〞LT小于或“<〞。 MISSING用于定义数据文件中的缺失值。Mplus提供两种缺失值标记
数值型和非数值型。数值型即是指定数据文件中的某几个值代表数据缺失 例如MISSING=ALL(9)表示所有变量的缺失值用9表示。如果不同的变量 有不同缺失值标记符那么同MISSING=Y1(9) Y2(99) Y3(999)表示为变量Y1 的缺失值用9表示其他两个变量Y2和Y3的缺失值分别用99和999表示。
非数值型那么为采用某种符合代表数据缺失。常用的非数值型缺失标记符有“*〞 “.〞或直接指代为空白MISSING = BLANK。
GROUPING用于指定数据文件中用于分组的变量及数值标签代表的组别。 例如GROUPING=gender1=male 2=female说明数据文件中的gender为分 组变量1代表男性组2代表女性组。 2.4.4 分析 ANALYSIS
分析命令涉及的主要是参数估计方法。其表达式为: ANALYSIS:
TYPE = 分析类型
= GENERAL; 分析的类型为一般
= MIXTURE; 分析的类型为混合模型 = TWOLEVEL; 分析的类型为两水平模型 = EFA # #; 分析的类型为探索性因素分析 ESTIMATOR = 参数估计方法 = MLM; 稳健极大似然估计
=ML;参数估计方法 Mplus提供的估计方法
1ML(Maximum Likelihood)极大似然估计是最常用的参数估计法也是 很多结构方程建模软件默认的参数估计法。当因变量为连续变量时也是 Mplus默认的参数估计法。
2MLM估计。极大似然估计伴标准误和均值校正的卡方检验此时得到 参数为Satorra-Bentler校正统计量。此方法适用于非正态数据见第5 第6及第9章。
3MLMV估计。极大似然估计伴标准误和均值-方差校正卡方检验用于 非正态数据估计。
4稳健极大似然估计(Robust Maximum Likelihood Eestimator, MLR)适应于 非正态和非独立数据复杂数据结构与TYPE=COMPLEX合用标准 误采用sandwich 估计法。MLR卡方检验渐进等价于Yuan-Bentler T2* 检 验统计量。这种方法适用于小样本估计。
5MLF极大似然估计伴一阶衍生近似标准误和传统卡方检验。
6Muthén有限信息参数估计(Muthén’s limited information, MUML)。 7加权最小二乘法估计(Weighted least square, WLS)。当所有的指标为连续 性变量时WLS所得卡方等同于渐进自由分别法ADF。WLS对数据分布形 态没有要求但是需要较大的样本量如n>2500才能得到稳定的参数
.
估计值。
8WLSM加权最小二乘法估计伴均值校正卡方检验。
9WLSMV 加权最小二乘法估计使用对角加权矩阵伴均值-方差校正卡方检 验。该估计法为处理类别数据设计更深入的介绍见第9章。 10非加权最小二乘法(Unweighted Least Squares,ULS)。
11ULSMV非加权最小二乘法使用全部加权矩阵伴均值-方差校正卡方检验。 12广义最小二乘法(Generalized Least Square, GLS)。 2.4.5 模型MODEL
Mplus提供分析方法多为基于模型(model based)的方法所以在Mplus中 通过MODEL命令对假设模型进行设定。在MODEL模块中提供了如下表所示 的语句用于设定模型。 表2-2 Mplus命令汇总 字符 功能 例如与注解 BY 通过指标定义
潜变量 f1 BY y1-y5;!因子f1由y1 y2 y3 y4 y5 五个外显指标 测量 ON
定义回归关系
f1 ON f2-f4; !因子f2 f3 f3三个变量预测因子f1; f1 ON x1 x2;观测指标 x1 x2 预测因子f1; PON
定义配对回归
关系 f1 f2 ON f3 f4等价于f1 ON f3; f2 ON f4;
WITH 定义相关或协方差相关 f1 WITH f2; 因子f1与因子f2相关 x1 WITH x2; 指标x1与x2 相关 PWITH
定义配对相关或协方差关系 f1 f2 PWITH f3 f4;等价于f1WITH f3; f2 WITH f4
List of variables; 定义方差和残差方差 f1 y1-y5; 估计f1 y1-y5的方差或残差方差。当变量是 自变量时为方差当为因变量时为残差方差。
潜变量模型的类型
近年来,潜变量分析模型领域最重要的革新是将连续型潜变量和类别型潜变量整合到一个模型中即混合模型(Hybrids Model, Muthén, 2021)。表1根据连续-类别潜变量和横断面-纵向研究设计将潜变量模型划分为不同的类别。
表1潜变量类型—扩展
连续潜变量 类别潜变量 混合
.
横断面模型 Cross-section Models
因子分析模型,SEM
潜类别分析(Latent Class Analysis, LCA), 因子混合模型(Factor Mixture Modeling, FMM)
回归混合模型 (Regression Mixture Modeling, RMM)
纵向模型
潜变量增长模型
Longitudinal Models (Latent
Growth Curve Model, LGCM)
潜在转换分析(Latent 增长混合模型Transition (Growth Mixture Analysis, LTA); 潜类别增长模型(latent class growth modeling, LCGM)
2.4.6 输出OUTPUT
通过OUTPUT命令获得模型分析结果。在OUTPUT下有如下几个常用 的语句。
SAMPSTAT 要求报告的样本统计量有以下几项。连续变量时均值
方差协方差和相关系数类别变量时阈限值二分因变量时的一阶和二阶 样本比率四分相关多级相关polychoric多系列相关polyserial等信息。 CROSSTABS提供类别变量间的交叉频率表。
STANDARDIZED要求提供标准化参数统计量及对应的标准误。Mplus 默认提供三种标准化结果STDYXSTDY和STD。 RESIDUAL要求提供观察变量的残差值。
MODINDICES提供模型修正指数期望参数变化指数和两种标准化
期望参数变化等信息。程序默认提供大于等于10的MI值。如果需要报告所有 M值涉及ONWITH和BY关系的所有可能的MI值可在MODINDICES 后加上ALL。如果只想获得大于某一特定值的MI只需将括号中的ALL 换成相应数值即可。
CINTERVAL要求报告参数置信区间值。对于频率论设置提供三种置 信区间SYMMETRICBOOTSTRAP和BCBOOTSTRAP后两种与ANALYSIS 在的BOOTSTRAP连用。
Mplus还提供14个技术报告其中常用的是TECH1提供参数设置和 所有自由估计参数开始值等信息。TECH3提供估计的协方差和相关矩阵。 TECH4提供模型中潜变量的均值协方差和相关系数等信息。TECH11混 合模型分析时报告LMR(Lo-Mendell-Rubin)检验和校正的LMR检验用
于比拟M个潜类别模型和M-1个潜类别模型间的差异显著的p值说明拒绝
.
M-1个潜类别模型而支持估计的模型。TECH11仅适用于MLR估计法。TECH12 混合模型分析时提供观测和估计的均值方差协方差单变量偏态和峰态 值之间的残差。TECH13混合模型分析时模型拟合单变量二分多元偏
态和峰态模型的双侧检验1。TECH14混合模型分析时报告BLRT(Bootstrapped Likelihood Ratio Test)参数用于确定潜类别个数。 2.4.7 保存SAVEDATA
保存命令用于保存分析的数据以及分析的结果。其格式如下 SAVEDATA:
保存信息命令IS 文件名 常用的保存信息命令如下
FILE IS newdata.dat; 指分析所用数据保存在以命名的文件中。 SAMPLE IS sample.dat; 样本统计量如相关、协方差矩阵保存在以 命名的文件中。
RESULTS IS results.dat; 分析的结果被保存在以命名的文件中。
DIFFETST IS diffetest.dat; WLSMV和MLMV估计时嵌套模型比拟的信 息被保存在以命名的文件中见第九章。
THCH3 IS tech3.dat; 技术文件3的信息被保存在以命名的文件中。 2.4.8 绘图PLOT
绘图不是Mplus的强项通过命令可以获得简单的图形。表达形式如下 PLOT:
TYPE IS PLOT1;获得样本的直方图散点图和样本均值
PLOT2;提供工程特征曲线信息曲线EFA分析时的碎石土等。 其他功能将在具体运用时再做介绍。
Mplus的绘图结果在模型运行结束后通过GRAPH下拉菜单的view graphs 查看。
.
因篇幅问题不能全部显示,请点此查看更多更全内容