为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

Mplus学习

2019-04-22 20页 doc 45KB 526阅读

用户头像

is_890199

暂无简介

举报
Mplus学习DATA命令用于指定数据文件存放的路径,为必须命令。mplus只能读取ASCII格式的文件(.dat和.txt文件)一般可以通过,spss中进行另存为该文件类型生成。同时也可以直接在Excel或者是记事本中进行生成,但是注意在Excel中和记事本中的数据不包括任何的变量名称信息,只能是数据。一般我们会将mplus的语句文件(.inp)和数据文件放在同一个文件夹中,这样就可以直接用“FILE = ex11.1.txt(数据文件名);”表示。但是如果保存的不是同一个文件夹下,需要制定数据所在的路径。 数据格式分为固定和自由格式,...
Mplus学习
DATA命令用于指定数据文件存放的路径,为必须命令。mplus只能读取ASCII格式的文件(.dat和.txt文件)一般可以通过,spss中进行另存为该文件类型生成。同时也可以直接在Excel或者是记事本中进行生成,但是注意在Excel中和记事本中的数据不包括任何的变量名称信息,只能是数据。一般我们会将mplus的语句文件(.inp)和数据文件放在同一个文件夹中,这样就可以直接用“FILE = ex11.1.txt(数据文件名);”表示。但是如果保存的不是同一个文件夹下,需要制定数据所在的路径。 数据格式分为固定和自由格式,一般社会科学中样本量不是很大,一般采用自由格式,而当数据量较大时可以采用固定格式,提高运行速度。自由格式可以通过如下图所示在spss中得到,注意将下面是否包含变量名去掉。 mplus还可以采用协方差矩阵以及相关矩阵的汇总数据进行分析。这个时候需要加上"nobservations="来表示样本量的大小。如下图所示为两种相关矩阵的数据结构(相关矩阵需要加上平均数和差用来得到协方差矩阵,协方差矩阵不需要)。同时data命令下加上"TYPE IS CORRELATION MEANS STDEVIATIONS; "命令。假如采用协方差矩阵,在data命令下加上“TYPE is covariance". 1.1 模型表述 1.1.1 测量模型 1.1.2 结构模型 1.1.3 模型表达方程 1.2 模型识别 1.3 模型估计 1.4 模型评估 1.5 模型修正 附录 1.1 将总体方差/协方差表达为模型参数的函数 附录 1.2 结构方程模型的最大似然函数 第二章 验证性因子分析模型 2.1 验证性因子分析模型基础知识 2.2 连续观察标识的验证性因子分析模型 2.3 非正态与删截连续观察标识的验证性因子分析模型 2.3.1 非正态性检验 2.3.2 非正态数据的验证性因子分析模型 2.3.3 删截标识的验证性生因子分析模型 2.4 分类观察标识的验证性因子分析模型 2.5 高阶验证性因子分析模型 附录 2.1 BSI-18 量表 附录 2.2 条目可靠度 附录 2.3 Cronbacha系数 附录 2.4 分类结局测量的连接函数和概率计算 第三章 结构方程模型 3.1 MIMIC模型 3.2 结构方程模型 3.3 单标识变量中测量误差的校正 3.4 检验涉及潜变量的交互作用 附录3.1 测量误差的影响 第四章 潜发展模型 4.1 线性潜发展模型 4.2 非线性潜发展模型 4.3 多结局测量发展过程的线性潜发展模型 4.4 两部式潜发展模型 4.5 分类结局测量的潜发展模型 第五章多组模型 5.1 多组验证性因子分析模型 5.1.1 多组一阶验证性因子分析模型 5.1.2 多组二阶验证性因子分析模型 5.2 多组结构方程模型 5.3 多组潜发展模型 第六章结构方程建模的样本量估计 6.1 结构方程模型样本量估计的经验法则 6.2 satorra-Saris法估计样本量 6.2.1 应用satorra-Saris法估计CFA模型的样本量 6.2.2 应用satorra-Saris法估计LGM模型的样本量 6.3 蒙特卡罗模拟法估计样本量 6.3.1 蒙特卡罗模拟法估计CFA模型的样本量 6.3.2 蒙特卡罗模拟法估计LGM模型的样本量 6.3.3 蒙特卡罗模拟法估计具有协变量的LGM模型样本量 6.3.4 蒙特卡罗模拟法估计具有协变量和缺失值的LGM模型样本量 6.4 基于模型拟合统计量/指标的SEM样本量估计 本文来自: 人大经济论坛 LISREL、AMOS等结构方程模型分析软件 版,详细出处参考: 2.1 M plus 简介 Mplus是一款功能强大的多元统计分析软件 其综合了数个潜变量分析方 法于一个统一的一般潜变量分析框架内。Mplus主要处理如下模型 探索性因 素分析(Exploratory factor analysis)、验证性因素分析与结构方程模型(Structural equation modeling)、项目反应理论(Item response theory analysis)、潜类别分析 (Latent class analysis)、潜在转换分析(Latent transition analysis)、生存分析 (Survival analysis)、增长模型(Growth modeling)、多水平模型(Multilevel analysis)、 复杂数据(Complex survey data analysis)和蒙特卡洛模拟(Monte Carlo simulation) 等。 Mplus 软件的前身是Bengt O. Muthén教授开发的结构方程建模软件 LISCOMP(1988)。Mplus的第一版发布于1998年底 经过10多年的完善 最 近一次升级为2010年发布的第6版 最新版本6.12。当前的Mplus 6提供了 多个操作系统版(Windows, Mac OS X, 和Linux)。 图2-1为Mplus的界面 非常简洁。图2-2为Mplus的工作界面 所有的 建模过程均呈现在工作界面上。Mplus默认命令符为蓝色字体 其他为黑色字 注释通过感叹号“ ”引导开始 为草绿色字体。 2.4 Mplus常用命令 Mplus有十个命令群 分别为 标题(TITLE) 数据(DATA) 变量 (VARIABLE) 定义(DEFINE) 分析(ANALYSIS) 模型(MODEL) 输出 (OUTPUT) 保存数据(SAVEDATA) 绘图(PLOT)和蒙特卡洛(MONTECARLO)。 其中DATA VARIABLE和ANALYSIS是所有分析必要的命令 其他命令则 为非必要命令。请注意 这里的必要是指 一个分析缺少这些命令将无法执行 其他非必要命令的缺失不会影响到分析的执行。然而 有些非必要命令对于有 效的分析仍然是不可缺少的。执行一个分析的目的是为了得到有用的结果 如 果不使用OUTPUT结果输出命令 整个分析可以执行 但并不报告任何结果 这样的分析也是无效的。 十个命令群中 除了TITLE标题命令较为单一外 其他命令群均包含多个子命令 Mplus强大的分析功能就是通过这些子命令实现的。限于篇幅 下面仅对各命令群中最常用的子命令进行介绍 其他子命令可在Mplus手册第15-20章获得详细介绍。 2.4.1 标题TITLE  标题命令用于为程序起个标题 不是Mplus必须的命令。标题可以是英文 也可以是中文。注意 标题中尽量不要出现Mplus的命令字符 以免产生不必 要的错误。 2.4.2 数据DATA  数据命令是Mplus必须的命令 用于指定数据文件存放的路径。 1 数据准备 心理学及社会科学研究者经常使用SPSS作为数据管理和统计分析的工 具。使用SPSS的一个好处是可以通过SPSS将数据转换成与其他统计分析软 件对接的数据格式或自由格式。具体通过SPSS的“FILE”下拉菜单中的“SAVE AS”来实现。不像其他结构方程软件可以读取多种数据文件 Mplus只能读取 ASCII格式文件。 Mplus可以识别自由和固定两种格式数据。由于心理学研究的样本量通 常不是很大 涉及的变量也不是很多 所以使用自由格式数据比较普遍。当样 本量和变量很多时 使用固定格式的数据读取速度更快。Mplus通过DATA命 令指定与数据相关的信息。FILE语句用于指定数据文件的存储路径和文件名。 例如 上述指令提示文件名为ptsd.dat 存储路径为C盘Mplus文件夹。在自由 格式数据文件中 每列为一个变量 变量之间用空格、逗号或制表符进行限定 缺省值必须用“.”或其它数值代替 如 9或99  否则会发生读取错误。Mplus 对变量数是有限制的 变量数的上限是500 字符的长度是5000。也就是说 数据文件中最多能包含500个10位数的变量。 2 数据格式 固定格式 在固定格式文件中 每个变量所占字符数必须相等 FORTRAN式的定义 是可以被Mplus接受的。常用的FORTRAN的描述符有“F”“x”“t”“/”。其 中F用于指定变量的格式 其后可以跟整数 也可以跟小数。整数表示变量是 没有小数点的整数值 整数是几就表示是几位数 如果是小数则说明数据含有 小数点 小数点前的数值代表数据包含几个数字 小数点后的数字是几就表示 数据包含几位小数。例如 12.36可写成F4.2的形式为1236。F前也可以有整 数值 表示多少个F 例如F4.1 F4.1 F4.1 F4.1 F4.1 可缩写为5F4.1。x 字符用于表示跳过多少列不读取 如25x 表示跳过25列不读。t字符用于指 定具体读取某列变量 如t30 表示读取第30列。下面的语句 FORMAT IS 5F4.1, 5x, t30, 5F5.2; 第一个5F4.1是5个F4.1 的缩写形式 即表示F4.1 F4.1 F4.1 F4.1 F4.1。第2个5x表示跳过5列数据不读取。t30表示直接读取第30列的数据 最后的5F5.2与5F4.1一样 表示5个保留2个小数点的5位数。整个数据文 件为55位数。 2.4.3 VARIABLE (变量)  变量命令是Mplus必须的命令之一 通过变量命令才可以对数据文件进行 有意义的处理。对于初学者来说 最大的困难便是如何整理数据和使用变量命 令来定义变量。一般情况下 最基本的变量命令有三个 ①定义数据文件中的 变量 ②选择分析使用的变量 ③定义变量的类型或尺度。 1 VARIABLE定义数据文件中的变量 前面提到过 数据文件中除了数字之外不允许其它变量名称的字符存在 所以在分析数据之前需要给数据文件中出现的数据命名 或者说给每列变量取 个名字。由于数据文件的格式已通过DATA命令定义 所以这里只需要给每列 变量指定一个标签即可 所有变量都要有名称 否则程序读取时会出现错误 变量名最多允许8个字符。例如 VARIABLE IS/ARE/= y1 y2 y3 y4 y5; 说明数 据文件包含5个变量 名称分别为y1-y5。 2 USEVARIABLES 选择分析使用的变量  一个数据文件可能包含很多变量 但某项分析可能只涉及到部分变量 所 以在某个具体分析之前要对所使用的变量进行选择 使用USEVARIABLES来 定义。例如 USEVARIABLES  ARE/= y1 y2 y3 y4 y5; 或缩写成 USEVARIABLES  ARE/= y1-y5。数据文件包含y1-y10十个变量 而本研究只 使用其中的前五个变量。 3 定义变量的类型或尺度 定义变量的类型或尺度很重要 因为在Mplus中 不同的变量类型对应着 不同的参数估计方法 也就是说程序使用不同的统计方法是根据指定的变量类 型进行的。例如 在回归分析中 连续型因变量对应线性回归 二分因变量对 应logistic回归等等。变量的尺度有连续、类别、计数、名义、截尾 这些数 据需要不同的字符来定义 分别对应 CONTINUOUS CATEGORICAL COUNT NOMINAL和CENSORED。在Mplus中默认的数据类型是连续的 所以连续变量不需要定义 或者说 非连续性变量不定义程序会当作连续型变 量处理。 心理学和社会科学研究中常用的量表多采用李克特式问卷 如李克特5点 计分 1=非常同意 2=同意 3=中立 4=不同意 5=非常同意。从心理测量 学角度来说 李克特5点式数据为类型数据 并没有达到等距水平 因为从1= 非常同意到2=同意之间的距离并不等同与从3=中立到4=不同意之间的距离 然而在心理学研究中多数研究者将5点李克特量表视作连续性变量来近似处理。 需要提醒读者的是这种做法只是处理数据上的方便和得到近似估计 而非5点 李克特量表为连续型数据。在研究过程中也常会遇到二分变量 如MMPI EPQ 和CPI等人格量表或临床评估工具。在定义顺序变量 ordered categorical 或 二分变量(binary)时需要使用CATEGORICAL指令。用COUNT、NOMINAL 和CENSORED分别指定计数、名义和结尾尺度数据。 除了上述3种常用的功能之外 Mplus如下几个重要的数据定义功能 USEOBSERATIONS 用于选择符合特定条件的样本。例如 USEOBSERVATIONS = gender EQ 1 AND GRADE EQ 1; 选择所有符合性别为 1 也为1的样本。EQ为逻辑符 表示“等于” 除此之外 还有如下逻 辑符 AND 和 OR 或者 NOT 否 NE 不等于或“/=” GE 大于等 于“>=” LE 小于等于或“<=” GT 大于或“>” LT 小于或“<”。 MISSING 用于定义数据文件中的缺失值。Mplus提供两种缺失值标记 数值型和非数值型。数值型即是指定数据文件中的某 几 个值代表数据缺失 例如 MISSING=ALL(9) 表示所有变量的缺失值用9表示。如果不同的变量 有不同缺失值标记符 则同MISSING=Y1(9) Y2(99) Y3(999) 表示为变量Y1 的缺失值用9表示 其他两个变量Y2和Y3的缺失值分别用99和999表示。 非数值型则为采用某种符合代表数据缺失。常用的非数值型缺失标记符有“*” “.” 或直接指代为空白MISSING = BLANK。 GROUPING 用于指定数据文件中用于分组的变量及数值标签代表的组别。 例如 GROUPING=gender 1=male 2=female  说明数据文件中的gender为分 组变量 1代表男性组 2代表女性组。 2.4.4 分析 ANALYSIS  分析命令涉及的主要是参数估计方法。其表达式为: ANALYSIS:  TYPE = 分析类型 = GENERAL; 分析的类型为一般 = MIXTURE; 分析的类型为混合模型 = TWOLEVEL; 分析的类型为两水平模型 = EFA # #; 分析的类型为探索性因素分析 ESTIMATOR = 参数估计方法   = MLM; 稳健极大似然估计 =ML;参数估计方法 Mplus提供的估计方法   1 ML(Maximum Likelihood)极大似然估计 是最常用的参数估计法 也是 很多结构方程建模软件默认的参数估计法。当因变量为连续变量时 也是 Mplus默认的参数估计法。 2 MLM估计。极大似然估计伴标准误和均值校正的卡方检验 此时得到 参数为Satorra-Bentler校正统计量。此方法适用于非正态数据 见第5 第6及第9章。  3 MLMV估计。极大似然估计伴标准误和均值-方差校正卡方检验 用于 非正态数据估计。 4 稳健极大似然估计(Robust Maximum Likelihood Eestimator, MLR) 适应于 非正态和非独立数据 复杂数据结构 与TYPE=COMPLEX合用  标准 误采用sandwich 估计法。MLR卡方检验渐进等价于Yuan-Bentler T2* 检 验统计量。这种方法适用于小样本估计。  5 MLF极大似然估计伴一阶衍生近似标准误和传统卡方检验。 6 Muthén有限信息参数估计(Muthén’s limited information, MUML)。 7 加权最小二乘法估计(Weighted least square, WLS)。当所有的指标为连续 性变量时WLS所得卡方等同于渐进自由分别法ADF。WLS对数据分布形 态没有要求 但是需要较大的样本量 如n>2500 才能得到稳定的参数 估计值。 8 WLSM加权最小二乘法估计伴均值校正卡方检验。  9 WLSMV 加权最小二乘法估计使用对角加权矩阵伴均值-方差校正卡方检 验。该估计法为处理类别数据设计 更深入的介绍见第9章。 10 非加权最小二乘法(Unweighted Least Squares,ULS)。 11 ULSMV非加权最小二乘法使用全部加权矩阵伴均值-方差校正卡方检验。  12 广义最小二乘法(Generalized Least Square, GLS)。 2.4.5 模型MODEL Mplus提供分析方法多为基于模型(model based)的方法 所以在Mplus中 通过MODEL命令对假设模型进行设定。在MODEL模块中提供了如下表所示 的语句用于设定模型。 表2-2 Mplus命令汇总 字符 功能 示例与注解 BY 通过指标定义 潜变量 f1 BY y1-y5;!因子f1由y1 y2 y3 y4 y5 五个外显指标 测量 ON 定义回归关系 f1 ON f2-f4; !因子f2 f3 f3三个变量预测因子f1; f1 ON x1 x2;观测指标 x1 x2 预测因子f1; PON 定义配对回归 关系 f1 f2 ON f3 f4等价于f1 ON f3; f2 ON f4; WITH 定义相关或协方差相关 f1 WITH f2; 因子f1与因子f2相关 x1 WITH x2; 指标x1与x2 相关 PWITH 定义配对相关或协方差关系 f1 f2 PWITH f3 f4;等价于f1WITH f3; f2 WITH f4   List of variables; 定义方差和残差方差 f1 y1-y5; 估计f1 y1-y5的方差或残差方差。当变量是 自变量时为方差 当为因变量时为残差方差。 潜变量模型的类型 近年来,潜变量分析模型领域最重要的革新是将连续型潜变量和类别型潜变量整合到一个模型中即混合模型(Hybrids Model, Muthén, 2008)。表1根据连续-类别潜变量和横断面-纵向研究设计将潜变量模型划分为不同的类别。 表1潜变量类型—扩展 连续潜变量 类别潜变量 混合 横断面模型 Cross-section Models 因子分析模型,SEM 潜类别分析(Latent Class Analysis, LCA), 回归混合模型(Regression Mixture Modeling, RMM) 因子混合模型(Factor Mixture Modeling, FMM) 纵向模型 Longitudinal Models 潜变量增长模型 (Latent Growth Curve Model, LGCM) 潜在转换分析(Latent Transition Analysis, LTA); 潜类别增长模型(latent class growth modeling, LCGM) 增长混合模型(Growth Mixture         2.4.6 输出OUTPUT  通过OUTPUT命令获得模型分析结果。在OUTPUT下 有如下几个常用 的语句。 SAMPSTAT 要求报告的样本统计量有以下几项。连续变量时 均值 方差 协方差和相关系数 类别变量时 阈限值 二分因变量时的一阶和二阶 样本比率 四分相关 多级相关polychoric 多系列相关polyserial等信息。 CROSSTABS 提供类别变量间的交叉频率表。 STANDARDIZED 要求提供标准化参数统计量及对应的标准误。Mplus 默认提供三种标准化结果 STDYX STDY和STD。 RESIDUAL 要求提供观察变量的残差值。 MODINDICES 提供模型修正指数 期望参数变化指数 和两种标准化 期望参数变化等信息。程序默认提供大于等于10的MI值。如果需要报告所有 M值 涉及ON WITH和BY关系的所有可能的MI值  可在MODINDICES 后加上 ALL 。如果只想获得大于某一特定值的MI 只需将括号中的ALL 换成相应数值即可。 CINTERVAL 要求报告参数置信区间值。对于频率论设置 提供三种置 信区间 SYMMETRIC BOOTSTRAP和BCBOOTSTRAP 后两种与ANALYSIS 在的BOOTSTRAP连用 。 Mplus还提供14个技术报告 其中常用的是 TECH1 提供参数设置和 所有自由估计参数开始值等信息。TECH3 提供估计的协方差和相关矩阵。 TECH4 提供模型中潜变量的均值 协方差和相关系数等信息。TECH11 混 合模型分析时 报告LMR(Lo-Mendell-Rubin)检验和校正的LMR检验 用 于比较M个潜类别模型和M-1个潜类别模型间的差异 显著的p值说明拒绝 M-1个潜类别模型而支持估计的模型。TECH11仅适用于MLR估计法。TECH12 混合模型分析时 提供观测和估计的均值 方差 协方差 单变量偏态和峰态 值之间的残差。TECH13 混合模型分析时 模型拟合单变量 二分 多元偏 态和峰态模型的双侧检验1。TECH14 混合模型分析时 报告BLRT(Bootstrapped Likelihood Ratio Test)参数用于确定潜类别个数。 2.4.7 保存SAVEDATA  保存命令用于保存分析的数据以及分析的结果。其格式如下 SAVEDATA: 保存信息命令IS 文件名 常用的保存信息命令如下 FILE IS newdata.dat; 指分析所用数据保存在以newdata.dat命名的文件中。 SAMPLE IS sample.dat; 样本统计量如相关、协方差矩阵保存在以 sample.dat命名的文件中。 RESULTS IS results.dat; 分析的结果被保存在以results.dat命名的文件中。 DIFFETST IS diffetest.dat; WLSMV和MLMV估计时 嵌套模型比较的信 息被保存在以diffetest.dat命名的文件中 见第九章。 THCH3 IS tech3.dat; 技术文件3的信息被保存在以tech3.dat命名的文件中。 2.4.8 绘图PLOT  绘图不是Mplus的强项 通过命令可以获得简单的图形。表达形式如下 PLOT: TYPE IS  PLOT1;获得样本的直方图 散点图和样本均值 PLOT2;提供项目特征曲线 信息曲线 EFA分析时的碎石土等。 其他功能将在具体运用时再做介绍。 Mplus的绘图结果在模型运行结束后通过GRAPH下拉菜单的view graphs 查看。
/
本文档为【Mplus学习】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索