8 Lavaan Results - Grundlagen

Hat man unter lavaan Input eine Syntax spezifiziert, um ein Modell zu testen, erscheint der Output, also die Ergebnisse der Testung, unter lavaan Results (Hauptmenü). Der Output ist in mehrere Teile gegliedert. Zuoberst werden die Teststatistiken bzw. der Modellfit dargestellt, also die Maße, die angeben wie gut das Modell die Daten wiederspiegelt. Darunter werden die Ladungen, Intercepts, Mittelwerte, Residualvarianzen und Varianzen angezeigt. Die genannten Outputabschnitte werden im Folgenden näher erläutert.

8.1 Number of Observations

Ganz oben wird die Anzahl an Beobachtungen, die in der Analyse berücksichtigt wurden dargestellt. Hier steht gegebenenfalls auch, wie viele Beobachtungen ausgeschlossen wurden.

8.2 Teststatistiken

Unter der Anzahl beobachteter Werte werden die Gütekriterien des Modellfits dargestellt. Für jedes der Kriterien gibt es Grenzwerte, deren Über- oder Unterschreiten für oder gegen einen Modellfit sprechen. Die wichtigsten Kriterien sind der Chi-Quadrattest, CFI, TLI und RMSEA.

8.2.1 Chi Quadrat \(\chi\)²

Zu Oberst wird der \(\chi\)²-Test dargestellt. Sofern nicht anders unter der „Estimator“ Schaltfläche im Seitenmenü eingestellt, basiert die Berechnung auf der Maximum Likelihood (ML) Methode. Es werden die Teststatistik, die Freiheitsgrade und der \(p\)-Wert der Berechnung dargestellt.

Die Nullhypothese (H0) des \(\chi\)²-Tests lautet: Die modellimplizierte Varianz-Kovarianz Matrix entspricht der empirischen Varianz-Kovarianz Matrix.

Um den Modellfit mit Hilfe des \(\chi\)²-Tests beurteilen zu können, ist der \(p\)-Wert des Tests das interessante Maß. Der \(\chi\)²-Test spricht für einen Modellfit, wenn der \(p\)-Wert auf einem \(\alpha\) = 0.05 Level getestet wird und kein signifikantes Ergebnis anzeigt, die Nullhypothese also angenommen wird.

Alternativ kann auch das Verhältnis zwischen Freiheitsgraden und der Teststatistik betrachtet werden. Dies gilt allerdings nur als Daumenregel und ist keine exakte Methode! Liegt die Teststatistik zwischen der doppelten Anzahl der Freiheitsgrade, spricht der Test für einen guten Modellfit. Liegt die Teststatistik \(\chi\)² zwischen der doppelten und dreifachen Anzahl der Freiheitsgrade, spricht es für einen akzeptablen Fit. \[ 0 < \chi^2 < 2*df: Guter Modellfit \\ 2*df < \chi^2 < 3*df: Akzeptabler Modellfit \] Dann sollten aber weitere Teststatistiken, wie im Folgenden beschriebenen, hinzugezogen werden, um den Fit bestimmen zu können.

Der \(\chi\)²-Test ist ein sehr sensibler Test, der unter sehr vielen Bedingungen ein signifikantes Ergebnis produziert. Daher sollte jeweils ein weiteres Maß des Modellfits in die Beurteilung miteinbezogen werden.

Ein Beispiel für den Output eines \(\chi\)²-Tests seht ihr hier:

Figure 8.1: Chi-Quadrat-Test

8.2.2 CFI und TLI

Eine Möglichkeit den Modellfit eines spezifizierten Modells (Benutzermodell) zu testen, ist es, dieses mit einem anderen Modell zu vergleichen. Dafür sind die beiden Schätzer „Comparative Fit Index“ (CFI) und „Tucker-Lewis Index“ (TLI) Beispiele. Beide Schätzer sind Angaben dafür, inwiefern das spezifizierte Benutzermodell im Vergleich zu einem Baselinemodell fittet im Bezug auf die gegebenen Daten. Dabei ist das Baselinemodell meistens ein Modell, in dem die manifesten Variablen untereinander unkorreliert sind. CFI und TLI gelten als inkrementelle Fitindizes, was bedeutet, dass beide Schätzer messen, inwiefern die modellimplizierte Varianz-Kovarianzmatrix besser an die Daten fittet, als ein Modell, das keine Kovarianzen zwischen den manifesten Variablen zulässt.

Beide Schätzer sind gering sensitiv gegenüber Verletzungen von Verteilungsannahmen und dem Stichprobenumfang.

CFI und TLI sprechen für einen Modellfit, wenn die Schätzer nahe 1 sind: \[ 0.97 < CFI/TLI < 1.00: Guter Modellfit \\ 0.95 < CFI/TLI < 0.97: Akzeptabler Modellfit \] Ein Beispiel für einen Output der CFI und TLI Maße wird hier dargestellt:

Figure 8.2: CFI und TLI Statistiken

8.2.3 RMSEA

Der Root Mean Square Error of Approximation (RMSEA) wird weiter unten im Output dargestellt. Zusammen mit dem RMSEA Testwert werden dessen Konfidenzintervall und der \(p\)-Wert dargestellt. Der RMSEA ist ein deskriptiver Kennwert, der die durchschnittliche Abweichung der empirischen Varianz-Kovarianzmatrix und der modellimplizierten Varianz-Kovarianzmatrix misst. Da die Abweichung minimal 0 betragen kann, ist der untere Grenzwert = 0. Die Nullhypothese lautet: \[ H0: RMSEA \leq 0.05 \]

\[ 0.00 < RMSEA < 0.05: Guter Modellfit \\ 0.05 < RMSEA < 0.08: Akzeptabler Modellfit \\ 0.08 < RMSEA: Schlechter Modellfit \] Der RMSEA reagiert sensitiv auf Missspezifikationen der Ladungen.

Hier wird euch ein Beispiel für einen RMSEA-Output dargestellt. Wichtig ist dabei zu beachten, dass der relevante Wert der RMSEA Schätzer (hier umrandet), nicht der \(p\)-Wert ist.

Figure 8.3: RMSEA Teststatistik

8.3 Latent Variables

Unterhalb der Gütekriterien werden die Parameter Estimates, also die Parameterschätzungen, dargestellt (Diese können gesondert unter der Schaltfläche „Parameter Estimates“ im Hauptmenü eingesehen werden). Der Abschnitt „Latent Variables“ stellt die Ladungen der latenten Variablen auf die Items dar (lambda11, lambda21, lambda31, etc.(\(\lambda\) 1-Parameter)). Im Output werden diese Parameter z.B. mit “lmb” oder “la” abgekürzt. In der linken Spale ganz oben steht die latente Variable mit dem Zeichen “=~” dahinter. Darunter werden alle manifesten Variablen aufgelistet, die in der Syntax spezifiziert wurden zur Messung dieser latenten Variable. Wurden in der Syntax mehrere latente Variablen definiert, werden diese hier, jeweils mit den entsprechenden manifesten Variablen, untereinander dargestellt. Für jede manifeste Variable wird der Schätzer für die Ladung (Estimate), dessen Standardfehler (Std.Err) und der dazugehörige z- und \(p\) -Wert dargestellt. Der z-Wert stellt den Quotienten der Ladung (des Estimates) und des Standardfehlers dar. Der \(p\)-Wert ist das Ergebnis des Signifikanztests für die Annahme, dass die Ladung (der Estimate) gleich 0 ist.

Wurden, wie im tau-parallelen Modell, die Ladungen der manifesten Variablen in der Syntax spezifiziert, werden nur die (fixierten) Punktschätzungen angegeben, die restlichen Spalten bleiben leer.

Latent Variables:
                   Estimate  Std.Err  z-value  P(>|z|)
  eta =~                                              
    y1                                           
    y2                                         
    y3                                         
   ...

8.4 Intercepts

Unter dem Abschnitt „Intercepts“ werden die Intercepts (\(\lambda\) 0- oder \(\alpha\) -Parameter) der manifesten Variablen aufgeführt. Diese werden im Output mit “alp” oder “la0” abgekürzt. Sowohl innerhalb der Intercepts, als auch innerhalb des kommenden Abschnitts der Varianzen, werden endogene und exogene Variablen unterschieden. Endogene Variablen sind Variablen, die weiter erklärt werden, wie beispielsweise manifeste Variablen. Diese Variablen stehen im Pfadmodell an Stellen, auf die Pfeile gerichtet sind, von denen aber keine Pfeile abgehen. Exogene Variablen hingegen sind Variablen, die eine andere Variable weiter erklären, wie beispielsweise die latente Variable. Diese Variablen stehen in Pfadmodellen an Stellen, von denen Pfeile abgehen, auf die aber keine Pfeile gerichtet sind.

In lavaan in den Abschnitten der Intercepts und Varianzen werden die Variablen unterschiedlich dargestellt. Endogene Variablen werden durch einen Punkt (.) vor dem Variablennamen in der linken Spalte gekennzeichnet, exogene Variablen führen diesen Punkt nicht vor ihrem Namen.

Intercepts:
    eta
   .y1                          
   .y2                          
   .y3                          
   .y4                          
   .y5                          
   .y6                          
   .y7                           
   .y8

Für endogene Variablen, also solche mit Punkt vor dem Namen, beziehen sich die Schätzer auf die Intercepts, also den Y-Achsenabschnitt, der Variablen. Für exogene Variablen, zeigt der Schätzer den Mittelwert der exogenen Variable an.

Zusätzlich zu den Schätzern der Intercepts bzw. Mittelwerte der Variablen werden jeweils die Standardfehler, der z-Wert und der \(p\)-Wert dargestellt.

Intercepts:
                   Estimate  Std.Err  z-value  P(>|z|)
    eta              
   .y1                                      
   .y2 
   ...

Wie für die latenten Variablen gilt auch für die Intercepts, dass wenn in der Syntax die Intercepts der manifesten Variablen auf einen Wert festgelegt werden, wie beispielsweise im tau-parallelen Modell, nur die Spalte der Estimates ausgefüllt ist und die anderen leern bleiben.

8.5 Variances

Der Abschnitt „Variances“ ist der letzte Abschnitt der Parameter Estimates, sofern keine weiteren Variablen oder Berechnungen in der Syntax definiert wurden. Hier werden die (Residual-)Varianzen der Variablen dargestellt. Auch hier werden endo- und exogene Variablen unterschieden. Endogene Variablen werden wieder durch einen Punkt (.) gekennzeichnit. Der Schätzer der Varianzen für endogene Variablen stellt die Residualvarianz, also die Fehlervarianz, dieser Variablen dar. Für exogene Variablen wird die Varianz der Variable dargestellt.

Hat man für die Variablen in der Syntax gesondert Namen vergeben, werden diese in Klammern hinter dem Variablennamen, also in der zweiten Spalte von links, dargestellt. Hier steht “veta” für die Varianz von \(\eta\) (Var(\(\eta\))) und “veps” für die Residualvarianz der Items (Var(\(\epsilon\))). Auch für die Schätzer der Varianzen werden, neben dem Schätzer selbst, der jeweilige Standardfehler, der z-Wert und \(p\)-Wert dargestellt.

Variances:
                    Estimate  Std.Err  z-value  P(>|z|)
    eta     (veta)    
   .y1      (veps1)    
   .y2      (veps2)    
   .y3      (veps2) 
   ...

Zur Erinnerung: Die Varianz der manifesten Variable Y (Var(Yi)) muss erst noch berechnet werden, da Y eine endogene Variable darstellt. Die Formel dazu lautet:

\[ Var(Yi) = Var(\eta) + Var(\epsilon i) \]

8.6 User defined Parameters

Im untersten Abschnitt werden die vom Benutzer definierten Parameter dargestellt. Der Abschnitt wird nur dann angezeigt, wenn in der Syntax Parameter definiert wurden. Dies können beispielsweise Reliabilitätsberechnungen oder Itemkennwerte sein. Wie genau Reliabilitäten und Itemkennwerte berechnet werden, wird in den Kapiteln der einzelnen Modelle der KTT näher erläutert. Hier seht ihr ein Beispiel eines Outputs definierter Schätzer: