Model comparison (perbandingan model) dan parameter constraints (batasan parameter)
Apa itu model dalam SEM?
Model = “peta hubungan sebab-akibat” antar variabel.
- Panah satu arah X → Y: “X memengaruhi Y” (regresi/efek langsung)
- Panah dua arah X ↔ Y: “X berkorelasi dengan Y” (hubungan tanpa arah sebab-akibat yang tegas)
- Setiap panah punya angka (parameter) yang menunjukkan seberapa kuat pengaruh/hubungannya
- Ada juga “error” (bagian yang tidak bisa dijelaskan model)
Tujuan SEM: melihat apakah pola hubungan yang kita gambar cocok (fit) dengan data.
Intinya: model mencoba meniru pola hubungan yang ada di data. Kalau model “mirip” dengan data, kita bilang fit-nya bagus.
Apa itu “Parameter”?
Parameter = angka-angka di model yang harus diestimasi/dicari dari data, misalnya:
- Koefisien pengaruh pada panah (seberapa kuat pengaruh X ke Y)
- Korelasi (↔)
- Varians (besar penyebaran/error)
Kalau model punya lebih banyak parameter bebas, biasanya lebih mudah “menyesuaikan” data (fit bisa membaik), tapi risikonya: terlalu “menghafal” data (overfit) dan tidak sederhana.
Apa itu Model Fit (kecocokan model)?
Model fit menjawab: “Seberapa dekat model kita dengan data nyata?”
Di SEM, sering muncul beberapa ukuran (fit indices), misalnya:
- Chi-square (χ²): mengukur “jarak” antara model dan data. (Semakin kecil umumnya semakin baik.)
- df (degrees of freedom/ derajat bebas): kira-kira ukuran “kesederhanaan model”.
- Model lebih sederhana → df biasanya lebih besar.
- Model lebih rumit → df biasanya lebih kecil.
- CFI, TLI: umumnya makin mendekati 1 makin baik.
- RMSEA: umumnya makin kecil makin baik.
- AIC, BIC: dipakai untuk membandingkan model (umumnya lebih kecil lebih baik).
Catatan: membandingkan fit indices itu deskriptif (membantu memilih), bukan “pembuktian mutlak” untuk semua situasi.
Kenapa kita perlu “Model Comparison” (membandingkan model)?
Karena saat analisis, kita sering mencoba beberapa model:
- Model A: sederhana (lebih sedikit panah/ parameter)
- Model B: kompleks (lebih banuak panah/ parameter)
Pertanyaan:
- Kalau menambah parameter: apakah fit benar-benar membaik?
- Kalau menghapus parameter: apakah fit jadi jauh lebih buruk?
Ukuran-ukuran fit yang sering dibandingkan
- χ² (Chi-square)
Mengukur “jarak” antara model dan data.
Umumnya χ² lebih kecil → lebih baik (tapi sangat dipengaruhi ukuran sampel N).
- df (degrees of freedom/ derajat bebas)
Kira-kira menunjukkan “seberapa dibatasi” modelnya.
- Model lebih sederhana biasanya punya df lebih besar.
- Model lebih fleksibel/kompleks biasanya df lebih kecil.
- CFI, TLI
Indeks perbandingan dengan baseline model.
Semakin mendekati 1 → biasanya semakin baik.
- RMSEA
Mengukur error aproksimasi per df.
Lebih kecil → biasanya lebih baik.
- AIC, BIC
Untuk membandingkan model (terutama yang tidak selalu nested).
Lebih kecil → biasanya lebih baik (menghukum model yang terlalu kompleks).
Catatan: perbandingan fit indices bersifat deskriptif (membantu memilih), bukan satu-satunya dasar “pembuktian statistik”.
Konsep penting: “Nested Models” (model bersarang)
Dua model disebut nested (bersarang) kalau:
- Model lengkap (full/ unrestricted) punya semua parameter model sederhana plus minimal 1 parameter tambahan.
- Model sederhana (reduced/ restricted) bisa dibuat dari model lengkap hanya dengan memberi batasan (constraint), misalnya:
- mengubah suatu panah jadi 0 (dihapus)
- atau memaksa dua pengaruh harus sama.
Contoh:
- Model 1 (full): ada korelasi error (lebih banyak parameter)
- Model 2 (reduced): korelasi error dihilangkan (ada “pembatasan”) → Model 2 nested di dalam Model 1.
Kalau tidak nested, kita tidak bisa memakai beberapa tes perbedaan χ² dengan cara standar.
Cara membandingkan model nested: LRT/ Chi-square Difference Test
Nama lain: Likelihood Ratio Test (LRT) atau uji selisih chi-square.
- Ide sederhana:
Kita bandingkan model full (lebih bebas) vs reduced (lebih dibatasi)
Hitung selisih:
Aturan keputusan (gampangnya):
- Jika Δχ² “besar” (signifikan) → model reduced lebih buruk secara nyata → model full lebih layak.
- Jika tidak signifikan → tambahan parameter di full tidak terlalu perlu → pilih reduced (lebih sederhana).
LM Test (Lagrangian Multiplier) & Modification Indices (MI)
- LM Test itu apa?
LM test menjawab pertanyaan:
“Kalau kita membebaskan satu constraint (misalnya menambah satu panah yang tadinya 0), kira-kira fit membaik tidak?”
Ciri penting:
- Cukup mengestimasi model yang restricted saja.
- Hasilnya memberi petunjuk: constraint mana yang kalau dibuka akan paling menurunkan χ².
- Modification Indices (MI) itu apa?
MI adalah “petunjuk otomatis” dari software:
“Kalau kamu menambah parameter ini (mis. tambah panah X → Y), kira-kira χ² turun sebesar …”
Kadang ada contoh MI yang menyarankan hubungan tertentu untuk ditambah, lalu model direvisi dan fit membaik.
Peringatan penting dari:
- Hati-hati “fishing expedition” (asal coba-coba karena ingin fit bagus).
- Bisa “capitalizing on chance” = kebetulan cocok di data ini, tapi gagal di data lain.
- Idealnya perubahan harus masuk akal secara teori, dan perlu replikasi (dicek lagi di data lain).
Wald Test (untuk “model trimming”/ menghapus jalur)
Kalau LM/MI itu seperti:
“Tambahkan apa supaya lebih baik?”
Maka Wald test seperti:
“Parameter ini kalau dihapus (dibuat 0), apakah model jadi jauh lebih buruk atau tidak?”
Catatan:
- Dipakai untuk “trimming” (merapikan model)
- Disarankan hati-hati, terutama kalau N (jumlah data) kecil
- Jangan asal buang semua jalur yang tidak signifikan; lebih aman menunggu replikasi
Ringkasan fungsi:
- Wald: menguji apakah pembatasan bisa dipasang (boleh dihapus/ dibuat 0).
- LM: menguji apakah pembatasan sebaiknya dilepas (sebaiknya ditambah jalur).
Model Respecification (kalau model tidak fit, apa yang dilakukan?)
- Cari penyebab umum:
- Salah memasukkan hubungan (inclusion yang keliru)
- Ada hubungan penting yang lupa dimasukkan (exclusion)
- Memang model dasarnya kurang tepat
- Kalau sudah mengubah-ubah model berdasarkan data, kita masuk wilayah eksploratori:
- p-value jadi “perkiraan”
- butuh replikasi
- Lebih baik revisi berdasarkan teori, bukan hanya angka.
- Praktik yang lebih sehat:
- Lihat residuals (bagian yang tidak dijelaskan model) untuk tanda “ada yang aneh”
- Bisa “pecah” masalah jadi bagian kecil (piece-wise fitting)
Parameter Constraints (Pembatasan Parameter)
Ini bagian “mengunci” parameter untuk menguji hipotesis tertentu.
- Jenis constraint yang umum
Fixing parameter to 0
- Contoh: “panah ini dianggap tidak ada” → koefisien = 0.
- Ini mirip ide trimming.
- Equality constraints (membuat dua parameter sama)
- Contoh hipotesis: “Pengaruh A ke Y sama besar dengan pengaruh B ke Y.”
- Ditulis seperti:
Makna konseptualnya:
Kita mengatakan dua pengaruh itu “kekuatan efeknya sama”, jadi model dipaksa memperlakukan keduanya setara.
Cara mengecek constraint “masuk akal atau tidak”, biasanya dibandingkan:
- Model full (tanpa dipaksa sama)
- Model constrained (dipaksa sama)
Kalau setelah dipaksa sama ternyata fit jadi jauh lebih buruk, berarti dugaan “keduanya sama” tidak cocok dengan data.
Jadi, “pilih yang mana” saat membandingkan?
Rekomendasi:
- Umumnya LRT (chi-square difference test) direkomendasikan karena fleksibel dan “serbaguna”
- Ada pengecualian tertentu (mis. constraint pertidaksamaan)
Prinsip besar yang aman:
- Kalau dua model nested dan hasil LRT bilang “perbedaannya tidak signifikan” → pilih model yang lebih sederhana
- Tapi jangan cuma angka: perubahan model sebaiknya tetap masuk akal secara teori
0 komentar:
Posting Komentar
Berkomentarlah dengan baik dan sopan ya ^^