Apa itu path analysis?
Path analysis (analisis jalur) adalah metode statistik untuk menjelaskan hubungan sebab–akibat (atau “dugaan pengaruh”) antara beberapa hal sekaligus, memakai diagram panah.
Bayangkan kamu ingin menjawab:
- “Apakah olahraga membuat orang lebih jarang sakit?”
- Tapi mungkin pengaruhnya tidak langsung, melainkan lewat perantara seperti olahraga → kebugaran meningkat → sakit menurun
Jadi path analysis membantu memetakan: pengaruh langsung dan pengaruh tidak langsung.
Panah X → Y artinya: X memprediksi/mempengaruhi Y (dalam kerangka model).
Kita bisa punya banyak panah sekaligus, jadi kita bisa membedakan:
- pengaruh langsung (direct effect): X → Y
- pengaruh tidak langsung (indirect effect): X → M → Y (melewati variabel perantara/mediator M)
Path analysis biasanya dipakai ketika semua variabelnya terukur langsung (bukan “konstruk laten” dengan indikator-indikator).
Alur kerja analisis (mengikuti Kline)
Urutan umum:
- Specify model → tentukan model/diagram panah (hipotesis hubungan)
- Identify model → pastikan model “bisa dihitung/diestimasi”
- Select measures/collect data → tentukan alat ukur & kumpulkan data
- Fit model → cocokkan model ke data (hitung angka pengaruhnya)
- Evaluate fit & revise → cek apakah model cocok dengan data; revisi jika perlu
- Interpret results → maknai hasilnya (ceritakan kesimpulannya)
Contoh:
1. Konsep “Model”: variabel dan arah panah
Dari contoh ada 5 variabel:
- Exercise (olahraga)
- Hardiness (ketangguhan/ketahanan mental)
- Fitness (kebugaran)
- Stress (stres)
- Illness (sakit/keluhan)
Intinya, model ini mencoba menjelaskan Illness (sakit) dengan mempertimbangkan jalur dari Exercise dan Hardiness melalui variabel lain (Fitness, Stress).
- Cara membaca panah (konsep koefisien jalur)
Biasanya tiap panah punya koefisien (sering ditulis β atau simbol lain) yang berarti:
- jika X naik 1 satuan (atau 1 standar deviasi jika distandardisasi)
- maka Y berubah sebesar koefisien itu,
- dengan variabel prediktor lain dikontrol sesuai struktur model.
2. Data yang dipakai (apa yang diukur)
Yang diukur: Exercise, Hardiness, Fitness, Stress, Illness
Jumlah responden: N = 373 mahasiswa
Artinya: ada 373 orang, masing-masing punya skor olahraga, ketangguhan, kebugaran, stres, dan sakit.
3. Hipotesis
Tidak ada jalur langsung:
- Exercise → Illness (tidak dimasukkan)
- Hardiness → Illness (tidak dimasukkan)
Pengaruh Exercise dan Hardiness ke Illness harus lewat mediator, misalnya:
- Exercise → Fitness → Illness
- Exercise → Stress → Illness
- Hardiness → Stress → Illness
4. Pengaruh langsung vs tidak langsung
- Pengaruh langsung
Kalau ada panah:
X → Y maka X punya pengaruh langsung ke Y.
- Pengaruh tidak langsung (lewat perantara)
Kalau jalurnya:
X → M → Y maka X memengaruhi Y lewat M.
Biasanya (secara konsep) besarnya pengaruh tidak langsung mengikuti ide: pengaruh (X → M) “dikombinasikan” dengan pengaruh (M → Y).
5. Model Identification
Apakah parameter yang kita minta bisa ditentukan dari informasi data?
- Berapa banyak informasi dari data?
Dari contoh ada 5 variabel terukur, kita bisa membentuk matriks kovarians/ korelasi 5×5.
Jumlah elemen unik (karena simetris) adalah:
Artinya: ada 15 informasi yang bisa dipakai untuk menaksir parameter.
- Berapa banyak parameter yang mau diestimasi?
Koefisien jalur dan varians/ kovarians error yang relevan, lalu menyimpulkan jumlahnya:
t = 10 parameter
- Aturan t (t-rule)
Syarat perlu (umum dipakai): jumlah parameter t harus lebih kecil atau sama dari jumlah informasi data.
Dari contoh:
10 < 15 → t-rule terpenuhi
Catatan: t-rule biasanya syarat perlu, bukan jaminan mutlak; karena kita akan lanjut ke “recursive rule”.
- Recursive rule
Model recursive (secara konsep) berarti:
- panahnya satu arah dan tidak membentuk lingkaran sebab-akibat (tidak ada feedback loop seperti A → B dan B → A dalam satu waktu),
- dan biasanya error antar variabel endogen tidak saling berkorelasi (tergantung spesifikasi).
Akibatnya, model lebih “aman” untuk diestimasi dan cenderung identified (parameter dapat ditaksir unik).
6. Select measures/ collect data
Dari contoh, langkah ini “kita lewatkan” karena datanya sudah tersedia. Secara konsep, ini adalah tahap:
- memilih instrumen ukur yang valid,
- mengumpulkan data,
- memastikan skala, reliabilitas, dsb.
7. Fit the model to data
Kita mungkin stop disini karena tes model fit akan dijelaskan di post selanjutnya. Disini kita akan menggunakan lavaan.
Lavaan adalah paket di R untuk SEM/ path analysis. Di tahap “fit model”, software akan:
- mengestimasi koefisien jalur (mis. a, b, c),
- mengestimasi varians residual,
- biasanya memberi ukuran kecocokan model (fit) seperti χ^2, CFI, RMSEA, SRMR, dll.
Referensi
Kline, R. B. (2016). Principles and practice of structural equation modeling (4th ed.). New York: Guilford Press.
0 komentar:
Posting Komentar
Berkomentarlah dengan baik dan sopan ya ^^