Path analysis dan identifikasi model ~ Diklogi

Apa itu path analysis (analisis jalur)?

Path analysis adalah cara memodelkan hubungan sebab–akibat antar variabel dengan diagram panah, lalu menghitung seberapa kuat pengaruhnya.

- Variabel eksogen (exogenous): variabel “penyebab awal” (tidak dijelaskan oleh variabel lain di model), biasanya ditulis x.

- Variabel endogen (endogenous): variabel “akibat” (dipengaruhi variabel lain di model), biasanya ditulis y.

- Panah satu arah A→B: “A memengaruhi B” (efek langsung).

- Error/gangguan (disturbance), sering ditulis ζ: faktor lain yang memengaruhi y tapi tidak kita masukkan ke model.

Intinya: kita tidak cuma ingin tahu “ada hubungan/ tidak”, tapi juga besarnya pengaruh dan struktur penyebabnya.

Jenis parameter: free, fixed, constrained

Di model, ada angka-angka yang disebut parameter (yang mau kita tentukan nilainya).

- Free (diestimasi)

Angka belum diketahui, jadi akan dicari dari data.

- Fixed (ditetapkan)

Angka sudah ditentukan dari awal, seringnya 0.

Misal: kita putuskan “tidak ada pengaruh langsung”, jadi panahnya = 0.

- Constrained (dibuat sama)

Dua parameter dipaksa bernilai sama.

Contoh: pengaruh x → y1 disamakan dengan pengaruh x → y2.

Model Identification (Identifikasi)

Hal paling penting sebelum mulai menghitung parameter, kita harus bertanya:

Dari informasi data (kovarians populasi) Σ dan model yang kita buat Σ(θ), apakah kita bisa menemukan nilai parameter θ secara unik?

Analogi:

Kalau kita punya persamaan: x + y = 10, maka solusinya banyak: bisa (5,5), (1,9), (3,7), dll. Ini artinya tidak unik → “tidak teridentifikasi”.

Dalam model statistik, data memberi kita “informasi” (hubungan variabel yang bisa dihitung).

Pertanyaannya: informasi itu cukup tidak untuk menentukan semua parameter secara unik?

Kalau tidak cukup → hasil hitungan bisa “bingung” (banyak kemungkinan), sehingga estimasi tidak jelas.

3 tingkat identifikasi

- Underidentified (tidak teridentifikasi)

Informasi dari data kurang → ada parameter yang tidak bisa ditentukan unik.

- Just identified (cukup)

Informasi cukup → semua parameter bisa ditentukan, tapi model jadi “pas sekali”.

- Overidentified (lebih dari cukup)

Informasi lebih banyak dari yang dibutuhkan → masih bisa ditentukan unik, dan ini biasanya memungkinkan kita mengecek kecocokan model (model fit).

“Known” dan “Unknown” dalam identifikasi

- Known (yang dianggap sudah diketahui/terukur dari data):

varians dan kovarians antar variabel yang kita amati
ini bisa dihitung dari data (misalnya dari tabel kovarians/ estimas dari sampel tersedia)

- Unknown (yang ingin dicari):

koefisien jalur/ regresi (β, γ)
varians/ korelasi error (Ψ)
varians/ kovarians eksogen (Φ)

Model teridentifikasi kalau semua unknown bisa ditulis/ dihitung secara unik dari yang known.

Aturan “normalisasi” (pembatas awal yang wajib/ umum)

Pembatas penting supaya model “masuk akal”:

- Di matriks B, diagonal utama dibuat 0

Artinya: variabel endogen (yang dipengaruhi) tidak boleh memengaruhi dirinya sendiri secara langsung.

- Koefisien untuk “error/disturbance” dibuat seperti identitas (di-set agar skalanya jelas)

Intinya “error” itu tidak terlihat, jadi perlu “patokan ukuran”.

Dua cara umum:

memperbaiki varians error (misal jadi 1), atau
koefisien tertentu dibuat 1 supaya skalanya sama dengan variabelnya.

Apa saja yang sebenarnya ingin “dipecahkan”?

Targetnya adalah solusi unik untuk:

Φ: varians & kovarians variabel eksogen
Ψ: varians & kovarians disturbance/error
B: koefisien regresi antar endogen (panah y→y)
Γ: koefisien regresi dari eksogen ke endogen (panah x→y)

Lalu ditanya: bisa tidak semuanya diselesaikan dari Σ?

Contoh:

Penjelasan:

y1 = suka matematika
y2 = nilai matematika
x1 = jenis kelamin

Misal modelnya:

x1 memengaruhi y1
y1 memengaruhi y2

Lalu kita punya data yang bisa menghitung:

VAR(y1), VAR(y2), VAR(x1)
COV(y1,y2), COV(x1,y1), COV(x1,y2)

Dari informasi itu, kita cek apakah:

koefisien (misal pengaruh y1 → y2) dan varians error bisa dihitung tanpa ambigu.

Hitung:

Parameter yang diistimasi:

Kesimpulan: model teridentifikasi.

Aturan/tes identifikasi untuk model yang lebih rumit

1. t-rule (perlu, tapi belum cukup)

Aturan ini membandingkan:

t = jumlah parameter bebas yang mau diestimasi
jumlah informasi unik dalam matriks kovarians untuk semua variabel teramati

Rumus:

dengan:

p = jumlah variabel endogen
q = jumlah variabel eksogen

Makna:

Kalau t terlalu besar, informasi dari data tidak cukup (kalau parameter lebih banyak daripada informasi) ⇒ pasti bermasalah.
Tapi kalau lolos t-rule, belum otomatis teridentifikasi (makanya perlu, tapi belum cukup).

2. Null B rule (cukup, tapi tidak wajib)

Jika B=0, artinya: tidak ada hubungan antar variabel endogen (tidak ada panah y → y).

Ini mirip kasus regresi linear biasa (atau multivariat). Dalam kondisi itu, identifikasi biasanya aman (aturan ini cukup, tapi tidak selalu harus B = 0 untuk bisa teridentifikasi).

3. Recursive rule (cukup, tapi tidak wajib)

Model recursive itu seperti alur satu arah (tidak ada “balik arah/feedback”)

Syaratnya:

B berbentuk segitiga bawah (lower triangular): hubungan endogen mengalir satu arah (tidak ada feedback).
Ψ diagonal: error antar persamaan tidak berkorelasi.

Jika terpenuhi, model biasanya teridentifikasi.

4. Order & Rank conditions (untuk model non-recursive)

Dipakai saat ada struktur yang tidak searah ( ada feedback/ hubungan bolak-balik atau error berkorelasi).

Asumsi umum saat memakai ini, misalnya:

tidak ada measurement error
x tidak berkorelasi dengan ζ
(I−B) nonsingular
biasanya diasumsikan tidak ada pembatas pada Ψ (semua korelasi error diizinkan) ketika mengecek Order & Rank (O&R).

a. Order condition (perlu, tidak cukup)

Dicek per persamaan:

Bentuk matriks tertentu lalu hitung jumlah nol (0) pada baris persamaan itu
Jika sebuah baris punya setidaknya (p−1) nol ⇒ persamaan itu lolos order condition

Contoh:

setidaknya satu angka 0 dari ini?

Kalau gagal order condition ⇒ underidentified.

b. Rank condition (perlu & cukup)

Masih per persamaan:

Setelah membentuk matriks (anggap proses membentuk C, memodifikasi jadi 0/1, menghapus baris/kolom tertentu), dicek apakah rank-nya memenuhi target
Kriteria: jika rank (Ci) = p−1, maka persamaan ke-i teridentifikasi

Contoh:

selanjutnya, rank suatu matriks adalah jumlah baris (atau kolom) independen.

Hasilnya: persamaan memenuhi rank condition ⇒ model teridentifikasi.

Catatan penting soal “restrictions” (pembatas) pada korelasi error: Order & rank condition sering mengasumsikan error bisa saling berkorelasi (tidak dibatasi). Kalau kenyataannya kita memberi pembatas pada error (misal beberapa korelasi error dipaksa 0), bisa terjadi:

kelihatan gagal order/rank
tapi sebenarnya masih bisa teridentifikasi dengan cara lain

Rigdon’s graphical identification rules (aturan grafis)

Ini aturan identifikasi berbasis gambar model, khususnya untuk non-recursive.

Konsep utamanya: cari “instrument unik”.

Instrument = variabel yang membantu “membedakan” pengaruh, karena dia memengaruhi salah satu variabel tapi tidak langsung memengaruhi yang lain (secara sederhana: jadi “pembeda”).

Pola yang dibahas:

Bow pattern (hubungan teridentifikasi jika Y1 punya instrument unik)
Feedback tanpa error berkorelasi (teridentifikasi jika Y1 atau Y2 punya instrument unik)
Feedback dengan error berkorelasi (teridentifikasi jika keduanya (Y1 dan Y2) punya instrument unik)

Instrument unik: variabel yang memengaruhi salah satu (mis. Y1) tetapi tidak “langsung ikut memengaruhi” yang lain dengan cara yang sama, sehingga membantu “memisahkan” arah pengaruh.

Ringkasan

Identifikasi: apakah parameter bisa ditentukan unik dari Σ?

Ada 3 status: under/ just/ over

Cara cek:

t-rule: cek jumlah informasi vs jumlah parameter (perlu, belum cukup)
Null B atau Recursive: kondisi kuat yang membuat identifikasi aman (cukup)
Order (perlu) & Rank (perlu + cukup): cek per persamaan untuk non-recursive
Rigdon (grafis): aturan perlu+cukup berbasis diagram, fokus pada instrument unik

Referensi

Bollen, K. A. (1989). Structural equations with latent variables. New York: Wiley.

Kline, R. B. (2016). Principles and practice of structural equation modeling (4th ed.). New York: Guilford Press.

Diklogi

Pendidikan dan Teknologi

3/01/2026

Path analysis dan identifikasi model

0 komentar:

Posting Komentar

My Profile

Postingan Populer

Tips CPNS

Tips Beasiswa

Study Abroad ke Amerika

Content Categories

Contact Me

My Community

Follow Me