3/01/2026

Path analysis dan identifikasi model

Apa itu path analysis (analisis jalur)?

Path analysis adalah cara memodelkan hubungan sebab–akibat antar variabel dengan diagram panah, lalu menghitung seberapa kuat pengaruhnya.

- Variabel eksogen (exogenous): variabel “penyebab awal” (tidak dijelaskan oleh variabel lain di model), biasanya ditulis x.

- Variabel endogen (endogenous): variabel “akibat” (dipengaruhi variabel lain di model), biasanya ditulis y.

- Panah satu arah A→B: “A memengaruhi B” (efek langsung).

- Error/gangguan (disturbance), sering ditulis ζ: faktor lain yang memengaruhi y tapi tidak kita masukkan ke model.

Intinya: kita tidak cuma ingin tahu “ada hubungan/ tidak”, tapi juga besarnya pengaruh dan struktur penyebabnya.


Jenis parameter: free, fixed, constrained

Di model, ada angka-angka yang disebut parameter (yang mau kita tentukan nilainya).

- Free (diestimasi)

Angka belum diketahui, jadi akan dicari dari data.

- Fixed (ditetapkan)

Angka sudah ditentukan dari awal, seringnya 0.

Misal: kita putuskan “tidak ada pengaruh langsung”, jadi panahnya = 0.

- Constrained (dibuat sama)

Dua parameter dipaksa bernilai sama.

Contoh: pengaruh x → y1 disamakan dengan pengaruh x → y2.


Model Identification (Identifikasi)

Hal paling penting sebelum mulai menghitung parameter, kita harus bertanya:

Dari informasi data (kovarians populasi) Σ dan model yang kita buat Σ(θ), apakah kita bisa menemukan nilai parameter θ secara unik?

Analogi:

Kalau kita punya persamaan: x + y = 10, maka solusinya banyak: bisa (5,5), (1,9), (3,7), dll. Ini artinya tidak unik → “tidak teridentifikasi”.

Dalam model statistik, data memberi kita “informasi” (hubungan variabel yang bisa dihitung). 

Pertanyaannya: informasi itu cukup tidak untuk menentukan semua parameter secara unik? 

Kalau tidak cukup → hasil hitungan bisa “bingung” (banyak kemungkinan), sehingga estimasi tidak jelas.


3 tingkat identifikasi

- Underidentified (tidak teridentifikasi)

Informasi dari data kurang → ada parameter yang tidak bisa ditentukan unik.

- Just identified (cukup)

Informasi cukup → semua parameter bisa ditentukan, tapi model jadi “pas sekali”.

- Overidentified (lebih dari cukup)

Informasi lebih banyak dari yang dibutuhkan → masih bisa ditentukan unik, dan ini biasanya memungkinkan kita mengecek kecocokan model (model fit).


“Known” dan “Unknown” dalam identifikasi

- Known (yang dianggap sudah diketahui/terukur dari data): 

  • varians dan kovarians antar variabel yang kita amati
  • ini bisa dihitung dari data (misalnya dari tabel kovarians/ estimas dari sampel tersedia)

- Unknown (yang ingin dicari): 

  • koefisien jalur/ regresi (β, γ)
  • varians/ korelasi error (Ψ)
  • varians/ kovarians eksogen (Φ)

Model teridentifikasi kalau semua unknown bisa ditulis/ dihitung secara unik dari yang known.


Aturan “normalisasi” (pembatas awal yang wajib/ umum)

Pembatas penting supaya model “masuk akal”:

- Di matriks B, diagonal utama dibuat 0

Artinya: variabel endogen (yang dipengaruhi) tidak boleh memengaruhi dirinya sendiri secara langsung.

- Koefisien untuk “error/disturbance” dibuat seperti identitas (di-set agar skalanya jelas)

Intinya “error” itu tidak terlihat, jadi perlu “patokan ukuran”.

Dua cara umum:

  • memperbaiki varians error (misal jadi 1), atau
  • koefisien tertentu dibuat 1 supaya skalanya sama dengan variabelnya.


Apa saja yang sebenarnya ingin “dipecahkan”?

Targetnya adalah solusi unik untuk:

  • Φ: varians & kovarians variabel eksogen
  • Ψ: varians & kovarians disturbance/error
  • B: koefisien regresi antar endogen (panah y→y)
  • Γ: koefisien regresi dari eksogen ke endogen (panah x→y)

Lalu ditanya: bisa tidak semuanya diselesaikan dari Σ?

Contoh:

Penjelasan:

  • y1 = suka matematika
  • y2 = nilai matematika
  • x1 = jenis kelamin

Misal modelnya:

  • x1 memengaruhi y1
  • y1 memengaruhi y2

Lalu kita punya data yang bisa menghitung:

  • VAR(y1), VAR(y2), VAR(x1)
  • COV(y1,y2), COV(x1,y1), COV(x1,y2)

Dari informasi itu, kita cek apakah:

koefisien (misal pengaruh y1 → y2) dan varians error bisa dihitung tanpa ambigu.

Hitung:

Parameter yang diistimasi: 

Kesimpulan: model teridentifikasi.


Aturan/tes identifikasi untuk model yang lebih rumit

1. t-rule (perlu, tapi belum cukup)

Aturan ini membandingkan:

  • t = jumlah parameter bebas yang mau diestimasi
  • jumlah informasi unik dalam matriks kovarians untuk semua variabel teramati

Rumus:

dengan:

  • p = jumlah variabel endogen
  • q = jumlah variabel eksogen

Makna:

  • Kalau t terlalu besar, informasi dari data tidak cukup (kalau parameter lebih banyak daripada informasi) ⇒ pasti bermasalah.
  • Tapi kalau lolos t-rule, belum otomatis teridentifikasi (makanya perlu, tapi belum cukup).


2. Null B rule (cukup, tapi tidak wajib)

Jika B=0, artinya: tidak ada hubungan antar variabel endogen (tidak ada panah y → y).

Ini mirip kasus regresi linear biasa (atau multivariat). Dalam kondisi itu, identifikasi biasanya aman (aturan ini cukup, tapi tidak selalu harus B = 0 untuk bisa teridentifikasi).


3. Recursive rule (cukup, tapi tidak wajib)

Model recursive itu seperti alur satu arah (tidak ada “balik arah/feedback”)

Syaratnya: 

  • B berbentuk segitiga bawah (lower triangular): hubungan endogen mengalir satu arah (tidak ada feedback).
  • Ψ diagonal: error antar persamaan tidak berkorelasi.

Jika terpenuhi, model biasanya teridentifikasi.


4. Order & Rank conditions (untuk model non-recursive)

Dipakai saat ada struktur yang tidak searah ( ada feedback/ hubungan bolak-balik atau error berkorelasi).

Asumsi umum saat memakai ini, misalnya:

  • tidak ada measurement error
  • x tidak berkorelasi dengan ζ
  • (I−B) nonsingular
  • biasanya diasumsikan tidak ada pembatas pada Ψ (semua korelasi error diizinkan) ketika mengecek Order & Rank (O&R).

a. Order condition (perlu, tidak cukup)

Dicek per persamaan:

  • Bentuk matriks tertentu lalu hitung jumlah nol (0) pada baris persamaan itu
  • Jika sebuah baris punya setidaknya (p−1) nol ⇒ persamaan itu lolos order condition

Contoh:

setidaknya satu angka 0 dari ini?

Kalau gagal order condition ⇒ underidentified.

b. Rank condition (perlu & cukup)

Masih per persamaan:

  • Setelah membentuk matriks (anggap proses membentuk C, memodifikasi jadi 0/1, menghapus baris/kolom tertentu), dicek apakah rank-nya memenuhi target
  • Kriteria: jika rank (Ci) = p−1, maka persamaan ke-i teridentifikasi

Contoh:

selanjutnya, rank suatu matriks adalah jumlah baris (atau kolom) independen.

Hasilnya: persamaan memenuhi rank condition ⇒ model teridentifikasi.

Catatan penting soal “restrictions” (pembatas) pada korelasi error: Order & rank condition sering mengasumsikan error bisa saling berkorelasi (tidak dibatasi). Kalau kenyataannya kita memberi pembatas pada error (misal beberapa korelasi error dipaksa 0), bisa terjadi:

  • kelihatan gagal order/rank
  • tapi sebenarnya masih bisa teridentifikasi dengan cara lain


Rigdon’s graphical identification rules (aturan grafis)

Ini aturan identifikasi berbasis gambar model, khususnya untuk non-recursive.

Konsep utamanya: cari “instrument unik”.

Instrument = variabel yang membantu “membedakan” pengaruh, karena dia memengaruhi salah satu variabel tapi tidak langsung memengaruhi yang lain (secara sederhana: jadi “pembeda”).

Pola yang dibahas:

  • Bow pattern (hubungan teridentifikasi jika Y1 punya instrument unik)
  • Feedback tanpa error berkorelasi (teridentifikasi jika Y1 atau Y2 punya instrument unik)
  • Feedback dengan error berkorelasi (teridentifikasi jika keduanya (Y1 dan Y2) punya instrument unik)

Instrument unik: variabel yang memengaruhi salah satu (mis. Y1) tetapi tidak “langsung ikut memengaruhi” yang lain dengan cara yang sama, sehingga membantu “memisahkan” arah pengaruh.


Ringkasan

Identifikasi: apakah parameter bisa ditentukan unik dari Σ?

Ada 3 status: under/ just/ over

Cara cek:

  • t-rule: cek jumlah informasi vs jumlah parameter (perlu, belum cukup)
  • Null B atau Recursive: kondisi kuat yang membuat identifikasi aman (cukup)
  • Order (perlu) & Rank (perlu + cukup): cek per persamaan untuk non-recursive
  • Rigdon (grafis): aturan perlu+cukup berbasis diagram, fokus pada instrument unik


Referensi

Bollen, K. A. (1989). Structural equations with latent variables. New York: Wiley.

Kline, R. B. (2016). Principles and practice of structural equation modeling (4th ed.). New York: Guilford Press.









This entry was posted in

0 komentar:

Posting Komentar

Berkomentarlah dengan baik dan sopan ya ^^

View My Stats