Populasi dan sampel
- Populasi (ideal): kalau model benar, maka matriks kovarians yang “benar” akan sama persis dengan yang diprediksi model.
Ditulis: Σ = Σ(θ)
Maka residual populasi: Σ − Σ(θ) = 0
- Sampel (data nyata): kita tidak punya Σ populasi, yang kita punya adalah:
S = matriks kovarians hasil data sampel (observed)
Σ hat = matriks kovarians yang diimplikasikan model memakai parameter hasil estimasi (θ hat)
Karena itu residual:
Konsep inti: Residual itu “selisih” observed vs model
S = “hubungan yang terlihat di data” (misalnya kovarians/korelasi yang benar-benar terjadi)
Σ hat = “hubungan yang diprediksi/diharapkan oleh model”
R = “seberapa meleset model” pada tiap bagian (tiap varians/kovarians)
Poin penting:
Kalau ada komponen residual ≠ 0 (di populasi), berarti spesifikasi model salah. Residual hampir selalu tidak nol (karena data terbatas & acak), jadi kita lihat besar-kecilnya residual.
Makna tanda residual: positif vs negatif
- Residual positif (R > 0)
Artinya: kovarians yang terlihat di data lebih besar daripada yang diprediksi model (model underpredicts covariance/ model “kekecilan” memprediksi hubungan).
- Residual negatif (R < 0)
Artinya: kovarians data lebih kecil daripada yang diprediksi model (model overpredicts covariance atau model “kebesaran” memprediksi hubungan).
Bayangkan “hubungan” itu seperti “seberapa sering dua hal naik-turun bareng”:
- Kalau residual positif, data bilang “barengnya kuat”, model bilang “nggak sekuat itu” → model kekecilan.
- Kalau residual negatif, model bilang “barengnya kuat”, data bilang “nggak sekuat itu” → model kebesaran.
Kenapa residual dipakai untuk menilai fit (kecocokan model)?
Karena residual itu seperti “jejak kesalahan” model:
- Kalau banyak residual kecil-kecil → model cukup cocok.
- Kalau ada residual besar, misal pada pasangan variabel A dan B maka model kurang tepat menjelaskan hubungan A – B (mungkin ada hubungan yang seharusnya dimasukkan, atau asumsi model keliru)
Kenapa perlu residual “standardized” (distandardisasi)?
Kalau residual belum distandardisasi, perbandingan antar-angka bisa tidak adil (karena skala/ketidakpastian tiap elemen beda).
- Normalized residual
Intinya: residual dibagi ukuran “simpangan baku”/ketidakpastian tertentu → jadi lebih sebanding antar-elemen.
- Standardized residual
Tujuannya mirip “z-score”: membuat residual kira-kira mengikuti normal standar sehingga lebih mudah menilai mana yang “besar tidak wajar”.
0 komentar:
Posting Komentar
Berkomentarlah dengan baik dan sopan ya ^^