Kas yra Homoskedastic?
Homoskedastika (taip pat rašoma kaip „homoscedastic“) reiškia būklę, kai regresijos modelyje liekamojo ar klaidos termino dispersija yra pastovi. T. y., Paklaidos terminas labai nesikeičia, nes keičiasi numatytojo kintamojo vertė. Tačiau, nesant homoskedastumo, gali būti, kad regresijos modelyje gali reikėti įtraukti papildomų prognozuojančių kintamųjų, kad būtų galima paaiškinti priklausomo kintamojo veikimą.
Pagrindiniai išvežamieji daiktai
- Homoskedasticiškumas atsiranda, kai paklaidos termino dispersija regresijos modelyje yra pastovi. Jei klaidos termino dispersija yra homoskedadiška, modelis buvo tiksliai apibrėžtas. Jei varianto yra per daug, modelis gali būti netinkamai apibrėžtas. Pridėjus papildomų prognozuojančių kintamųjų, gali būti paaiškinta priklausomo kintamojo našumas. Priešingai, heteroskedaziškumas atsiranda tada, kai klaidos termino dispersija nėra pastovi.
Kaip veikia homoskedastika
Homoskedasticiškumas yra viena tiesinės regresijos modeliavimo prielaida. Jei klaidų dispersija aplink regresijos liniją labai skiriasi, regresijos modelis gali būti prastai apibrėžtas. Homoskedastikumo priešingybė yra heteroskedastingumas, lygiai taip pat kaip „homogeniško“ priešingybė yra „heterogeninė“. Heteroskedaziškumas (taip pat rašoma kaip „heteroskedaziškumas“) reiškia būseną, kai paklaidos termino dispersija regresijos lygtyje nėra pastovi.
Atsižvelgiant į tai, kad dispersija yra išmatuotas skirtumas tarp numatomo ir faktinio tam tikros situacijos rezultato, homoskedabilumo nustatymas gali padėti nustatyti, kuriuos veiksnius reikia pakoreguoti siekiant tikslumo.
Ypatingos aplinkybės
Paprastą regresijos modelį arba lygtį sudaro keturi terminai. Kairėje pusėje yra priklausomas kintamasis. Tai reiškia reiškinį, kurį modelis siekia „paaiškinti“. Dešinėje pusėje yra konstanta, prognozuojamasis kintamasis ir liekamasis arba paklaidos terminas. Klaidos terminas parodo priklausomo kintamojo kintamumo kiekį, kurio nepaaiškina prognozuojamasis kintamasis.
Homoskedastic pavyzdys
Pavyzdžiui, tarkime, kad norėjote paaiškinti studentų testų balus naudodamiesi kiek laiko kiekvienas studentas praleido studijuodamas. Tokiu atveju testų balai būtų priklausomi kintamieji, o laikas, praleistas studijuojant, būtų numatomasis kintamasis.
Klaidos terminas parodytų testų balų dispersijos dydį, kuris nebuvo paaiškintas studijų laiku. Jei šis pokytis yra vienodas arba homoskedatinis, tai rodo, kad modelis gali būti tinkamas bandymo atlikimo paaiškinimas - paaiškinantis tai, kiek laiko praleista studijuojant.
Tačiau dispersija gali būti heteroskedatinė. Klaidų terminų duomenų diagrama gali parodyti, kad didelis tyrimo laikas labai tiksliai atitiko aukštus testų balus, tačiau tie žemi tyrimo laiko testų rezultatai labai skyrėsi ir netgi apėmė labai aukštus balus. Taigi balų dispersija nebus gerai paaiškinta paprasčiausiai vienu prognozuojamuoju kintamuoju - studijų trukme. Šiuo atveju tikriausiai dar veikia koks nors kitas veiksnys, todėl modelį gali reikėti patobulinti, kad jis ar jie būtų atpažinti. Tolesnis tyrimas gali atskleisti, kad kai kurie studentai prieš laiką matė atsakymus į testą arba kad anksčiau buvo išlaikę panašų testą, todėl jiems nereikėjo mokytis tam tikram testui.
Todėl, norėdamas patobulinti regresijos modelį, tyrėjas pridėtų kitą aiškinamąjį kintamąjį, nurodantį, ar studentas matė atsakymus prieš testą. Tada regresijos modelis turėtų du aiškinamuosius kintamuosius - laiko studijas ir tai, ar studentas iš anksto žinojo atsakymus. Su šiais dviem kintamaisiais būtų galima paaiškinti daugiau testo balų dispersijos, o klaidos termino dispersija gali būti homoskedadiška, o tai rodo, kad modelis buvo aiškiai apibrėžtas.
