Kas yra kvadratų suma?
Kvadratų suma yra statistinė technika, naudojama regresinėje analizėje duomenų taškų pasiskirstymui nustatyti. Atliekant regresinę analizę, siekiama išsiaiškinti, kaip gerai duomenų eilutes galima pritaikyti funkcijai, kuri galėtų padėti paaiškinti, kaip buvo generuojamos duomenų eilutės. Kvadratų suma naudojama kaip matematinis būdas rasti funkciją, kuri labiausiai tinka (skiriasi mažiausiai) nuo duomenų.
Kvadratų sumos formulė yra
Visiem, kas noklusina, tacu Jei n yra elementų X aibė: Kvadratų suma = i = 0∑n (Xi −X) 2 kur: Xi = i-asis elementas aibėjeX = visų aibės elementų vidurkis (Xi −X)) = Kiekvieno elemento nuokrypis nuo vidurkio
Kvadratų suma taip pat žinoma kaip variacija.
Ką pasako kvadratų suma?
Kvadratų suma yra nuokrypio nuo vidurkio matas. Statistikoje vidurkis yra skaičių aibės vidurkis ir yra dažniausiai naudojamas centrinės tendencijos matas. Aritmetinis vidurkis paprasčiausiai apskaičiuojamas sudedant duomenų rinkinyje esančias vertes ir padalijant iš verčių skaičiaus.
Tarkime, kad „Microsoft“ (MSFT) uždarymo kainos per pastarąsias penkias dienas buvo 74, 01, 74, 77, 73, 94, 73, 61 ir 73, 40 JAV doleriais. Bendra visų kainų suma yra 369, 73 USD, taigi vadovėlio vidutinė arba vidutinė kaina būtų 369, 73 USD / 5 = 73, 95 USD.
Bet ne visada pakanka žinoti matavimo rinkinio vidurkį. Kartais naudinga žinoti, kiek gali būti matavimų rinkinio variacijų. Tai, kiek atskirtos atskiros vertės nuo vidurkio, gali šiek tiek suprasti, kaip pastebėjimai ar vertės atitinka sukurtą regresijos modelį.
Pvz., Jei analitikas norėjo sužinoti, ar MSFT akcijų kaina kinta kartu su „Apple“ (AAPL) kaina, jis gali išvardyti abiejų akcijų tam tikro laikotarpio proceso stebėjimo rinkinį, tarkime, 1, 2, arba 10 metų, ir sukurkite tiesinį modelį su kiekvienu užregistruotu stebėjimu ar matavimu. Jei santykis tarp abiejų kintamųjų (ty AAPL ir MSFT kainos) nėra tiesi, tada duomenų rinkinyje yra variacijų, kurias reikia ištirti.
Kalbant statistika, jei sukurto linijinio modelio linija neperžengia visų vertės matavimų, tada kai kurie kintamumai, pastebėti akcijų kainose, yra nepaaiškinami. Kvadratų suma naudojama apskaičiuoti, ar tarp dviejų kintamųjų yra tiesinis ryšys, o nepaaiškinamas kintamumas vadinamas likutine kvadratų suma.
Kvadratų suma yra variacijos kvadrato suma, kur kitimas apibrėžiamas kaip skirtumas tarp kiekvienos atskiros vertės ir vidurkio. Norint nustatyti kvadratų sumą, atstumas tarp kiekvieno duomenų taško ir tinkamiausios linijos yra kvadratas, tada sudedamas. Geriausiai tinkanti linija sumažins šią vertę.
Kaip apskaičiuoti kvadratų sumą
Dabar galite pamatyti, kodėl matavimas vadinamas kvadratų nuokrypių suma arba trumpų kvadratų suma. Naudojant aukščiau pateiktą MSFT pavyzdį, kvadratų sumą galima apskaičiuoti taip:
- SS = (74, 01 - 73, 95) 2 + (74, 77 - 73, 95) 2 + (73, 94 - 73, 95) 2 + (73, 61 - 73, 95) 2 + (73, 40 - 73, 95) 2 SS = (0, 06) 2 + (0, 82) 2 + (- 0, 01) 2 + (-0, 34) 2 + (-0, 55) 2 SS = 1, 0942
Sudėjus vien tik nuokrypių sumą nedalijant skaičiaus, rezultatas bus lygus nuliui arba artimas nuliui, nes neigiami nuokrypiai beveik puikiai atsvers teigiamus nuokrypius. Norint gauti tikroviškesnį skaičių, nuokrypių sumą reikia kvadratuoti. Kvadratų suma visada bus teigiamas skaičius, nes bet kokio skaičiaus kvadratas, tiek teigiamas, tiek neigiamas, visada yra teigiamas.
Kaip naudoti kvadratų sumą
Remiantis MSFT skaičiavimo rezultatais, didelė kvadratų suma rodo, kad dauguma verčių yra atokiau nuo vidurkio, taigi, duomenys labai skiriasi. Maža kvadratų suma reiškia mažą stebėjimų rinkinio kintamumą.
Aukščiau pateiktame pavyzdyje 1.0942 parodyta, kad MSFT akcijų kainų pokyčiai per pastarąsias penkias dienas yra labai maži, o investuotojai, norintys investuoti į akcijas, pasižyminčias kainų stabilumu ir mažu nepastovumu, gali pasirinkti MSFT.
Pagrindiniai išvežamieji daiktai
- Kvadratų suma matuojamas duomenų taškų nuokrypis nuo vidutinės vertės. Didesnis kvadratų sumos rezultatas rodo didelį duomenų rinkinio kintamumą, o mažesnis rezultatas rodo, kad duomenys labai skiriasi nuo vidutinės vertės..
Kvadratų sumos naudojimo apribojimai
Priimant investicinį sprendimą dėl akcijų, kurias norite įsigyti, reikia daug daugiau stebėjimų nei išvardyti čia. Analitikui gali tekti dirbti su daugelio metų duomenimis, kad būtų aiškiau žinoma, koks didelis ar mažas turto kintamumas. Pridėjus daugiau duomenų taškų prie rinkinio, kvadratų suma tampa didesnė, nes reikšmės bus labiau paskirstomos.
Plačiausiai naudojami variacijos matavimai yra standartinis nuokrypis ir dispersija. Tačiau norint apskaičiuoti bet kurią iš dviejų metrikų, pirmiausia reikia apskaičiuoti kvadratų sumą. Dispersija yra kvadratų sumos vidurkis (ty kvadratų suma, padalyta iš stebėjimų skaičiaus). Standartinis nuokrypis yra dispersijos kvadratinė šaknis.
Yra du regresinės analizės metodai, kuriuose naudojama kvadratų suma: tiesinių mažiausių kvadratų metodas ir netiesinių mažiausių kvadratų metodas. Mažiausiųjų kvadratų metodas reiškia, kad regresijos funkcija sumažina dispersijos kvadratų sumą iš tikrųjų duomenų taškų. Tokiu būdu galima nubrėžti funkciją, kuri statistiškai geriausiai atitinka duomenis. Atkreipkite dėmesį, kad regresijos funkcija gali būti tiesinė (tiesė) arba netiesinė (kreivė).
