Regresija programmā Excel: vienādojums, piemēri. Lineārā regresija. Regresijas analīze Kā tiek ziņots par regresijas analīzes rezultātiem
Regresijas analīze ir viena no populārākajām metodēm statistikas pētījumi. To var izmantot, lai noteiktu neatkarīgo mainīgo ietekmes pakāpi uz atkarīgo mainīgo. Microsoft Excel ir rīki, kas paredzēti šāda veida analīzes veikšanai. Apskatīsim, kas tie ir un kā tos izmantot.
Bet, lai izmantotu funkciju, kas ļauj veikt regresijas analīzi, vispirms ir jāaktivizē analīzes pakotne. Tikai tad šai procedūrai nepieciešamie rīki parādīsies Excel lentē.
Tagad, kad mēs ejam uz cilni "Dati", uz lentes instrumentu kastē "Analīze" mēs redzēsim jaunu pogu - "Datu analīze".
Regresijas analīzes veidi
Ir vairāki regresijas veidi:
- parabolisks;
- nomierinošs līdzeklis;
- logaritmisks;
- eksponenciāls;
- demonstratīvs;
- hiperbolisks;
- lineārā regresija.
Sīkāk par pēdējā veida regresijas analīzes veikšanu programmā Excel runāsim vēlāk.
Lineārā regresija programmā Excel
Zemāk kā piemērs ir tabula, kurā norādīta vidējā diennakts gaisa temperatūra ārā un veikala klientu skaits attiecīgajā darba dienā. Noskaidrosim, kā tieši, izmantojot regresijas analīzi laikapstākļi gaisa temperatūras veidā var ietekmēt mazumtirdzniecības uzņēmuma apmeklējumu.
Vispārējais lineārās regresijas vienādojums ir šāds: Y = a0 + a1x1 +…+ akhk. Šajā formulā Y nozīmē mainīgo, faktoru ietekmi, uz kuriem mēs cenšamies izpētīt. Mūsu gadījumā tas ir pircēju skaits. Nozīme x ir dažādi faktori, kas ietekmē mainīgo. Iespējas a ir regresijas koeficienti. Tas ir, viņi ir tie, kas nosaka konkrēta faktora nozīmi. Rādītājs k apzīmē šo pašu faktoru kopējo skaitu.
Analīzes rezultātu analīze
Regresijas analīzes rezultāti tiek parādīti tabulas veidā iestatījumos norādītajā vietā.
Viens no galvenajiem rādītājiem ir R-kvadrāts. Tas norāda uz modeļa kvalitāti. Mūsu gadījumā šis koeficients ir 0,705 jeb aptuveni 70,5%. Tas ir pieņemams kvalitātes līmenis. Atkarība, kas mazāka par 0,5, ir slikta.
Vēl viens svarīgs indikators atrodas šūnā līnijas krustpunktā "Y-krustojums" un kolonnu "Izredzes". Tas norāda, kāda būs Y vērtība, un mūsu gadījumā tas ir pircēju skaits, un visi pārējie faktori ir vienādi ar nulli. Šajā tabulā šī vērtība ir 58,04.
Vērtība diagrammas krustpunktā "Mainīgais X1" Un "Izredzes" parāda Y atkarības līmeni no X. Mūsu gadījumā tas ir veikala klientu skaita atkarības līmenis no temperatūras. Koeficients 1,31 tiek uzskatīts par diezgan augstu ietekmes rādītāju.
Kā redzat, izmantojot Microsoft Excel, ir diezgan viegli izveidot regresijas analīzes tabulu. Bet tikai apmācīts cilvēks var strādāt ar izvaddatiem un saprast to būtību.
Regresijas analīze
Regresija (lineārs) analīze- statistikas metode, lai pētītu viena vai vairāku neatkarīgu mainīgo ietekmi uz atkarīgo mainīgo. Neatkarīgos mainīgos citādi sauc par regresoriem vai prognozētājiem, un atkarīgos mainīgos sauc par kritēriju mainīgajiem. Terminoloģija atkarīgi Un neatkarīgs mainīgie atspoguļo tikai mainīgo matemātisko atkarību ( skatiet viltus korelāciju), nevis cēloņu un seku attiecības.
Regresijas analīzes mērķi
- Kritērija (atkarīgā) mainīgā lieluma variācijas noteikšanas pakāpes noteikšana ar prognozētājiem (neatkarīgie mainīgie)
- Atkarīgā mainīgā vērtības prognozēšana, izmantojot neatkarīgo(-s) mainīgo(-us)
- Atsevišķu neatkarīgo mainīgo devuma noteikšana atkarīgā mainīgā variācijā
Regresijas analīzi nevar izmantot, lai noteiktu, vai pastāv saistība starp mainīgajiem lielumiem, jo šādas attiecības esamība ir priekšnoteikums analīzes piemērošanai.
Regresijas matemātiskā definīcija
Stingri regresijas attiecības var definēt šādi. Ļaut , ir nejauši mainīgie ar noteiktu kopīgu varbūtības sadalījumu. Ja katrai vērtību kopai ir noteikta nosacīta matemātiskā cerība
(regresijas vienādojums vispārīgā formā),tad tiek izsaukta funkcija regresija Y vērtības pēc vērtībām, un tā grafiks ir regresijas līnija, vai regresijas vienādojums.
Atkarība no izpaužas Y vidējo vērtību izmaiņās, mainoties . Lai gan katrai fiksētai vērtību kopai vērtība paliek nejaušs mainīgais ar noteiktu izkliedi.
Lai noskaidrotu jautājumu par to, cik precīzi regresijas analīze novērtē Y izmaiņas, mainot , tiek izmantota Y dispersijas vidējā vērtība dažādām vērtību kopām (patiesībā mēs runājam par atkarīgā mainīgā izkliedes mēru ap regresijas taisni).
Mazāko kvadrātu metode (koeficientu aprēķināšana)
Praksē regresijas taisne visbiežāk tiek meklēta lineāras funkcijas veidā (lineārā regresija), kas vislabāk tuvina vēlamo līkni. To veic, izmantojot mazāko kvadrātu metodi, kad faktiski novēroto noviržu kvadrātu summa no to aprēķiniem ir samazināta līdz minimumam (tas nozīmē aprēķinus, izmantojot taisnu līniju, kas it kā atspoguļo vēlamo regresijas attiecību):
(M - izlases lielums). Šī pieeja ir balstīta uz zināms fakts, ka summa, kas parādās iepriekš minētajā izteiksmē, iegūst minimālo vērtību tieši gadījumam, kad .
Lai atrisinātu regresijas analīzes uzdevumu, izmantojot mazāko kvadrātu metodi, tiek ieviesta koncepcija atlikušās funkcijas:
Minimālais nosacījums atlikušajai funkcijai:
Iegūtā sistēma ir sistēma lineārie vienādojumi ar nepazīstamiem cilvēkiem
Ja vienādojumu kreisajā pusē esošos brīvos terminus attēlojam kā matricu
un koeficienti nezināmajiem labajā pusē ir matrica
tad iegūstam matricas vienādojumu: , ko viegli atrisināt ar Gausa metodi. Iegūtā matrica būs matrica, kas satur regresijas līnijas vienādojuma koeficientus:
Lai iegūtu vislabākās aplēses, nepieciešams izpildīt OLS priekšnoteikumus (Gausa–Markova nosacījumi). Angļu literatūrā šādus aprēķinus sauc par BLUE (Best Linear Unbiased Estimators).
Regresijas parametru interpretācija
Parametri ir daļējas korelācijas koeficienti; tiek interpretēta kā Y dispersijas proporcija, kas izskaidrojama, fiksējot atlikušo prognozētāju ietekmi, tas ir, tā mēra individuālo ieguldījumu Y skaidrojumā. Korelēto prognozētāju gadījumā rodas aplēšu nenoteiktības problēma, kas kļūst atkarīgi no secības, kādā prognozētāji ir iekļauti modelī. Šādos gadījumos ir nepieciešams izmantot korelācijas un pakāpeniskās regresijas analīzes metodes.
Runājot par regresijas analīzes nelineārajiem modeļiem, ir svarīgi pievērst uzmanību tam, vai runa ir par nelinearitāti neatkarīgos mainīgajos (no formālā viedokļa, viegli reducējama līdz lineārai regresijai), vai par nelinearitāti novērtētajos parametros (izraisot nopietnas skaitļošanas grūtības). Pirmā tipa nelinearitātes gadījumā no satura viedokļa ir svarīgi izcelt formas terminu parādīšanos modelī , , kas norāda uz mijiedarbības esamību starp pazīmēm utt. (sk. Multikollinearitāte).
Skatīt arī
Saites
- www.kgafk.ru - Lekcija par tēmu “Regresijas analīze”
- www.basegroup.ru - metodes mainīgo atlasei regresijas modeļos
Literatūra
- Normens Drapers, Harijs Smits Lietišķā regresijas analīze. Daudzkārtēja regresija= Lietišķā regresijas analīze. - 3. izdevums. - M.: “Dialektika”, 2007. - Lpp. 912. - ISBN 0-471-17082-8
- Robustas metodes statistisko modeļu novērtēšanai: Monogrāfija. - K.: PP "Sansparel", 2005. - P. 504. - ISBN 966-96574-0-7, UDC: 519.237.5:515.126.2, BBK 22.172+22.152
- Radčenko Staņislavs Grigorjevičs, Regresijas analīzes metodika: Monogrāfija. - K.: "Korniychuk", 2011. - P. 376. - ISBN 978-966-7599-72-0
Wikimedia fonds. 2010. gads.
Regresijas analīze izmērīto datu modelēšanas un to īpašību izpētes metode. Dati sastāv no vērtību pāriem atkarīgais mainīgais(atbildes mainīgais) un neatkarīgais mainīgais(skaidrojošais mainīgais). Regresijas modelis ir neatkarīgā mainīgā un parametru funkcija ar pievienotu gadījuma lielumu. Modeļa parametri tiek pielāgoti tā, lai modelis vislabāk atbilstu datiem. Tuvināšanas (objektīvās funkcijas) kvalitātes kritērijs parasti ir vidējā kvadrātiskā kļūda: starpības kvadrātu summa starp modeļa vērtībām un atkarīgo mainīgo visām neatkarīgā mainīgā vērtībām. arguments. Matemātiskās statistikas un mašīnmācīšanās regresijas analīzes nozare. Tiek pieņemts, ka atkarīgais mainīgais ir kāda modeļa un nejaušā mainīgā lieluma vērtību summa. Tiek veikti pieņēmumi par šī daudzuma sadalījuma raksturu, ko sauc par datu ģenerēšanas hipotēzi. Lai apstiprinātu vai atspēkotu šo hipotēzi, tiek veikti statistiskie testi, ko sauc par atlikuma analīzi. Tiek pieņemts, ka neatkarīgais mainīgais nesatur kļūdas. Regresijas analīze tiek izmantota prognozēšanai, laikrindu analīzei, hipotēžu pārbaudei un slēpto attiecību identificēšanai datos.
Regresijas analīzes definīcija
Paraugs var būt nevis funkcija, bet gan relācija. Piemēram, dati regresijas veidošanai varētu būt šādi: . Šādā izlasē viena mainīgā vērtība atbilst vairākām mainīgā vērtībām.
Lineārā regresija
Lineārā regresija pieņem, ka funkcija ir lineāri atkarīga no parametriem. Šajā gadījumā lineāra atkarība no brīvā mainīgā nav nepieciešama,
Gadījumā, ja lineārās regresijas funkcijai ir forma
šeit ir vektora sastāvdaļas.
Parametru vērtības lineārās regresijas gadījumā tiek atrastas, izmantojot mazāko kvadrātu metodi. Šīs metodes izmantošana ir pamatota ar pieņēmumu par gadījuma lieluma Gausa sadalījumu.
Tiek izsauktas atšķirības starp atkarīgā mainīgā faktiskajām vērtībām un rekonstruētajām regresijas atlikumi(atlikumi). Sinonīmi tiek lietoti arī literatūrā: atlikumi Un kļūdas. Viens no svarīgākajiem iegūtās atkarības kvalitātes kritērija novērtējumiem ir atlikuma kvadrātu summa:
Šeit ir kvadrātu kļūdu summa.
Atlikumu dispersiju aprēķina, izmantojot formulu
Šeit vidējā kvadrāta kļūda, vidējā kvadrātiskā kļūda.
Grafikos parādīti paraugi, kas apzīmēti ar ziliem punktiem, un regresijas attiecības, kas apzīmētas ar nepārtrauktām līnijām. Brīvais mainīgais tiek attēlots pa abscisu asi, bet atkarīgais mainīgais tiek attēlots pa ordinātu asi. Visas trīs atkarības ir lineāras attiecībā uz parametriem.
Nelineārā regresija
Nelineārās regresijas modeļi - formas modeļi
ko nevar attēlot kā skalāru reizinājumu
kur ir regresijas modeļa parametri, ir brīvais mainīgais no telpas, ir atkarīgais mainīgais, - nejauša vērtība un ir funkcija no kādas noteiktas kopas.
Parametru vērtības nelineārās regresijas gadījumā tiek atrastas, izmantojot kādu no gradienta nolaišanās metodēm, piemēram, Levenberga-Marquardt algoritmu.
Par noteikumiem
Terminu "regresija" 19. gadsimta beigās ieviesa Frensiss Galtons. Galtons atklāja, ka gara vai īsa auguma vecāku bērni parasti nepārmanto izcilu augumu un nosauca šo fenomenu par "regresiju uz viduvējību". Sākumā šis termins tika izmantots tikai bioloģiskā nozīmē. Pēc Kārļa Pīrsona darba šo terminu sāka lietot statistikā.
Statistikas literatūrā tiek nošķirta regresija, kas ietver vienu brīvu mainīgo, un regresija, kas ietver vairākus brīvus mainīgos viendimensionāls Un daudzdimensionāls regresija. Tiek pieņemts, ka mēs izmantojam vairākus brīvus mainīgos, tas ir, brīvo mainīgo vektoru. Īpašos gadījumos, kad brīvais mainīgais ir skalārs, tas tiks apzīmēts ar . Atšķirt lineārs Un nelineārs regresija. Ja regresijas modelis nav lineāra parametru funkciju kombinācija, tad to sauc par nelineāru regresiju. Šajā gadījumā modelis var būt patvaļīga funkciju superpozīcija no noteiktas kopas. Nelineārie modeļi ir eksponenciāli, trigonometriski un citi (piemēram, radiālās bāzes funkcijas vai Rozenblata perceptrons), kas pieņem, ka attiecība starp parametriem un atkarīgo mainīgo ir nelineāra.
Atšķirt parametrisks Un neparametrisks regresija. Ir grūti novilkt striktu robežu starp šiem diviem regresijas veidiem. Pašlaik nav vispārpieņemtu kritēriju, lai atšķirtu viena veida modeļus no cita. Piemēram, lineārie modeļi tiek uzskatīti par parametriskiem, un modeļi, kas ietver atkarīgā mainīgā vidējo lielumu brīvā mainīgā telpā, nav parametriski. Parametriskās regresijas modeļa piemērs: lineārais prognozētājs, daudzslāņu perceptrons. Jauktās regresijas modeļu piemēri: radiālās bāzes funkcijas. Neparametrisks modelis, kas pārvietojas vidēji noteiktā platuma logā. Kopumā neparametriskā regresija atšķiras no parametriskās regresijas ar to, ka atkarīgais mainīgais nav atkarīgs no vienas brīvā mainīgā vērtības, bet gan no kādas noteiktas šīs vērtības apkārtnes.
Pastāv atšķirība starp terminiem "funkcijas aproksimācija", "tuvināšana", "interpolācija" un "regresija". Tas ir šādi.
Funkciju tuvināšana. Tiek dota diskrēta vai nepārtraukta argumenta funkcija. Nepieciešams atrast funkciju no noteiktas parametru saimes, piemēram, starp noteiktas pakāpes algebriskajiem polinomiem. Funkciju parametriem ir jānodrošina minimāla funkcionalitāte, piemēram,
Jēdziens tuvināšana sinonīms terminam “funkciju aproksimācija”. To biežāk izmanto, ja mēs runājam par noteiktu funkciju, kā diskrēta argumenta funkciju. Šeit arī jāatrod funkcija, kas iet vistuvāk visiem dotās funkcijas punktiem. Tas ievieš jēdzienu atlikumi attālumi starp nepārtrauktas funkcijas punktiem un atbilstošajiem diskrētās argumenta funkcijas punktiem.
Interpolācija funkcionē īpašs aproksimācijas uzdevuma gadījums, kad nepieciešams, lai noteiktos punktos izsaukts interpolācijas mezgli funkcijas un to tuvinātās funkcijas vērtības sakrita. Vispārīgāk, ierobežojumi tiek noteikti noteiktu atvasināto instrumentu vērtībām. Tas nozīmē, ka tiek dota diskrēta argumenta funkcija. Ir jāatrod funkcija, kas iet cauri visiem punktiem. Šajā gadījumā metriku parasti neizmanto, bet bieži tiek ieviests vēlamās funkcijas “gluduma” jēdziens.
Regresijas analīze ir metode, kā noteikt analītisku izteiksmi stohastiskajai atkarībai starp pētāmajiem raksturlielumiem. Regresijas vienādojums parāda, kā mainās vidējais rādītājs plkst mainot kādu no x i , un tam ir šāda forma:
Kur y - atkarīgais mainīgais (tas vienmēr ir vienāds);
X i - neatkarīgi mainīgie (faktori) (to var būt vairāki).
Ja ir tikai viens neatkarīgs mainīgais, tā ir vienkārša regresijas analīze. Ja ir vairāki no tiem ( P 2), tad šādu analīzi sauc par daudzfaktoriālu.
Regresijas analīze atrisina divas galvenās problēmas:
konstruējot regresijas vienādojumu, t.i. sakarības veida atrašana starp rezultāta rādītāju un neatkarīgiem faktoriem x 1 , x 2 , …, x n .
iegūtā vienādojuma nozīmīguma novērtējums, t.i. nosakot, cik lielā mērā atlasītie faktoru raksturlielumi izskaidro pazīmes variāciju u.
Regresijas analīze galvenokārt tiek izmantota plānošanai, kā arī normatīvā regulējuma izstrādei.
Atšķirībā no korelācijas analīzes, kas atbild tikai uz jautājumu, vai starp analizētajiem raksturlielumiem pastāv saistība, regresijas analīze sniedz arī tās formalizēto izteiksmi. Turklāt, ja korelācijas analīze pēta jebkādas attiecības starp faktoriem, tad regresijas analīze pēta vienpusējo atkarību, t.i. sakarība, kas parāda, kā faktoru raksturlielumu izmaiņas ietekmē efektīvo raksturlielumu.
Regresijas analīze ir viena no visattīstītākajām matemātiskās statistikas metodēm. Stingri sakot, lai īstenotu regresijas analīzi, ir jāizpilda vairākas īpašas prasības (jo īpaši, x l ,x 2 ,...,x n ;y jābūt neatkarīgiem, normāli sadalītiem gadījuma lielumiem ar nemainīgām variācijām). IN īsta dzīve stingra regresijas un korelācijas analīzes prasību ievērošana ir ļoti reta, taču abas šīs metodes ir ļoti izplatītas ekonomiskajos pētījumos. Atkarības ekonomikā var būt ne tikai tiešas, bet arī apgrieztas un nelineāras. Regresijas modeli var izveidot jebkuras atkarības klātbūtnē, tomēr daudzfaktoru analīzē tiek izmantoti tikai formas lineārie modeļi:
Regresijas vienādojums parasti tiek veidots, izmantojot mazāko kvadrātu metodi, kuras būtība ir samazināt iegūtā raksturlieluma faktisko vērtību kvadrātu noviržu summu no tā aprēķinātajām vērtībām, t.i.:
Kur T - novērojumu skaits;
j =a+b 1 x 1 j +b 2 x 2 j + ... + b n X n j - aprēķinātā rezultāta faktora vērtība.
Regresijas koeficientus ieteicams noteikt, izmantojot analītiskās paketes personālajam datoram vai speciālu finanšu kalkulatoru. Vienkāršākajā gadījumā formas vienfaktora lineārās regresijas vienādojuma regresijas koeficienti y = a + bx var atrast, izmantojot formulas:
Klasteru analīze
Klasteranalīze ir viena no daudzdimensiju analīzes metodēm, kas paredzēta tādas populācijas grupēšanai (klasterēšanai), kuras elementiem ir raksturīgi daudz raksturlielumu. Katras pazīmes vērtības kalpo kā katras pētāmās populācijas vienības koordinātas daudzdimensiju pazīmju telpā. Katrs novērojums, ko raksturo vairāku rādītāju vērtības, var tikt attēlots kā punkts šo rādītāju telpā, kuru vērtības tiek uzskatītas par koordinātām daudzdimensionālā telpā. Attālums starp punktiem R Un q Ar k koordinātas ir definētas kā:
Galvenais klasterizācijas kritērijs ir tas, ka atšķirībām starp klasteriem jābūt būtiskākām nekā starp novērojumiem, kas piešķirti vienam un tam pašam klasterim, t.i. daudzdimensionālā telpā ir jāievēro šāda nevienlīdzība:
Kur r 1, 2 — attālums starp 1. un 2. kopām.
Tāpat kā regresijas analīzes procedūras, arī klasterizācijas procedūra ir diezgan darbietilpīga, to vēlams veikt datorā.
Regresijas un korelācijas analīze ir statistikas pētījumu metodes. Šie ir visizplatītākie veidi, kā parādīt parametra atkarību no viena vai vairākiem neatkarīgiem mainīgajiem.
Tālāk, izmantojot konkrētus praktiskus piemērus, mēs aplūkosim šīs divas ļoti populārās analīzes ekonomistu vidū. Mēs sniegsim arī piemēru rezultātu iegūšanai, tos apvienojot.
Regresijas analīze programmā Excel
Parāda dažu vērtību (neatkarīgo, neatkarīgo) ietekmi uz atkarīgo mainīgo. Piemēram, kā ekonomiski aktīvo iedzīvotāju skaits ir atkarīgs no uzņēmumu skaita, algām un citiem parametriem. Vai arī: kā IKP līmeni ietekmē ārvalstu investīcijas, enerģijas cenas utt.
Analīzes rezultāts ļauj izcelt prioritātes. Un, pamatojoties uz galvenajiem faktoriem, prognozēt, plānot prioritāro jomu attīstību un pieņemt vadības lēmumus.
Regresija notiek:
- lineārs (y = a + bx);
- parabolisks (y = a + bx + cx 2);
- eksponenciāls (y = a * exp(bx));
- jauda (y = a*x^b);
- hiperbolisks (y = b/x + a);
- logaritmisks (y = b * 1n(x) + a);
- eksponenciāls (y = a * b^x).
Apskatīsim piemēru regresijas modeļa izveidei programmā Excel un rezultātu interpretācijai. Ņemsim lineāro regresijas veidu.
Uzdevums. 6 uzņēmumos vidēji mēnesī alga un aizgājušo darbinieku skaits. Nepieciešams noteikt aizejošo darbinieku skaita atkarību no vidējās algas.
Lineārās regresijas modelis izskatās šādi:
Y = a 0 + a 1 x 1 +…+a k x k.
Kur a ir regresijas koeficienti, x ir ietekmējošie mainīgie, k ir faktoru skaits.
Mūsu piemērā Y ir darbinieku aiziešanas rādītājs. Ietekmējošais faktors ir algas (x).
Programmā Excel ir iebūvētas funkcijas, kas var palīdzēt aprēķināt lineārās regresijas modeļa parametrus. Taču papildinājums “Analīzes pakotne” to paveiks ātrāk.
Mēs aktivizējam jaudīgu analītisko rīku:
Kad papildinājums būs aktivizēts, tas būs pieejams cilnē Dati.
Tagad veiksim pašu regresijas analīzi.
Pirmkārt, mēs pievēršam uzmanību R kvadrātam un koeficientiem.
R kvadrāts ir determinācijas koeficients. Mūsu piemērā – 0,755 jeb 75,5%. Tas nozīmē, ka modeļa aprēķinātie parametri izskaidro 75,5% sakarību starp pētītajiem parametriem. Jo augstāks determinācijas koeficients, jo labāks modelis. Labi - virs 0,8. Slikti – mazāk par 0,5 (šādu analīzi diez vai var uzskatīt par saprātīgu). Mūsu piemērā – “nav slikti”.
Koeficients 64.1428 parāda, kāds būs Y, ja visi aplūkojamajā modelī mainīgie ir vienādi ar 0. Tas ir, analizējamā parametra vērtību ietekmē arī citi modelī neaprakstītie faktori.
Koeficients -0,16285 parāda mainīgā X svaru uz Y. Tas ir, vidējā mēnešalga šajā modelī ietekmē atmesto skaitu ar svaru -0,16285 (tā ir neliela ietekmes pakāpe). Zīme "-" norāda slikta ietekme: jo lielāka alga, jo mazāk cilvēku pamet darbu. Kas ir godīgi.
Korelācijas analīze programmā Excel
Korelācijas analīze palīdz noteikt, vai pastāv saistība starp rādītājiem vienā vai divās izlasēs. Piemēram, starp mašīnas darbības laiku un remonta izmaksām, aprīkojuma cenu un darbības ilgumu, bērnu augumu un svaru utt.
Ja ir saistība, vai viena parametra palielināšana noved pie otra parametra palielināšanās (pozitīva korelācija) vai samazināšanās (negatīva). Korelācijas analīze palīdz analītiķim noteikt, vai viena rādītāja vērtību var izmantot, lai prognozētu iespējamā nozīme cits.
Korelācijas koeficientu apzīmē ar r. Svārstās no +1 līdz -1. Korelāciju klasifikācija priekš dažādās jomās būs savādāk. Ja koeficients ir 0, starp paraugiem nav lineāras attiecības.
Apskatīsim, kā atrast korelācijas koeficientu, izmantojot programmu Excel.
Lai atrastu pāru koeficientus, tiek izmantota funkcija CORREL.
Mērķis: noteikt, vai pastāv saistība starp virpas darbības laiku un tās uzturēšanas izmaksām.
Novietojiet kursoru jebkurā šūnā un nospiediet fx pogu.
- Kategorijā “Statistika” atlasiet funkciju CORREL.
- Arguments "Masīvs 1" - pirmais vērtību diapazons - mašīnas darbības laiks: A2:A14.
- Arguments "Masīvs 2" - otrais vērtību diapazons - remonta izmaksas: B2:B14. Noklikšķiniet uz Labi.
Lai noteiktu savienojuma veidu, jāskatās uz koeficienta absolūto skaitli (katrai darbības jomai ir sava skala).
Vairāku parametru (vairāk nekā 2) korelācijas analīzei ērtāk ir izmantot “Datu analīzi” (papildinājums “Analīzes pakotne”). Sarakstā ir jāizvēlas korelācija un jānorāda masīvs. Visi.
Iegūtie koeficienti tiks parādīti korelācijas matricā. Kā šis:
Korelācijas un regresijas analīze
Praksē šīs divas metodes bieži izmanto kopā.
Piemērs:
Tagad ir kļuvuši redzami regresijas analīzes dati.