Poslovna Statistika

  • Uploaded by: Betty BellaItalia
  • 0
  • 0
  • February 2021
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Poslovna Statistika as PDF for free.

More details

  • Words: 11,995
  • Pages: 87
Loading documents preview...
POSLOVNA ST ATISTIKA

P R E D A V A NJ A

Milan Papić

2

LITERATURA: M. Papić: PRIMIJENJENA STATISTIKA U MS EXCELU; Naklada Zoro, Zagreb, 2008. M. Vukičević & M. Papić: MATEMATIČKO-STATISTIČKI PRIRUČNIK ZA PODUZETNIKE; Golden marketing – Tehnička knjiga, Zagreb, 2003.

3

1. UVOD U STATISTIKU 1.1. POJAM STATISTIKE Statistika je znanstvena disciplina koja na organiziran način pristupa planiranju, prikupljanju, selekciji, grupiranju, prezentaciji i analizi informacija ili podataka, te interpretiranju rezultata provedene analize, a u svrhu realizacije postavljenih istraživačkih ciljeva.

1.2. DESKRIPTIVNA I INFERENCIJALNA STATISTIKA Statistika kao posebna znanstvena disciplina uključuje dva specifična segmenta: deskriptivnu i inferencijalnu statistiku. Deskriptivna statistika: opisuju se osnovne katakteristike određenog skupa podataka. Inferencijalna statistika: na temelju statističkih pokazatelja dobivenih na uzorku procjenjuje se vrijednost tih pokazatelja na cjelokupnoj populaciji (pri čemu se koriste osnovna načela teorije vjerojatnosti).

4

1.3. STATISTIČKI SKUP Statistički skup tvore statističke jedinice (osobe, stvari, poslovni subjekti, regije, države i slično) koje imaju slična, zajednička svojstva. Statistički skup mora biti definiran pojmovno, prostorno i vremenski. Npr. statistički skup: Studenti Sveučilišta u Splitu, Sveučilišni studijski centar za stručne studije u Zagrebu, školska godina 2009/10.  pojmovna definicija: studenti  prostorna definicija: Sveučilište u Splitu, Sveučilišni studijski centar za stručne studije u Zagrebu  vremenska definicija: školska godina 2009/10.

5

1.4. OBILJEŽJA JEDINICA STATISTIČKOG SKUPA Obilježja jedinica statističkog skupa su odgovarajuća svojstva po kojima su te jedinice međusobno slične ili se razlikuju. Svako obilježje se javlja u više pojavnih oblika (modaliteta) uz koje se vežu frekvencije (apsolutne ili relativne) kao numerički izraz intenziteta pojavnosti pojedinog modaliteta u promatranom statističkom skupu. Zbroj svih apsolutnih frekvencija jednak je opsegu statističkog skupa. VRSTE OBILJEŽJA Imamo više različitih vrsta obilježja. Određena vrsta obilježja vezana je i uz određenu skalu. Globalna podjela razlikuje kvalitativna i kvantitativna obilježja. I. Kvalitativna obilježja a) nominalna - dodatno se dijele na atributivna i geografska (prostorna); vezana su uz nominalnu skalu b) redoslijedna (obilježja ranga) - vezana su uz ordinalnu skalu

II. Kvantitativna obilježja - modaliteti izraženi brojem Izražena intervalnom i omjernom skalom. Kvantitativno obilježje kod kojeg se vrijednosti obilježja pridružuju statističkim jedinicama uz pomoć omjerne skale zove se numeričko obilježje. Numeričko obilježje može biti diskretno (diskontinuirano) i kontinuirano.

6

1.5. FAZE STATISTIČKOG ISTRAŽIVANJA Statističko istraživanje općenito obuhvaća: 1. Planiranje i određivanje cilja istraživanja. 2. Organizirano prikupljanje statističkih podataka. 3. Sređivanje, odnosno grupiranje statističkih podataka. 4. Tabelarno i grafičko prikazivanje statističkih podataka. 5. Statističku analizu i interpretaciju rezultata provedene analize.

7

2. UNOS, GRUPIRANJE, TABELARNO I GRAFIČKO PRIKAZIVANJE STATISTIČKIH PODATAKA 2.1. GRUPIRANJE STATISTIČKIH PODATAKA Grupiranje statističkih podataka postupak je podjele statističkog skupa na određeni broj grupa ili podskupova prema prethodno utvrđenim modalitetima danog obilježja uz poštivanje principa isključivosti i iscrpnosti. Tablica 1. Distribucija (razdioba, raspodjela) stanovnika općine Tutanj prema dobi KUM. DOB APSOLUTNE KUM. RELATIVNE KUMULATIVNI FREKVENCIJE FREKVENCIJE NIZ NIZ NIZ (%) (fi) “MANJE OD” “VIŠE OD” (%) 0 - 10 56 56 929 6,03 6,03 10 - 20 124 180 873 13,35 19,38 20 - 30 158 338 749 17,01 36,39 30 - 40 215 553 591 23,14 59,53 40 - 50 178 731 376 19,16 78,69 50 - 60 105 836 198 11,30 89,99 60 - 70 57 893 93 6,14 96,13 70 - 80 24 917 36 2,58 98,71 80 - 90 12 929 12 1,29 100,00 929 100,00 Σ

Važni pojmovi vezani uz distribuciju podataka u razrede: - svaki razred ima svoju donju i gornju granicu (u prethodnoj distribuciji donja granica 1. razreda je 0, a gornja 10); - granice mogu biti prave (precizne) ili neprave (nominalne); u slučaju pravih granica gornja granica svakog razreda jednaka je donjoj granici sljedećeg razreda; u slučaju nepravih granica postoji

8

određeni razmak (najčešće 1) između gornje granice svakog razreda i donje granice sljedećeg; - interval razreda ( i ) razlika je između prave gornje i donje granice razreda (u našem primjeru svi razredi imaju jednak interval (10); - sredina razreda ( xi ) dobije se tako da zbroj donje i gornje granice podijelimo s 2 (sredina prvog razreda u prethodnoj distribuciji je 5, drugog 15 itd.) Procedura koju u MS Excelu koristimo za grupiranje podataka naziva se Histogram. Treba napomenuti da nam procedura Histogram pored grupiranja podataka omogućava i istoimeni grafički prikaz. Postupak je sljedeći: Na padajućem izborniku Tools kliknimo mišem na opciju Data Analysis. U dobivenom okviru Analysis Tools označimo Histogram i kliknemo na OK. Napomena: Moguće je da vam se opcija Data Analysis ne pojavi na padajućem izborniku Tools. Tada ju trebate uključiti tako da kliknete na Add-Ins na istom izborniku, te u dobivenom okviru označite opcije Analysis ToolPak i Analysis ToolPak-VBA i kliknete OK. Ponovno se vratite na Tools, čarobni Data Analysis trebao bi biti tu.

9

2.2.

TABELARNO I GRAFIČKO STATISTIČKIH PODATAKA

PRIKAZIVANJE

Tabelarno i grafičko prikazivanje statističkih podataka je faza sređivanja sirove statističke građe koja ima za cilj da na jasan, cjelovit i pregledan način prezentira rezultate njihovog prikupljanja i grupiranja. Pored vizualne prezentacije statističkih informacija, tablice i grafikoni služe i kao pomoćno sredstvo statističke analize promatranih pojava. Grafičke prikaze možemo podijeliti u četiri osnovne skupine: 1. Površinski grafikoni (jednostavni, dvostruki, višestruki i strukturni stupci, strukturni krugovi ili polukrugovi, histogram, Varzarov znak). Grafički prikaz 2.1. Primjer strukturnog kruga Struktura studenata 1. godine VPŠ Libertas prema ocjenama na ispitu iz Poslovne matematike (01.02.06.) 19,57% 42,39%

5,43%

8,70% 23,91%

izvrstan (5)

vrlo dobar (4)

dobar (3)

dovoljan (2)

nedovoljan (1)

10

Grafički prikaz 2.2. Primjer jednostavnih stupaca

broj studenata

Distribucija studenata 1. godine VPŠ Libertas prema ocjenama na ispitu iz Poslovne matematike (01.02.06.) 45 40 35 30 25 20 15 10 5 0

39

22 18 8

izvrstan (5)

vrlo dobar (4)

dobar (3)

5

dovoljan (2)

nedovoljan (1)

ocjene

2. Linijski grafikoni (poligon frekvencija - apsolutnih, relativnih i kumulativnih). Grafički prikaz 2.3. Primjer linijskog grafikona

broj noćenja (000)

Kretanje broja noćenja na otoku Visu u razdoblju od 1995. do 2005. godine 50 45 40 35 30 25 20 15 10 5 0 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006

godina

11

3. Točkasti grafikoni (dijagram rasipanja ili XY Scatter, dijagram točaka) Grafički prikaz 2.4. Primjer točkastog grafikona (XY Scatter) Odnos između prisustva nastavi i broja bodova na ispitu iz Poslovne matematike (01.02.06.) 120

Broj bodova (%)

100 80 60 40 20 0 0

20

40

60

80

100

120

Prisustvovanje vježbama (% )

4. Kartogrami (dijagramske karte, statističke karte, piktogrami).

Napomena: Svaki grafički prikaz mora imati naslov, te naznačene nazive varijabli koje se nalaze na pojedinim koordinatnim osima.

12

3. TEMELJNE NIZOVA

KARAKTERISTIKE

NUMERIČKIH

3.1. SREDNJE VRIJEDNOSTI NUMERIČKIH NIZOVA Srednja vrijednost je konstanta koja ima za cilj na reprezentativan način predstaviti niz varijabilnih podataka statističkog skupa. To je centralna vrijednost oko koje se gomilaju podaci numeričkog niza zbog čega se još zove i “mjera centralne tendencije”. Temeljne vrste srednjih vrijednosti su: 1.) aritmetička sredina 2.) geometrijska sredina 3.) harmonijska sredina 4.) medijan 5.) mod Primjena pojedine vrste srednje vrijednosti određena je karakterom promatrane numeričke statističke varijable, te raspoloživim podacima. Općenito, razlikujemo potpune i položajne srednje vrijednosti. Potpune srednje vrijednosti su aritmetička sredina, harmonijska sredina i geometrijska sredina. U njihovom izračunavanju sudjeluju svi podaci numeričkog niza. Položajne srednje vrijednosti su medijan i mod, a njihova je vrijednost određena mjestom (položajem) unutar statističkog skupa. Srednje vrijednosti možemo izračunavati (određivati) iz pojedinačnih (negrupiranih) i iz grupiranih podataka statističkog skupa.

13

3.1.1. ARITMETIČKA SREDINA Aritmetička sredina je najvažnija i najčešće korištena srednja vrijednost. Aritmetičku sredinu možemo jednostavno definirati kao prosječnu vrijednost koju dobijemo tako da zbroj svih vrijednosti podijelimo s njihovim brojem. Označava se sa X , X , M, E(x). Iz negrupiranih podataka izračunava se iz relacije: N

X =

∑x i =1

N

i

x1 + x 2 +...+ x N = N

gdje je N broj jedinica statističkog skupa. Ovako izračunata aritmetička sredina naziva se jednostavna aritmetička sredina. Za izračunavanje aritmetičke sredine iz negrupiranih podataka u MS Excelu koristimo funkciju: =AVERAGE( : ) Primjer 3.1.1.1. Jožina neto plaća (u kunama) u 12 mjeseci 2004. godine bila je: 3640, 3680, 3785, 4250, 4050, 5620, 3150, 3020, 4820, 4960, 5230 i 5860. Izračunajte Jožinu prosječnu mjesečnu neto plaću u 2004. godini. N

X =

∑x i =1

N

i

=

3640 + 3680 + 3785 + 4250 + 4050 + 5620 + 3150 + 3020 + 4820 + 4960 + 5230 + 5860 12

= 4338,75 Dakle, Jožina prosječna mjesečna neto plaća u 2004. godini bila je 4338,75 kuna.

14

Vagana ili ponderirana aritmetička sredina primjenjuje se u slučaju grupiranih numeričkih nizova, odnosno distribucija frekvencija. Distribuciju općenito čini skup parova vrijednosti numeričke varijable X i njima pridruženih frekvencija: k   x ; f : i = 1 , 2 , 3 ,..., k , f = N ( )  i i . ∑ i i =1  

Vagana ili ponderirana aritmetička sredina dobit će se iz izraza: k

f x + f 2 x2 +...+ f k xk X= 1 1 ⇒ f 1 + f 2 +...+ f k

X =

∑fx i =1 k

i

∑f i =1

i

i

Apsolutne frekvencije fi u gornjem izrazu imaju ulogu pondera. Primjer 3.1.1.2. Zadana je distribucija studenata 1. godine RIF-a prema broju položenih jednosemestralnih ispita: Broj položenih ispita (xi) 0 1 2 3 4 Σ

Broj studenata (fi) 235 128 176 44 17 600

fixi 0 128 352 132 68 680

Izračunajte prosječan broj položenih ispita po studentu.

15

k

X =

∑fx i =1 k

i i

∑f i =1

=

680 = 1,13 600

i

Dakle, prosječan broj položenih ispita po jednom studentu prve godine RIF-a je 1,13 ispita. Primjer 3.1.1.3. Zadana je distribucija nezaposlenih u RH prema dobi (lipanj 1997.): Navršene go- Nezaposleni dine starosti (u 000) 15 - 24 65,84 25 - 49 95,23 50 - 64 13,27 65 - (79) 0,86 175,20 Σ

Razredna sredina (xi) 19,5 37 57 72

fixi 1283,88 3523,51 756,39 61,92 5625,70

Izračunajte prosječnu dob nezaposlenih u RH. k

X =

∑fx i =1 k

i i

∑f i =1

=

5625,70 = 32,11 175,20

i

Prosječna dob nezaposlenih u RH (stanje u lipnju 1997.) je bila 32,11 godina.

16

OSNOVNE KARAKTERISTIKE ARITMETIČKE SREDINE 1. Svaka distribucija u kojoj su vrijednosti obilježja pridružene jedinicama skupa na temelju intervalne ili omjerne skale ima aritmetičku sredinu. 2. Sve vrijednosti aritmetičkog niza uključene su pri izračunavanju aritmetičke sredine (potpunost). 3. Numerički niz ima samo jednu aritmetičku sredinu. 4. Aritmetička sredina može poslužiti za usporedbu dvaju ili više numeričkih nizova koji su nastali grupiranjem prema istom obilježju. 5. Aritmetička sredina nalazi se uvijek između najmanje (Xmin) i najveće (Xmax) vrijednosti numeričkog obilježja u distribuciji. 6. Aritmetička sredina jedina je mjera centralne tendencije gdje je zbroj odstupanja svih vrijednosti od sredine uvijek jednak nuli:

∑ (x N

i =1

i

− X) = 0

7. Zbroj kvadrata odstupanja pojedinih vrijednosti xi od aritmetičke sredine je minimalan, tj. ako umjesto X uzmemo bilo koji broj a ≠ X , zbroj kvadrata odstupanja pojedine vrijednosti xi od a bit će veći od prethodno spomenutog zbroja: 2

N

∑(x i =1

i

N

N

− X ) = min ⇒ ∑ ( xi − X ) < ∑ ( xi − a ) i =1

2

2

i =1

8. Aritmetička sredina neće biti zadovoljavajuće reprezentativna kada u numeričkom nizu postoje ekstremno male ili velike vrijednosti promatranog obilježja.

17

9. Aritmetička sredina izračunata na temelju distribucije frekvencija u kojoj su modaliteti obilježja predstavljeni razredima gotovo uvijek sadrži pogrešku budući da izračunata razredna sredina, koja se koristi za određivanje vagane sredine, predstavlja samo aproksimativnu zamjenu stvarne sredine odgovarajućeg razreda. 10. Problem reprezentativnosti aritmetičke sredine dodatno je pojačan u slučaju kada postoje otvoreni razredi u distribuciji frekvencija, a osobito kada nije moguće objektivno procijeniti nepoznate granice otvorenih razreda.

3.1.2 GEOMETRIJSKA SREDINA Geometrijska sredina predstavlja n-ti korijen iz produkta pojedinačnih vrijednosti obilježja svih jedinica statističkog skupa:

n

G = n x1 × x 2 ×...× x n Geometrijsku sredinu iz negrupiranih podataka u Ms Excelu izračunavamo pomoću funkcije: =GEOMEAN( : )

3.1.3 HARMONIJSKA SREDINA Harmonijska sredina može se definirati kao recipročna vrijednost aritmetičke sredine recipročnih vrijednosti numeričke varijable X. Za negrupirane podatke izračunava se iz izraza:

H=

N 1 1 1 + +....+ x1 x 2 xN

=

N N

1 ∑ i =1 x i

uz uvjet xi ≠ 0.

18

Harmonijsku sredinu iz negrupiranih podataka u Ms Excelu izračunavamo pomoću funkcije: =HARMEAN( : )

3.1.4. MEDIJAN Medijan je srednja položajna vrijednost numeričkog obilježja koja uređeni statistički niz dijeli na dva jednaka dijela. To znači da pola jedinica (50%) u nizu ima vrijednost obilježja jednaku ili manju od vrijednosti medijana, a preostalih pola jedinica (50%) ima vrijednost obilježja veću ili jednaku vrijednosti medijana. U literaturi se ponekad naziva i centralna vrijednost. Označava se sa Me (M, C). Kao glavni nedostatak aritmetičke sredine naveli smo negativan utjecaj ekstremno niskih i visokih rezultata na njezinu reprezentativnost. Upravo u takvim situacijama medijan predstavlja pogodniju srednju vrijednost. Primjer 3.1.4.1. Zadane su prosječne mjesečne plaće u poduzeću “Marx i Engels” d.o.o.: 3200, 2800, 2400, 1800, 1700, 2150, 48000, 2050 kuna. Odredite medijan i aritmetičku sredinu navedenih plaća. Objasnite konkretno značenje medijana. Koja srednja vrijednost reprezentativnije predstavlja navedeni niz. Zašto? Prvo ćemo zadani niz poredati od najmanje do najveće vrijednosti: 1700, 1800, 2050, 2150, 2400, 2800, 3200, 48000

x 4 + x5 2150 + 2400 N = 4 ⇒ = 4 ⇒ = = = 2275 r Me N=8 ⇒ 2 2 2 50% posto zaposlenih u “Marx i Engels”d.o.o. ima plaću manju od 2275 KN, a 50% veću od 2275 kn.

19

N

X =

∑x i =1

N

i

=

64100 = 8012.50 8

Očito je da u ovom slučaju medijan bolje reprezentira predstavlja navedeni niz (zbog ekstremno visoke plaće od 48000 kn). Za izračunavanje medijana iz negrupiranih podataka u MS Excelu koristimo funkciju: =MEDIAN( : ).

3.1.5. KVANTILI. Kvantili su vrijednosti obilježja koje numeričke nizove dijele na q jednakih dijelova. Broj kvantila (p) uvijek je za jedan manji od njegovog reda (p = q -1). U praksi se najčešće koriste kvantili 4. reda (kvartili), 10. reda (decili) i 100. reda (centili ili percentili). 3.1.5.1. KVARTILI Kvartili su položajne vrijednosti koje uređeni statistički niz dijele na 4 jednaka dijela. Prema prethodno navedenom imamo tri kvartila: prvi ili donji kvartil (Q1), drugi kvartil ili medijan, te treći ili gornji kvartil (Q3). Primjer 3.1.5.1. Odredite donji i gornji kvartil u primjeru 3.1.4.1. i objasnite njihovo značenje. 1700, 1800, 2050, 2150, 2400, 2800, 3200, 48000

N 1800 + 2050 = 2 ⇒ Q1 = = 1925 4 2 3N 2800 + 3200 = 3000 = 6 ⇒ Q3 = 4 2

20

Jedna četvrtina (25%) radnika u “M&E” ima plaću manju od 1925 kn, a jedna četvrtina (25%) veću od 3000 kn. Za izračunavanje donjeg kvartila iz negrupiranih podataka u MS Excelu koristimo funkciju: =QUARTILE( : ;1), a gornjeg kvartila: =QUARTILE( : ;3).

3.1.5.2. PERCENTILI Percentili (centili) su položajne vrijednosti koje uređeni statistički niz dijele na 100 jednakih dijelova (ima ih 99). Za izračunavanje npr. 10. percentila iz negrupiranih podataka u MS Excelu koristimo funkciju: =PERCENTILE( : ;10%). Objašnjenje bi bilo da 10% podataka iz promatranog statističkog skupa ima vrijednosti manje od ovako dobivene vrijednosti.

3.1.5.3. DECILI Decili su položajne vrijednosti koje uređeni statistički niz dijele na 10 jednakih dijelova (ima ih 9). U MS Excelu nemamo funkciju za direktno izračunavanje decila, ali možemo ih odrediti preko funkcije za percentile. Npr. 7. decil nije ništa drugo do 70. percentil, pa njegovu vrijednost izračunavamo pomoću funkcije: =PERCENTILE( : ;70%).

21

Dobivenu vrijednost interpretiramo tako da kažemo da je 3/10 (30%) podataka u promatranom statističkom skupu veće od te vrijednosti (može se reći i da je 70% podataka manje od dobivene vrijednosti, ali je prva interpretacija bliža praktičnoj svrsi izračunavanja decila).

3.1.6. MOD Mod je vrijednost obilježja koja se najčešće pojavljuje u nekom statističkom nizu, tj. vrijednost obilježja s najvećom frekvencijom. Naziva se još i dominantna vrijednost a označava sa Mo (D). Značajna karakteristika moda je ta što se osim za numeričke i redoslijedne nizove može primijeniti i za nominalne nizove. Svaki statistički niz ima samo jednu aritmetički sredinu i medijan, ali je moguće da ima više modalnih vrijednosti. Primjer 3.1.6.1. Ljubine ocjene na kraju školske godine su sljedeće: 2, 3, 2, 5, 4, 2, 4, 3, 2, 2, 4, 3, 2, 4, 3, 3. Odredite mod i objasnite njegovo značenje. Modalna vrijednost je 2, tj. najčešća ocjena koja se pojavljuje u Ljubinoj svjedodžbi je dvojka. Za izračunavanje moda iz negrupiranih podataka u MS Excelu koristimo funkciju: =MODE( : ).

22

3.2. MJERE DISPERZIJE (RASPRŠENJA) Srednje vrijednosti često ne daju pravu sliku o nekom skupu podataka. Npr. u poduzeću A svi radnici imaju plaću od 5000 kn. U poduzeću B je prosječna plaća također 5000 kn, ali plaće variraju od 1200 do 60000 kn. Očito je da u ovom slučaju ne možemo samo na temelju bilo koje od srednjih vrijednosti dobiti pravu sliku o plaćama u poduzećima A i B. Zato se uz srednje vrijednosti statističkog skupa izračunavaju i mjere disperzije (stupnja varijabilnosti ili raspršenja) za taj skup. Razlikujemo apsolutne i relativne mjere disperzije. Apsolutne mjere disperzije su raspon varijacije, interkvartil i varijanca (te iz nje izvedena stadandardna devijacija). Apsolutne mjere disperzije izražene su u jedinicama mjere varijable statističkog skupa. Relativne mjere disperzije izražavaju se u proporcijama ili postotcima, a najčešće su koeficijent kvartilne devijacije i koeficijent varijacije. Mjere disperzije ukazuju na reprezentativnost srednjih vrijednosti. Manja mjera disperzije znači veću reprezentativnost srednje vrijednosti i obrnuto. Pomoću mjera disperzije uspoređujemo razlike u varijabilitetu dviju ili više distribucija. Ukoliko se radi o istim obilježjima (sa sličnim vrijednostima) za usporedbu možemo koristiti apsolutne mjere disperzije. Ako se radi o distribucijama različitih obilježja (ili istih obilježja različitih modaliteta) za usporedbu varijabiliteta obavezno se koriste relativne mjere disperzije.

23

3.2.1. RASPON VARIJACIJE Najjednostavnija mjera disperzije je raspon varijacije, a predstavlja razliku između najveće (Xmax) i najmanje (Xmin) vrijednosti numeričkog obilježja u nekom nizu:

Rx = X max − X min Najmanja moguća vrijednost raspona varijacije je 0, a najveća nije određena. U slučaju grupiranih podataka kao Xmin uzimamo pravu donju granicu prvog razreda, a kao Xmax pravu gornju granicu posljednjeg razreda. Prednost raspona varijacije je njegova jednostavnost. Nedostatak je taj što pri njegovu izračunavanju koristimo samo dvije vrijednosti statističkog skupa. U slučaju ekstremnih rezultata Rx je vrlo nepouzdana mjera varijabiliteta. Raspon varijacije koristi se u grubom opisu statističkog skupa, ali nije dovoljno precizna mjera za njegovu detaljniju analizu. U MS Excelu nemamo gotovu funkciju za izračunavanje raspona varijacije, ali ga možemo posredno izračunati pomoću funkcija za maximum i minimum: =MAX( : )-MIN( : )

3.2.2. INTERKVARTIL Interkvartil (IQ) je apsolutna mjera disperzije koja pokazuje raspon varijacije središnjih 50% jedinica uređenog statističkog skupa. Interkvartil predstavlja razliku između gornjeg i donjeg kvartila:

I Q = Q3 − Q1 Prednost interkvartila u odnosu na raspon varijacije je ta što se pri njegovu određivanju eliminiraju ekstremne vrijednosti. Nedostatak je,

24

slično kao i kod Rx-a, njegova nepotpunost, tj. korištenje samo dvije vrijednosti za njegovo izračunavanje. Kao i za raspon varijacije niti za interkvartil nemamo gotovu funkciju u MS Excelu. Izračunamo gornji i donji kvartil, te koristimo gornju relaciju ili direktno: =QUARTILE( : ;3)-QUARTILE( : ;1)

3.2.3. VARIJANCA I STANDARDNA DEVIJACIJA Za razliku od raspona varijacije i interkvartila gdje koristimo samo dvije vrijednosti statističkog skupa u određivanju varijance i standardne devijacije sudjeluju sve vrijednosti tog skupa. Varijanca predstavlja prosječno kvadratno odstupanje od aritmetičke sredine. Označava se sa σ2 i izračunava pomoću formule: a) za negrupirane podatke:

∑ (x N

σ = 2

i =1

i

− X)

2

N

b) za grupirane podatke:

∑ f (x k

σ = 2

i =1

i

i

− X)

2

k

∑f i =1

i

Budući je varijanca kvadratna mjera teško ju je interpretirati. Uz pomoć drugog korijena iz varijance dolazimo do najčešće mjere disperzije - standardne devijacije. Standardna devijacija definira se kao prosječno odstupanje od aritmetičke sredine (što je matematički netočno). Označava se sa σ i analogno prethodnim formulama izračunava kao:

25

a) za negrupirane podatke: N

∑ ( xi − X )

σ=

2

i =1

N

b) za grupirane podatke:

k



σ =

i =1

f i ( xi − X )

2

k

∑f i =1

i

Funkcije u MS Exscel-u: - za izračunavanje varijance iz negrupiranih podataka: =VARP( : ) - za izračunavanje standardne devijacije iz negrupiranih podataka: =STDEVP( : )

26

3.2.4. KOEFICIJENT VARIJACIJE Koeficijent varijacije je relativna mjera disperzije i predstavlja postotni udio standardne devijacije u odnosu na vrijednost aritmetičke sredine. Označava se sa V i izračunava iz relacije:

V =

σ X

× 100

Najmanja vrijednost koeficijenta varijacije je 0%, a najveća nije određena (vrlo rijetko je veća od 100%). Kao relativna mjera disperzije koeficijent varijacije koristi se prije svega za usporedbu varijabiliteta dviju ili više distribucija.

Varijabilitet elemenata statističkog skupa u ovisnosti o iznosu koeficijenta varijacije V (%) 0

- 10

Varijabilitet vrlo slab

10 - 30

relativno slab

30 - 50

umjeren

50 -

70

veći od 70

relativno jak vrlo jak

Koeficijent varijacije u MS Excelu izračunavamo iz gornje relacije koristeći se funkcijama za aritmetičku sredinu i standardnu devijaciju: =STDEVP( : )/AVERAGE( : )*100

27

3.2.5. KOEFICIJENT KVARTILNE DEVIJACIJE Koeficijent kvartilne devijacije je relativna mjera disperzije središnjih 50% elemenata uređenog statističkog skupa, a koristi se u slučajevima kada se disperzija izražava interkvartilom. Označava se sa Vq i izračunava iz relacije:

Q3 − Q1 Vq = Q3 + Q1 Vq poprima vrijednosti od 0 do 1. Što je manji varijabilitet Vq je bliži 0, a što je varijabilitet veći Vq je bliži 1.

Varijabilitet središnjih 50% elemenata uređenog statističkog skupa u ovisnosti o iznosu koeficijenta kvartilne devijacije Vq 0

- 0,1

Varijabilitet vrlo slab

0,1 - 0,2

relativno slab

0,2 - 0,3

umjeren

0,3 - 0,5

relativno jak

0,5 - 1

vrlo jak

U MS Excelu izračunamo vrijednost donjeg i gornjeg kvartila, pa ih uvrstimo u gornju relaciju (zagradama riješiti problem hijerarhije računskih operacija). Može i direktno pomoću relacije: =(QUARTILE(...;3)-QUARTILE(Q;1))/(QUARTILE(Q;3)+QUARTILE(Q;1))

28

3.3. MJERE ASIMETRIJE Pri opisu distribucije određenog statističkog skupa, uz srednje vrijednosti i mjere disperzije, koristimo i mjere asimetrije. One nam ukazuju na raspored pojedinih vrijednosti statističkog skupa oko neke od srednjih vrijednosti, najčešće aritmetičke sredine. Ako su vrijednosti ravnomjerno raspoređene oko srednje vrijednosti govorimo o simetričnoj distribuciji. Kod simetrične distribucije sve tri srednje vrijednosti su jednake ( X = Me = Mo). U slučaju simetrične distribucije zvonolikog oblika (normalna ili Gaussova distribucija) vrijednosti statističkog skupa su oko aritmetičke sredine raspoređene kao na donjoj slici: Površina ispod krivulje normalne distribucije

X -3σ σ

X -2σ σ







 ←



X -σ σ

X

X +σ σ

← 68.27%→ →

←

X +2σ σ

X +3σ σ









95.45%

→

99.73%

→



Kao što se vidi 99.73% vrijednosti statističkog skupa nalazi se u intervalu

X

± 3σ. Ovo treba imati na umu kod izračunavanja

29

standardne devijacije - raspon rezultata približno je 6σ

( ako je

distribucija približno normalna). Ocjene 1 2 3 4 5

Broj studenata 2 5 10 5 2

PRIMJER SIMETRIČNE DISTRIBUCIJE 12 10 8 6 4 2 0 1

2

3

α3

4

5

=0

Ako u statističkom skupu postoji jedna ili više velikih ekstremnih vrijednosti (prevladavaju niže vrijednosti) riječ je o pozitivno asimetričnoj distribuciji ( X > Me> Mo).

Ocjene 1 2 3 4 5

Broj studenata 8 10 3 2 1

30

PRIMJER POZITIVNO ASIMETRIČNE DISTRIBUCIJE 10 8 6 4 2 0 1

2

3

α3

4

5

= 1,11

Ako u statističkom skupu postoji jedna ili više malih ekstremnih vrijednosti (prevladavaju više vrijednosti) riječ je o negativno asimetričnoj distribuciji ( X <Me<Mo). Ocjene Broj studenata 1 1 2 2 3 3 4 10 5 8 PRIMJER NEGATIVNO ASIMETRIČNE DISTRIBUCIJE 10 9 8 7 6 5 4 3 2 1 0 1

2

3

α3

= - 1,11

4

5

31

PEARSONOV KOEFICIJENT ASIMETRIJE α3 Pearsonov koeficijent asimetrije α3 je potpuna mjera asimetrije. Vrijedi: -2 ≤ α3 ≤ 2. U slučaju simetrične distribucije α3 = 0. Što je asimetrija više izražena apsolutna vrijednost koeficijenta asimetrije bliža je broju 2, a njegov predznak ukazuje na pozitivnu ili negativnu asimetriju. Funkcija u MS Excel-u za izračunavanje Pearsonovog koeficijenta asimetrije α3: =SKEW( : )

3.4. MJERA ZAOBLJENOSTI Mjera zaobljenosti brojčani je pokazatelj zaobljenosti vrha krivulje distribucije (u literaturi se koristi pojam kurtosis prema grčkoj riječi koja znači izbočenost). U deskriptivnoj statistici se koristi relativno rijetko, pa ćemo ga samo ukratko opisati. Koeficijent zaobljenosti najčešće se označava sa α4 (ponekad i β2) , ali budući da se u MS Excelu koristi malo izmjenjena formula u odnosu na standardne formule u statističkoj / literaturi, označit ćemo ga sa α 4 . U MS Excel-u imamo gotovu funkciju

za koeficijent zaobljenosti: =KURT(raspon podataka) Koeficijent zaobljenosti interpretira se tako da se uspoređuje sa zaobljenošću normalne distribucije čiji koeficijent zaobljenosti α4/ iznosi 0. Ako je α4/ veći od 0 distribucija je “šiljastija” od normalne, a ako je

32

manji od 0 radi se o distribuciji koja je “plosnatija” od normalne distribucije (vidi sliku).

Usporedba zaobljenosti normalne distribucije i “šiljastije”, odnosno “plosnatije” distribucije

α 4/ = 0

α 4/ > 0

α 4/ < 0

33

4. KORELACIJA I REGRESIJA Korelacijska analiza primjenom specifičnih statističkih metoda i tehnika ispituje stupanj povezanosti između dvije ili više varijabli. Ukoliko se utvrdi statistički značajan stupanj povezanosti između promatranih varijabli, regresijskom analizom razvija se analitički izraz ili algebarski model te veze. Veza između dviju varijabli može biti: 1. Funkcionalna – npr. veza između duljine brida i volumena kocke 2. Statistička (stohastička) – npr. veza između visine i težine čovjeka

4.1. KORELACIJSKA ANALIZA Korelacijska analiza uključuje konstrukciju odgovarajućeg grafičkog prikaza kovarijacije varijabli (dijagram rasipanja, oblak raspršenja, XY Scatter), te utvrđivanje brojčanog pokazatelja jakosti i smjera veze između varijabli (koeficijent korelacije). Kada govorimo o vezi između dvije varijable obično razlikujemo nezavisnu varijablu (X) i zavisnu varijablu (Y) (nije uvijek točno određeno koja je nezavisna, a koja zavisna varijabla). Dijagram rasipanja dobijemo tako da točke sa odgovarajućim vrijednostima X i Y varijable nanesemo na koordinatni sustav. Iz oblika dijagrama rasipanja može se otprilike odrediti o kakvoj povezanosti promatranih varijabli se radi. Koeficijent korelacije poprima vrijednosti između -1 i 1. Oznake za koeficijent korelacije se razlikuju ovisno o načinu njegovog izračunavanja, za sada ćemo ga označiti sa r, što je i najčešća oznaka.

−1≤ r ≤1

34

Pozitivan koeficijent korelacije ukazuje na upravnu proporcionalnost varijabli X i Y, tj. da rast jedne varijable uzrokuje i rast druge, i obrnuto. Negativan r ukazuje na obrnutu proporcionalnost varijabli, tj. da rast jedne varijable uzrokuje pad druge, i obrnuto. Apsolutna vrijednost koeficijenta korelacije ukazuje na jačinu povezanosti između varijabli. Što je r  bliže nuli, povezanost je slabija, a što je bliža jedinici povezanost je jača: r = 1 ⇒ potpuna korelacija 0.8 ≤ r< 1 ⇒ jaka korelacija 0.5 ≤ r< 0.8 ⇒ srednje jaka korelacija 0.2 ≤ r< 0.5 ⇒ slaba korelacija 0 < r< 0.2 ⇒ neznatna korelacija r = 0 ⇒ potpuna odsutnost korelacije

POTPUNA POZITIVNA KORELACIJA (r = 1) 12 10 8 Y 6 4 2 0 0

2

4

6 X

8

10

12

35

POTPUNA NEGATIVNA KORELACIJA (r =- 1) 12 10 8 Y 6 4 2 0 0

2

4

6

8

10

12

X

ODSUSTVO KORELACIJE (r = 0) 10 8 6 Y 4 2 0 0

1

2

3

4 X

5

6

7

8

36

JAKA POZITIVNA KORELACIJA (r = 0.95) 12 10 8 Y 6 4 2 0 0

2

4

6

8

10

12

X

SLABA NEGATIVNA KORELACIJA (r = -0.44) 9 8 7 6 5 Y 4 3 2 1 0 0

1

2

3

4 X

5

6

7

37

4.1.1. PEARSONOV KOEFICIJENT LINEARNE KORELACIJE U praksi se kao mjera povezanosti između dvije varijable najčešće koristi Pearsonov koeficijent linearne korelacije (r). Kada raspolažemo sa podacima o parovima vrijednosti varijabli X i Y u MS Excel-u izračunavamo ga pomoću funkcije: =CORREL(Raspon varijable X;Raspon varijable Y) ili =PEARSON(Raspon varijable X;Raspon varijable Y)

4.1.2. SPEARMANOV KOEFICIJENT KORELACIJE RANGA Koeficijent linearne korelacije primjenjuje se za utvrđivanje stupnja povezanosti između numeričkih varijabli čije jedinice odgovaraju intervalnoj ili omjernoj skali. Ukoliko se radi o dvije varijable od kojih je barem jedna obilježja ranga (ordinalna skala) za određivanje stupnja povezanosti koristi se Spearmanov koeficijent korelacije ranga. Označava se sa rs (ρ) i izračunava iz relacije: N

rs = 1 −

6 × ∑ d i2 i =1

N3 − N

gdje je: di = r(xi) - r(yi), i = 1,2,3,...,N ⇒ razlika rangova odgovarajućeg para vrijednosti varijable X i varijable Y. Funkcija pomoću koje rangiramo brojeve u MS Excelu glasi: =RANK(Traženi broj;Raspon podataka;Način)

38

Način: - 0 ili prazno → padajući niz - bilo koji prirodni broj → rastući niz Primjer 4.1.2.1. Zadani su bodovi iz testova iz statistike i matematike. Izračunajte Spearmanov koeficijent korelacije ranga i objasnite njegovo značenje. matematika Xi

statistika Yi

r(xi)

r(yi)

di=r(xi)-r(yi)

di2

45 20 50 0 100 50 30 80 Σ

50 10 50 20 90 50 40 100

5 7 3,5 8 1 3,5 6 2

4 8 4 7 2 4 6 1

1 -1 - 0,5 1 -1 - 0,5 0 1 0

1 1 0,25 1 1 0,25 0 1 5,50

N

rs = 1 −

6 × ∑ d i2 i =1 3

N −N

= 1−

6 × 5,50 = 0,93 3 8 −8

Postoji vrlo jaka pozitivna korelacija između bodova na testu iz matematike i testu iz statistike. Znači da će student koji ostvari visoki rezultat u jednom testu vrlo vjerojatno postići visoki rezultat i u drugom, i obrnuto.

39

4.1.3. KOEFICIJENT DETERMINACIJE Koeficijent determinacije (R2) povezani su relacijom:

R2 = r 2

i koeficijent linearne korelacije (r)

odnosno

r = ± R2

pri čemu je predznak koeficijenta korelacije određen odnosom između promatranih varijabli. Koeficijent determinacije može se objasniti kao proporcija varijance zavisne varijable objašnjena nezavisnom varijablom. Npr. koeficijent korelacije između kvocijenta inteligencije i školskog uspjeha je oko 0,45 ⇒ R2 = 0,2025, što znači da je oko 20% školskog uspjeha objašnjeno inteligencijom učenika, odnosno studenata. Koeficijent determinacije u MS Excelu možemo direktno izračunati pomoću funkcije: =RSQ(Raspon varijable Y; Raspon varijable X)

40

4.2. REGRESIJSKA ANALIZA Cilj regresijske analize je vezu između promatranih varijabli izraziti ili opisati odgovarajućim analitičko-matematičkim izrazom, tj. regresijskim modelom. Osnovna svrha ovakvog modela je, uz objašnjavanje zavisnosti promatranih pojava, mogućnost predviđanja vrijednosti zavisne varijable za određene vrijednosti jedne ili više nezavisnih varijabli. Mi ćemo obraditi problem u kojem uz zavisnu varijablu imamo samo jednu nezavisnu varijablu (jednostavni regresijski model). Opći oblik ovakvog modela je:

Y = f (X) + u

ili

Y = Y$ + u

gdje je u dio varijance varijable Y koji nije objašnjen utjecajem varijable X. Dva su osnovna cilja koja želimo ostvariti pri konstrukciji regresijskog modela: 1. Pronaći funkciju koja najbolje opisuje vezu između promatranih varijabli. 2. Parametre te funkcije odrediti tako da neobjašnjeni dio varijance zavisne varijable (u) bude što manji. 4.2.1. MODEL JEDNOSTAVNE LINEARNE REGRESIJE Ukoliko ravnomjeran rast varijable X prati i ravnomjeran rast (pad) varijable Y (što se vidi i iz dijagrama rasipanja) model koji odgovara promatranoj vezi je model jednostavne linearne regresije. Opći oblik tog modela je:

Y = β$0 + β$1 X + u

41

Cilj nam je odrediti parametre u linearnoj funkciji (jednadžba pravca regresije):

Yˆ = bX + a tako da u bude minimalan, tj. da dobiveni pravac što bolje aproksimira skup točaka u dijagramu rasipanja. Parametre ćemo odrediti koristeći se metodom najmanjih kvadrata. Temeljni kriterij je minimum zbroja kvadrata rezidualnih odstupanja ui, tj. kvadrata odstupanja originalnih vrijednosti zavisne varijable

yi

od očekivanih

(regresijskih) vrijednosti yˆ i . Objašnjenje značenja parametara u regresijskoj jednadžbi: a ⇒ konstantni član, tj. očekivana vrijednost zavisne (Y) kada je vrijednost nezavisne varijable (X) nula

varijable

b ⇒ regresijski koeficijent koji pokazuje prosječnu promjenu zavisne varijable (Y) kada se nezavisna varijabla (X) poveća za jedan (jednu jedinicu mjerenja). Interpretira se na sljedeći način:”Ako se varijabla X poveća za jedan (jednu jedinicu) očekuje se povećanje (smanjenje) varijable Y za b jedinica.” Geometrijski gledano on predstavlja koeficijent smjera pravca, pa će biti pozitivan ako pravac raste (varijable su upravno proporcionalne), a negativan ako pravac pada (varijable su obrnuto proporcionalne).

Primjer 4.2.1. Promatrana je veza između broja proizvedenih proizvoda (X) i ukupnog profita (u 000 kn) u 8 tvornica kompanije “MICA KOMBAJN” d.o.o. a) Nacrtajte dijagram rasipanja. b) Odredite jednažbu pravca regresije i objasnite značenje parametara. c) Procijenite reprezentativnost dobivenog regresijskog modela.

42

d) Na temelju dobivene jednadžbe regresijskog modela procijenite profit tvornice ako je proizvedeno 50 proizvoda. Broj proizvedenih Ukupni profit (u 000 kn) proizvoda (Xi) (Yi) 20 220 25 280 32 520 28 500 40 1250 35 1000 36 980 30 600 Rješenje: a)

Ukupni profit (000 kn)

Odnos proizvedenih proizvoda i ukupnog profita u 8 tvornica kompanije "MICA KOMBAJN" d.o.o. 1400 1200

y = 54,603x - 1010,3

1000

R = 0,9064

2

800 600 400 200 0 15

20

25

30

35

40

45

Broj proizvedenih proizvoda

b)

Yˆ = 54,60X – 1010,30 Ako tvornica proizvede nula proizvoda, očekuje se gubitak od

43

1.010.300 kn. Ako se priozvodnja poveća za 1 proizvod očekuje se povećanje profita za 54.600 kn. Do gornje jednadžbe modela linearne regresije u MS Excel-u možemo doći na dva načina: I. Parametre jednadžbe možemo izračunati pomoću funkcija: b ⇒ =SLOPE(Raspon varijable Y;Raspon varijable X) a ⇒ =INTERCEPT(Raspon varijable Y;Raspon varijable X)

II. Kraći i jednostavniji način je direktno dobivanje kompletne jednadžbe regresijskog modela iz grafa (XY Scatter) koristeći se opcijom Add Trendline (označite graf ⇒ na izborniku vam se umjesto Data pojavi Chart ⇒ kliknite na njega i dobit ćete padajući izbornik s opcijom Add Trendline) ⇒ Linear , te podopcijom Display equation on chart. Ova opcija omogućava nam i direktno izračunavanje koeficijenta determinacije kao mjere reprezentativnosti regresijskog modela (Display R – squared value on chart). c) R2 = 0,9064 ⇒ 90,64% veze između broja proizvedenih proizvoda i ukupnog profita objašnjeno je linearnim regresijskim modelom. d) U dobivenu jednadžbu ćemo jednostavno umjesto X uvrstiti zadanu vrijednost (50): =54,60*50-1010,30 ⇒ 1719,7 Dakle, ako tvornica proizvede 50 proizvoda, očekuje se ukupan profit u iznosu od 1.719.700 kn (procjena na temelju linearnog regresijskog modela)

44

4.2.2. PRIMJER DVA NELINEARNA MODELA JEDNOSTAVNE REGRESIJE Odnos zavisne i nezavisne varijable često nije linearan (ravnomjerne promjene nezavisne varijable ne uzrokuju ravnomjerne promjene zavisne varijable). U tom slučaju potrebno je pronaći neku drugu funkciju (nelinearnu) koja najbolje pokazuje odnos zavisne i nezavisne varijable. 4.2.2.1. MODEL JEDNOSTAVNE EKSPONENCIJALNE REGRESIJE Standardni oblik regresijske jednadžbe u ovom modelu je:

Yˆ = a × b X pri čemu vrijedi: a, b > 0. Značenje regresijskih parametara u gornjoj regresijskoj jednadžbi: a ⇒ očekivana vrijednost zavisne varijable (Y) kada je vrijednost nezavisne varijable (X) jednaka nuli b ⇒ prosječna relativna promjena zavisne varijable kada se nezavisna varijabla poveća za 1 (jednu jedinicu); kada se X poveća za 1 (jednu jedinicu) očekuje se povećanje (smanjenje) varijable Y b puta (ako je b > 1 sa povećanjem varijable X povećava se i varijabla Y; ako je b < 1 povećanje varijable X uzrokuje smanjenje varijable Y). Bolja interpretacija parametra b je preko stope promjene: s = (b - 1) × 100 Npr. b = 1,25 ⇒ s = (1,25 – 1) × 100 = 25% ⇒ ako se varijabla X poveća za jednu jedinicu, očekuje se povećanje varijable Y za 25%, ili b = 0,80 ⇒ s = (0,80 – 1) × 100 = - 20% ⇒ ako se varijabla X poveća za jednu jedinicu očekuje se smanjenje varijable Y za 20%.

45

Jednadžbu eksponencijalnog regresijskog modela dobijemo tako da, nakon što smo podatke grafički prikazali XY Scatterom, biramo opciju Add Trendline, a zatim podopciju Exponential. Napomena: U MS Excel-u jednadžbu eksponencijalnog regresijskog modela dobijemo u obliku:

Yˆ = a × e kX Vidljivo je da je b = pomoću funkcije:

ek ,

te vrijednost ovog parametra dobijemo =EXP(k)

4.2.2.2. DVOSTRUKO LOGARITAMSKI REGRESIJSKI MODEL U ekonomskim istraživanjima često se koristi ovaj model regresije. Standardni oblik jednadžbe dvostruko logaritamskog regresijskog modela (POWER) je:

b ˆ Y = a× X Značenje parametara u gornjem modelu je: a ⇒ očekivana vrijednost zavisne varijable kada je vrijednost nezavisne varijable 1 (jedna jedinica) b ⇒ očekivana promjena zavisne varijable (izražena u postotku) kada se nezavisna varijabla poveća za 1%. Ovim modelom omogućava se mjerenje elastičnosti zavisne varijable u odnosu na nezavisnu varijablu. Funkcija je elastična ako je b > 1, a neelastična ako je b < 1.

46

Jednadžbu dvostruko logaritamskog regresijskog modela dobijemo tako da, nakon što smo podatke grafički prikazali XY Scatterom, biramo opciju Add Trendline, a zatim Power.

PROCJENA REPREZENTATIVNOSTI MODELA REGRESIJE Nakon što smo odredili jednadžbu modela jednostavne regresije potrebno je utvrditi valjanost tog modela. Postavlja se pitanje u kolikoj mjeri vrijednosti zavisne varijable predviđane modelom odgovaraju stvarnim (empirijskim) vrijednostima tj. koliko točno možemo predvidjeti vrijednost zavisne varijable za određenu vrijednost nezavisne varijable. Procjena reprezentativnosti modela temelji se na analizi rezidualnih odstupanja stvarnih (empirijskih, originalnih) vrijednosti ( yi ) od očekivanih (regresijskih, teorijskih) vrijednosti ( yˆ i ) zavisne varijable.

MJERE REPREZENTATIVNOSTI LINEARNE REGRESIJE

MODELA

JEDNOSTAVNE

Varijanca regresije Varijanca regresije je apsolutna mjera reprezentativnosti modela i predstavlja prosječno kvadratno odstupanje originalnih od regresijskih vrijednosti.

Standardna devijacija (pogreška) regresije Standardna devijacija ili standardna pogreška regresije je apsolutna mjera reprezentativnosti modela i predstavlja prosječno odstupanje originalnih od regresijskih vrijednosti (matematički netočno).

47

Koeficijent varijacije regresije Koeficijent varijacije regresije je relativna mjera reprezentativnosti modela i predstavlja postotni udio standardne pogreške regresije u odnosu na aritmetičku sredinu zavisne varijable.

Koeficijent determinacije Koeficijent determinacije definira se kao omjer sume kvadrata odstupanja protumačene regresijom i sume kvadrata ukupnih odstupanja. Budući da se može dobiti direktno iz XY Scattera opcijom Display R-squared value on chart najčešće je primjenjivana mjera reprezentativnosti regresijskog modela. Interpretira se kao postotak veze između promatranih varijabli protumačen modelom. Npr. ako je R2 = 0,95 to znači da je 95% veze između varijable X i varijable Y protumačeno odgovarajućim regresijskim modelom. Na taj način vrlo jednostavno možemo izabrati najreprezentativniji regresijski model (onaj s najvećim R2).

Primjer 4.2.2. Zadani su podaci o godišnjim primanjima četveročlane obitelji ( X varijabla - u tisućama kn) i izdvajanju za ljetovanje i zimovanje u toku godine (Y varijabla - u tisućama kn) a) Odredite standardni oblik jednadžbe modela jednostavne eksponencijalne regresije i objasnite značenje parametara. b) Odredite standardni oblik jednadžbe dvostrukog logaritamskog regresijskog modela (power) i objasnite značenje parametara. c) Na temelju koeficijenta determinacije procijenite koji model bolje aproksimira zadane podatke. d) Na temelju oba modela procijenite koliko bi na ljetovanje i zimovanje izdvajala obitelj s 220.000 kn godišnjih prihoda.

48

a)

Godišnji prihod (000 kn)

Izdvajanje za ljetovanje i zimovanje (000 kn)

30 60 90 120 150 180

2 4 8 15 30 50

Eksponencijalni regresijski model:

Izdvajanje za

ljetovanje i zimovanje (000 kn)

Odnos godišnjih primanja i izdvajanja za ljetovanje i zimovanje 0,0217x

60

y = 1,0904e 2 R = 0,9981

50 40 30 20 10 0 0

50

100

150

200

Godišnja primanja (000 kn)

Parametar b dobijemo pomoću funkcije =EXP(0,0217) i on iznosi 1,0219. Dakle jednadžba eksponencijalnog modela regresije glasi:

Yˆ = 1,0904 × 1,0219 X Objašnjenje značenja parametara: a (1,0904) ⇒ Ako četveročlana obitelj ne bi imala nikakva primanja, očekuje se da bi za ljetovanje i zimovanje izdvajali 1.090,40 kn. b (1,0219) ⇒ S povećanjem godišnjih primanja za 1.000 kn očekuje se povećanje izdvajanja za ljetovanje i zimovanje za 2,19% (s = (1,0219 – 1) × 100 ).

49

b) Dvostruko logaritamski regresijski model:

Izdvajanje za ljetovanje i zimovanje (000 kn)

Odnos godišnjih primanja i izdvajanja za ljetovanje i zimovanje 60 1,7918

y = 0,0034x 2 R = 0,9501

50 40 30 20 10 0 0

50

100

150

200

Godišnja primanja (000 kn)

Jednadžba dvostruko logaritamskog regresijskog modela glasi:

Yˆ = 0,0034 X 1, 7918 Objašnjenje značenja parametara: a (0,0034) ⇒ Ako godišnja primanja četveročlane obitelji iznose 1.000 kn, očekuje se da bi za ljetovanje i zimovanje izdvajali 3,40 kn. b (1,7918) ⇒ S povećanjem godišnjih primanja za 1% očekuje se povećanje izdvajanja za ljetovanje i zimovanje za 1,79%. Napomena: Ovaj rezultat ukazuje na to da je funkcija koja pokazuje zavisnost izdvajanja za ljetovanje i zimovanje o godišnjim primanjima četveročlane obitelji elastična. c) Eksponencijalni regresijski model objašnjava 99,81% (R2 = 0,9981) veze između godišnjih primanja četveročlane obitelji i izdvajanja za ljetovanje i zimovanje.

50

Dvostruko logaritamski regresijski model objašnjava 95,01% (R2 = 0,9501) veze između godišnjih primanja četveročlane obitelji i izdvajanja za ljetovanje i zimovanje. Dakle, eksponencijalni regresijski model je reprezentativniji. d) Eksponencijalni model: =1,0904*1,0219^220 ⇒ 128,06594 Očekuje se da bi obitelj sa godišnjim prihodima od 220.000 kn za ljetovanje izdvajala 128.065,94 kn (procjena na temelju eksponencijalnog regresijskog modela). Dvostruko logaritamski model: =0,0034*220^1,7918 ⇒ 53,53427 Očekuje se da bi obitelj sa godišnjim prihodima od 220.000 kn za ljetovanje izdvajala 53.534,27 KN (procjena na temelju dvostruko logaritamskog regresijskog modela). Ako malo pažljivije pogledate grafičke prikaze dva promatrana modela, bit će vam jasnija dobivena razlika u procjenama.

51

5. TREND 5.1. DEFINICIJA VREMENSKOG NIZA I VRSTE VREMENSKIH NIZOVA Vremenski niz je skup kronološki uređenih vrijednosti. Veličine Yt za t = 1,2,....,n koje tvore niz nazivaju se frekvencije. Razlikujemo dvije vrste vremenskih nizova s obzirom na vremensku definiciju: 1. INTERVALNI VREMENSKI NIZ - veličina pojave mjeri se u vremenskom intervalu (npr. broj noćenja tijekom cijele godine u periodu od 1991. do 2000. godine). 2. TRENUTAČNI VREMENSKI NIZ - mjerenje ili promatranje pojave vrši se u određenom trenutku (npr. broj stanovnika općine Donji Miholjac u periodu 1971. do 2001. godine - stanje sredinom godine). Ukoliko postoji neka pravilnost u promjenama vrijednosti promatrane pojave u određenom vremenskom periodu (vremenski niz ima tendenciju rasta ili pada) kažemo da niz ima trend. Tada se kretanje promatrane pojave može prikazati pomoću odgovarajućeg trend modela. Mi ćemo detaljnije opisati dva najčešća.

5.2. LINEARNI TREND Ako se promatrana pojava mijenja za približno jednake apsolutne iznose u svakoj vremenskoj jedinici njezino kretanje možemo opisati linearnim trendom. Jednadžba linearnog trenda, kao i odgovarajući parametri, ista je kao kod modela jednostavne linearne regresije. U slučaju trenda nezavisna varijabla (X) je uvijek vrijeme, a zavisna (Y) pojava koju promatramo. Razlika je jedino što ovdje kao indeks umjesto i koristimo t (time).

52

Yˆ = bX + a Postupak dobivanja jednadžbe linearnog trenda isti je kao i postupak dobivanja jednadžbe linearne regresije (XY-scatter ⇒ Chart ⇒ Add trendline ⇒ Linear ⇒ Display equation on chart ⇒ Display Rsquared value on chart ). Jedina razlika je što sami formiramo X varijablu tako da početnom vremenskom razdoblju pridružimo vrijednost 0, sljedećem 1, itd. Na taj način izbjegavamo velike brojeve i olakšavamo interpretaciju parametara jednadžbe. Objašnjenje značenja parametara u jednadžbi linearnog trend – modela: a ⇒ konstantni član, tj. očekivana (trend) vrijednost zavisne varijable (Y) kada je vrijednost varijable X jednaka nuli, tj. u početnom razdoblju promatranog vremenskog niza b ⇒ koeficijent koji pokazuje prosječnu promjenu zavisne varijable (Y) kada se nezavisna varijabla (X) poveća za jedan (jednu jedinicu mjerenja). Interpretira se na sljedeći način: “U promatranom vremenskom razdoblju varijabla Y se svake godine (mjeseca, dana,W) u prosjeku povećavala (smanjivala) za b jedinica.” Napomena: Parametar b pokazatelj je apsolutne promjene promatrane pojave. Možemo izračunati i relativnu mjeru promjene – prosječnu stopu promjene:

s=

b × 100 Y

koju interpretiramo na sljedeći način: “U promatranom vremenskom razdoblju varijabla Y se svake godine (mjeseca, dana, W) u prosjeku povećavala (smanjivala) za “s” %”.

53

Primjer 5.1. U periodu od 1995. do 2001. godine praćen je broj noćenja na otoku Visu. Podaci su zadani u tablici. a) Prikažite zadani niz linijskim grafikonom. b) Odredite jednadžbu linearnog trenda s ishodištem na početku promatranog razdoblja. c) Objasnite značenje parametara u jednadžbi trenda. d) Ako se kretanje broja noćenja nastavi po izračunatom trendu, koliko noćenja možemo očekivati u 2010. godini? e) Na temelju linearnog trenda procijenite očekivani broj noćenja za svaku godinu u razdoblju od 2002. do 2005. godine. f) Kada možemo očekivati 50.000 noćenja ako se kretanje broja noćenja nastavi mijenjati po utvrđenom trendu? h) Procijenite reprezentativnost dobivenog trenda.

GODINA

xt

1995 1996 1997 1998 1999 2000 2001

0 1 2 3 4 5 6

BROJ NOĆENJA U TISUĆAMA Yt 12 18 21 20 23 28 35

54

a) Kretanje broja noćenja na otoku Visu u razdoblju od 1995. do 2001. god.

Broj noćenja (000)

40 35 30 25 20 15 10 1994

1995

1996

1997

1998

1999

2000

2001

2002

Godina

b)

Yˆ = bX + a 40

y = 3,25x + 12,679 R2 = 0,908

35 30 25 20 15 10 5 0 0

1

Yˆ = 12,68 + 3,25 X

2

3

4

5

6

7

X = 0, 1995. godine jedinica za X = 1 godina jedinica za Y = 1000 noćenja

55

c) Trend vrijednost 1995. godine iznosi 12.680 noćenja. Broj noćenja na otoku Visu se u promatranom razdoblju svake godine u prosjeku povećavao za 3.250. Izračunat ćemo i prosječnu stopu promjene:

s=

b × 100 Y

=3,25/AVERAGE(C2:C8) ⇒ ikonica za % ⇒ 14,49% Dakle, u promatranom razdoblju broj noćenja na Visu svake je godine u prosjeku rastao za 14,49%.

d)

Ovaj zadatak možemo riješiti na dva načina. 1.) U jednadžbu linearnog trenda umjesto odgovarajuću vrijednost xt za traženu godinu:

X

uvrstimo

xt (2010) = 2010 – 1995 = 15

Yˆ (15) = 12,68 + 3,25 × 15 = 61,43 2.) Koristimo funkciju: =FORECAST(novi xt;raspon varijable Y;raspon varijable xt) U našem primjeru napisali bi: =FORECAST(15;C2:C8;B2:B8) ⇒ 61,43 Prema prethodno dobivenom linearnom trendu, 2005. godine možemo očekivati 61.430 noćenja na otoku Visu (ako se kretanje broja noćenja nastavi kao u promatranom razdoblju).

56

e)

Za prognozu očekivanih vrijednosti za pojedine godine unutar određenog vremenskog perioda pomoću linearnog trenda koristimo funkciju:

=TREND(raspon varijable Y;raspon varijable xt;raspon novih xt) U ćelije A9:A12 upišemo tražene godine (2002 – 2005), u B9:B12 odgovarajuće vrijednosti xt (7 – 10). Označimo ćelije C9:C12 i upišemo funkciju: =TREND(C2:C8;B2:B8;B9:B12) ⇒ Ctrl/Shift/Enter Dobit ćemo sljedeće vrijednosti: God. 2002 2003 2004 2005

f) 50 = 12,68 + 3,25 × X

xt 7 8 9 10 ⇒

Yt 35,43 38,68 41,93 45,18 X = 11,48 ≈ 12

Ako se kretanje broja noćenja nastavi kao u promatranom razdoblju, 50000 noćenja možemo očekivati 2007. godine (1995 + 12 = 2007). g) R2 = 0,908 → 90,80% periodičnih promjena broja noćenja na otoku Visu u promatranom razdoblju objašnjeno je dobivenim linearnim trend-modelom.

57

5.3. EKSPONENCIJALNI TREND Eksponencijalni trend - model često se koristi u ekonomskoj analizi. Primjenjuje se kada promjena promatrane pojave nije linearna, već je u funkciji vremena sve brža (ili sporija). Jednadžba i odgovarajući parametri određuju se analogno modelu jednostavne eksponencijalne regresije (XY-scatter → Add trendline → Exponential → Display equation on chart → Display R-squared value on chart ). Kao i kod linernog trenda sami formiramo X varijablu tako da početnom vremenskom razdoblju pridružimo vrijednost 0, sljedećem 1, itd.. Standardni oblik jednadžbe jednostavnog eksponencijalnog trend - modela glasi:

Yˆ = a × b X Objašnjenje značenja parametara u jednadžbi eksponencijalnog trend – modela: a ⇒ konstantni član, tj. očekivana (trend) vrijednost zavisne varijable (Y) kada je vrijednost varijable X jednaka nuli, tj. u početnom razdoblju promatranog vremenskog niza b ⇒ predstavlja prosječni tempo promjene varijable Y u promatranom razdoblju. Iz ovog parametra možemo direktno izračunati prosječnu periodičnu stopu promjene za promatrano razdoblje:

s = (b − 1) × 100 koju interpretiramo na slijedeći način: “U promatranom vremenskom razdoblju varijabla Y se svake godine (mjeseca, dana, Q) u prosjeku povećavala (smanjivala) za

s

%”.

58

Napomena: U MS Excel-u jednadžbu eksponencijalnog trend-modela (kao i kod regresije) dobijemo u obliku:

Yˆ = a × e kX Vrijednost parametra b =

ek

dobijemo pomoću funkcije: =EXP(k).

Primjer 5.2. Mjerena je zagađenost zraka sumporom u centru Zagreba u periodu od 1992. do 1999. god. (svake godine mjerenje je izvršeno 30.06.). Podaci su zadani u tablici. a) Navedeni vremenski niz prikažite grafički. b) Odredite standardni oblik jednadžbe jednostavnog eksponencijalnog trenda. c) Objasnite značenje parametara. d) Ako se zagađivanje nastavi istim trendom koliko će iznositi 2010. godine? e) Na temelju eksponencijalnog trenda procijenite očekivanu zagađenost za svaku godinu u razdoblju od 2000. do 2005. godine. f) Nastavi li se trend, kada možemo očekivati zagađenost od 500 mg/m3? g) Procijenite reprezentativnost dobivenog trenda.

a)

Godina

xt

1992 1993 1994 1995 1996 1997 1998 1999

0 1 2 3 4 5 6 7

Količina sumpora (mg/m3) 3 5 8 13 20 32 50 75

59

Količina 3 sumpora(mg/m )

Zagađenost centra Zagreba sumporom u razdoblju 1992. - 1999.god. 80 70 60 50 40 30 20 10 0 1992 1993 1994 1995 1996 1997 1998 1999 Godina

b)

Yˆ = a × b X 90 80

y = 3,1445e0,4599x R2 = 0,9992

70 60 50 40 30 20 10 0 0

2

4

6

8

Potrebno je izračunati parametar b: =EXP(0,4599) ⇒ 1,583916 Standardni oblik jednadžbe jednostavnog eksponencijalnog trenda je:

60

Yˆ = 3,14 × 1,5839 X X = 0, 30.06.1992.g. jedinica za X = 1 godina jedinica za Y = 1mg/m3 c) S = (b - 1)×100 = 58,39% Trend vrijednost za 30.06.1992. iznosi 3,14 mg/m3. U promatranom razdoblju količina sumpora u centru Zagreba svake se godine u prosjeku povećavala za 58,39%. d) 2010. god. ⇒ x = 2010 - 1992 = 18 Y(18) = 3,14 × 1,583918 = 12360,31 Ako se zagađivanje nastavi istim trendom, 2010. godine možemo očekivati 12.360,31 mg/m3 sumpora. e) Za prognozu očekivanih vrijednosti za pojedine godine unutar određenog vremenskog perioda pomoću eksponencijalnog trenda koristimo funkciju: =GROWTH(raspon varijable Y;raspon varijable xt;raspon novih xt) U ćelije A10:A15 upišemo tražene godine (2000 – 2005), u B10:B15 odgovarajuće vrijednosti xt (8 – 13). Označimo ćelije C10:C15 i upišemo funkciju: =GROWTH(C2:C9;B2:B9;B10:B15) ⇒ Ctrl/Shift/Enter Dobit ćemo sljedeće vrijednosti:

61

God. 2000 2001 2002 2003 2004 2005

f)

xt 8 9 10 11 12 13

Yt 124,60 197,37 312,63 495,20 784,38 1242,44

500 = 3,14 × 1,5839X /:3,14 159,24 = 1,5839X / log log159,24 = log1,5839X log159,24 = X×log1,5839 / : log1,5839

X =

log 159,24 log 1,5839

X = 11,02 ≈ 11 Nastavi li se trend, zagađenost od 500 mg/m3 možemo očekivati u srpnju 2003. godine (1992 + 11 = 2003). Odgovor na ovo pitanje možemo dobiti i iz gornje tablice. g) R2 = 0,9992 → 99,92% periodičnih promjena stupnja zagađenosti centra Zagreba sumporom u promatranom razdoblju objašnjeno je dobivenim eksponencijalnim trend-modelom.

Napomena: Reprezentativnost trend – modela određuje se na isti način kao i reprezentativnost regresijskih modela → pomoću varijance, standardne devijacije, koeficijenta varijacije i koeficijenta determinacije trenda.

62

6. INDIVIDUALNI INDEKSI Indeksi spadaju u relativne pokazatelje dinamike. Indeksima se uspoređuje stanje jedne ili više pojava u različitim vremenskim intervalima ili momentima ili na različitim mjestima. Razlikujemo individualne i skupne indekse. Individualnim indeksima mjerimo dinamiku jedne pojave u funkciji vremena ili prostora. 6.1. VERIŽNI INDEKSI Verižni (lančani) indeksi pokazuju relativne promjene pojave u tekućem razdoblju u odnosu na prethodno razdoblje.

Vt =

Yt × 100 Yt −1

Verižni indeks predstavlja postotni udio vrijednosti određene pojave u tekućem razdoblju u odnosu na vrijednost te pojave u prethodnom razdoblju. Stopa promjene u uzastopnim vremenskim razdobljima lako se izračuna iz odgovarajućeg verižnog indeksa (vrijedi i obrnuto):

St = Vt - 100 Primjer 6.1. Zadani su podaci o broju noćenja na otoku Visu u razdoblju od 1995. do 2001. godine. a) Izračunajte verižne indekse po navedenim godinama. Objasnite konkretno značenje indeksa za 1998. i 2000. godinu. b) Izračunajte prosječne stope promjena u uzastopnim vremenskim razdobljima. c) Grafički prikažite izračunate indekse.

63

GODINA 1995 1996 1997 1998 1999 2000 2001

BR. NOĆENJA U VERIŽNI INDEKSI TISUĆAMA Vt Yt 12 18 150 21 116,67 20 95,24 23 115 28 121,74 35 125

POJEDINAČNE STOPE PROMJENA St 50 16,67 - 4,76 15 21,74 25

a) Napomena: Verižni indeks se ne računa za početnu godinu u promatranom razdoblju.

Vt =

Yt × 100 Yt −1

Y1996 18 V = × 100 = × 100 = 150 1996 ⇒ Y1995 12

itd. 1998. godine broj noćenja na otoku Visu bio je za 4,76% manji u odnosu na prethodnu, 1997. godinu. 2000. godine broj noćenja na otoku Visu bio je za 21,74% veći u odnosu na prethodnu, 1999. godinu.

b) St = Vt – 100 itd.



S1996 = V1996 – 100 = 150 – 100 = 50

64

c) Kretanje broja noćenja na Visu u razdoblju od 1995. do 2001. god. 160

Verižni indeksi

150 140 130 120 110 100 1995

1996

1997

1998

1999

2000

2001

90

Godina

6.1.1. IZRAČUNAVANJE APSOLUTNIH VRIJEDNOSTI IZ VERIŽNIH INDEKSA Ukoliko imamo već izračunate verižne indekse tada na temelju zadane apsolutne vrijednosti za jednu godinu možemo izračunati vrijednosti promatrane pojave za sve ostale godine u promatranom periodu. Za računanje vrijednosti u godinama koje slijede iza godine u kojoj je vrijednost poznata koristimo relaciju:

Yt =



Vt × Yt −1 100

Za računanje vrijednosti u godinama koje prethode godini u kojoj je vrijednost poznata koristimo relaciju:



Yt −1 =

Yt × 100 Vt

65

6.2. BAZNI INDEKSI Bazni indeksi pokazuju relativne promjene u tekućem razdoblju u odnosu na neko odabrano bazno razdoblje.

It =

Yt × 100 Yb

Bazni indeks predstavlja postotni udio vrijednosti određene pojave u tekućem razdoblju u odnosu na vrijednost te pojave u baznom razdoblju. Stopa promjene u tekućem vremenskom razdoblju u odnosu na bazno razdoblje je:

St* = It - 100 Primjer 6.2. Zadani su podaci o proizvodnji zdrave hrane u RH u razdoblju od 1995. do 2001. godine. a) Izračunajte individualne indekse na bazi 1997 = 100. Objasnite konkretno značenje za 1995. i 1999. godinu. b) Izračunajte odgovarajuće stope promjena. c) Prethodno izračunate indekse prikažite grafički.

Godina

Proizvodnja zdrave hrane u RH ( u 000 tona)

Individualni indeksi (1997 = 100)

Stope promjena (1997 = 100)

1995 1996 1997 1998 1999 2000 2001

58 52 48 46 46 49 61

120,83 108,33 100 95,83 95,83 102,08 127,08

20,83 8,33 0 - 4,17 - 4,17 2,08 27,08

66

a)

It =

Yt × 100 Yb

Y1995 58 = × = × 100 = 120,83 I 100 → 1995 Y 48 1997

itd. 1995. godine proizvodnja zdrave hrane u RH bila je za 20,83% veća u odnosu na baznu, 1997. godinu. 1999. godine proizvodnja zdrave hrane u RH bila je za 4,17% manja u odnosu na baznu, 1997. godinu. b)

St* = It - 100 → S*1995 = I1995 – 100 = 120,83 - 100 = 20,83 itd.

c)

Kretanje proizvodnje zdrave hrane u RH u razdoblju od 1995. do 2001. god.

Bazni indeksi (1997 = 100)

130 125 120 115 110 105 100 1995

1996

1997

1998

95 90

Godina

1999

2000

2001

67

6.2.1. IZRAČUNAVANJE APSOLUTNIH VRIJEDNOSTI IZ BAZNIH INDEKSA Ako su nam poznati bazni indeksi i vrijednost promatrane pojave u baznoj godini tada apsolutne vrijednosti za pojedine godine u promatranom razdoblju dobivamo iz relacije:

Yb × I t Yt = 100 Ukoliko nam je poznata vrijednost promatrane pojave u nekoj drugoj godini (Yt) tada iz sljedeće relacije prvo izračunamo vrijednost u baznoj godini, a zatim koristeći se prethodnom formulom računamo vrijednosti za ostale godine:

Yt Yb = × 100 It

6.3. PRETVARANJE BAZNIH INDEKSA IZ JEDNE U DRUGU BAZU Ako želime indekse izračunate uz jedno bazno razdoblje (SB) pretvoriti u indekse s novim baznim razdobljem (NB) koristimo relaciju:

I

NB t

I tSB = SB × 100 Ib

68

6.4. PRETVARANJE BAZNIH U VERIŽNE INDEKSE Verižne indekse iz baznih indeksa (bez obzira na to koja godina je odabrana kao bazna) računamo iz relacije:

It Vt = × 100 I t −1 6.5. PRETVARANJE VERIŽNIH INDEKSA U BAZNE Bazne indekse s baznim razdobljem b iz verižnih indeksa izračunavamo iz relacija:

I t = 100 ⇔ t = b I I t −1 = t ×100 ⇔ t < b Vt I t −1 × Vt It = ⇔t >b 100

69

Primjer 6.3. Zadani su verižni indeksi prihoda u tvornici “Perpetum Mobile” u razdoblju od 1995. do 2001.godine. 1999. godine prihod je iznosio 8.250.000 kn. a) Izračunajte bazne indekse na bazi 1998 = 100. b) Izračunajte prihode po godinama iz verižnih indeksa. c) Izračunajte prihode po godinama iz baznih indeksa. Godina

Verižni indeksi

Vt

Bazni indeksi (1998 = 100) It

Prihod (000 kn) (iz Vt)

Prihod (000 kn) (iz It)

1995 1996 1997 1998 1999 2000 2001

107 105 103 94 104 100

86,42 92,47 97,09 100 94 97,76 97,76

7584,31 8115,21 8520,97 8776,60 8250 8580 8580

7584,73 8115,72 8521,20 8776,60 8250 8580 8580

a) Koristimo relacije:

I t = 100 ⇔ t = b It I t −1 = × 100 ⇔ t < b Vt I t −1 × Vt It = ⇔ t >b 100 I1997 =

I 1999

I1998 100 × 100 = × 100 = 97,09 V1998 103

I 1998 × V1999 100 × 94 = = = 94 100 100

70

b)

Vt × Yt −1 Yt = 100 Yt −1

Yt = × 100 Vt



Y2000 =

V2000 × Y1999 104 × 8250 = = 8580 100 100



Y1998 =

Y1999 8250 × 100 = × 100 = 8776,60 V1999 94

c) Prvo ćemo izračunati vrijednost prihoda za baznu 1998. god.:

Yb =

8250 Yt ×100 = ×100 = 8776,60 94 It

Zatim izračunavamo vrijednosti za ostale godine iz relacije:

Yt =

Yb × I t 8776,60 × 86.42 ⇒ Y1995 = = 7584,74 100 100

Napomena: Kao što se vidi iz tablice, postoje male razlike u dobivenim vrijednostima u b) i c) zadatku. Te razlike posljedica su zaokruživanja izračunatih vrijednosti na dvije decimale. Točnije rezultate dobivamo ako apsolutne vrijednosti izračunavamo iz originalnih, već zadanih indeksa (ili ako zaokružujemo na veći broj decimala).

71

6.6. GEOMETRIJSKA SREDINA VERIŽNIH INDEKSA. PROSJEČNA STOPA PROMJENE. Pri izračunavanju prosječnog tempa promjene promatrane pojave važno mjesto zauzima geometrijska sredina verižnih indeksa:

G=

N

N −1

∏V t =2

t

Nakon uvrštavanja osnovne relacije za verižne indekse i sređivanja dobit ćemo skraćenu formulu za izračunavanje geometrijske sredine verižnih indeksa:

G = N −1

YN × 100 Y1

ili

G = N −1

IN × 100 I1

Kao što se vidi, za izračunavanje geometrijske sredine verižnih indeksa potrebno je znati samo prvu i posljednju vrijednost vremenskog niza u promatranom razdoblju. To je ujedno i najveći nedostatak geometrijske sredine kao mjere prosječnog tempa promjene, jer ne uzima u obzir sve vrijednosti vremenskog niza (za razliku od trenda). Iz geometrijske sredine verižnih indeksa izračunava se prosječna stopa promjene:

S = G − 100

72

Pomoću geometrijske sredine mogu se prognozirati vrijednosti promatrane pojave u budućim vremenskim razdobljima (uz uvjet da se dinamika pojave ne mijenja u odnosu na dinamiku u promatranom razdoblju):

 G  ˆ Yt = Y1 ×    100 

t −1

Geometrijsku sredinu verižnih indeksa u MS Excelu možemo direktno izračunati pomoću funkcije: =GEOMEAN(Raspon verižnih indeksa) Napomena: Ako imamo izračunatu prosječnu godišnju stopu promjene (ili odgovarajuću geometrijsku sredinu verižnih indeksa G) geometrijsku sredinu vezanu uz vremenski period koji se unutar godine javlja m puta izračunava se iz relacije:

G Gm = × 100 100 m

Npr. ako želimo izračunati geometrijsku sredinu verižnih indeksa koja pokazuje mjesečni tempo promjene:

Gmj . =

12

G × 100 100

73

7. SKUPNI INDEKSI Pomoću skupnih indeksa mjerimo dinamiku skupine pojava koje na neki način čine cjelinu ili su međusobno slične po nekim karakteristikama. Razdoblje u kojemu iskazujemo dinamiku pojave naziva se tekuće ili izvještajno razdoblje, a razdoblje u odnosu na koje se dinamika iskazuje naziva se baznim razdobljem. Najčešće se računaju skupni indeksi količina, cijena i vrijednosti. Često se računaju i specijalni oblici skupnih indeksa kao što su: indeksi fizičkog obujma (poseban oblik indeksa količina), indeksi troškova života (poseban oblik indeksa cijena) itd. U praksi se najčešće koriste Laspeyres-ov i Paasche-ov oblik skupnih indeksa. Oznake koje ćemo koristiti u relacijama koje slijede su: p0 ⇒ cijena u baznom razdoblju p1 ⇒ cijena u tekućem razdoblju q0 ⇒ količina u baznom razdoblju q1 ⇒ količina u tekućem razdoblju

74

7.1. SKUPNI INDEKSI KOLIČINA LASPEYRES-OV SKUPNI INDEKS KOLIČINA Laspeyres-ov skupni indeks količina predstavlja mjeru relativne promjene ukupnih količina promatrane skupine pojava u tekućem razdoblju u odnosu na ukupne količine u baznom razdoblju računajući uz neizmjenjene cijene iz baznog razdoblja. Najjednostavnija relacija iz koje se može izračunati je: k

Q01 ( p0 ) =

∑q i =1 k

∑q i =1

i1

pi 0 × 100

i0

pi 0

PAASCHE-OV SKUPNI INDEKS KOLIČINA Paasche-ov skupni indeks količina predstavlja mjeru relativne promjene ukupnih količina promatrane skupine pojava u tekućem razdoblju u odnosu na ukupne količine u baznom razdoblju računajući uz neizmjenjene cijene iz tekućeg razdoblja. Najjednostavnija relacija iz koje se može izračunati je:

k

Q01 ( p1 ) =

∑q i =1 k

∑q i =1

i1

i0

pi 1 × 100 pi 1

75

7.2. SKUPNI INDEKSI CIJENA LASPEYRES-OV SKUPNI INDEKS CIJENA Laspeyres-ov skupni indeks cijena promjene ukupnih cijena promatrane razdoblju u odnosu na ukupne cijene u uz neizmjenjene količine iz baznog relacija iz koje se može izračunati je:

predstavlja mjeru relativne skupine pojava u tekućem baznom razdoblju računajući razdoblja. Najjednostavnija

k

P01 (q 0 ) =

∑p

q

∑p

qi 0

i1 i 0

i =1 k

× 100

i0

i =1

PAASCHE-OV SKUPNI INDEKS CIJENA Paasche-ov skupni indeks cijena predstavlja mjeru relativne promjene ukupnih cijena promatrane skupine pojava u tekućem razdoblju u odnosu na ukupne cijene u baznom razdoblju računajući uz neizmjenjene količine iz tekućeg razdoblja. Najjednostavnija relacija iz koje se može izračunati je: k

P01 (q1 ) =

∑p q i =1 k

i1 i1

∑p i =1

q

i 0 i1

× 100

76

7.3. SKUPNI INDEKS VRIJEDNOSTI Vrijednost predstavlja umnožak količine i cijene. Skupni indeks vrijednosti je mjera koja pokazuje relativnu promjenu vrijednosti promatrane skupine pojava u tekućem razdoblju u odnosu na ukupnu vrijednost u baznom razdoblju. Izračunava se iz relacije: k

V01 =

∑p

q

∑p

qi 0

i =1 k

i =1

i1 i1

i0

× 100

Skupni indeks vrijednosti može se dobiti i kao umnožak Laspeyresovog indeksa cijena i Paasche-ovog indeksa količina, odnosno Paasche-ovog indeksa cijena i Laspeyres-ovog indeksa količina dijeljen sa 100:

P01 (q0 ) × Q01 ( p1 ) V01 = 100 ili

P01 (q1 ) × Q01 ( p0 ) V01 = 100

77

Primjer 7.1. U tablici su zadane cijene u kunama i količine različitih vrsta voća prodanih u Zagrebu u 2000. i 2001. godini.

Vrsta voća Cijene po kg Cijene po kg Količina u t Količina u t 2000.g. (kn) 2001.g. (kn) 2000.g. 2001.g. banane 7 9 1600 1700 jabuke 10 12 850 720 kruške 12 13 340 310 mušmule 6 7 52 37

Odgovorite: a) Za koliko su se promijenile cijene svih navedenih vrsta voća u 2001. u odnosu na 2000. godinu, računajući uz neizmjenjene količine iz 2000. godine? b) Za koliko su se promijenile prodane količine svih navedenih vrsta voća u 2001. u odnosu na 2000. godinu, računajući uz neizmjenjene cijene iz 2001. godine? c) Za koliko su se promijenile cijene svih navedenih vrsta voća u 2001. u odnosu na 2000. godinu, računajući uz neizmjenjene količine iz 2001. godine? d) Za koliko su se promijenile prodane količine svih navedenih vrsta voća u 2001. u odnosu na 2000. godinu, računajući uz neizmjenjene cijene iz 2000. godine? e) Za koliko su se promijenile vrijednosti svih navedenih vrsta voća u 2001. u odnosu na 2000. godinu?

78

Rješenje: Prvo ćemo formirati pomoćnu tablicu i izračunati međuvrijednosti potrebne za izračunavanje traženih indeksa: p0q0 11200 8500 4080 312 24092

p1 q1 15300 8640 4030 259 28229

p0 q1 11900 7200 3720 222 23042

p1 q0 14400 10200 4420 364 29384

a) k

P01 (q0 ) =

∑p

q

∑p

q

i =1 k

i =1

i1 i 0

× 100 =

29384 × 100 = 121,97 24092

i0 i0

Cijene svih navedenih vrsta voća u 2001. godini povećale su se za 21,97% u odnosu na 2000. godinu, računajući uz neizmjenjene količine iz 2000. godine. b) k

Q01 ( p1 ) =

∑q i =1 k

∑q i =1

i1

pi1

i0

pi1

× 100 =

28229 × 100 = 96,07 29384

Prodane količine svih navedenih vrsta voća u 2001. godini smanjile su se za 3.93% u odnosu na 2000. godinu, računajući uz neizmjenjene cijene iz 2001. godine.

79

c) k

P01 (q1 ) =

∑p q

i1 i1

i =1 k

∑p

× 100 =

q

28229 × 100 = 122,51 23042

i 0 i1

i =1

Cijene svih navedenih vrsta voća u 2001. godini povećale su se za 22,51% u odnosu na 2000. godinu, računajući uz neizmjenjene količine iz 2001. godine. d) k

Q01 ( p0 ) =

∑q

i1

pi 0

∑q

i0

pi 0

i =1 k

i =1

× 100 =

23042 × 100 = 95,64 24092

Prodane količine svih navedenih vrsta voća u 2001. godini smanjile su se za 4,36% u odnosu na 2000. godinu, računajući uz neizmjenjene cijene iz 2000. godine. e) k

V01 =

∑p

q

∑p

q

i =1 k

i =1

i1 i1

× 100 =

28229 × 100 = 117,17 24092

i0 i0

Vrijednosti svih navedenih vrsta voća u 2001. godini povećale su se za 17,17% u odnosu na 2000. godinu.

80

7.4. NEKI POSEBNI OBLICI SKUPNIH INDEKSA I NJIHOVA PRIMJENA U određenim ekonomskim analizama često se koriste različiti oblici individualnih i skupnih indeksa. Tako se npr. skupni indeks cijena može računati za cijene na malo, cijene na veliko, cijene poljoprivrednih proizvoda, cijene tzv. “sindikalne košarice” itd. 7.4.1. IZRAČUNAVANJE REALNIH PLAĆA NA OSNOVU SKUPNIH INDEKSA TROŠKOVA ŽIVOTA Jedan od najvažnijih oblika skupnog indeksa cijena je skupni indeks troškova života. Kod računanja skupnog indeksa troškova života u obzir se uzimaju samo one cijene koje ulaze u troškove života (za troškove života nije bitno povećanje vrijednosti Beckham-ovog ugovora s Realom). Pomoću skupnog indeksa troškova života mjeri se utjecaj troškova života na nominalne plaće. Na taj način dolazimo do realnih plaća čije kretanje odražava kretanje životnog standarda stanovništva. Realne plaće i indekse realnih plaća kao pokazatelje njihove dinamike izračunavamo iz relacija: NOMINALNA PLAĆA REALNA PLAĆA =  × 100 INDEKS TROŠKOVA ŽIVOTA

INDEKS NOMINALNE PLAĆE INDEKS REALNE PLAĆE =  × 100 INDEKS TROŠKOVA ŽIVOTA

NAPOMENA: Svi indeksi se moraju odnositi na istu baznu godinu (na onu godinu u odnosu na čije troškove života se računaju realne plaće)!!!

81

Primjer 7.2. Prosječne godišnje plaće i indeksi troškova života u kraljevini Bananko u razdoblju od 1996. do 2001. godine zadani su u tablici. a) Izračunajte indekse realnih plaća na bazi 2000 = 100. Objasnite konkretno značenje indeksa za 1998.godinu. b) Izračunajte realne plaće po godinama na bazi troškova života iz 2000. godine. Objasnite značenje dobivene vrijednosti za 1997. godinu. c) Za koliko su se ukupno promijenile realne plaće u razdoblju od 1996. do 2001. godine? d) Izračunajte prosječnu godišnju stopu promjene i objasnite njeno značenje.

Godina 1996 1997 1998 1999 2000 2001

Prosječne Verižni godišnje indeksi neto-plaće troškova života u USD

1600 1800 2400 2900 3500 4300

112 108 104 109 110

Indeksi Indeksi Indeksi Realne plaće realnih uz troškove nominalnih troškova života plaća života u plaća 2000=100 2000=100 2000=100 2000. god.

45,71 51,43 68,57 82,86 100 122,86

72,93 81,68 88.21 91,74 100 110

62,68 62,97 77,73 90,32 100 111,69

2193,88 2203,72 2720,78 3210,81 3500 3909,09

a) Prvo ćemo izračunati bazne indekse nominalnih plaća na bazi 2000. godine:

It =

Yt 1600 × 100 ⇒ I1996 = × 100 = 45,71 Yb 3500

itd.

Verižne indekse troškova života moramo pretvoriti u bazne indekse 2000 = 100:

I t −1 × Vt I 2000 × V2001 100 × 110 It = ⇒ I 2001 = = = 110 100 100 100

82

I t −1 =

100 It I × 100 ⇒ I1999 = 2000 × 100 = × 100 = 91,74 109 Vt V2000

itd. INDEKS NOMINALNE PLAĆE INDEKS REALNE PLAĆE =  × 100 INDEKS TROŠKOVA ŽIVOTA

IRP1996 =

45,71 × 100 = 62,68 72,93

U 1998. godini prosječne realne godišnje plaće bile su manje za 22,27% u odnosu na 2000. godinu. b) NOMINALNA PLAĆA REALNA PLAĆA =  × 100 INDEKS TROŠKOVA ŽIVOTA

RP1996 =

1600 × 100 = 2193,88 72.93

Realne plaće smo mogli izračunati i na temelju nominalne plaće iz bazne godine i indeksa realnih plaća:

RP1996 =

3500 × 62,68 = 2193,8 100

U 1997. godini prosječne godišnje realne plaće, uz troškove života iz 2000. godine, iznosile su 2.203,72 USD. c) Ukupan postotak promjene realnih plaća u promatranom razdoblju možemo izračunati na dva načina: - određivanjem omjera posljednje i prve vrijednosti realne plaće uz troškove života u 2000. godini:

83

P=

YN 3909.09 × 100 − 100 = × 100 − 100 = 78,18% Y1 2193,88

- određivanjem omjera posljednjeg i prvog indeksa realnih plaća:

P=

IN 111.69 × 100 − 100 = × 100 = 78,19% I1 62,68

U razdoblju od 1996. do 2001. godine realne plaće su se ukupno povećale za 78,18%. d) Prosječna godišnja stopa izračunava se iz relacije:

 YN  − 1 N  S = − 1 × 100 Y1   U MS Excelu prosječnu godišnju stopu promjena izračunavamo pomoću geometrjske sredine verižnih indeksa iz relacije: =GEOMEAN(raspon verižnih indeksa)-100

 3909,09  S =  5 − 1 ×100 = 12,25%  2193,88  Realne plaće su u promatranom razdoblju rasle po prosječnoj godišnjoj stopi od 12,25%.

84

7.4.2. VRIJEDNOST U STALNIM CIJENAMA. INDEKS FIZIČKOG OBUJMA. Poseban oblik skupnog indeksa količina je skupni indeks fizičkog obujma. Pomoću odgovarajućeg skupnog indeksa cijena vrši se poseban postupak tzv. deflacioniranja vrijednosnih pokazatelja. Statističkim postupkom deflacioniranja iz pokazatelja vrijednosti se odstranjuje utjecaj cijena, pa se može sagledati kretanje tih pokazatelja u fizičkom obujmu, tj. u realnim okvirima. VRIJEDNOST U TEKUĆIM CIJENAMA VRIJEDNOST U STALNIM CIJENAMA =  × 100 INDEKS CIJENA

INDEKS VRIJEDNOSTI U TEKUĆIM CIJENAMA INDEKS FIZIČKOG OBUJMA =  × 100 INDEKS CIJENA

NAPOMENA: Svi indeksi se moraju odnositi na istu baznu godinu (godinu uz čije cijene se računaju vrijednosti)!!!

Primjer 7.3. Vrijednosti bruto domaćeg proizvoda Republike Hrvatske i indeksi cijena za razdoblje od 1995 - 2000. godine prikazani su u tablici. a) Izrazite vrijednosti bruto domaćeg proizvoda po godinama u stalnim cijenama iz 2000. godine. Objasnite značenje dobivene vrijednosti za 1995. godinu. b) Izračunajte indekse fizičkog obujma na bazi 2000 = 100. Objasnite značenje indeksa za 1997. godinu. c) Koliko posto se ukupno promijenila vrijednost bruto domaćeg proizvoda u stalnim cijenama u navedenom razdoblju?

85

d) Izračunajte prosječnu godišnju stopu promjene bruto domaćeg proizvoda u stalnim cijenama u navedenom razdoblju. Objasnite njeno značenje. Godina

Vrijednost BDP u milijunima kuna

1995 1996 1997 1998 1999 2000

94564 103610 110852 116940 125315 135428

Indeksi Verižni cijena indeksi cijena 2000 = 100

109 105 106 107 105 106

75,45 79,22 83,97 89,85 94,34 100

Vrijednosti BDP u cijenama iz 2000. god.

Indeksi BDP u tekućim cijenama 2000 = 100

Indeksi fizičkog obujma 2000 = 100

125333,33 130787,68 132013,81 130150,25 132833,37 135428

69,83 76,51 81,85 86,35 92,53 100

92,55 96,58 97,48 96,10 98,08 100

a) Prvo ćemo verižne indekse cijena pretvoriti u bazne indekse sa 2000. kao baznom godinom:

I t −1 =

I It 100 × 100 ⇒ I1999 = 2000 × 100 = × 100 = 94,34 V2000 Vt 106

VRIJEDNOST U TEKUĆIM CIJENAMA VRIJEDNOST U STALNIM CIJENAMA =  × 100 INDEKS CIJENA

VUSC1995 =

94564 ×100 = 125333,33 75,45

U 1995. godini BDP u RH iznosio je 125.333,33 milijuna kuna uz cijene iz 2000. godine. b) Potrebno je izračunati bazne indekse BDP u tekućim cijenama (2000 = 100). Zatim koristimo relaciju: INDEKS VRIJEDNOSTI U TEKUĆIM CIJENAMA INDEKS FIZIČKOG OBUJMA =  × 100 INDEKS CIJENA

86

IFO1995 =

69,83 × 100 = 92,55 75,45

U 1997. godini BDP u RH izražen u stalnim cijenama bio je za 2,52% manji od BDP u 2000. godini. Indekse fizičkog obujma mogli smo izračunati i kao bazne indekse vrijednosti BDP u stalnim cijenama:

IFO1995 =

c)

P=

125333,33 × 100 = 92,55 135428

YN 135428 × 100 − 100 = × 100 − 100 = 8,05% Y1 125333,33

Vrijednost BDP RH u stalnim cijenama se u razdoblju od 1995. do 2000. godine ukupno povećala za 8,05%. Ukupnu promjenu BDP u stalnim cijenama u promatranom razdoblju može se izračunati i iz indeksa fizičkog obujma:

P=

IFON 100 × 100 − 100 = × 100 − 100 = 8,05% IFO1 92,55

 YN   135428      × 100 = 1,56% 5 N −1 = − × = − S 1 1 100 d)     Y1  125333,33    U MS Excelu stopu izračunamo iz geometrijske sredine verižnih indeksa: =GEOMEAN(raspon verižnih indeksa)-100 BDP Republike Hrvatske u stalnim cijenama u razdoblju od 1995. do 2000. godine rastao je po prosječnoj godišnjoj stopi od 1,56%.

-THE

END-

87

Related Documents

Poslovna Statistika
February 2021 1
Statistika
February 2021 0
Poslovna-matematika
January 2021 1
Poslovna Pisma
January 2021 3
Poslovna Matematika
January 2021 1
Poslovna Inteligencija
February 2021 1

More Documents from "seminarjoe"