STATISTIKA ZA PRAVNIKE
Prof.dr.sc. Nihada Mujić Mr.sc. Jelena Legčević Mr.sc. Martina Mikrut
Sveučilište Josipa Jurja Strossmayera Pravni fakultet u Osijeku Godina 2009
STATISTIKA ZA PRAVNIKE Autori: Prof.dr.sc. Nihada Mujić Mr.sc. Jelena Legčević Mr.sc. Martina Mikrut
Recenzenti: Prof.dr.sc. Ivana Barković Prof.dr.sc. Jasna Horvat
Lektorica: Nataša Balaban, prof.
ISBN 978-953-6072-47-7
2
Sadrţaj 1.
Pojam i predmet proučavanja statistike
2.
Izvori podataka i metode prikupljanja podataka
3.
Faze rada statističke metode
4.
Statističko tabeliranje
5.
Grafičko prikazivanje nominalnih i redoslijednih nizova
6.
Relativni brojevi kvalitativnih nizova
7.
Numerički nizovi
8.
Grafičko prikazivanje numeričkih nizova
9.
Srednje vrijednosti
10.
Aritmetička sredina
11.
Medijan
12.
Mod
13.
Mjere disperzije
14.
Standardizirano obiljeţje
15.
Analiza vremenskih nizova
16.
Indeksna metoda
17.
Individualni indeksi stalne baze
18.
Veriţni indeksi
19.
Preračunavanje individualnih indeksa
20.
Srednje vrijednosti vremenskih nizova
21.
Skupni indeksi
22.
Linearni trend
23.
Regresija i korelacija
24.
Metoda uzoraka 3
4
“Statistički način mišljenja jednog će dana za svakodnevni život graĎana postati jednako neophodan kao znanje čitanja i pisanja.”
H.G.Wells (1866. – 1946.)
5
Definicija statistike
Preko 100 definicija pojma “statistika”
“Nijedna definicija ne znači mnogo tako dugo dok nismo proučili ono na čemu radimo – a tada je svaka definicija gotovo nepotrebna”; Mainland
Statistika je znanstvena disciplina koja se bavi prikupljanjem, analizom i tumačenjem podataka masovnih pojava
U svakodnevnom govoru, riječ statistika koristi se i za već prikupljenje i ureĎene podatke, brojčane pokazatelje, koji su objavljeni u obliku tablica, grafikona i sl.
6
Statistika u svakodnevnom ţivotu Pojam statistike ne odnosi se isključivo na statističke podatke, već uz način proučavanja pojava koje nas okruţuju, a u svakodnevnom ţivotu susrećemo se s njom kroz:
Prosjek ocjena
Stopu inflacije
Postotak porasta nezaposlenih
Prosječnu starost stanovnika RH
...
7
Podjela statistike Deskriptivna
statistika
Temelji se na potpunom obuhvatu statističkog skupa, koristi brojčane (numeričke) i grafičke metode kako bi opisala populaciju (N) mjere centralne tendencije, mjere disperzije, mjere asimetrije, mjere zaobljenosti... Inferencijalna
statistika
Temelji se na dijelu (uzorku (n)) jedinica izabranih iz statističkog skupa, radi donošenja zaključaka o parametrima populacije procjene parametara, testiranje hipoteza, neparametrijski testovi (hi-kvadrat test)... 8
Predmet proučavanja statistike
Varijacije (različitost, promjenjivost) i kovarijacije (sličnost, povezanost, meĎuovisnost) podataka koji prikazuju različite pojave u prirodi i društvu ili su rezultat mjerenja
Zakonitosti koje se javljaju u masovnim pojavama
Masovne pojave su skupine istovrsnih, ali ujedno i varijabilnih elemenata koje imaju jedno ili više zajedničkih svojstava i nazivamo ih statističkom masom ili statističkim skupom
9
Definiranje statističkog skupa
Statistički skup potrebno je definirati:
ŠTO: Pojmovno
GDJE: Prostorno
KADA: Vremenski u jednom trenutku u intervalu
Opseg statističkog skupa je broj njegovih elemenata
Skup moţe biti konačan (jer ima konačan opseg) i beskonačan (jer ima beskonačno mnogo članova)
10
Elementi statističkog skupa
Sastav
statističkog
pojedinačnom
skupa
slučaju
–
ovisi
o
ovisi
o
pojavama koje se istraţuju
STATISTIČKA JEDINICA
STATISTIČKA MASA
1.) osoba
1.) stanovništvo, studenti
2.) stvar
2.) knjige,vozila
3.) ustanove i poduzeća
3.) bolnice, sudovi, škole
4.) usluge
4.) u zdravstvu,
5.) dogaĎaji
5.) roĎenje, nezgode
6.) djelovanje
6.) krivična djela, djela socijalne zaštite
11
Statističko obiljeţje
Svojstvo po kojemu jedinice statističkog skupa meĎusobno nalikuju i meĎusobno se
razlikuju
(npr.
spol,
dob,
visina,
ocjene...)
Statističko obiljeţje naziva se i varijabla
Pojavljuje
se
u
različitim
oblicima
ili
stupnjevima
Obiljeţja mogu biti:
KVALITATIVNA (izraţavaju se opisno)
KVANTITATIVNA (izraţavaju se brojčano)
12
Statističko obiljeţje Kvalitativna obiljeţja mogu biti: Nominalna Atributivna (spol, zanimanje) Geografska (mjesto roĎenja, mjesto studiranja)
Redoslijedna (ocjena, školska sprema, stupanj zadovoljstva studiranjem)
Kvantitativna (numerička) obiljeţja mogu biti: Prekidna ili diskontinuirana (broj studenata na godini, broj počinjenih kaznenih djela)
Neprekidna ili kontinuirana (visina, teţina, duljina, cijena) 13
14
Podaci prema izvoru
Podaci
su
osnova
svake
statističke
analize
Pribavljanje podataka ovisi o cilju i
predmetu istraţivanja, prirodi pojava, raspoloţivim resursima... Prema izvoru, podatke dijelimo na: Sekundarni podaci: podaci prikupljeni u skladu s nekim ciljem i na odreĎen način, opseg i vrsta ne izviru neposredno iz potreba danog istraţivanja
Primarni podaci: podaci koji se prikupljaju u skladu s ciljem istraţivanja, za sve članove skupa ili dio njih
15
Sekundarni podaci
Sekundarni dostupni,
podaci a
su
njihovo
u
pravilu
lako
pribavljanje
nije
povezano uz velike troškove, no ponekad
su nedovoljni
Mogu biti interni i eksterni: INTERNI PODACI
EKSTERNI PODACI
-Računovodstvo - Referada - Knjiţnica ...
-Statistički uredi -Zavodi za istraţivanje trţišta -Drţavne institucije ... 16
Primarni podaci Metode prikupljanja podataka dijele se na: Osobno– F2F (uz pomoć papirnatog upitnika PAPI ili računala CAPI) Telefonsko (uz pomoć računala CATI) Poštansko (klasična pošta ili fax)
Internet (web, mail, chat, …) Opaţanja (mjerenje) Ili ovisno o tome gdje se anketira npr.
Upitnicima u kućanstvu Anketiranje na centralnoj lokaciji... Za sve metode i mjesta postoje prednosti i nedostatci, potreban je odabir metode s
najpovoljnijim odnosom uloţenog i dobivenog 17
18
Faze rada statističke metode Statističko
promatranje
Grupiranje
ili klasifikacija
Statistička
analiza
Tumačenje
rezultata
19
Statističko promatranje S
obzirom na vrijeme: Periodično Jednokratno Tekuće
S
obzirom na obuhvat: Sveobuhvatno (iscrpno) Reprezentativno (uzorak)
20
Grupiranje ili klasifikacija
UreĎivanje izvornih podataka na temelju utvrĎenog pravila
Veliki broj podataka ureĎuje se grupiranjem prema odreĎenom pravilu razvrstavanja podataka
Broj podataka u jednoj grupi naziva se frekvencijom grupe, koja moţe biti apsolutna ili relativna
Zbroj svih frekvencija čini opseg skupa
21
Grupiranje ili klasifikacija Formiranje
grupa:
Iscrpno Isključivo
RasporeĎivanje
podataka u
grupe ili razrede koji mogu biti: Jednaki ili nejednaki Zatvoreni ili otvoreni
22
Statistička analiza
UreĎivanjem izvornih podataka na temelju utvrĎenog pravila kreira se statistički niz
Statistički niz = suma frekvencija svih grupa statističkog skupa,čine ga grupe poredane po odreĎenom principu...
23
Vrste statističkih nizova (skupova): Vrste statičkih nizova s obzirom na grupiranje:
a)
NEGRUPIRANI
Xi: X1, X2, X3,..., XN
GRUPIRANI
statističke tablice
Negrupirani statistički niz - podaci su zapisani slijedom kojim su i prikupljani Xi: X1, X2, X3,...., XN studenti prema ocjeni iz statistike: 5, 5, 5, 5, ..., 5
24
b)
Grupirani statistički niz podaci se prikazuju u tablicama distribucije frekvencija
STATISTIČKE SKUPINE - modaliteti obiljeţja (redovi) FREKVENCIJE - broj jedinica modaliteta obiljeţja (stupci)
Spol xi
Broj studenata fi
M
40
Ţ
60
Ukupno
100
25
Statistički nizovi Vrste statičkih nizova s obzirom na obiljeţje:
NOMINALNI NIZ - prema veličini frekvencija, abecedno,nomenklaturno
REDOSLIJEDNI NIZ – prema intenzitetu
NUMERIČKI NIZ – prema vrijednosti num. obiljeţja
VREMENSKI NIZ – kronološki
26
Tumačenje rezultata
Statistički ispravno
U skladu s pravilima struke
Nuţno izbjeći manipulaciju rezultatima
27
28
Statističko tabeliranje
Postupak svrstavanja podataka u tablice
prema odreĎenom pravilu
Cilj tabeliranja je olakšati praćenje i analizu podataka
Tablice mogu biti izvještajne (veliki broj redova i stupaca, kao tablice DZS-a) i analitičke (u pravilu manjih dimenzija)
29
Elementi statističke tablice Naslov tablice: Z A G L A V LJ E P R E T S T U P A C
Brojčani dio tablice:
Ukupno Z
Ø prosjek
B
… ne raspolaţe se
R
- nema podatka ( ) nepotpun podatak * ispravljen podatak
I N
I
S T U P A
C
Ukupno
Izvor :
ZBIRNI RED (sume stupaca)
30
Vrste statističkih tablica Vrste statističkih tablica su
Jednostavne tablice: samo jedna pojava, jedan statistički niz kada je grupiranje provedeno prema jednom obiljeţju Skupne ili sloţene tablice: dva ili više statističkih nizova grupiranih prema jednom obiljeţju Kombinirane tablice: jedan statistički niz promatran prema dva ili više obiljeţja. Sadrţi i zbirni red i zbirni stupac
31
Grafičko prikazivanje nominalnih i redoslijednih nizova 32
Grafičko prikazivanje
Grafički prikazani statistički podaci razumljiviji su i pregledniji u odnosu na njihovo predstavljanje tablicom
Veća preglednost grafičkog prikaza i snaga prvog vizualnog utiska o karakteristikama promatrane pojave prednosti su grafičkih prikaza
Danas se grafički prikazi konstruiraju pomoću računalnih programa koji u sebi sadrţe predefinirana načela opisne statistike
Skupine grafičkih prikaza Grafički
je moguće prikazati jedan ili
više kvalitativnih nizova
Skupine grafičkih prikaza:
Površinski
Linijski
grafikoni
grafikoni
Kartogrami
34
Površinski grafikoni podaci se prikazuju površinama geometrijskih likova, površine likova su upravno razmjerne brojevima koji se tim površinama prikazuju
Jednostavni stupci (P = a * b) Razdijeljeni (strukturni) stupci Dvostruki stupci Površina kvadrata (P = a²)
35
Površinski grafikoni
Površina kruga (P = r²π)
Površina polukruga
Varzarov znak ( RBK ili RBS )
(baza= nazivnik odnosa , visina= rel. broj)
Histogram
36
Linijski grafikoni
Koriste
se za prikazivanje nizova
a) NUMERIČKIH (kontinuirani i diskontinuirani) b) VREMENSKIH (trenutačni i intervalni)
Apscisa
- A.M. za obiljeţje
Ordinata
- A.M. za frekvenciju
37
Kartogrami
Grupiranje
jedinica prema
geografskom obiljeţju gdje sve grupe zajedno predstavljaju cjelovito geografsko područje
VRSTE:
Dijagramske karte Piktogrami Statističke karte
38
Grafičko prikazivanje redoslijednih nizova
Grupiranje
se vrši na isti način kao
i grupiranje prema nominalnom obiljeţju s tim da je redoslijed modaliteta ili grupa uvijek odreĎen rangom intenziteta obiljeţja koji pojedina grupa predstavlja, i to polazeći
od
najniţeg
prema
najvišem ili obratno
39
40
Relativni brojevi
RELATIVNI BROJ je logičan izraz mjerenja kada se neka veličina mjeri drugom veličinom (nazivnik=baza usporedbe)
Ova posljednja veličina postaje time mjera za veličinu koja se usporeĎuje (mjeri)
Zadatak relativnih brojeva je: Brojčano izraziti odnose meĎu
pojavama Omogućiti i olakšati usporedbu 41
Vrste relativnih brojeva 1. Relativni brojevi strukture (D/C) proporcije, postoci, promili (p, %, ‰) 2. Relativni brojevi dinamike (indeksi) bazni, veriţni individualni, skupni 3. Relativni brojevi koordinacije (RBK) 42
Relativni brojevi strukture
Ako se stavi u odnos broj elemenata dijela skupa prema broju elemenata u skupu,
dobiva se relativan broj koji se zove PROPORCIJA tog dijela u skupu
Proporciju označavamo s p
Budući da je dio uvijek manji od cjeline,
onda je:
0
Relativna frekvencija modaliteta ai je omjer apsolutne frekvencije fi tog modaliteta i zbroja apsolutnih frekvencija N:
f (ai ) dio p(ai ) N cjelina
i 1,2,3,...,k
k
N f (ai ) i 1
43
Svojstva
Relativne
frekvencije
su
upravno
proporcionalne apsolutnim frekvencijama
Relativne
frekvencije
se
radi
lakšeg
tumačenja mnoţe sa sto (%) ili sa tisuću
(‰)
0 < fi < N
...
fi=N
0 < pi
...
pi=1
0 < Pi
...
Pi=100
Ekstremni slučajevi: Dio pojave koji se usporeĎuje = 0, tada je i p=0 Dio pojave koji se usporeĎuje = C (cjelina), tada je
p=1
44
Kutno sto, vodoravno sto, okomito sto Analiziranje podataka u kombiniranoj tablici relativnim brojevima strukture: vodoravno 100, okomito 100, kutno 100 Primjer 1. Upisani studenti na stručni i sveučilišni studij prema spolu i načinu strudiranja u ak. g. 2008./2009
Upisani studenti Redovni Izvanredni Ukupno
Studenti
Studentice
Ukupno
36.681
44.721
81.402
8.180
16.360
24.540
44.861
61.081
105.942
Izvor: Statistički ljetopis 2009., str.467 45
Kutno sto stavljanje u odnos svih brojeva u tablici prema ukupnoj statističkoj masi
Upisani studenti Redovni Izvanredni Ukupno
Upisani studenti Redovni Izvanredni Ukupno
Studenti
Studentice
Ukupno
36.681
44.721
81.402
8.180
16.360
24.540
44.861
61.081
105.942
Studenti
Studentice
Ukupno
34,62
42,21
76,84
7,72
15,44
23,16
42,34
57,66
100,00
+
+
46
Vodoravno sto stavljanje u odnos svih brojeva u tablici prema vrijednostima iz zbirnog stupca
Upisani studenti Redovni Izvanredni Ukupno
Upisani studenti
Studenti
Studentice
Ukupno
36.681
44.721
81.402
8.180
16.360
24.540
44.861
61.081
105.942
Studenti
Studentice
Ukupno
Redovni
45,06
54,94
100,00
Izvanredni
33,33
66,67
100,00
Ukupno
42,34
57,66
100,00
+
47
Okomito sto stavljanje u odnos svih brojeva u tablici prema vrijednostima iz zbirnog reda
Upisani studenti Redovni Izvanredni Ukupno
Upisani studenti
Studenti
Studentice
Ukupno
36.681
44.721
81.402
8.180
16.360
24.540
44.861
61.081
105.942
Studenti
Studentice
Ukupno
Redovni
81,77
73,22
76,84
Izvanredni
18,23
26,78
23,16
100,00
100,00
100,00
Ukupno
+
48
Relativni brojevi dinamike
Nazivaju se INDEKSI
Pokazuju odnos izmeĎu stanja jedne te iste pojave ili skupine pojava na različitim
mjestima ili u različitim vremenskim razdobljima Vrste
indeksa:
individualni (dinamika jedne pojave) skupni (odnosi stanja heterogene skupine pojava)
49
Relativni brojevi koordinacije
Koristi se za usporeĎivanje dvije pojave (P1 i P2), npr. broja studenata prema broju
nastavnika, broj optuţenih u odnosu na broj prijavljenih ...
Izračunavaju se stavljanjem u odnos frekvencije pojave koja se usporeĎuje, s frekvencijom pojave prema kojoj se provodi usporedba
RBK se grafički prikazuje površinskim grafikonom Varzarovim znakom
P1 RBK= P2
1
P2
= RBK P1
50
51
Numerički niz
Numerički nizovi konstruiraju se ureĎenjem vrijednosti kvantitativnih varijabli
Vrste: - NUMERIČKI KONTINUIRANI NIZOVI - NUMERIČKI DISKONTINUIRANI NIZOVI
GRUPIRANJE – raščlanjivanje statističkog skupa prema modalitetima obiljeţja
Grupiranje podataka: ISKLJUČIVO
ISCRPNO 52
Numerički niz DISTRIBUCIJA FREKVENCIJA =
skup: (xi,fi) gdje je
k
fi=N i=1 N - broj jedinica statističkog skupa i=1,2,...,k k – broj modaliteta obiljeţja xi – vrijednosti modaliteta obiljeţja f(i)
APSOLUTNA FREKVENCIJA
p(i)
RELATIVNA FREKVENCIJA
53
Numerički niz
Pojedinačni par u distribuciji frekvencija
predstavlja NUMERIČKU GRUPU, tj. broj jednakih
vrijednosti modaliteta obiljeţja varijable x
Modaliteti obiljeţja
Obiljeţje (xi)
Broj jedinica modaliteta obiljeţja (fi)
Distribucija frekvencije
X1
f1
(x1, f1)
X2
f2
(x2, f2)
...
...
...
Xk
fk
(Xk, fk)
fi = N 54
Sturgesovo pravilo
za odreĎivanje broja razreda k za N podataka k 1 + 3,3 log N
Uobičajeni broj k numeričkih grupa kreće se od 5 do 15 (maximalno 25)
Ako su razredi jednaki, širina im se aproksimativno odreĎuje diobom raspona varijacija i broja razreda:
ΔX = Xmax-Xmin = RV k k
55
Granice razreda 1.) NOMINALNE GRANICE (zadane) za izračunavanje parametara diskontinuiranog numerickog niza
2.) PRAVE GRANICE (“popravljene”) za izračunavanja parametara kontinuiranog numerickog niza crtanje kontinuiranog numerickog niza
3.) PRECIZNE GRANICE samo za crtanje diskontinuiranih numerickih nizova
56
Formiranje razreda kod kontinuiranog n.o.
PRAVILO: Gornja granica prethodnog razreda jednaka je donjoj granici idućeg razreda
Formiranje razreda kod diskontinuiranog n.o.
PRAVILO: Donja granica idućeg razreda za 1 jedinicu je veća od gornje granice prethodnog razreda
57
Veličina razreda
Oznaka za veličinu razreda je “i”
i = L1i +1 – L1i
VELIČINA RAZREDA – od donje granice
i = 1,2,...k
idućeg razreda oduzmemo donju granicu prethodnog razreda
58
Razredna sredina
za kontinuirane i diskontinuirane nizove
xi=L1i+L2i 2
RAZREDNA SREDINA – jednaka je poluzbroju donje (L1) i gornje (L2) prave granice i-tog razreda
59
Korigirane frekvencije
Ako su veličine razreda meĎusobno različite, podijeliti originalne
frekvencije pripadajućim veličinama razreda ili njima proporcionalnim vrijednostima
Frekvencije se obavezno korigiraju: za crtanje poligona frekvencija za crtanje histograma pri izračunavanju moda
60
Korigirane frekvencije
Fc = apsolutne korigirane frekvencije
fi fc= i
Pc = relativne korigirane frekvencije
pi pc= i
61
Grafičko prikazivanje numeričkih nizova 62
Grafičko prikazivanje numeričkih nizova Numerički nizovi prikazuju se slijedećim vrstama grafikona:
LINIJSKIM GRAFIKONOM poligon frekvencija
specifičnim vrstama POVRŠINSKOG GRAFIKONA Histogram
S-L dijagram
63
1. Linijski grafikon POLIGON FREKVENCIJA (MNOGOKUTNIK) - distribucija frekvencija (ili kretanje neke pojave) se prikazuje linijama - ako je prethodno nacrtan histogram: polovice vrhova stupaca (tj. sredine razreda Xi) spojiti linijama - ucrtana linija:
oblik distribucije frekvencija - površina ispod linije:
ukupan broj elemenata statističkog skupa ili opseg stat. skupa
64
os
X – vrijednost numeričkog
obiljeţja izraţenog sredinom razreda (xi ) os
Y – frekvencija:
- apsolutna (fi), - relativna (pi),
za
razrede nejednakih veličina:
- korigirati frekvencije! -
aps. korigirana (fc)
-
rel. korigirana (pc) 65
2.
Površinski grafikon
grafikon kontura stupaca
stupci se crtaju bez razmaka
visina pravokutnika – frekvencija ( fi, fc, pi, pc )
baza pravokutnika – veličina razreda
površina svih pravokutnika jednaka je zbroju apsolutnih frekvencija, tj. relativnih frekvencija (1 ili 100 ili 1000)
66
Grafičko prikazivanje kumulativnih nizova
Kumulativni
nizovi se UVIJEK
tvore od originalnih vrijednosti KN
“manje od”
X : gornja granica promatranog razreda Y: frekvencija kumulativnog niza
KN
“više od”
X: donja granica promatranog razreda Y: frekvencija kumulativnog niza
67
Srednje vrijednosti 68
Vrste srednjih vrijednosti
Srednje vrijednosti ili mjere centralne tendencije
Vrste srednjih vrijednosti:
1. POTPUNE SREDNJE VRIJEDNOSTI 2. POLOŢAJNE SREDNJE VRIJEDNOSTI 3. SPECIFIČNE SREDNJE VRIJEDNOSTI
69
Potpune srednje vrijednosti
Aritmetička sredina – ( A.S.) X
aritmetička sredina relativnih brojeva strukture – P aritmetička sredina relativnih brojeva koordinacije – R
Harmonijska sredina – H
Geometrijska sredina – G
Aritmetička sredina aritmetičkih sredina X
70
Poloţajne srednje vrijednosti
medijan – Me (ordinalni niz)
mod - Mo (nominalni niz, ordinalni niz)
Specifične srednje vrijednosti
momenti distribucije frekvencija
71
Osnovne značajke srednjih vrijednosti
Utjecaj ekstremnih obiljeţja na srednje
vrijednosti
Utjecaj frekvencija u distribuciji frekvencija na srednje vrijednosti
Utjecaj svih obiljeţja koja su različita od srednje vrijednosti na tu srednju vrijednost
Odnos promatrane srednje vrijednosti i drugih obiljeţja
72
Zahtjevi srednjih vrijednosti
Mogućnost utvrĎivanja srednje vrijednosti objektivnim računskim pravilom na jedinstven način
Srednja vrijednost mora biti sadrţana izmeĎu najmanje i najveće vrijednosti obiljeţja
Ako su sve srednje vrijednosti obiljeţja jednake, i srednja vrijednost mora biti jednaka toj vrijednosti
73
Aritmetička sredina 74
Aritmetička sredina (MEAN), X, x
prosjek
N-ti dio totala
vrijednosti N.O. osnovnog skupa (N – broj jedinica osnovnog skupa) X1,X2,Xi,...XN
i=1,2,...,N
vrijednosti N.O. uzorka (n – broj jedinica uzorka) x1,x2,xi,...xn
i=1,2,...n
75
Aritmetička sredina osnovnog skupa suma vrijednosti num. obiljeţja osnovnog skupa
X=
broj jedinica osnovnog skupa
Total
=
N
Aritmetička sredina uzorka suma vrijednosti num. obiljeţja uzorka
x=
broj jedinica uzorka
total
=
n
76
Jednostavna aritmetička sredina
Jednostavna, neponderirana A.S. osnovnog skupa
Koristi se za negrupirani niz podataka
Ako obijeţje X od N elemenata ima vrijednosti mjerene na svakom elementu:
X: X1,X2,X3,...XN k
Xi
X1+X2+X3+...+Xk
X=
N
i 1
=
N
77
Ponderirana, vagana aritmetička sredina
A.S. vagana frekvencijama
Koristi se za grupirani niz podataka
Ako je zabiljeţeno k modaliteta obiljeţja, podaci predstavljaju distribuciju frekvencija sa:
k
fiXi i 1
f1X1+ f2X2+ f3X3+ ... + fkXk
X=
f1 + f2 + f3 + ... + fk
=
k
fi i 1
78
Ponderirana aritmetička sredina relativnih frekvencija Relativne i apsolutne frekvencije
su upravno proporcionalne! X: X1,X2,Xi, ... , Xk i= 1,2, ..., k
p: p1,p2, pi, ..., pk i=1,2, ..., k
k
piXi i 1
p1X1 + p2X2 + piXi+ ... +pkXk
X= f1 + f2 + f3 + ... + fk
=
k
pi i 1
79
Svojstva aritmetičke sredine 1. svojstvo Algebarski zbroj odstupanja originalnih vrijednosti numeričkog obiljeţja od aritmetičke sredine jednak je nuli
Σ(Xi – X) = 0
2. svojstvo Zbroj kvadrata odstupanja originalnih
vrijednosti numeričkog obiljeţja od aritmetičke sredine jednak je minimumu Σ(Xi – X)2 = min.
80
3. svojstvo
Aritmetička sredina uvijek se nalazi izmeĎu najmanje i najveće vrijednosti numeričkog obiljeţja varijable Xi Xmin X Xmax
4.svojstvo Ako je vrijednost numeričke varijable Xi jednaka konstanti c, aritmetička sredina
te varijable jednaka je konstanti c. X=c X1 = X2 = ... = Xk = c
5. svojstvo Aritmetička sredina je sklona ekstremima 81
Medijan
82
Medijan
Medijan (Me) je srednja pozicijska vrijednost numeričkog obiljeţja ili redoslijednog obiljeţja
Medijan je srednja vrijednost redoslijednog ili numeričkog obiljeţja koja elemente osnovnog skupa (statističkog niza) dijeli na dva jednaka dijela, tako da se
u jednom dijelu nalaze elementi koji imaju vrijednost obiljeţja manju ili jednaku Me ,a u drugom dijelu se nalaze elementi koji imaju vrijednost obiljeţja jednaku ili veću od Me
83
OdreĎivanje medijana OdreĎivanje medijana moguće je kod:
Individualnog numeričkog obiljeţja
Redoslijednog numeričkog obiljeţja
Diskontinuiranog numeričkog obiljeţja i=1
Izračunavanje medijana Medijan se izračunava kod:
Kontinuiranog numeričkog obiljeţja
Diskontinuiranog numeričkog obiljeţja gdje su razredi različiti od 1
Grafičko odreĎivanje medijana Medijan se moţe grafički odrediti uz pomoć:
Kumulativnog niza “manje od”
Kumulativnog niza “manje od” i kumulativnog niza “više od” 84
OdreĎivanje medijana za individualne vrijednosti Ako je broj elemenata u skupu:
a)
NEPARAN
b)
PARAN
N=(2k+1) onda je Me=k+1 N=2k onda je Me= polusuma
dva srednja elementa
POSTUPAK:
vrijednosti obiljeţja poredati po veličini
odrediti centralnu jedinicu
85
Izračunavane Me kod grupiranih vrijednosti
Medijan se ne moţe odrediti nego se mora izračunati prilikom: Kontinuiranog numeričkog obiljeţja Diskontinuiranog numeričkog obiljeţja kada je i>1
jer nije poznata vrijednost NO za svaki element, odnosno statističku jedinicu
POSTUPAK:
KORAK 1: Formirati kumulativni niz KORAK 2: Naći N/2 KORAK 3: Odrediti medijalni razred
86
KORAK 4a: Uvrstiti podatke u formulu za korištenje kumulativnog niza “manje od”
Me= l1 + N/2 - fi fmed
l1
*i
– donja granica medijalnog razreda
fi – zbroj frekvencija odozgo prema dolje do medijalnog razreda i
– veličina medijalnog razreda
fmed – originalna frekvencija medijalnog razreda
87
KORAK 4b: Uvrstiti podatke u formulu za korištenje kumulativnog niza “više od”
Me= l2 -
l2
N/2 - fi fmed
*i
– gornja granica medijalnog razreda
fi – zbroj frekvencija odozgo prema dolje do medijalnog razreda i
– veličina medijalnog razreda
fmed – originalna frekvencija medijalnog razreda
88
Grafičko odreĎivanje medijana
Aritmetičko mjerilo za frekvencije
N/2
Me
Aritmetičko mjerilo za obiljeţje 89
Uporaba medijana
Kod redoslijednog obiljeţja medijan je prihvatljivija mjera od aritmetičke sredine
Za vrlo asimetrične distribucije, te distribucije s ekstremno visokim i/ili niskim krajnjim vrijednostima
Za distribucije s otvorenim razredima gdje procjena donje odnosno gornje granice bitno utječe na aritmetičku sredinu
90
Mod 91
MOD (Mo)
Mod je vrijednost redoslijednog ili numeričkog obiljeţja koja se najčešće javlja u statističkom nizu
Mod je vrijednost obiljeţja oko koje se elementi statističkog skupa najgušće gomilaju
Mod dijeli distribuciju frekvencija na lijevu (rastuću-uzlaznu) i desnu (opadajuću-silaznu) stranu
92
UtvrĎivanje moda
Mod se utvrĎuje ako su jedinice
numeričkog obiljeţja grupirane u razrede veličine 1, tada je modalna vrijednost, vrijednost razreda koji ima najveću frekvenciju
Primjer:
Ocjena na ispitu
Br. studenata
1
12
2
18
3
31
4
11
5
9
81 93
Izračunavanje moda
Mod se izračunava kada su elementi statističkog skupa (niza) grupirani prema: diskontinuirnom numeričkom obiljeţju s razredima i>1 kontinuiranom numeričkom obiljeţju
Kod distribucija koje su grupirane u razrede nejednakih veličina, izračunavanju moda prethodi korigiranje
frekvencija:
fc=
fi i
94
Na temelju odreĎenog Mo razreda (b)
te dva susjedna razreda: lijevog (a) i desnog (c), izračunava se vrijednost Mo Mo l1
b a i b a (b c)
l1 – donja granica modalnog razreda b – frekvencija modalnog razreda (najveća frekvencija)
a – frekvencija razreda ispred Mo razreda
c – frekvencija razreda iza Mo razreda
i – veličina modalnog razreda 95
U distribuciji frekvencija moţe postojati:
jedna Mo vrijednost - UNIMODALNA DISTRIBUCIJA
dvije Mo vrijednosti - BIMODALNA DISTRIBUCIJA
više Mo vrijednosti - MULTIMODALNA DISTRIBUCIJA
Grafički se Mo moţe odrediti kada se na krivulji
distribucije
frekvencija
(poligon
frekvencija) pronaĎe najveća ordinata (ili tjeme)
iz
kojeg
se
spušta
okomica
na
apscisu, gdje se potom pročita vrijednost Mo
96
Nedostaci i prednosti Mo
NEDOSTACI
ovisan je načinu formiranja razreda
nema smisla ako se distribucija pribliţava pravokutnoj
sporan je kod bimodalne ili multimodalne distribucije
PREDNOSTI
kod distribucija s ekstremno malim ili velikim vrijednostima NO Me i x imaju teţnju njihovom pribliţavanju, pri čemu će primicanje Me biti značajno manje od primicanja x
Mo neće imati tu tendenciju jer ga odreĎuje najveća frekvencija 97
Mjere disperzije 98
Mjere disperzije
Osim značajke distribucije frekvencija dane u srednjoj vrijednosti, nastaje
potreba za drugom značajkom distribucije frekvencija koja će izraţavati stupanj varijabilnosti vrijednosti obiljeţja
Ta se značajka zove MJERA DISPERZIJE ili MJERA RASPRŠENOSTI
99
Mjere disperzije
Osim značajke distribucije frekvencija dane u srednjoj vrijednosti, nastaje
potreba za drugom značajkom distribucije frekvencija koja će izraţavati stupanj varijabilnosti vrijednosti obiljeţja
Ta se značajka zove MJERA DISPERZIJE ili MJERA RASPRŠENOSTI
100
Mjere disperzije mogu biti: apsolutne (istorodne distribucije) relativne (raznorodne distribucije)
APSOLUTNE M.D.
RELATIVNE M.D.
Raspon varijacija
Koeficijent varijacije
Interkvartil Kvartilna devijacija Srednje apsolutno odstupanje
Koeficijent kvartilne devijacije
Varijanca Standardna devijacija
101
Apsolutne mjere disperzije prikladne za usporeĎivanje disperzije
samo istorodnih distribucija
Raspon varijacija Interkvartil
Kvartilna devijacija Srednje apsolutno odstupanje Varijanca Standardna devijacija
102
1. Raspon varijacije (R) ili raspon disperzije je gruba informacija o veličini disperzije izmeĎu najveće i najmanje
vrijednosti numeričkog obiljeţja R= Xmax- Xmin Raspon varijacije za distribucije frekvencija s razredima odreĎuje se kao razlika gornje granice posljednjeg i donje granice prvog razreda, ili izračunavanjem razlike razrednih sredina posljednjeg i prvog razreda Nepouzdana mjera disperzije jer promatra razliku izmeĎu ekstremnih vrijednosti, a ne uzima u obzir rasporeĎivanje ostalih podataka 103
2. Interkvartil (Iq) KVANTILI – vrijednosti NO koje niz ureĎen po veličini dijele na q jednakih dijelova KVARTILI – niz ureĎen po veličini dijele na 4 jednaka dijela Q1 – prvi ili donji kvartil Me – drugi kvartil ili medijan Q3 – treći ili gornji kvartil
104
Donji
kvartil
(Q1)
–
je
vrijednost
redosljednog ili numeričkog obiljeţja, koja sve elemente u distribuciji frekvencija dijeli na ¼ (25%) elemenata koji imaju vrijednost obiljeţja jednaku ili manju od vrijednosti donjeg kvartila i na ¾ (75%) elemenata koji imaju vrijednost obiljeţja jednaku ili veću od donjeg kvartila
Gornji
kvartil
(Q3)
–
je
vrijednost
redosljednog ili numeričkog obiljeţja koja sve elemente u distribuciji frekvencija dijeli na ¾ (75%) elemenata koji imaju vrijednost obiljeţja jednaku ili manju od gornjeg kvartila i na ¼ (25%) elelmenata koji imaju vrijednost obiljeţja jednaku ili veću od gornjeg kvartila 105
Iq predstavlja raspon izmeĎu Q3 i Q1
IQ = Q3-Q1 25%
25% Q1
Me
N/4
N/2
Q3
3N/4
50% elemenata Izraţen je u jedinicama u kojima je izraţeno i obiljeţje Što je interkvartil brojčano manji to će polovica svih elemenata statističkog skupa biti više nagomilana oko Me, a to znači da će disperzija biti manja i obratno 106
Q1 i Q3 za grupirane vrijednosti izračunavaju se prema formulama: Prvi kvartil Q1
N f1 Q1 l1 4 i fQ1 Treći kvartil Q3
3N f1 Q3 l1 4 i fQ3 N
– ukupan broj elemenata
L1 – donja granica kvartilnog razreda fi – suma frekvencija KN “m.o.” do kvartilnog razreda fQ – originalna frekvencija kvartilnog razreda i
– veličina kvartilnog razreda 107
3. Kvartilna devijacija Rang polu-interkvartila
Q3 Q1 Q 2
4. Srednje apsolutno odstupanje prosječna veličina odstupanja pojedinačnih rezultata (bez obzira na smjer odstupanja) N
Za negrupirane vrijednosti
MAD
x i 1
MAD
X
N k
Za grupirane vrijednosti
i
f i 1
i
xi X
k
f i 1
i
108
5. Varijanca (ơ²) je aritmetička sredina kvadrata odstupanja vrijednosti numeričkog obiljeţja od x za... Za individualne vrijednosti: X: x1, x2, ...,xN
2 2 2 2
x )2 N
( xi
Za grupirane vrijednosti: X: x1, x2, ...,xN f: f1, f2, ..., fN
2 2 2 2
f i ( xi x )2 fi
109
6. Standardna devijacija (ơ) je drugi korijen iz varijance, standardno odstupanje od prosjeka
2
110
Relativne mjere disperzije prikladne i za usporeĎivanje disperzije
raznorodnih distribucija
Koeficijent varijacije Koeficijent kvartilne devijacije
111
1. Koeficijent varijacije relativna mjera disperzije i sluţi za usporeĎivanje varijabilnosti različitih pojava i svojstava Postotni omjer standardne devijacije i aritmetičke sredine
V
X
100
112
2. Koeficijent kvartilne devijacije Disperzija središnjih 50% jedinica
Q3 Q1 V Q Q3 Q1 Moţe biti u intervalu od 0 do 1
113
Standardizirano obiljeţje
Standardizirano obiljeţje originalnih
Odstupanja numeričkog
obiljeţja
sredine u
od
vrijednosti aritmetičke
raznorodnim distribucijama
frekvencija izračunavaju se s pomoću standardiziranog obiljeţja:
Izračunata odstupanja vrijednosti num. obiljeţja
od
aritmetičke
sredine
su
izraţena
u
jedinicama
standardnih
devijacija, te je na taj način osigurana mogućnost
usporedbe
za
raznorodne
distribucije 115
Svojstva standardiziranog obiljeţja aritmetička sredina standardiziranog obiljeţja jednaka je nuli
standardna devijacija standardiziranog obiljeţja je jednaka 1
Pravilo Čebiševa Standardizirana varijabla moţe poprimiti i pozitivne i negativne vrijednosti One će rijetko odstupati od aritmetičke sredine za više od +3
-3
-2
-
2
3 116 116
Pravilo Čebiševa Za zvonolike distribucije (posebice normalne distribucije): +1
pribliţno 68% podataka,
+2
pribliţno 95% podataka (najmanje 75% svih podataka),
+3
pribliţno 99,7% podataka (najmanje 88,89% svih podataka).
oko oko oko 117
Analiza vremenskih nizova 118
Vremenski nizovi su
nizovi istovrsnih podataka
prikupljenih u uzastopnim
vremenskim razmacima ili trenucima namjena
analize VN je promatrati
vremenski razvoj pojava, traţiti zakonitosti pojava i predviđati dalji razvoj pojava ZADATAK DINAMIČKE ANALIZE: ispitati
promjene pojava kao
funkciju vremena y = f(t) 119
PROBLEM: utvrĎivanje
homogenosti
podataka tijekom promatranog razdoblja
KOMPONENTE: trend
komponenta
ciklička
komponenta
sezonska slučajna
komponenta
komponenta
sistematske, determinističke komp. – kovarijacije pojave koje se daju izraziti nekom funkcijom vremena 120
Formiranje vremenskih nizova Vremenski
niz je skup kronološki
ureĎenih veličina koje su odraz razine intenziteta neke pojave u izabranim vremenskim točkama ili intervalima
Dvije
vrste vremenskih nizova:
INTERVALNI i TRENUTAČNI
121
Intervalni vremenski niz Pojave
s jednim smjerom kretanja
Intervalno
promatranje čijim
grupiranjem nastaje INTERVALNI NIZOVI Intervali
promatranja: godina,
mjesec, tjedan, dan, sezona, školska (akademska) godina, kazališna ili športska sezona i sl. Vremenski
intervalni nizovi imaju
svojstvo kumulativnosti
122
Trenutačni vremenski niz
Pojave s dva smjera kretanja
Promatraju se u presjeku vremena ili odreĎenom trenutku ("kritičnom trenutku"), a nizanjem rezultata takvih promatranja formirat će se TRENUTAČNI VREMENSKI NIZ
Frekvencije trenutačnog vremenskog niza nemaju svojstvo kumulativnsti
123
Usporedivost frekvencija vremenskoga niza Pojmovna i prostorna definicija ne smiju se mijenjati Jednakost intervala vremena promatranja Ako su vremenska razdoblja različita, potrebno je korigirati frekvencije prije usporeĎivanja Kod trenutačnih vremenskih nizova razmaci izmeĎu vremenskih točaka promatranja nisu bitni za usporedbu frekvencija 124
Grafičko prikazivanje vremenskih nizova
Površinski grafikon
INTERVALNI
Linijski grafikon
TRENUTAČNI
Linijski grafikon 125
Intervalni vremenski niz a) površinski (pomoću stupaca)
izgledom i konstrukcijom nalikuje
histogramu
na X-osi se nanosi vremensko razdoblje svakog člana vremenskog niza
na Y-osi se unosi član vremenskog niza za
odreĎeno razdoblje (uz napomenu da mjerilo na ordinati mora UVIJEK započinjati s 0) NAPOMENA: potrebno
ako ih
je
razdoblja svesti
nisu na
jednaka
zajedničko
razdoblje, a na ordinatu nanositi korigirane vrijednosti članova vremenskog niza
126
b) linijski
na X-osi se ucrtava sredina vremenskog razdoblja
na Y-osi se unosi odreĎena vrijednost pripadajućeg člana vremenskog niza, odnosno korigirana vrijednost ako se
radi o različitim razdobljima
linijski grafikon pokazuje SMJER i INTENZITET promjene pojave u
jednom rasponu vremena
postupnim zbrajanjem članova vremenskog INTERVALNOG NIZA odozgo prema dolje, nastaje
kumulativni vremenski niz 127
Trenutačni vremenski niz samo LINIJSKIM GRAFIKONOM
na X-os - trenutak promatranja
na Y-os - pripadajući član vremenskog niza (frekvenciju- koja je UVIJEK originalna)
podizanje ordinate na onom mjestu apscise koje odgovara trenutku promatranja pojave
jakost apsolutne promjene – strmina
lin.graf.
razlika dvije susjedne ordinate- apsolutna promjena pojave u dva trenutka promatranja
mogući prekidi (i vodoravni i okomiti) aritmetičkog mjerila
128
Grafičko usporeĎivanje vremenskih nizova
Dva se VN mogu usporediti linijskim grafikonom s aritmetičkim mjerilom samo ako su:
a)
izraţena u istim jedinicama mjere
b)
pribliţnih brojčanih vrijednosti
c)
odnose se na isto vremensko razdoblje
129
Indeksna metoda
Indeksi
relativni brojevi dinamike koji pokazuju relativan odnos izmeĎu dva ili više stanja jedne te iste pojave na dva
različita mjesta ili u dva različita vremenska intervala
pomoću indeksnih brojeva mogu se
analizirati i trenutačni i intervalni vremenski nizovi
131
Podjela indeksa
Prema obuhvatu promatranih pojava:
a) individualni indeksi S obzirom na bazu usporedbe: a) indeksi stalne i b) indeksi promjenjive baze
b) skupni ili grupni indeksi a) indeksi cijena b) indeksi količina c) indeksi vrijednosti
132
Individualni indeksi stalne baze 133
Individualni indeksi stalne baze
Dinamika samo jedne pojave pomoću indeksnih brojeva kroz nekoliko vremenskih razdoblja
Baznim indeksima izraţavaju se relativne varijacije izmeĎu dva stanja istog VN, od kojih je jedna pojava bazna veličina Yt It = Yb
Vrijednost kvocjenta pokazuje koliko jedinica usporeĎenih pojava odgovara svakoj jedinici baznog stanja
134
POSTUPAK: 1. Izabiranje baze usporedbe: Jedan član vremenskog niza
kod određivanja stalne baze, treba izabrati reprezentativan član (npr. najčešći član u nizu), a ne najnižu ili najvišu vrijednost u nizu
Neka druga vrijednost:
Veličina promatrane pojave iz proteklog vremenskog razdoblja koje nije obuhvaćeno intervalom promatranja
AS vrijednosti pojave kada su varijacije pojave znatne (u oba smjera); baza usporedbe – prosjek varijacija vremenskog niza
2. Svi članovi originalnog VN se stavljaju u odnos prema izabranoj bazi usporedbe
3. Kvocjente pomnoţiti sa 100 (radi tumačenja) 135
Pokazatelji
Yt Yb Yt Yb
Koeficijent promjene
*100= It Indeks promjene
It – 100 = St Stopa promjene (+ rast, - pad)
136
Ako je:
Yt = Yb
It=100
Yt > Yb
It>100
Yt < Yb
It<100
It je uvijek pozitivan
137
Individualni indeksi na bazi srednje vrijednosti promatrane pojave usporeĎivanje
dva ili više VN
mjerenih raznorodnim obiljeţjima grafički
se prikazuju i površinskim i
linijskim grafikonima baza
usporedbe – srednja
vrijednost promatrane pojave
I yi =
Yi
Y
*100
i=1,2,...,N 138
Pravila za indekse na stalnoj bazi
Niz originalnih vrijednosti VN upravno je proporcionalan nizu indeksa na stalnoj
bazi
Prikazuju se uglavnom površinskim grafikonima (ordinata-indeksi u artm. mjerilu; ishodište = 100 na ordinati)
Grafikon se čita u odnosu na bazu
Usporedba varijacija različitih VN, ako svi VN imaju jednaku bazu
Izraţavaju relativne promjene VN,
neovisne o sustavima i brojčanim razinama mjerenja u kojima su izraţene originalne vrijednosti originalnih VN 139
Individualni indeksi s promjenjivom bazom (veriţni ili lančani indeksi) 140
Veriţni ili lančani indeksi ako Y1, Y2, Y3, ... Yn, predstavljaju frekvencije nekog vremenskog niza ,i potrebito je saznati
kako se pojava mjenjala iz razdoblja u razdoblje, koriste se VERIŢNI ILI LANČANI INDEKSI to su indeksi na PROMJENJIVOJ BAZI ,a
dobiju se dijeljenjem svakog člana vremenskog niza prethodnim članom te mnoţenjem dobivenog rezultata sa 100 svaka originalna vrijednost javlja se kao:
- tekuća vrijednost koja se usporeĎuje - baza usporeĎivanja iznimke: prva i posljednja orig. vrijednost VN - prva orig. vrij.–samo baza usporeĎivanja
- posljednja orig.vrij.–samo kao tekuća vrij.141
Veriţni indeksi ne mogu biti negativne veličine, jer su frekvencije vremenskog niza uvijek pozitivne Za veriţne indekse vrijede sljedeće relacije: Yt > Y t-1 Yt < Y t-1 Yt = Y t-1
Vt > 100 Vt < 100 Vt = 100
Veriţni indeks Vt pokazuje koliko jedinica pojave u vremenu t dolazi na svakih 100 jedinica u vremenu t-1
Govori o relativnoj promjeni neke pojave uvijek u odnosu na pojavu iz prethodnog
perioda.
Intenzitet
promjene
izraţen
u
postotku dobije se kao razlika indeksa Vt i veličine 100 ( St=Vt-100 ) 142
Grafičko prikazivanje veriţnih indeksa
specifična vrsta linijskog grafikona
promjenjiva baza veriţnih indeksa zahtjeva prikazivanje svakog veriţnog indeksa posebnom linijom
ishodište apscise (koja označava vrijeme) je na ordinati označeno vrijednošću 100
veriţni indeksi >100: od apscise prema vrhu ordinate, unutar ili u sredini intervala jedne godine
veriţni indeksi < 100: od apscise prema niţim vrijednostima ordinate
nagib ucrtane linije – intenzitet relativne promjene 143
Preračunavanje individualnih indeksa 144
Preračunavanje baznih indeksa u veriţne -
postupnim dijeljenjem baznih indeksa (*100)
-
kao da je riječ o originalnim frekvencijama VN
145
Preračunavanje veriţnih u bazne ako je bazno razdoblje prvo u nizu– postupnim mnoţenjem:
It =
I
t-1
* Vt
100
t=2,3,..., N ako bazno razdoblje nije prvo u nizu - bazni indeks za razdoblja koja prethode baznom: I
It =
I I
t-1
t
t-1
* Vt
100 =
= 100
It V
; kada je t > b
*100
; kada je t < b
t
; kada je t = b 146
Srednje vrijednosti vremenskih nizova 147
Srednje vrijednosti vremenskih nizova
neke pojave su statičkog karaktera
nemaju opću razvojnu tendenciju
analiziraju se statičnim srednjim vrijednostima
VRSTE:
- AS intervalnog VN - kronološka sredina trenutačnog VN - geometrijska sredina (upotrebljava se u analizi intervalnog i trenutačnog VN)
148
Kronološka sredina Vremenski
trenutačni niz je
sastavljen od frekvencija čije se vrijednosti u pravilu ne mogu zbrajati te iz toga proizlazi da se za VTN ne bi mogla izračunati srednja vrijednost
Stoga
se VTN transformira u IVN te
se pomoću kronološke sredine računa srednja vrijednost
149
Geometrijska sredina srednja vrijednost veriţnih indeksa (prosječan tempo promjene) Primjena: a)
u analizi VN negrupiranih i grupiranih podataka (“prosječan tempo promjene”)
b)
kao srednja vrijednost numeričkih nizova za nizove sa
asimetričnim rasporedom podataka
150
Jednostavna, neponderirana geometrijska sredina Za N individualnih vrijednosti varijable X (numeričkog ili vremenskog niza):
G N x1x2x3 ...xN N
G N xi , xi 0 i 1
za svaki xi N
rješava se logaritmiranjem: log G
log i 1
xi
N
Logaritam geometrijske sredine jednak je aritmetičkoj sredini logaritama promatrane varijable, odnosno, aritmetičke sredine logaritama elemenata vremenskog niza ili numeričkog niza. 151
Vagana, ponderirana geometrijska sredina Podaci grupirani u distribuciju frekvencija:
G x1 x 2 x 3 ... x N N
f1
f2
f3
k
fN
N fi
,
i 1
k
log G
f log i 1
i
N
xi
k
,
N fi i 1
ne računa se za nizove koji sadrţe vrijednost 0 na njenu veličinu utjecati će vrijednost svih elemenata promatranoga niza manja je od aritmetičke sredine istoga niza (osim u slučajevima kada su sve vrijednosti promatranoga niza 152 meĎusobno jednake)
Skupni indeksi 153
Skupni indeksi
Skupnim indeksima se mjeri dinamika skupine pojava ili se utvrĎuju varijacije heterogene skupine pojava na različitim mjestima (npr. potrošnja, izvoz, uvoz,industrijska proizvodnja )
Najčešće se dinamika heterogenih pojava prati kroz vrijednosni način izraţavanja
-
Razlikujemo:
skupni indeksi količina skupni indeksi cijena skupni indeks vrijednosti
154
Simboli
•
p0 = cijene baznoga razdoblja
•
p1 = cijene izvještajnoga razdoblja
•
q0 = količine baznoga razdoblja
•
q1 = količine izvještajnoga razdoblja
•
p0q0 = ponder vrijednosti baznoga razdoblja
•
p1q1 = ponder vrijednosti izvještajnoga razdoblja
155
Zapamtiti kod izračunavanja skupnih indeksa
Sve
nizove koji su zadani svesti na istu bazu (stalnu ili promjenjivu)
Indekse
na stalnoj bazi svesti na isto bazno razdoblje
156
Linearni trend 157
Trend
Ovisno o karakteru čimbenika koji djeluju u vremenu na neku pojavu, vremenski niz čine slijedeće komponente:
a)
trend ili osnovna tendencija kretanja neke pojave kroz vrijeme sezonske oscilacije, koje se pojavljuju unutar jedne godine ciklične komponente slučajne komponente, koje čine slučajni, teško predvidivi dogaĎaji
b) c)
d)
158
Metode utvrĎivanja trenda
Za utvrĎivanje trenda mogu se primijeniti: - neparametrijske i - parametrijske metode
159
Neparametrijske metode - ne rezultiraju matematičkom jednadţbom trenda. - dobra prethodnica parametrijskim metodama
metoda prostom rukom metoda poluprosjeka metoda pomičnih prosjeka Prednost: jednostavno izračunavanje Nedostatak: ne postojanje trend vrijednosti za početna i završna razdoblja niza; osjetljivost aritmetičke sredine na ekstremne vrijednosti 160
Parametrijske metode
Najčešća:
metoda najmanjih
kvadrata Izračunava se jednadţba linije kod
koje će suma odstupanja izmeĎu originalnih vrijednosti vremenskog niza i utvrĎenih trend podataka biti jednaka nuli (model linearnog trenda jednak je modelu jednostavne linearne regresije)
161
Metoda najmanjih kvadrata
izračunava se jednadţba linije kod koje će suma odstupanja izmeĎu originalnih vrijednosti vremenskog niza i utvrĎenih trend podataka biti jednaka 0
Označe li se podaci sa Yi, a trend podatke sa Yci, te primjeni li se metoda najmanjih kvadrata, vrijedi sljedeće: N
(Y Y i 1
i
ci
) 0
Nadalje vrijedi sljedeće: N
2 ( Y Y ) i ci min imun i 1
162
Da bi se uočila tendencija razvoja pojave dobro je: imati što veći vremenski niz (više frekvencija) grafički prikazati pojavu – gdje se iz pribliţnog izgleda nacrtane funkcije donosi sud o mogućem obliku osnovne tendencije razvoja ili tipu trenda
Ako su promatranja po: - jednakim intervalima i - ako su prve diferencije frekvencija pribliţno konstantne (u apsolutnom izrazu)
osnovna tendencija je linearna, linearni trend je polinom prvog stupnja f(x) = a+bx 163
Linearni trend Jednadţba linearnog trenda je jednadţba
pravca: Yci=a+bx ,
i=1,2,...k
gdje su:
Yci – zavisna varijabla (trend vrijednosti) Xi – oznaka za vrijeme (nezavisna varijabla)
parametar a – vrijednost trenda u ishodištu parametar b – koeficijent smjera pravca, te
kazuje koliko se pojava
mijenja u jedinici
vremena 164
Kada se izračunava linearni trend kojemu
je ishodište u prvoj godini vremenskog niza, parametri se izračunavaju na sljedeći način:
parametar b: N
b
x y i 1 N
i
x i 1
2 i
parametar a:
N
i
x yi i 1 N
a y bx
x xi i 1
Suma trend vrijednosti mora biti jednaka sumi originalnih vrijednosti promatranog niza
165
Izračunavanje parametara a i b za jednadţbu linearnog trenda moţe se pojednostaviti tako da se ishodište jednadţbe premjesti u sredinu čitavog promatranog razdoblja
Formule za izračunavanje parametara a i b su sljedeće: N
b
xi yi i 1 N
2 x i i 1
N
a
y i 1
N
i
y
166
Preračunavanje godišnjih jednadţbi u kraća vremenska razdoblja Trend se moţe izračunati i za vremenske nizove u kojima su podaci dati u vremenskim razdobljima koja nisu godišnje vrijednosti – npr. u polugodištima, kvartalima, mjesecima i dr. Pri preračunavanju godišnje jednadţbe trenda u trend s kraćim vremenskim razdobljima treba paziti da li se radi o trenutačnom ili intervalnom vremenskom nizu
167
A)TRENUTAČNI NIZ –
preračunavanje godišnje jednadţbe u mjesečnu
parametar “a” ostaje jednak godišnjem ukoliko se nije promijenilo ishodište jednadţbe
b Yci a x i , 12
i 1,2,...,N
B) INTERVALNI NIZ –
preračunavanje godišnje jednadţbe u mjesečnu
a b Yci xi , 12 144
i 1,2,...,N
168
Regresija i korelacija 169
Korelacija utvrĎivanje
meĎusobne povezanosti
pojava koje se proučavaju te na
osnovi jedne pojave predviĎaju promjene i zbivanja u drugoj pojavi
POVEZANOST MEĐU POJAVAMA MOŢE BITI uzročno-posljedična
(regresijski model y=a+bx) korelativna
(korelacijski model x=f(y) ili y=f(x)) 170
Uzročno - posljedična povezanost jednostavna
- jedan uzrok jedna posljedica
složena
- jedan uzrok - više posljedica - više uzroka - jedna posljedica - više uzroka i više posljedica
171
Korelativna povezanost
pojava
postoji kada promjene u
jednoj i drugoj pojavi mogu postojati paralelno ,a da jedno nisu uzrok drugima
proučavanjem
korelativnih odnosa
ne utvrĎuju se uzročno-posljedični odnosi ,ali se pridonosi boljem razumjevanju pojava i dogaĎaja koje
istraţujemo i njihovom boljem predviĎanju 172
indikator
povezanosti izmeĎu pojava
je KOEFICIJENT KORELACIJE ili KOEFICIJENT ASOCIJACIJE izmeĎu varijabli
pokazuje
smjer i intenzitet
povezanosti izmeĎu promatranih, registriranih i mjerenih pojava
koef.
korelacije vrlo rijetko ukazuje
na uzročno-posljedičnu povezanost,a puno češće ukazuje na korelativni odnos izmeĎu promatranih pojava 173
Korelacijska analiza 1. UtvrĎivanje postojanja veze izmeĎu pojava ili varijabli
(A i B)
2. UtvrĎivanje intenziteta i smjera povezanosti meĎu varijablama
3. UtvrĎivanje oblika veze meĎu varijablama - funkcionalna 4. UtvrĎivanje jakosti veze meĎu
pojavama - stohastička (statistička)
174
Linearna korelacija postoji kada je porast jedne pojave (Y) praćen linearnim porastom ili padom druge pojave
DIJAGRAM RASIPANJA (scatter diagram) – pruţa informacije o obliku, smjeru i jakosti veze
UKUPNA VARIJANCA= PROTUMAČENI DIO + NEPROTUMAČENI DIO
175
Koeficijent determinacije (r2) protumačeni dio odstupanja Koeficijent determinacije= ukupna odstupanja
Kako je r2 dan u drugom stupnju češće se koristi PEARSONOV KOEFICIJENT KORELACIJE (r) r = ±1 (mjera jakosti samo za LINEARNU korelaciju)
176
kod
tumačenja koeficijenta
korelacije (r) treba imati u vidu da je nastao iz koeficijenta determinacije (r2), te da npr. r=0,70 znači r2=0,49, da je tek 50
% ukupnih odstupanja objašnjivo s promatrane dvije pojave
177
Krivolinijska kada
se veza meĎu pojavama
najbolje ilustrira krivom linijom prva
orjentacija o krivolinijskoj
regresiji se dobiva preko dijagrama rasipanja na temelju kojeg se odlučuje koja se matematička krivulja najbolje prilagoĎuje nacrtanim originalnim
vrijednostima.Jakost krivolinijske veze mjeri se INDEKSOM KORELACIJE (ro)
178
Odnos koeficijenta determinacije i koeficijenta linearne korelacije r
r
Tumačenje
0
0
odsutnost korelacije
0,00-0,25
0,00-0,50
slaba korelacija
0,25-0,64
0,50-0,80
korelacija srednje jakosti
0,64-1,00
0,80-1,00
čvrsta korelacija
1
1
potpuna (perfektna) korelacija
2
179
Parcijalna korelacija koristi
se u slučaju utvrĎivanja
povezanosti izmeĎu dviju pojava, eliminirajući utjecaj npr. neke treće zajedničke varijable
KORELACIJA jakost
RANGA
veze izmeĎu pojava
promatranih po redoslijednom obiljeţju mjeri se koeficijentom korelacije ranga
180
Postupak izračunavanja:
1)
upare se vrijednosti redoslijednog obiljeţja za svaku statističku jedinicu
2)
jednom obiljeţju odredi se rang i poreda ga se po redoslijedu – drugo obiljeţje mu se pridruţuje ne rasparujući prethodno stvorene parove
3)
ako se u nizu pojavi više jednakih vrijednosti njihovi se rangovi zbroje i podijele s brojem pojavljivanja, te se tako izračunana vrijednost pridruţuje jednakim članovima niza
181
4) najniţi rang pripada najniţoj vrijednosti
obiljeţja, najviši rang najvišoj vrijednoati obiljeţja 5) izračuna se di=xri – yri kao razlika
ranga za svaku statističku jedinicu 6) izračuna se kvadrat razlika di2
182
Nedostaci:
nije
osobito precizna mjera
primjenom
ovog koeficijenta
korelacije ne mogu se izračunati ostali pokazatelji kao što su koeficijent regresije, koeficijent determinacije, jednadţba analize varijance, jednadţba regresije.
183
Opis koeficijenata korelacije prema jačini veze
Koeficijent korelacije
Tumačenje
0,00–0,10
Nema povezanosti
0,11-0,25
Jako slaba veza
0,26-0,40
Slaba veza
0,41-0,50
Srednje jaka veza
0,51-0,75
Jaka veza
0,76-0,90
Veoma jaka veza
0,91-1,00
Izuzetno jaka veza 184
Korelacijsko-regresijska analiza
KORELACIJA • ispitivanje veze i zavisnosti izmeĎu dvije pojave ili promjenjive veličine Pokazatelji: •koeficijent korelacije •koeficijent determinacije •koeficijent nedeterminacije
REGRESIJA • omogućava sagledavanje očekivane vrijednosti zavisno promjenjive veličine na osnovi vrijednosti nezavisno promjenjive veličine
Pokazatelji: • jednadţba regresije • standardna pogreška procjene regresije
185
Analiza regresijskih modela Osnovicu za analizu reprezentativnosti regresijskih modela čine sljedeći
statistički pokazatelji i metode:
Rezidualna odstupanja
Relativna rezidualna odstupanja
Standardizirana odstupanja
Koeficijent determinacije
Koeficijent korelacije
Standardna greška regresije
Analiza varijance (ANOVA)
Testiranje razine signifikantnosti regresijskih koeficijenata
OdreĎivanje intervala povjerenja regresijskih koeficijenata
OdreĎivanje intervala povjerenja prognoziranih vrijednosti
Testiranje razine signifikantnosti koeficijenta korelacije
186
Koeficijent multiple determinacije R2 i koeficijent multiple korelacije R
Koristi
se prosudbu valjanosti i
primjenjivosti modela višestruke regresije
187
Metoda uzoraka 188
ORIGINALNE, EMPIRIJSKE,
OPAŢENE DISTRIBUCIJE su formirane grupiranjem opaţanja ili elemenata skupa prema nekom obiljeţju.
TEORIJSKE DISTRIBUCIJE
očekivane distribucije u skladu s našim iskustvom ili na temelju teorijskih postavki. Pretpostavljamo ih u nekom statističkom modelu ili ih postavljamo kao hipotezu koju treba ispitati. Pojavljuju se u funkciji distribucije vjerojatnosti
189
Teorijske distribucije diskontinuirane slučajne varijable
1.
BINOMNA DISTRIBUCIJA
2.
POISSONOVA DISTRIBUCIJA
190
1. BINOMNA DISTRIBUCIJA
najjednostavnija teorijska distribucija
distribucija za alternativna obiljeţja
2. POISSONOVA DISTRIBUCIJA
koristi se za opis rijetkih dogaĎaja, tj. dogaĎaja s malom vjerojatnošću (br. kvarova strojeva:mjesečni (tjedni), broj dolazaka po min. , broj ˇpadovaˇračunala u jednom mjesecu)
191
Teorijske distribucije kontinuirane slučajne varijable
najpoznatije:
1) NORMALNA
(GAUSSOVA) DISTRIBUCIJA
2) STUDENTOVA 3) HI-KVADRAT 4) F
(t) DISTRIBUCIJA
DISTRIBUCIJA
DISTRIBUCIJA
192
1. Normalna (gaussova) distribucija
Ima oblik zvona
Unimodalna je
Proteţe se od - do +
Simetrična je, pa je 3=0
Mjera zaobljenosti je 4=3
Egzaktan oblik normalne krivulje bit će poznat ako su poznate arit.sred. i stand.devij.
193
2. Studentova (t) distribucija
Kod
uzoraka koji broje više od 30
jedinica pribliţava se oblikom i svojstvima normalnoj distribuciji Kod
n<30 razvučena je po apscisi (u
odnosu na normalnu)
194
3. F distribucija
Odnos dviju varijanci
4 . Hi-kvadrat distribucija
Primjenjuje se kada treba donijeti odluku o signifikantnosti razlika izmeĎu stvarnih
(opaţenih) i teorijskih (očekivanih) frekvencija
Moţe zauzeti vrijednosti od 0 do
195
Osnovni skup i uzorak Populacija
(odluka, koje jedinice
sudjeluju u populaciji )
Okvir
uzorka (popis jedinica, iz
kojeg se izabiru jedinice u uzorak npr.popis zaposlenih, lista pretplatnika )
196
Zadaća metode uzoraka 1.
Na osnovi uzorka procijene
karakteristike osnovnog skupa
2.
Na osnovi podataka donosi se odluka o prihvaćanju, odnosno odbacivanju hipoteze koja se odnosi na neku karakteristiku osnovnog skupa
197
Koraci u procesu izabiranja uzorka 1.
OdreĎivanje populacije
2.
Izabiranje primjerenog okvira uzorka
3.
Izabiranje plana uzorka (metode za izbor uzorka )
4.
OdreĎivanje potrebne veličine uzorka
198
Vrste planova uzorka
1. UZORCI BEZ PRIMJENE VJEROJATNOSTI
Prigodni
uzorci
Namjerni Kvotni
uzorci
uzorci
199
2. UZORCI UZ PRIMJENU VJEROJATNOSTI
Jednostavni
slučajni uzorak
Stratificirani
uzorak
proporcionalan neproporcionalan Uzorak
skupina
sustavan područni
200
Pitanja:
[email protected] [email protected] [email protected]
201
Literatura: 1. 2. 3.
4. 5. 6. 7. 8.
9. 10. 11. 12.
Kazmier, Leonard J.: Business Statistics. McGraw-Hill, 2004. Neufeld, J. L.: Learning Business Statistics with Microsoft Excel, Prentice Hall, New Jersey, 1997. Newbold, Paul / Carlson, William L. / Thorne, Betty M.: Statistics for Business and Economics. Prentice-Hall, 2002. Petz, Boris: Osnovne statističke metode za nematematičare. Slap, Jastrebarsko, 2004. Sekulić, Branko et al.: Primjena matematike za ekonomiste. Informator, Zagreb 1996. Spiegel, Murray R. / Stephens, Larry J.: Statistics. McGraw-Hill, 1999. Studenmund, A. H.: Using Econometrics: A Practical Guide, HarperCollins Publishers Inc., New York, 1996. Šošić, I.: Pregled formula iz statistike, Mikrorad, Zagreb Šošić, Ivan / Serdar, Vladimir: Uvod u statistiku. Školska knjiga, Zagreb, 2002. Šošić, Ivan: Primijenjena statistika. Školska knjiga, Zagreb, 2004. Šošić, Ivan: Zbirka zadataka iz statistike. Mikrorad, Zagreb, 1998. Wonnacott, Thomas H. / Wonnacott, Ronald J.: Introductory Statistics. Wiley, 1990.
202
Literatura: Internet: 1. 2. 3. 4.
5. 6. 7.
http://www.efos-statistika.com/ HyperStat Online (David M. Lane) Statistics: Power from Data! (Statistics Canada) Introductory Statistics: Concepts, Models and Applications (David W. Stockburger) Introduction to Probability (Charles M. Grinstead, J. Laurie Snell) Virtual Laboratories in Probability and Statistics The R Project for Statistical Computing
Sve tekuće informacije bit će objavljene na www.pravos.hr
203