Seminario Psicometria I

  • Uploaded by: msmpio
  • 0
  • 0
  • February 2021
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Seminario Psicometria I as PDF for free.

More details

  • Words: 5,155
  • Pages: 86
Loading documents preview...
Università degli Studi e Campus Facoltà di Scienze Psicologiche Corso Psicometria I

Relatori Prof.ssa Simona Musacchio Ing. Gianluca Pizzuti

Introduzione

 Cos' è la statistica?  Definizione Trilussa (nota di colore)  La  statistica  fornisce  gli  strumenti 

per  analizzare i fenomeni collettivi (caratteristiche  fisiche di un gruppo di soggetti).

Statistica descrittiva  Popolazione globale/campione Descrizione  Sintesi numerica  Analisi dei risultati

Statistica inferenziale  Campione  Stima delle caratteristiche  Sintesi numerica  Analisi dei risultati

Campione statistico/Popolazione

 Il  campione  statistico  è  un  sottoinsieme  dell'universo  di  riferimento,  caratterizzato  popolazione. 

da 

attributi 

comuni 

alla 

 La  popolazione  è  l'insieme  dei  soggetti  appartenenti  alla  categoria oggetto di studio.

Fasi dell'analisi statistica 1 Definizione obiettivi

Rilevazione

Analisi statistica

Elaborazione dati Interpretazione dati

Applicazione degli  esiti dell'analisi

Fasi dell'analisi statistica:definizione obiettivi 2

 Individuazione obiettivi  Delimitazione  della  ricerca  nel  tempo  e  nello  spazio

Fasi dell'analisi statistica:rilevazione

 L'osservazione  dei  fenomeni  mediante  opportuni  tecniche e strumenti

 L'oggetto  3

della  rilevazione  può  essere  l'intera  popolazione o un campione di essa rappresentativo

 Chi può fare la rilevazione?  Enti pubblici (Istat) ed Istituti privati  La  rilevazione  si  effettua  mediante  strutturati ai fini dell'analisi

formulari 

Fasi dell'analisi statistica:elaborazione dati

 Sintesi  dei  dati  più  significativi  mediante  l'utilizzo  di opportuni indici 

4

Fasi dell'analisi statistica:presentazione ed interpretazione dei dati

 Rappresentazione dei dati mediante tabelle, grafici  ed indici

 Spiegazione dei risultati

5

Fasi dell'analisi statistica:applicazione degli esiti dell'analisi

 La statistica non è fine a se stessa

Statistica

Economia

6

Demografia

.. .. .. .. ..

Medicina

Output

Indagine statistica: definizione 1

Il carattere oggetto di studio

2

La scala di misurazione del carattere

3

L'universo delle unità statistiche (popolazione)

4

L'ampiezza della rilevazione (totale o parziale)

Unità statistica :definizione

 Unità  statistica  :  elemento  base  della  popolazione  sul  quale viene rilevata la caratteristica oggetto di studio

●Unità semplici (persona, abitazione) ●Unità composta (famiglia, edificio) ●Unità  complesse,  insieme  di  unità  semplici  differenti,considerati  nella  loro  globalità  (rapporto coniugale, rapporto di lavoro)       

Carattere :definizione

 Carattere 

:  elemento  che  popolazione od un campione

descrive 

una 

 Modalità  :  valori  assunti  da  un  carattere  su  un'unità statistica

 Tipologia carattere  ●Qualitativo  o  Mutabile  (rappresentato  mediante attributi) ●Quantitativo (rappresentato mediante numeri)       

Variabile :definizione

 Variabile :  rappresentata mediante numeri  Modalità  :  valori  assunti  da  un  carattere  su  un'unità statistica

 Tipologia carattere  ●Qualitativo  o  Mutabile  (rappresentato  mediante attributi) ●Quantitativo (rappresentato mediante numeri)       

Variabili: tipologia

 Variabili Qualitative ● Modalità nominali (es. stato civile) ● Modalità ordinali (es. livello di istruzione)

 Variabili Quantitative ● Valori numerici (es. numero di figli)

 Variabili indipendenti (manipolata dallo sperimentatore)  Variabili dipendenti (misurate dallo sperimentatore)  Variabili di disturbo

Variabili: quantitative

 Variabili Quantitative ● Continue (numeri reali) ● Discrete (numeri interi)

Esempio di variabili dipendenti ed indipendenti 

30 adolescenti vengono convocati per un test di memoria, a 15 di loro,  prima  di  iniziare  la  prova  viene  detto  che  si  tratta  di  un  compito  particolarmente difficile, agli altri 15 non viene data alcune indicazione.  Indicare la variabile indipendente e quella dipendente.

   

VARIABILE INDIPENDENTE? Informazione sulla difficoltà della prova  VARIABILE DIPENDENTE? Punteggio test di memoria

LA MISURAZIONE: definizione

 Misurazione

● Assegnare  valori  numerici  ad  eventi/oggetti  secondo  le  proprietà del sistema numerico (S.I.)

 Scale di misurazione

● Scala  nominale  (variabili  o  mutabili;  i    numeri  hanno  valore di etichetta).   Operazioni di misurazione – Raggruppamento in classi – Conteggio delle frequenze delle classi

● Scala  ordinale  (ordinamento  secondo  una  specifica  caratteristica)  Operazione di misurazione – Confronti di ordine – Relazione di minore o maggiore

LA MISURAZIONE: le scale ad intervalli

 Scale ad intervalli ● Caratteristiche     

Fondo scala pari a 0 Unità di misura convenzionali Misurano la differenza tra eventi/oggetti L’ampiezza dell’intervallo è costante Operazioni di misura: addizione e sottrazione, trasformazione  dei numeri (normalizzazione)

 Esempi: ● Scala  Celsius,  Kelvin,  Q.I.,  Test  di  atteggiamento  e  di  personalità

LA MISURAZIONE: le scale a rapporti

 Scale a rapporti  ● Caratteristiche  Lo 0 equivale ad assenza di proprietà  Non assumono valori negativi  Operazioni di misura: addizione e sottrazione, trasformazione  dei numeri (normalizzazione), moltiplicazione e divisione

 Esempi: ● Distanza, statura, peso

Output delle misurazioni: Dati

Frequenza

Variabili quantitative

Punteggio

Misura

Variabili qualitative

Dati

Le Frequenze

 Definizione: ● è il numero delle volte secondo cui una modalità di una  variabile si presenta nella popolazione osservata

 Frequenze classificazione: ● Cumulate  (somma  progressiva  delle  frequenze  della  distribuzione) ● Relative  (frequenza  della  modalità/numero  totale  delle  osservazioni) ● Percentuali: freq.relat*100 (%)

Esempio MASCHI

28

FEMMINE

22

Maschi 28 Femmine 22

Fm = 28

F f = 22

Il totale delle osservazioni N=50 Le frequenze relative dei maschi  sono F. rel=28/50=0,56 Le frequenze percentuali dei  maschi sono F%0 28/50x100=  56%

1

Le Classi

 Definizione:

● è un raggruppamento di dati in definiti intervalli ● Ogni  intervallo  è  delimitato  da  un  estremo  inferiore  ed  estremo superiore ● La differenza tra sup­inf= ampiezza di classe

 Regole di costruzione delle classi:

● Non meno di 5 e non più di 20 ● Intervalli della medesima ampiezza ● Ampiezze preferite 3, 5, 10 o multipli ● Intervalli mutuamente esclusivi (es. 0­2, 3­5, 6­8….) ● Punto  medio  centrale  =(sup+inf)/2  ­>costruzione  poligono di frequenza

Le Classi: rappresentazione grafica

 Definizione: ● Spesso  per  avere  una  visione  d'insieme  di  una  distribuzione  di  frequenza  si  usa  rappresentarla  su  grafici.  ● istogramma:  in  cui  sull'ascissa  sono  riportate  le  modalità della distribuzione e sulle ordinate le rispettive  frequenze assolute o relative.

 Nel  caso  di  distribuzione    in  classi:  in  ascissa  vengono 

rappresentati  i  limiti  degli  intervalli  e  in  ordinata  le  frequenze.

Le Classi: rappresentazione graficaIstogramma 90 80 70 60 50 40

Est Ovest Nord

30 20 10 0

1° Trim.

2° Trim.

3° Trim.

4° Trim.

Le Classi: rappresentazione graficaPoligono di frequenza

 Definizione: ● Poligono  di  frequenza:  in  cui  sull'ascissa  sono  riportate  le  modalità ( il valore medio di ciascuna classe )e sull'ordinata  le  frequenze  relative  cumulate  e  i  punti  trovati  si  uniscono  con una spezzata ● Il  poligono  di  frequenza  si  utilizza  quando  il  ricercatore  è  interessato  a  rappresentare  nello  stesso  grafico  più  distribuzioni di frequenze relative a gruppi diversi.

Le Classi: rappresentazione graficaPoligono di frequenza Poligono di frequenza 100

fr

80 60

maschi femmine

40 20 0 1° Trim.

2° Trim.

3° Trim.

4° Trim.

Statistica descrittiva

 Definizione: ● I  dati  ottenuti  durante  uno  studio  empirico  (dati  grezzi)  possono  essere  sintetizzati  in  una  forma  analizzabile.  L’ampio  numero  di  osservazioni  si  può  ridurre  in  numero  più  piccolo  di  indici  statistici  (statistiche  descrittive).  ● Le principali statistiche descrittive sono:  Misure della tendenza centrale: moda, mediana, media  Misure della variabilità:range, differenza interquartile,  deviazione standard e varianza.

Statistica descrittiva-Moda

 Definizione:  La moda è rappresentata dal valore più frequente della 

distribuzione osservata. Può essere espresso in ogni scala  di misura (è l’unico indice di tendenza centrale per la scala  nominale) Quando la moda è unica si parla di distribuzione  unimodale, ma se ci sono due valori ugualmente frequenti  la distribuzione è detta bimodale.

Statistica descrittiva-Moda

 Esempio ● 10, 15, 13, 4, 9, 8, 15, 7, 13, 15, 2, 15, 19.   N = 13 ● Il  15  si  presenta  più  frequentemente,  quindi  è  il  valore  modale   La distribuzione è UNIMODALE

 Esempio ● 10, 15, 13, 4, 9, 8, 15, 7, 13, 15, 2, 13, 19.   N = 13, 15 ● Il  13  ed  il  15  si  presentano  più  frequentemente,  quindi  sono i valori modali   La distribuzione è BIMODALE

Statistica descrittiva-Mediana 

Definizione:

 

distribuzione (valore che divide in due parti uguali la distribuzione, al di sopra  e al di sotto del quale si trovano il 50% dei casi) la determinazione della mediana è diversa a seconda che sia n dispari o pari. Se n è dispari, la mediana e l'intensità individuata dal posto centrale: C = (n+1) / 2



 

MEDIANA  −E’  rappresentata  dal  valore  che  occupa  la  posizione  centrale  della 

Ad esempio, la mediana dell'intensità 3, 15, 9, 2, 6,12, 5, si ottiene innanzitutto  ordinando la serie: 2, 3, 5, 6, 9,12,15. Siccome le intensità sono sette, numero dispari, il posto centrale è unico ed è  pari a:

  C = (7+1) / 2 = 4 (posizione della mediana)



La  mediana  è  quindi,  l'intensità  individuata  dal  quarto  posto,  vale  a  dire  che  essa è uguale a 6.

Statistica descrittiva-Mediana 

Se  n  è  pari,  la  mediana  è  data  dalla  semisomma  delle  intensità  corrispondenti ai due posti centrali:

 

 



C = n / 2                       C = (n / 2) + 1   Ad esempio, la mediana delle intensità 7, 16, 2, 3, 9, 12, 15, 5, si ottiene  innanzitutto ordinando la serie: 2, 3, 5, 7, 9, 12, 15, 16. (n=8) Visto che si tratta di 8 numeri, numeri pari, i posti centrali sono due e  sono: C = 4  (7 )      e          C = 5 (9)  (posizioni della mediana) Pertanto, la mediana è dalla semisomma delle intensità individuate dal  quarto e dal quinto posto, vale a dire che essa è uguale a:

  Me = (7 + 9) / 2 = 8

Statistica descrittiva-Media 

MEDIA (è il centro di gravità della distribuzione)        ● La  media  aritmetica  è  data  dalla  somma  delle  misure  osservate  diviso il  numero delle osservazioni fatte (N) ● Si indica con M per i campioni e con μ per le popolazioni ● Può  essere  calcolata  su  scale  di  misura  ad  intervalli  e  a  rapporti  (scale METRICHE)

 

La  media  aritmetica  è  uguale  alla  somma  dei  termini  divisa  per  il  loro  numero.  Se  si  indicano  gli  n    termini  di  una  serie  con  x1,  x2,  x3…..  xn,  la  media  aritmetica sarà pari a:M = (x1 +  x2 +  x3 + ….. + xn )  / n Se  ad  esempio  avessimo  i  valori  1,  2,  3,  7,  10,  13,  specificano  la  formula sopra enunciata, si ottiene: M = (1+2+3+7+10+13) / 6 = 36/6 = 6 La formula può essere meglio come:M = Σ Xi/N      Oppure  M = Σ fi Xi/N (in  questo  caso  si  moltiplica  la  frequenza  di  ogni  classe  per  il  valore  medio di ogni classe) 

  

Statistica descrittiva-MediaEsempio

 M = Σ fi Xi/N  Valore=193/10

1

VOTI

FREQ.

VALORE*FREQ.

18

2

36

19

3

57

20

5

100

TOTALE

10

193

Statistica descrittiva-Indici di posizione  

Definizione: Gli indici  DI POSIZIONE indicano la posizione che un valore occupa all’interno di una distribuzione. ● QUARTILI ● DECILI ● PERCENTILI ● I percentili o quantili sono le intensità che dividono una distribuzione in due parti, lasciandola da  una parte x% dei casi e dall’altra parte il rimanente (100 – x%). I quantili si dicono quartili se dividono la distribuzione in 4 parti uguali, tali che:  il primo quartile lascia alla sinistra il 25% dei casi e alla sua destra il rimanente 75 % dei casi; il secondo quartile, che coincide con la mediana lascia alla sua sinistra il 50% dei casi ed alla  destra il rimanente 50%; il terzo quartile lascia alla sua sinistra il 75% dei casi ed alla sua destra  il rimanente 25%.        1° quartile    2° quartile     3° quartile __________|__________|___________|__________   Per calcolarli occorre: 1.     Ordinare in senso crescente la distribuzione 2.     Calcolare le frequenze cumulate 3.     Calcolare la posizione del quartile con le seguenti formule: 1° quartile  pos Q1= ((n+1)/4) *1° quartile  pos Q2= ((n+1)/4) *2 3° quartile  pos Q3=  ((n+1)/4) *3 

Statistica descrittiva-Indici di posizione-Quartili

 Esempio ● Pos Q1=n+1/4*1= 101+1/4*1=101+1/4*1=25.5 ● Corrisponde alla seconda posizione

1

1 2 3 4 5 6

Freq. 10 21 20 26 20 4 101

F.cum. 10 31 51 77 97 101

Statistica descrittiva-Indici di posizione-Decili, centili o percentili

 Esempio: ● Decili=  nove  punti  che  dividono  la  distrib.  In  10  parti. (pos D1= n+1/10*1;pos D3=n+1/10*3) ● Percentili=  99  punti  che  dividono  la  distrib.  In  100  parti  (pos.P1= n+1/100*1)

Statistica descrittiva-Indici di dispersione o variabilità

 Definizione: ● Le medie facilitano la comprensione della frequenza dei  fenomeni  collettivi.  Per  una  più  esatta  conoscenza  di  essi occorre però anche studiare la loro variabilità, cioè  la  capacità  di  assumere  differenti  valori  quantitativi  in  un  certo  periodo  di  tempo,  o  in  seguito  all’influenza  di  un altro o altri fenomeni.

Statistica descrittiva-Indici di dispersione o variabilità-Campo variazione

 

Campo di variazione E’ una misura della variabilità dei dati. Esso si ottiene dalla differenza  tra il valore massimo e quello minimo delle intensità di un fenomeno. CV = Xmax­Xmin



Ad esempio se le intensità di un dato fenomeno sono le seguenti:

  29 24 20 28 22 22 23



Il campo di variazione sarà:  29 – 20 = 9

Statistica descrittiva-Indici di dispersione o variabilità-Differenza Interquartile

●Definizione  Differenza  interquartile:  è  un  indice  più  robusto  ai  valori  anomali rispetto al campo di variazione. 

 IQR=Q3­Q1

Statistica descrittiva-Indici di dispersione o variabilità-Varianza ●Definizione  Scostamento semplice medio (SSM) è la differenza tra un singolo punteggio e il punteggio medio  Devianza è la somma degli scarti elevati al quadrato di ciascun  punteggio dalla media  Varianza: è la media dei quadrati degli scostamenti dalla media  di tutti i soggetti e indica la distanza media di ciascun soggetto  dalla media del campione.  Si indica con s2.

 Scostamento quadratico medio o deviazione standard: è la radice quadrata positiva della varianza 

Statistica descrittiva-Indici di dispersione o variabilità-Varianza ●Esempio 1 2 3 4 5 6 7

DATI  GREZZI

MEDIA

SCARTI  DALLA  MEDIA

SCARTI  QUADRATI

4 5 6 7 8 9 10 49

7 7 7 7 7 7 7

­3 ­2 ­1 0 1 2 3 0

9 4 1 0 1 4 9 28

Statistica descrittiva-Indici di dispersione o variabilità-Deviazione Standard Calcolo

●Calcolo  MEDIA= SX/N= 49/7=7  DEVIANZA= sommatoria degli scarti al quadrato= 28  VARIANZA= sommatoria degli scarti al quadrato/media=28/7=4  DEVIAZIONE STANDARD=la radice quadrata positiva della  varianza= 2 

Statistica descrittiva-Standardizzazione delle misure ●Definizione naif Per  poter  confrontare  in  maniera  adeguata  i  punteggi  ottenuti  da  soggetti  diversi  in  situazioni  diverse,  non  possiamo  accontentarci  di  guardare  il  punteggio  grezzo,  ma  dobbiamo  fare  un  confronto  con  dei  punteggi,  detti  standardizzati,  che  possano essere un riferimento generale.

Statistica descrittiva-Standardizzazione delle misure Per effettuare il confronto, si usano delle trasformazioniche  rendono confrontabili tra loro distribuzioni diverse.   2 tipi di trasformazioni: ● punti Z (in questo caso dobbiamo avere come riferimento la  media e la deviazione standard) ● percentili, decili, quartili (riferimento posizione nel gruppo)

Statistica descrittivaStandardizzazione delle misure-Z

 Formula Z transform

Xi − X Zi = s

Statistica descrittivaStandardizzazione delle misure-Z Esempio



Un bambino di 5 anni ha un punteggio 20 in test di lettura. Tuttavia, possiamo domandarci: la posizione nel test del  bambino di  5 anni è migliore rispetto al gruppo di 5 anni.  Confrontiamo il punteggio del bambino con la media del suo gruppo  (media=10;d.s.=5) Otteniamo che: il bambino è migliore rispetto alla media della classe. Standardizziamo il punteggio del bimbo (standardizzare una misura  significa riferire la misura stessa a una scala standard con media e  varianza note. La scala più comune è quella  della standard o z che  ha la media  0 e varianza 1.

Statistica descrittivaStandardizzazione delle misure-Z



Esempio Tale  trasformazione  si  ottiene  trasformando  una  serie  di  punteggi  xi  in  punteggi  zi  con  la  seguente  formula: Zi =

X i − X 20 − 10 = =2 s 5

 Il  bimbo  sta  2  deviazioni  standard  sopra  la   

media. Se la media del suo gruppo fosse stata di 25:

20 − 25 Zb = = −1 La  prestazione  del  bimbo  è  inferiore  alla  5 media del gruppo.

Statistica descrittiva-Standardizzazione delle misure-Percentili

 Il  percentile  è  il  valore  al  di  sotto  del  quale  si  trova  una  certa  percentuale di casi di una distribuzione.

 Esempio:il 94 percentile è il valore al di sotto del quale si trova il  94% dei casi di una distribuzione.

 Ad 

esempio  si  considera  la  distrib.  delle  medie  dei  voti  d’esame,  il  voto  29  corrisponde  al    94°  percentile  della  distribuzione

Statistica descrittiva-Standardizzazione delle misure-Percentili-Calcolo  Il calcolo dei vari percentili è analogo a quello per il 

calcolo della mediana, dividendo la numerosità totale  invece che per due, per il numero di classi che sono  individuate (10 per i decili, 100 per i centili, ecc.).

 Per i decili il primo decile sarà dato dal valore 

corrispondente alla posizione n/10, il secondo dalla  posizione 2*n/10,  il quinto da 5*n/10 (=nl2=Mediana), …….  il decimo da 10*n/10 (=n).

Statistica descrittiva-Standardizzazione delle misure-Percentili-Calcolo  Si esprime il punteggio di un soggetto in relazione alla posizione 

occupata dal soggetto(So) nella distribuzione (cioè nel gruppo di cui  fa parte). In particolare, si calcola la sua posizione come se il  gruppo fosse formato da 100 soggetti(Ss).  Procedura (simile alla mediana): – si ordinano i Ss (da quello che ha preso il punteggio più basso a quello che ha preso il punteggio più alto) – si vede che posizione occupa il So (per es., è il 30° in un distribuzione di 50 Ss) – si vede che posizione il So occuperebbe se ci fossero non 50 Ss ma 100 Ss. – è logico pensare che se il So è 30° su 50 Ss sarebbe 60° su 100 Ss. – si dice perciò che il So è al 60° percentile.

Statistica descrittiva-Standardizzazione delle misure-Percentili-Calcolo  In altre parole, si fa una proporzione: 30° : 50 = x : 100 x = 30/50 ×  100 = 60°

 Il percentile indica perciò la percentuale di Ss che hanno avuto un 

punteggio minore del So (e, per differenza, la percentuale di Ss che  hanno avuto un punteggio superiore).

 Un So è nel 25° percentile: significa che sotto di lui c’è il 25% dei  Ss e sopra di lui il 75%.

 Un soggetto al 50% percentile sta a metà. 

Statistica Inferenziale

 La  statistica  inferenziale  ha  come  obiettivo,  invece,  quello  di 

fare  affermazioni,  con  una  possibilità  di  errore  controllata,  riguardo la natura teorica (la legge probabilistica) del fenomeno  che si osserva. 

 La  statistica  inferenziale  è  fortemente  legata  alla  teoria  della  probabilità.

Probabilità • La probabilità che si verifichi un certo evento è uguale alla  frequenza (relativa) con cui l’evento si verifica in un numero di  prove sufficientemente grande, ripetute nelle medesime  condizioni.

P( A) = lim n →∞

fA n

• P(A) è la probabilità di verificarsi un evento A  • Lim  limite per n che tende all’infinito ∞ e indica un numero  molto grande • fA  frequenza con cui si è verificato l’evento A in un numero di  prove n  

Probabilità-Posteriori Probabilità a posteriori: è data dal rapporto tra i risultati  favorevoli e il totale delle prove effettuate, quando questo  numero diventa infinitamente grande. Il concetto di  probabilità a posteriori si riduce in definitiva a quello di  frequenza relativa di un fenomeno, quando il numero di  prove è finito (quella sopradetta). Non è possibile definire la probabilità in base ad un’unica  prova ma le prove devono essere molte e ripetute. Es: lanciando un dado 10 volte avremo la seguente  sequenza (4752928145) la probabilità di ottenere la faccia  5; basata sulla frequenza relativa in 10 lanci, è di 2/10=0.20

Probabilità-Teorica Definizione: probabilità a priori o teorica: è il rapporto tra  numero di casi favorevoli al verificarsi di un evento ed il  totale degli eventi possibili, supposti equiprobabili.  Riprendendo il caso del lancio di un dado non truccato, la  probabilità dell'evento ­   esce 6 è uguale a 1/6.

Probabilità-Concetti generali  Evento: uno dei possibili risultati di una prova; se la  prova consistesse nell’osservazione dell’esito del lancio  del dado, l’evento sarebbe la faccia 5.  La prob.di A si definisce con P(A), faccia 5.  Tutte le altre facce esclusa la 5 hanno la prob.P(non A) P(A) +P(non A)= 1 La somma delle probabilità di tutti gli eventi è uguale a  1 (probabilità dell’evento certo)

Probabilità-Concetti generaliPrincipio della somma •  La probabilità di verificarsi di due eventi mutualmente  escludentisi è uguale alla somma delle probabilità di  verificarsi  dei singoli eventi: P(A  U   B) = P (A)   +  P (B)  •  La probabilità che lanciando un dado si  ottenga l’evento numero dispari (faccia 1,3,5)  sarà  uguale: P1+P3+P5= 1/6+1/6+1/6=3/6= ½

Probabilità-Concetti generaliPrincipio del prodotto

 Definizione: Quando  due  eventi  si  verificano  simultaneamente  o  in  successione : P (A e B)  = P (A)   *  P (B)   la  probabilità  di  avere  2  con  due  dadi  è  data  dalla  prob.di  avere 1 con dado e 1 con l’altro. P (s=2)  = P (1)   *  P (1)= 1/6*1/6 = 1/36 La combinazione 1+ 1 è solo una dei 36 eventi possibili che  corrispondono  ai  36  diversi  modi  possibili    in  cui  si  possono  combinare  le  6  facce  del  primo  dado  con  le  6  facce del secondo. 

Probabilità-Concetti generaliProbabilità condizionata

 Definizione: Abbiamo trattato di eventi indip., quando invece si tratta di  eventi  non  indipen.  Ossia  quegli  eventi  che  il  verificarsi  dell’uno modifica la prob. del verificarsi dell’altro.  Ad  esempio  nel  lotto  l’aver  estratto  un  numero  (tra  i  90  possibili)  modifica  la  prob.  di  estrazione  del  numero  successivo (1/89) P (A B)  = P (A)   *  P (B/A)= P(B) P(A/B)

Probabilità-Concetti generaliProbabilità condizionata

  

P (∅) = 0; P (Ā) = 1­ P(A), dove Ā è not A P (A U B)= P(A) +P(B) ­ P(A∩B)

Probabilità-Concetti generaliProbabilità condizionata Tra due eventi A e B può sussistere una relazione per la  quale, sapendo che una prova ha generato un risultato  che appartiene a B, si è indotti a modificare la  valutazione del verificarsi di A. La probabilità dell'evento  B, dato che si è verificato l'evento A, è il rapporto fra la  probabilità del contemporaneo verificarsi di A e B e la  probabilità di A, se questa è diversa da zero. P( A B) =

P ( A ∩B ) ; P( B)

P ( B ) >0

P ( B A) =

P ( B ∩A) ; P ( A)

P ( A) >0

Probabilità-Distribuzione normale



La  Curva  normale  è  la  curva  continua  rappresentativa  delle distribuzioni che più frequentemente si incontrano in  statistica



E’  simmetrica  e  unimodale.  Media,  moda  e  mediana  coincidono.  I  valori  si  addensano  attorno  alla  media  (il  94,5dei  valori  sono  posizionati  entro  i  due  scarti  quadrati  medi  sopra  e  sotto  la  media.)  Per  descriverla  bastano  la  media e la d.s.



Un  solo  valore  appare  con  la  frequenza  massima,  quella  centrale,  e  sono  tanto  meno  frequenti  quanto  più  si  allontanano dal valore centrale.  

Probabilità-Distribuzione normale

Probabilità-Distribuzione normale

  

Si  applica  a  variab.  Continue  ossia  che  la  funzione  viene  definita  su  tutto  l’asse  dei  numeri  reali  da  ­∞  a  +∞  (sulle  ascisse  si  trovano  tutti  i  valori  di  x  e  sulle  ordinate  le  frequenze di ciascun valore) La somma di tutte le prob. È uguale a 1 Espressa dall’integrale: +∞

ƒ ƒ(x)dx=1 ­∞



Che esprime l’area racchiusa dalla distrib. a campana

Probabilità-Distribuzione normale     ­1/2 .(Χ­μ)2/ σ2

      

F(x)=1/σ√2π e  F(x)=frequenza di un dato valore di x X=qualsiasi valore nella distribuzione μ=media della distribuzione σ=deviazione standard della distrib. π=3,1416 e=2,7183(base dei logaritmi neperiani) σ 2 µ  sono media e varianza della popolazione

Probabilità-Distribuzione normaleEsempio



L’area sottesa nel punto x esprime qual’è la probababilità che  si  presenti  un  valore  inferiore  o  superiore  a  x.  Per  esempio  consideriamo  una  distribuzioni  di  voti  all’esame,  ci  sono  20  possibilità che uno studente abbia una media superiore al 27,5

Probabilità-Distribuzione normaleEsempio 

Vogliamo sapere qual è la prob. , in una distrib. di Q.I. µ = 100 σ = 10, di  ottenere un punteggio compreso tra 90 e 100: X2=100

ƒ

   ƒ(x)dx=? ­x1=90

      

 Trasformiamo i punti grezzi in punti z: Z1= x­µ /σ = 90­100/10= ­1 Z2= 100­100/10=0 L’integrale diventa:   0                                    ƒ f(z)dz=?                                                   ­1

L’area che ci interessa è l’area tra 0 e –1. Sulla tavola B troviamo l’area tra  0 e 1. Riga = I cifra decimale colonna= II cifra decimale Z1=1        riga=1.0   col.=0     = .3413 la risposta che cercavamo

Probabilità-Distribuzione binomiale     



Ad  ogni  evento  si  associa  una  prob.  che  assume  una  distribuzione che si definisce in base all’evento. X= evento  e f(x) la sua distribuzione . In caso x assume 2 valori (testa  e  croce),  eventi  indip.Se  eseguiamo  n  prove  avremo  una  distrib. teorica definita binomiale.

   

Equazione: f(x)= n C x p x q n­x   p= prob. che si verifichi l’evento Q= prob che non si verifichi l’evento n  C  x  =  numero  dei  modi  in  cui  si  possono  combinare  x  successi (n­x) insuccessi in n prove 

Probabilità-Distribuzione binomiale     

      



C x

Si  definisce  comb.  di  n  oggetti  a  r  a  r  ,  tutte  le  possibili  repliche  che  si  costituiscono  con  n  oggetti  senza  tener  conto dell’ordine degli oggetti stessi. La combinazione formula: n n C x  = { r}= n!/ r!  (n­r) !=  Il punto ! Si legge fattoriale e indica tutta la serie di numeri  naturali. Per es n=4    n!= 4= 4*3*2*1=24 4 4C 2  = { 2}= 4!/ 2!(4­2)!= 4*3*2*1/ (2*1) (2*1)=6

Probabilità-Distribuzione binomiale     



La  distribuzione  Binomiale  si  applica  in  caso  di  variab.  Discrete e dicotomiche.

  

È simmetrica se la prob, di verificarsi l’evento è p=0.50 p≠  0.50 non è asimmetrica Per  la  variabili  continue  si  utilizza  la  distribuzione  normale.

Verifica delle ipotesi



La  popolazione:  l’insieme  degli  elementi  a  cui  si  rivolge  il  ricercatore per la sua indagine.



Campione:  un  sottoinsieme  della  popolazione  che  ha  tutte  le  caratteristiche  della  popolazione  da  cui  proviene  (campione  rappresentativo)



Quando si lavora con dati del campione si ricorre alla stima dei  parametri  (che  non  sono  altro  che  media,  varianza,  etc.)  perché  non  si  conosce  la  distribuzione  della  popolazione  da  cui  i  soggetti provengono. Per ottenere  queste informazioni si  utilizzano i parametri del campione.

Verifica delle ipotesiCampionamento



Il  campionamento  casuale  corrisponde  ad  un'estrazione  da  una popolazione di un determinato numero di individui/oggetti.  Il campionamento casuale può essere: ● Con  reinserimento:  se  ogni  elemento  estratto  viene  reinserito  all’interno  della  popolazione  nella  quale  può  essere  di  nuovo  estratto  (in  questo  caso  la  popolazione  rimane la stessa) ; ● Senza  reinserimento:  la  popolazione  cambia  ad  ogni  estrazione  e con essa  la probabilità che ciascun  elemento  ha di essere estratto.

Verifica delle ipotesi-Parametri indicatori     

Il  Parametro  di  una  popolazione  è  la  caratteristica  oggetto  d’esame  nella  popolazione. Indicatore  o  statistica  sintetizza  la  caratteristica  oggetto  d’esame  nel  campione estratto casualmente dalla popolazione che ci interessa . Es Una volta determinata l’ampiezza   n   del campione, restano definite   n     variabili  casuali   X1, ognuna delle quali rappresenta l’i­esima estrazione,  che, a sua volta, è suscettibile di assumere il valore x1.  Una volta effettuato il campionamento si avranno a disposizione   n   valori  per le   n   variabili casuali e la media di quel determinato campione sarà  data  dalla  media  dei  valori  assunti  dalla  variabile  casuale.(indicatore  più  diffuso) Questa media non è altro che uno dei possibili valori che può assumere la  variabile casuale, detta media del campione o media campionaria.

Verifica delle ipotesi-Parametri indicatori-Distribuzione campionaria della media



Distribuzione  campionaria  della  media:  esempio  di  distribuzione  campionaria  NOTA  (che  quindi  ha  media,  varianza  e deviazione  standard  note) 



Si  chiama       ERRORE  STANDARD     la  deviazione  standard  delle  distribuzioni campionarie.



Proprietà dei parametri della distribuzione campionaria delle medie 



La  media  delle  medie  del  campione  coincide  con  la  media  della  popolazione  dalla  quale  i  campioni  sono  estratti.Anche  se  la  media  della  distribuzione  campionaria  è  uguale  alla  media  della  popolazione  non  è  detto  che  la  forma  sia  identica;  ciò  riguarda  l’ampiezza  del  campione:  aumentando l’ampiezza dei campioni aumenta la media di ciascuno di essi  diventando una stima più precisa della popolazione

Verifica delle ipotesi-Parametri indicatori-Distribuzione campionaria della media

 

Esiste  una  relazione  tra  la  variabilità  della  distribuzione  campionaria delle medie, la variabilità della popolazione (σ 2) e  l’ampiezza  del  campione  (n).  Tale  relazione  si  esprime  con:    Var. (x) = σ2 /n ovvero σ 2 x = σ2 /n   All’aumentare di n la variabilità (o varianza) della distribuzione  campionaria delle medie diminuisce fino a tendere a zero (per  la legge dei grandi numeri)

Verifica delle ipotesi-Esempio

    

Compito  del  ricercatore  è  quello  di  controllare  se  l’ipotesi  formulata  è  da    considerare  verificata  o  meno.  Significa  prendere una decisione. Dopo  aver  estratto  un  campione,dopo  aver  sintetizzato  i  dati  con  un  adeguato  indicatore,si  può  considerare  verificata  l’ipotesi?  O  il  valore  ottenuto  sul  campione  è  suff.  vicino  al  valore atteso in funzione dell’ipotesi? Il  problema  diventa  un  problema  di  distanza  tra  il  valore  ottenuto e il valore atteso:tale distanza può essere dovuta:  Al caso l’ipotesi nulla è vera Non al caso l’ipotesi nulla è falsa

Verifica delle ipotesi-Esempio

   

In  quest’ultimo  caso  si  può  formulare  un  ipotesi  alternativa  quando si può dubitare dell’ipotesi nulla Es: un ricercatore vuole sapere se topi affamati vanno sempre  nel braccio sinistro di un labirinto a 2 vie, anche in assenza di  cibo. Ipot. Nulla: i topi sceglieranno in egual misura il braccio sinistro  e quello destra (H0: p=.50) Ip.  Alter.:i  topi  scelgono  il  braccio  sinistro  in  un  numero  maggiore rispetto a quello destro che ci si potrebbe aspettare  dal caso (H1>.50) 

Verifica delle ipotesi-Esempio

     

Supponiamo  di  aver  estratto  un  campione  di  10  topi:  ci  attendiamo che i topi scelgono il braccio sinistro: μ0 =np= 10*.05= 5 Nel caso in cui l’ipot. Nulla sia vera. Effettuato  l’esperimento  i  topi  scelgono  6  volte  il  braccio  sinistro. Sulle tavole della distribuzione binomiale  Leggiamo  la  prob.  di  un  risultato  di  6  con  n=10  p=.50  otteniamo .20508 ossia una prob. del 20% di ottenere risultato  6. Per convenzione si sceglie con probabilità critica (α ) quella  pari al 5% (.05)

Verifica delle ipotesi-Esempio



Tutti i risultati che hanno prob. Di verificarsi minori di tale livello  sono considerati significativi ossia si accetta l’ipot. Alternativa.



Il  risultato  6  che  corrisponde  a  una  prob.  20%  è  superiore  al  5%. Accettiamo l’ipot. Nulla.

Verifica delle ipotesi-EsempioRegione Critica

I  livelli  di  probabilità  adottati  sono  0,05  0,01  e  0,001,  generalmente  indicati  α  e  detti  livelli  di  significatività.  Essi  determinano la regione di rifiuto per l'ipotesi nulla.

Verifica delle ipotesi-Errori



Si individuano due tipi di errori ● rifiutare H0 quando è vera, errore di primo tipo ● accettare H0 quando è falsa, errore di secondo tipo



I  livelli  di  di  probabilità  critica  α=  .050,.01,  .001  significa  rischiare  di  sbagliare  rifiutando  l’ipot.  Nulla  5  volte  su  100,  1  volta  su  100,  1  volta  su  1000.  Nell’ultimo  caso  l’errore  è  minimo  anche  se  esiste  la  possibilità  di  accettare  l’ipot.nulla  quando è vera l’ipot. Alternativa (errore di 2 tipo). 

Verifica delle ipotesi-Errori-Livelli di probabilità



si  Chiamiamo  β  la  prob.di  accettare  l’ipotesi  nulla  quando  è  vera H1;  ● 1­β si accetta H1 quando è vera (decisione corretta) ● 1­α si accetta Ho quando è vera (decisione corretta)

 

α si accetta Ho quando è falsa La quantità 1­β si chiama potenza del test ed esprime quindi la  capacità di un test statistico riconoscere la falsità di H0  quando  questa è effettivamente falsa. 

 TRYSTORMING… Just do it !!!

Termine seminario

Studiare

Esercitarsi

Rilassarsi

Related Documents

Seminario Psicometria I
February 2021 1
Psicometria - Ruiz
January 2021 2
Seminario
February 2021 1
Ta Psicometria Nataly
January 2021 1

More Documents from ""

Seminario Psicometria I
February 2021 1