Distribución De Pareto

  • Uploaded by: Vanesa Cadin
  • 0
  • 0
  • August 2022
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Distribución De Pareto as PDF for free.

More details

  • Words: 2,248
  • Pages: 9
Loading documents preview...
Distribución de Pareto La distribución de Pareto fue introducida por el ingeniero, sociólogo, economista y filósofo italiano Vilfredo Pareto ( París, Francia, 15 de julio de 1848 - Céligny, Suiza, 19 de agosto de 1923 ) como un modelo para explicar la distribución de las rentas de los individuos de una población, siempre y cuando se partiera de dos supuestos, la existencia de un valor crítico (𝑋𝑚 ) de forma que no haya rentas inferiores a dicho valor y el decrecimiento de manera potencial del porcentaje de individuos con una renta superior o igual a un cierto valor de renta a medida que dicho valor de renta crece. El uso de esta distribución se ha ido ampliando a diferentes ámbitos de estudio. Se trata de una distribución de probabilidad continua biparamétrica, con parámetros de forma (α) y de situación (𝑥𝑚 ). El último parámetro, 𝑥𝑚 , es un indicador de posición (valor mínimo) que, en términos económicos, puede interpretarse como el ingreso mínimo de la población. El parámetro α está asociado con la dispersión, donde a mayor valor se obtienen densidades de Pareto más concentradas en las proximidades de 𝑥𝑚 , es decir, menos dispersas.

Probabilidad acumulada El mundo empírico muestra fenómenos cuya realización es susceptible de presentar diversos resultados, y para la frecuencia con que éstos aparecen resulta adecuado suponer que la distribución de probabilidad de variable aleatoria X, asociada a los posibles resultados de una realización cualquiera, cumple con las condiciones: 𝑋𝑚 𝛼 ( ) 𝑠𝑖 𝑥 > 𝑥𝑚 𝑃(𝑋 > 𝑥) = { 𝑥 0 𝑠𝑖 𝑥 < 𝑥𝑚 Funciones de distribución de probabilidad para diferentes α con 𝑥𝑚 = 1. El eje horizontal es el parámetro x. Siendo 𝑥𝑚 > 0 La función de distribución de X, que satisface las anteriores condiciones, es: 𝐹(𝑥) = 1 − 𝑃(𝑋 > 𝑥) 𝑋𝑚 𝛼

𝐹(𝑥) = 1 − (

𝑥

) para 𝑥 > 𝑋𝑚 , 𝑋𝑚 > 0

Donde 𝑋𝑚 es el valor mínimo posible (positivo) de X y α es un parámetro.

Función de Densidad A partir de la probabilidad acumulada, se puede deducir mediante una derivada que la función de densidad de probabilidad es:

𝑓𝑋 (𝑥) = 𝐹 ′ (𝑥) = 𝛼

𝛼 𝑥𝑚 𝑥 𝛼+1

Funciones de densidades de probabilidad para diferentes α con 𝑥𝑚 = 1. El eje horizontal es el parámetro x. Como α → ∞ la distribución se aproxima a ẟ(𝑥 − 𝑥𝑚 ) donde ẟ es la delta de Dirac.

Propiedades: Media, esperanza o valor esperado: 𝛼𝛽

µ = 𝛼−1 solo para α > 1 Demostración: ∞



µ = 𝐸(𝑋) = ∫ 𝑥 𝑓(𝑥) 𝑑𝑥 = ∫ 𝑥 −∞

𝛽

𝛼𝛽 𝛼 ∞−𝛼+1 𝛽 −𝛼+1 𝛼 𝑑𝑥 = 𝛼𝛽 ( − ) 𝑥 𝛼+1 −𝛼 + 1 −𝛼 + 1

si α > 1: ∞−𝛼+1 1 (−𝛼 + 1) < 0 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 = − = 0, 𝑝𝑜𝑟 𝑙𝑜 𝑞𝑢𝑒 µ −𝛼 + 1 ∞ −𝛼+1 −𝛼+1 ∞ 𝛽 𝛽 −𝛼+1 𝛼𝛽 𝛼−𝛼+1 = 𝛼𝛽 𝛼 ( − ) = 𝛼𝛽 𝛼 (0 − ) = −( ) −𝛼 + 1 −𝛼 + 1 −𝛼 + 1 −(𝛼 − 1) 𝛼𝛽 = 𝛼−1 si α = 1 ∞−𝛼+1 ∞0 (−𝛼 + 1) = 0 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 = 𝑝𝑜𝑟 𝑙𝑜 𝑐𝑢𝑎𝑙 µ −𝛼 + 1 0 ∞−𝛼+1 𝛽 −𝛼+1 = 𝛼𝛽 𝛼 ( − ) −𝛼 + 1 −𝛼 + 1 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑖𝑛𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑐𝑖ó𝑛 𝑝𝑜𝑟 𝑙𝑜 𝑞𝑢𝑒 µ 𝑛𝑜 𝑒𝑥𝑖𝑠𝑡𝑒.

Si 𝛼 < 1: (−𝛼 + 1) > 0 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠

∞−𝛼+1 −𝛼+1

= ∞ , 𝑒𝑛 𝑐𝑜𝑛𝑠𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 µ = 𝛼𝛽 𝛼 (∞ −

𝛽 −𝛼+1 −𝛼+1

)=

∞, 𝑦 𝑒𝑠𝑡𝑜 𝑛𝑜 𝑒𝑠 𝑢𝑛 𝑣𝑎𝑙𝑜𝑟 𝑝𝑎𝑟𝑎 µ 𝑝𝑜𝑟 𝑙𝑜 𝑞𝑢𝑒 𝛼 𝑠𝑜𝑙𝑜 𝑣𝑎𝑙𝑒 𝑐𝑢𝑎𝑛𝑑𝑜 𝛼 > 1

Método de estimación por momentos: Cuando tenemos una muestra y queremos estimar el parámetro α, utilizamos el método de estimación por momentos, que consiste en igualar el parámetro muestral con el parámetro poblacional, en este caso igualamos las medias muestral con el parámetro poblacional, en este caso igualamos las medias muestral y poblacional, y despejar α.

𝛼𝛽 = 𝑥̅ 𝛼−1 𝛼𝛽 = 𝑥̅ (𝛼 − 1) 𝛼𝛽 = 𝑥̅ 𝛼 − 𝑥̅ 𝑥̅ = 𝑥̅ 𝛼 − 𝛼𝛽 𝑥̅ = 𝛼(𝑥̅ − 𝛽) 𝑥̅ =𝛼 𝑥̅ − 𝛽

Varianza: 2

𝜎 = 𝑉𝑎𝑟(𝑋) = 𝐸[(𝑋 − µ)

2]

= 𝐸(𝑋

2)

𝛼𝛽 2 −µ = (𝛼 − 2)(𝛼 − 1)2 2

Demostración: Resolviendo por partes: ∞

𝐸(𝑋

2)

= ∫ 𝑥 2 𝑓(𝑥) 𝑑𝑥 −∞ ∞

𝛼𝛽 𝛼 = ∫ 𝑥 𝛼+1 𝑑𝑥 𝑥 𝛽 2

∞ 𝛼

= 𝛼𝛽 ∫ 𝛽

1 𝑥 𝛼+1−2

∞ 𝛼

𝑑𝑥 = 𝛼𝛽 ∫ 𝑥 𝛽

−𝛼+1

∞−𝛼+2 𝛽 −𝛼+2 = 𝛼𝛽 ( − ) −𝛼 + 2 −𝛼 + 2 𝛼

Si 𝛼 > 2:

∞−𝛼+2 −1 (−𝛼 + 2) < 0 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 = = 0, 𝑒𝑛 𝑐𝑜𝑛𝑠𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐸(𝑋 2 ) −𝛼 + 2 ∞ ∞−𝛼+2 𝛽 −𝛼+2 𝛽 −𝛼+2 𝛼 𝛼 = 𝛼𝛽 ( − ) = 𝛼𝛽 (0 − ) −𝛼 + 2 −𝛼 + 2 −𝛼 + 2 𝛼𝛽 𝛼−𝛼+2 𝛼𝛽 2 = = −(𝛼 − 2) 𝛼 − 2 Si 𝛼 = 2

∞−𝛼+2 ∞0 (−𝛼 + 2) = 0 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 = , 𝑝𝑜𝑟 𝑙𝑜 𝑞𝑢𝑒 < 𝐸(𝑋 2 ) −𝛼 + 2 0 ∞−𝛼+2 𝛽 −𝛼+2 𝛼 = 𝛼𝛽 ( − ) −𝛼 + 2 −𝛼 + 2 ∞0 𝛼 = 𝛼𝛽 ( 0 𝛽 −𝛼+2 − ) 𝑝𝑜𝑟 𝑙𝑜 𝑐𝑢𝑎𝑙 𝐸(𝑋 2 ) 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑖𝑛𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑐𝑖ó𝑛, 𝑒𝑛𝑡𝑜𝑛𝑒𝑠 𝑛𝑜 𝑒𝑥𝑖𝑠𝑡𝑒. −𝛼 + 2

Si 𝛼 < 2

∞−𝛼+2 (−𝛼 + 2) > 0 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 = ∞ 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝐸(𝑋 2 ) −𝛼 + 2 −𝛼+2 𝛽 = 𝛼𝛽 𝛼 (∞ − ) −𝛼 + 2 = ∞ 𝑦 𝑒𝑠𝑡𝑒 𝑛𝑜 𝑒𝑠 𝑢𝑛 𝑣𝑎𝑙𝑜𝑟 𝑣𝑎𝑙𝑖𝑑𝑜 𝑝𝑎𝑟𝑎 𝐸(𝑋 2 ) Por lo que 𝐸(𝑋 2 ) solo vale cuando 𝛼 > 2. Por otro lado sabemos: µ2 = (

𝛼𝛽

2

) 𝛼−1

Entonces:

𝛼𝛽 2 𝛼𝛽 2 𝜎 = 𝑉𝐴𝑅(𝑋) = 𝐸[(𝑋 − µ) = 𝐸(𝑋 − µ = −( ) 𝛼−2 𝛼−1 𝛼𝛽 2 (𝛼 − 1)2 − 𝛼 2 𝛽 2 (𝛼 − 2) = (𝛼 − 2)(𝛼 − 1)2 𝛼 3 𝛽 2 − 2𝛼 2 𝛽 2 + 𝛼𝛽 2 − 𝛼 3 𝛽 2 + 2𝛼 2 𝛽2 = (𝛼 − 2)(𝛼 − 1)2 𝛼𝛽 2 = (𝛼 − 2)(𝛼 − 1)2 2

2]

2)

2

Valido para 𝛼 > 2 Por lo que ya podemos calcular el desvio estándar:

𝛼𝛽 2 √𝛼𝛽 𝜎=√ = (𝛼 − 2)(𝛼 − 1)2 √𝛼 − 2(𝛼 − 1)

Coeficiente de variación o dispersión: √𝛼𝛽 𝜎 √𝛼 − 2(𝛼 − 1) √𝛼𝛽(𝛼 − 1) √𝛼 𝐶𝑉(𝑋) = = = = 𝛼𝛽 µ √𝛼 − 2(𝛼 − 1)𝛼𝛽 𝛼√𝛼 − 2 𝛼−1 𝛼 1 1 =√ 2 =√ = 𝛼 (𝛼 − 2) 𝛼(𝛼 − 2) √𝛼(𝛼 − 2) Reflejando que la dispersión solo depende del parámetro α se necesita 𝛼 > 10 para obtener un 𝐶𝑉 <

10%

ya que si 𝛼 = 10 entonces 𝐶𝑉(𝑋)

0.11 ~ 11% y cuando 𝛼 = 11 entonces 𝐶𝑉(𝑋) Cuanto más grande es α , más chico es el CV (X).

1 √11(11−2)

1 √10(10−2)

= 0.10 ~ 10%

=

Mediana: 𝛽𝛼 𝐹(𝑥) = 1 − 𝛼 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑝𝑎𝑟𝑎 𝑜𝑏𝑡𝑒𝑛𝑒𝑟 𝑙𝑎 𝑓𝑢𝑛𝑐𝑖ó𝑛 𝑖𝑛𝑣𝑒𝑟𝑠𝑎 𝑥 𝑥 𝛽𝛼 = 1 − 𝛼 𝑝𝑜𝑟 𝑙𝑜 𝑞𝑢𝑒 𝑑𝑒𝑠𝑝𝑒𝑗𝑎𝑛𝑑𝑜 𝑦 𝑜𝑏𝑡𝑒𝑛𝑒𝑚𝑜𝑠 ∶ 𝑦 𝑦 =𝐹

−1 (0.5)

𝛼 −𝛽 𝛼 𝛼 −𝛽 𝛼 = √ = √ = √2𝛽𝛼 1 0.5 − 1 − 2 𝛼

𝛼 −𝛽 𝛼 𝛼 = 𝛽 √2 𝑦 𝑙𝑜𝑠 𝑐𝑢𝑎𝑟𝑡𝑖𝑙𝑒𝑠 𝑠𝑜𝑛: 𝐹 −1 (0.25) = √ 0.25 − 1 𝛼 𝛼 𝛽𝛼 𝛽𝛼 𝛽 −𝛽 𝛼 −1 = √ = 𝑦 ∶ 𝐹 (0.75) = √ = √ 0.75 𝛼√0.75 0.75 − 1 0.25 𝛽 =𝛼 √0.25 𝛼

Parámetros de forma: Coeficiente de simetría:

Curtosis:

2(1+𝛼) 𝛼−3



6(𝛼 3 +𝛼 2 −6𝛼−2) 𝛼(𝛼−3)(𝛼−4)

𝛼−2 𝛼

𝑝𝑎𝑟𝑎 𝛼 > 3

𝑝𝑎𝑟𝑎 𝛼 > 4

Función generadora de momentos (mgf): 𝛼(−𝑥𝑚 𝑡)𝛼 𝛤(−𝛼, −𝛼𝑚 𝑡)

𝑝𝑎𝑟𝑎 𝑡 ≤ 0

Caso degenerado La función de la delta de Dirac es un caso límite de la densidad de Pareto:

lim 𝑓(𝑥; 𝛼, 𝑥𝑚 ) = ẟ(𝑥 − 𝑥𝑚 )

𝛼→∞

Índice de Pareto Cuando esta distribución es usada en un modelo sobre la distribución de riqueza, el parámetro α es conocido como índice de Pareto. Cuanto más grande sea el índice de Pareto, más pequeña será la proporción de gente muy rica. En economía, el índice de Pareto, es una medida de la amplitud de la distribución de los ingresos. Es uno de los parámetros que especifican la distribución Pareto e incorpora el principio de Pareto, que consistía en la observación de que el 20 por ciento de los miembros de la sociedad italiana poseían el 80 por ciento de la riqueza. Una de las caracterizaciones más simples de la distribución de Pareto, cuando se usa para modelar la distribución de riqueza, dice que la proporción de la población cuya riqueza excede cualquier número positivo 𝑥 > 𝑥𝑚 es:

(

𝑥𝑚 𝛼 ) 𝑥

donde 𝑥𝑚 es la riqueza de la gente más pobre donde el subíndice m significa mínimo. Dado 𝑝 + 𝑞 = 1 , con 𝑝 > 𝑞, el índice de Pareto se da por: 𝛼 = 𝑙𝑜𝑔𝑝/𝑞 1/𝑞 = log(1/𝑞)/log(𝑝/𝑞) = log 1 − log(𝑞)/log(𝑝) − log(𝑞) = 0 − log(𝑞)/log(𝑝) − log(𝑞) = (−1). (− log(𝑞))/(−1). log(𝑝) − log(𝑞) = log(𝑞)/log(𝑞) − log(𝑝) = 𝐥𝐨𝐠(𝒒)/𝐥𝐨𝐠(𝒒/𝒑) Si 𝑞 = 1/𝑛, entonces: 𝛼 = log(1/𝑛)/log(1/𝑛. 𝑝) = log(1) − log(𝑛)/log(1) − log(𝑛. 𝑝) = log(𝑛)/log(𝑛. (1 − 𝑞)) = log(𝑛)/log(𝑛. (1 − (1 − 𝑛))) = 𝒍𝒐𝒈(𝒏)/𝒍𝒐𝒈(𝒏 − 𝟏) Alternativamente, en términos de razones, 𝑋 ∶ 𝑌 𝛼 = 𝑙𝑜𝑔𝑋/𝑌 (𝑋 + 𝑌)/𝑌 así 𝑋 ∶ 1 , con ( Y = 1) quedaría: 𝛼 = log(𝑋 + 1) /1/log(𝑋/1) = 𝒍𝒐𝒈(𝑿 + 𝟏)/𝒍𝒐𝒈(𝑿)

Por ejemplo para la regla 80/20 :

99 − 1 se corresponde con 𝛼 = log(100) /log(99) ≅ 1.002 90 − 10 (9: 1) se corresponde con 𝛼 = log(10) /log(9) ≅ 1.05 80 − 20 (4: 1) se corresponde con 𝛼 = log(5) /log(4) ≅ 1.16 67 − 33 (2: 1) se corresponde con 𝛼 = log(3) /log(2) ≅ 1.585

Valor esperado y varianza Un punto relevante a retener en el caso de una distribución de Pareto es que al contrario de lo que ocurre en una distribución de Probabilidad Normal, el valor esperado y la varianza dan bastante poca información sobre la muestra, y en ciertos casos extremos como el de la paradoja de San Petersburgo pueden ser infinitos, por lo que es mucho mejor concentrarse en la mediana o moda de la muestra. La distribución de probabilidad de Pareto es la distribución de probabilidad típica de variables estadísticas aleatorias que parten de cero, que no tienen un límite superior definido y cuya probabilidad de ocurrencia es baja.

Ejemplo 1: Los salarios mensuales en cierto sector económico se modelan una r.v X (en miles de pesos) sigue una distribución de Pareto con parámetros 𝛼 = 2.4 y 𝛽 = 9. 𝑋~ 𝑃𝑎𝑟𝑒𝑡𝑜(2.4 ; 9) 𝐷𝑒𝑛𝑠𝑖𝑑𝑎𝑑: 𝑓(𝑥) =

2.4 ∗ 92.4 𝑥 2.4+1

𝐴𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎: 𝐹(𝑥) = 1 −

92.4 𝑥 2.4

Función cuantil: 2.4

𝐹 −1 (0.5) = √2 ∗ 92.4 = 12.01 ~12

Cuartiles 𝐹 −1 (0.25) = 𝐹 −1 (0.75) =

9 2.4

√0.75 9

2.4

√0.25

= 10.15 ~ 10 (𝑄1 ) = 16.04 ~16(𝑄3 )

Dados estos parámetros podemos decir inicialmente que en ese sector económico el salario mínimo es de $9.000. Por los valores de la mediana y cuartiles el 50% de la población activa tiene un salario hasta $12.000, o que el 50% de la población gana más de $12.000. Por otro lado, el 25% de dicha población recibe un salario mínimo de hasta $10.000 y el 75% recibe un salario de hasta $16.000 , dicho de otro modo, solo un 25% de la población gana más de $16.000.

Calculamos la media, varianza y desvío estándar:

𝑀𝑒𝑑𝑖𝑎(µ) =

2.4 ∗ 9 = 15.43 2.4 − 1

Entre 15.000 y 16.000 pesos es el salario personal esperado en el sector.

𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎(𝜎 2 ) =

2.4 ∗ 92 = 247.9 miles de 𝑝𝑒𝑠𝑜𝑠 2 (2.4 − 2)(2.4 − 1)2

𝜎 = √247.9 = 15.74 𝑚𝑖𝑙 𝑝𝑒𝑠𝑜𝑠 A partir de estos datos podemos calcular el coeficiente de variación: 𝐶𝑉(𝑋) =

15.74 = 1.02 15.43

Lo que significa que la media es poco confiable por lo tanto como medida de tendencia es preferible utilizar la mediana ya calculada. Con respecto a los parámetros de forma, curtosis y coeficiente de simetría , no existen para este ejemplo dado el valor de 𝛼 = 2.4 ya que para la curtosis se requiere que 𝛼 > 3 y para el coeficiente de simetría 𝛼 > 4. ¿Cuál es la proporción que perciben más de 18.000 pesos al mes? 𝑃(𝑋 ≥ 18) = 1 18

−∫ 9

18 2.4 ∗ 92.4 18−2.4 − 9−2.4 2.4 −3.4 2.4 = 1 − 2.4 ∗ 9 ∫ 𝑥 𝑑𝑥 = 1 − 2.4 ∗ 9 ( )= 𝑥 2.4+1 −2.4 9

= 0.189 ~19

¿Cuál es la proporción de asalariados que perciben menos de 15.000 pesos? 𝑃(𝑋 < 15) = 𝐹(15) = 1 −

92.4 = 0.7~70% 152.4

¿Cuál es la proporción de asalariados que perciben entre 10.000 y 13.000 pesos? 13

13 2.4 ∗ 92.4 13−2.4 − 10−2.4 2.4 −3.5 2.4 ∫ 𝑑𝑥 = 2.4 ∗ 9 ∫ 𝑥 𝑑𝑥 = 2.4 ∗ 9 ( ) 𝑥 2.4+1 −2.4 10 10 = 0.36~36%

Related Documents

Diagrama De Pareto
January 2021 2
Diagrama De Pareto
January 2021 1
Diagram Pareto
February 2021 1
Poli Lex Pareto
March 2021 0

More Documents from "Lor Belleza"