Rosa Millones - Estadistica Descriptiva Y Probabilidades-universidad De Lima (2018)

  • Uploaded by: Yis Arvizu
  • 0
  • 0
  • March 2021
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Rosa Millones - Estadistica Descriptiva Y Probabilidades-universidad De Lima (2018) as PDF for free.

More details

  • Words: 82,596
  • Pages: 322
Loading documents preview...
Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios / Rosa Millones, Emma Barreno, Félix Vásquez, Carlos Castillo. Primera edición, primera reimpresión. Lima: Universidad de Lima. Fondo Editorial, 2018. 332 páginas: gráficos, ilustraciones. (Textos Universitarios). Bibliografía: página 311. 1. Estadística descriptiva. 2. Probabilidades (Estadística). 3. Variables aleatorias. 4. Ingeniería - - Estadística aplicada. 5. Negocios - - Estadística aplicada. I. Millones-Rivalles, Rosa, autora. II. Barreno-Vereau, Emma-Virginia, autora. III. Vásquez-Urbano, Félix, autor. IV. Castillo-Crespo, Carlos, autor. V. Universidad de Lima. Fondo Editorial. 519.53 E

ISBN 978-9972-45-392-2

Colección Textos Universitarios Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios Primera edición: junio, 2017 Primera reimpresión: abril, 2018 Tiraje: 700 ejemplares © De esta edición: Universidad de Lima Fondo Editorial Av. Javier Prado Este N.o 4600, Urb. Fundo Monterrico Chico, Lima 33, Perú Apartado postal 852, Lima 100 Teléfono: 437-6767, anexo 30131 [email protected] www.ulima.edu.pe Diseño, edición y carátula: Fondo Editorial de la Universidad de Lima Imagen de portada: Natee K Jindakum / Shutterstock.com Impreso en el Perú Se prohíbe la reproducción total o parcial de este libro, por cualquier medio, sin permiso expreso del Fondo Editorial. ISBN 978-9972-45-392-2 Hecho el depósito legal en la Biblioteca Nacional del Perú n.o 2018- 04506

Índice

Presentación

11

Capítulo 1. Estadística descriptiva 1. División de la estadística 2. Conceptos básicos 3. Descripción tabular y gráfica de variables 3.1 Distribución de frecuencias de variable cualitativa 3.1.1 Gráfico de barras 3.1.2 Gráfico circular 3.2 Distribución de frecuencias de variable cuantitativa 3.2.1 Distribución de frecuencias de variable cuantitativa discreta 3.2.2 Distribución de frecuencias de variable cuantitativa continua 3.3 Diagrama de Pareto 4. Medidas de tendencia central 4.1 Media aritmética (promedio) 4.2 Mediana 4.3 Moda 4.4 Relaciones entre la media, la mediana y la moda 5. Medidas de posición 5.1 Cuartiles 5.2 Percentiles 6. Medidas de dispersión 6.1 Rango o amplitud 6.2 Rango intercuartílico 6.3 Varianza 6.4 Desviación estándar 6.5 Coeficiente de variación 7. Medidas de forma 7.1 Coeficiente de asimetría 7.1.1 Coeficiente de asimetría de Pearson 7.1.2 Coeficiente de asimetría de Fisher 7.2 Coeficiente de curtosis 8. Análisis exploratorio de datos

13 15 15 17 18 18 19 25 25 27 38 40 41 42 42 49 50 50 52 54 54 55 55 56 57 63 63 64 64 64 66

Índice

7

8.1 Gráfico de cajas 9. Problemas resueltos 10. Problemas propuestos

67 71 93

Capítulo 2. Probabilidad 107 1. Conceptos básicos 109 109 1.1 Experimento aleatorio o al azar 1.2 Espacio muestral 109 1.3 Suceso 110 110 1.4 Evento 2. Técnicas de conteo 112 112 2.1 Principio de adición 2.2 Principio de multiplicación 113 2.3 Permutaciones 114 2.3.1 Permutaciones de n elementos sin repetición 114 2.3.2 Permutaciones de n elementos sin repetición tomados de k en k 115 2.3.3 Permutaciones con elementos iguales 116 2.4 Combinaciones 117 3. Probabilidad 119 3.1 Introducción 119 3.2 Probabilidad clásica o a priori 119 121 3.3 Probabilidad relativista 3.4 Definición axiomática 122 4. Teoremas de probabilidad 123 4.1 Probabilidad condicional 123 4.2 Teorema de la multiplicación 124 4.3 Teorema de la probabilidad total 125 4.4 Teorema de Bayes 125 4.5 Probabilidad de eventos independientes 128 5. Problemas resueltos 132 6. Problemas propuestos 151 Capítulo 3. Variable aleatoria 1. Definición 2. Tipos de variables aleatorias 2.1 Variable aleatoria discreta 2.1.1 Definición 2.1.2 Función de probabilidad de una variable aleatoria discreta 2.1.3 Función de distribución 2.2 Variable aleatoria continua 2.2.1 Definición 2.2.2 Función de densidad de probabilidad de una variable aleatoria continua 2.2.3 Función de probabilidad acumulativa (distribución)

8

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

157 159 161 161 161 161 164 167 167 167 170

3. Esperanza matemática y varianza de una variable aleatoria 3.1 Esperanza matemática 3.1.1 Definición 3.1.2 Propiedades 3.2 Varianza 3.2.1 Definición 3.2.2 Propiedades 4. Interpretación de la esperanza matemática, varianza y coeficiente de variación de una variable aleatoria 5. Problemas resueltos 6. Problemas propuestos Capítulo 4. Distribuciones de probabilidad 1. Distribuciones de probabilidad 2. Distribuciones de probabilidad de variables aleatorias discretas 2.1 Distribución de Bernoulli 2.2 Distribución binomial 2.3 Distribución hipergeométrica 2.4 Distribución de Poisson 3. Distribuciones de probabilidad de variables aleatorias continuas 3.1 Distribución uniforme continua 3.2 Distribución triangular 3.3 Distribución normal 3.4 Distribución exponencial 3.5 Distribución gamma 3.6 Relación entre las distribuciones de Poisson, exponencial y gamma 3.6.1 Relación de la distribución de Poisson con la distribución exponencial 3.6.2 Relación de la distribución de Poisson con la distribución gamma 3.7 Distribución de Weibull 3.8 Distribución ji-cuadrado 3.9 Distribución t de Student 3.10 Distribución F de Fisher-Snedecor 4. Problemas resueltos 5. Problemas propuestos

171 171 171 171 175 175 175 178 181 199 207 209 209 209 210 215 221 225 225 229 231 240 242 245 245 246 246 250 254 256 260 282

Respuestas a los problemas propuestos

299

Bibliografía

311

Anexos Anexo 1: Resumen de fórmulas de estadística descriptiva Anexo 2: Resumen de fórmulas de probabilidad Anexo 3: Distribuciones notables de probabilidad

315 316 317

Índice

9

Presentación

En el mundo actual es imprescindible el uso de herramientas estadísticas que faciliten el procesamiento y comprensión de la información para así desarrollar un pensamiento reflexivo y analítico asociado a la realidad en diversos aspectos del ámbito profesional y social. Para ello, mediante el proceso de enseñanzaaprendizaje, se deben aplicar estrategias que permitan al alumno desarrollar su capacidad para enfrentar con éxito situaciones problemáticas, sintetizándolas en un lenguaje simbólico y gráfico para su mejor resolución. El propósito de este libro es proporcionar a los estudiantes que cursan una primera asignatura de estadística y probabilidad los conocimientos y nociones básicas en esta materia de una manera ágil y de fácil comprensión, a través de numerosos y variados ejemplos y problemas resueltos, gran parte de ellos mediante el uso de programas. Al final de cada capítulo se ha incluido un conjunto de problemas propuestos como una herramienta pedagógica que permita desarrollar las habilidades del alumno afianzando los nuevos conocimientos adquiridos y preparándolo para que pueda resolver problemas similares que se le presenten en su vida profesional, tanto en el ámbito de la ingeniería y sus procesos, así como en los negocios y la actividad empresarial. Entendemos que resolver problemas es una habilidad que se adquiere con la práctica, como los deportes, y mediante la metodología propuesta en el presente libro se brinda un sustento y ayuda para que el alumno desarrolle su razonamiento estadístico, el cual le permitirá solucionar los retos que se le presenten en su quehacer profesional. El desarrollo de diversos casos prácticos se puede encontrar en la siguiente dirección electrónica: http://downloads.ulima.edu.pe/fondoeditorial/libros/estaddescr Los temas y la casuística expuestos están basados en los apuntes de clases, así como en la experiencia acumulada, a través de muchos años, dictando la asignatura de Estadística y Probabilidad en la Escuela de Ingeniería de la Universidad de Lima.

Presentación

11

Todas las imágenes y tablas son materiales originales creados por los autores, salvo indicación expresa de lo contrario; con respecto a las capturas, de no indicarse lo contrario, estas corresponden al software Minitab. El capítulo 1 comprende las definiciones básicas, la organización, tabulación y presentación de datos; las medidas estadísticas de resumen y el análisis exploratorio de datos. Las técnicas de conteo, el cálculo de probabilidades y los teoremas de probabilidad son abordados en el capítulo 2. En el capítulo 3 se desarrolla el tema de distribución de probabilidad de una variable aleatoria, así como la esperanza y varianza que caracterizan a dicha distribución. Finalmente, en el capítulo 4 se consideran las distribuciones especiales de probabilidad. Expresamos nuestro agradecimiento a las autoridades de la Escuela de Ingeniería que han hecho posible la publicación del presente libro que será de gran utilidad para nuestros alumnos y el público interesado.

Los autores

Capítulo

1

Estadística descriptiva

La estadística es una ciencia necesaria y útil en toda carrera profesional, ya que las técnicas y procedimientos estadísticos son aplicables a características de diferente naturaleza, como, por ejemplo: la ocurrencia de fallas en un dispositivo, las ventas diarias de una empresa, entre otras. Los datos estadísticos se caracterizan por ser aleatorios, ya que el dato es inesperado y casual; inciertos, es decir, no se tiene conocimiento del valor que puede tener; y variables, no constantes. Para la comprensión de los datos estadísticos se debe partir por la organización, presentación y resumen de los mencionados datos.

Conocimientos previos Teoría de conjuntos, manejo de notación matemática.

Secciones

Sabes Capacidades adquiridas 9 Comprender los conceptos básicos de la estadística. 9 Clasificar los tipos de variables. 9 Organizar y representar los datos en forma tabular y gráfica. 9 Calcular las medidas resumen. 9 Determinar la forma de distribución de los datos.

Piensas Competencias por lograr 9 Diferenciar entre la estadística descriptiva e inferencial. 9 Utilizar las tablas y gráficas adecuadas según el tipo de variable. 9 Reconocer las situaciones de uso de las diferentes medidas resumen.

1. División de la estadística 2. Conceptos básicos 3. Descripción tabular y gráfica de variables 4. Medidas de tendencia central 5. Medidas de posición 6. Medidas de dispersión (variabilidad) 7. Medidas de forma 8. Análisis exploratorio de datos

Haces Habilidades por desarrollar 9 Resumir grandes volúmenes de datos. 9 Aplicar las propiedades de las principales medidas resumen. 9 Interpretar las medidas resumen de acuerdo al contexto de análisis

1. División de la estadística La estadística se divide en dos grandes ramas: la estadística descriptiva y la estadística inferencial. a. La estadística descriptiva se encarga de la recopilación, organización y presentación de los datos. b. La estadística inferencial se ocupa de analizar e interpretar los resultados de la muestra para generalizarlos a la población que generó la muestra y así tomar decisiones al respecto. La estadística inferencial utiliza conceptos de probabilidad para realizar el análisis de los datos. En este capítulo se presentan las técnicas de la estadística descriptiva, cuyo objetivo es describir gráfica y numéricamente un conjunto de datos. La esta­ dística descriptiva aplicada a un conjunto de datos es utilizada para conocer de manera aproximada lo que ocurre en la población, de la que se seleccionó la muestra, en cuanto a su forma (varianza, asimetría, curtosis) y posición (media, mediana, moda).

2. Conceptos básicos En esta sección se plantean los conceptos que se usarán frecuentemente en el resto del libro. a. Unidad de análisis. Corresponde a la entidad representativa que será objeto de análisis, el “qué” o “quién” es objeto de interés en un estudio. Presentan una o más características observables de interés. Una unidad de análisis podría ser, por ejemplo, un residente de Lima Metropolitana, una vivienda del distrito de Lince, una microempresa del cono este de Lima Metropolitana, entre otros.

Capítulo 1. Estadística descriptiva

15

b. Población. Se refiere al conjunto total de unidades de análisis correspondientes al estudio que se desea realizar, de los cuales se desea describir su comportamiento y/u obtener conclusiones. La cantidad total de unidades de análisis que tiene una población es denotada por N. c. Muestra. Una muestra es un subconjunto de la población, y debe ser representativa y aleatoria. La muestra es representativa si lo que se necesita conocer de la población está presente en la muestra, es decir, si los datos asociados a la muestra se asemejan a la población en estudio; y es aleatoria porque los datos registrados fueron obtenidos de manera espontánea sin preferencia alguna. Se trabaja a partir de muestras para: i. Reducir el costo y el tiempo de recopilación de datos. ii. Disminuir o eliminar los errores asociados a la manipulación de datos, etc. La cantidad total de observaciones que tiene una muestra es deno­­tada por n. d. Variable. Una variable es una característica de interés, y se denota preferentemente por cualquiera de las últimas letras del alfabeto. Las variables se pueden clasificar como: i. Cualitativas (Categóricas): Los valores de esta variable corresponden a propiedades, atributos, cualidades, etc. Estas variables se determinan por observación, y a su vez se pueden subdividir en: • Cualitativa nominal: los valores o categorías de esta variable son atributos que no presentan ningún tipo de ordenación o jerarquía. • Cualitativa ordinal: los valores o categorías de esta variable son atributos, pero responden a un orden o jerarquía. ii. Cuantitativas: Los valores de esta variable corresponden a valores numéricos. Estas variables se determinan por conteo o medición, y a su vez se pueden subdividir en: • Cuantitativa discreta. Se presenta cuando el registro de la variable es resultado de un proceso de conteo, y se representan mediante números naturales, los cuales forman un conjunto finito o infinito numerable. Ejemplos de variables cuantitativas discretas son la cantidad de televisores que existen en una vivienda familiar, el número de pasajeros que transporta diariamente un bus del Metropolitano. • Cuantitativa continua. Una variable numérica es cuantitativa continua si el valor de la variable se obtiene por medición o comparación con un patrón de medida; pueden adoptar cualquier valor dentro de un rango y se expresa mediante números reales. Ejemplos de este tipo de variable son el ingreso mensual de un ejecutivo, el tiempo de atención en ventanilla de una agencia bancaria, entre otros. e. Parámetro. Es una medida que resume y describe a una característica de la población; su valor se calcula usando todos los datos de la pobla-

16

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

ción. Los parámetros se denotan usando letras griegas (µ, p, s, etc.). En la mayoría de los problemas de análisis de datos, los valores de los parámetros no son conocidos. Ejemplo: media poblacional del consumo mensual de combustible (µ), proporción poblacional de ejecutivos con grado académico de doctor (p), entre otros. f. Estadístico. Un estadístico es una función definida sobre la muestra; mediante el valor del estadístico se busca conocer el posible valor del parámetro. El estadístico se caracteriza porque su valor cambia de muestra a muestra, es decir, no es constante, y se espera que su valor difiera muy poco de su respectivo parámetro poblacional. Los estadísticos se denotan por letras latinas: x , p, s, etc. Ejemplo: media muestral del ingreso mensual de los practicantes universitarios ( x ), proporción muestral de clientes satisfechos (p), entre otros. En la figura 1 se representa la relación entre población y muestra.

Población de tamaño N

Muestra de tamaño N Figura 1. Relación entre población y muestra.

Parámetros:

µ : Media poblacional Estadísticos: s2 : Varianza poblacional

x ,: Media muestral s2 : Varianza muestral

3. Descripción tabular y gráfica de variables La toma de decisiones depende del análisis de una gran cantidad de datos. Si este conjunto de datos u observaciones no tiene un orden determinado es casi imposible analizarlo. Esto motiva el estudio de procedimientos que resuman la información; en la ejecución de este proceso de resumen se origina un error

Capítulo 1. Estadística descriptiva

17

(pérdida de información) que debe ser el menor posible. Por otro lado, la descripción numérica y gráfica de las variables depende de su tipo; esto significa que cada tipo de variable tiene su particular descripción numérica, así como su propia gráfica. Esta última debe trasmitir en forma clara y precisa la información que poseen los datos acerca de la población en estudio.

3.1 Distribución de frecuencias de variable cualitativa La descripción numérica de una variable cualitativa, nominal u ordinal, es realizada con la denominada “tabla de distribución de frecuencias”, la cual se abreviará como TDF. Sea X una variable cualitativa (nominal u ordinal) con k categorías, las cuales son observadas a partir de una muestra de n unidades de análisis; las diferentes categorías de esta variable pueden organizarse de la forma que se aprecia en la tabla 1:

Tabla 1. Estructura de una TDF para una variable cualitativa.

Categorías de la variable (Ci)

Conteo de observaciones (Oi)

Porcentaje (%) (Pi)

C1

O1

P1

C2

O2

P2

:

:

:

Ck

Ok

Pk

Total

n

100 %

Donde: Oi: Número de datos observados en la i-ésima categoría. La suma de los

k

conteos es igual al tamaño de la muestra: ∑ Oi = n. i =1

Pi: Porcentaje de datos observados en la i-ésima categoría, respecto al tamaño O de muestra: Pi = i 100 %. La suma de los porcentajes es igual a n

k

100 % : ∑ Pi = 100 %. i =1

La descripción gráfica de las variables cualitativas puede ser realizada mediante barras (horizontales, verticales), gráficas circulares, entre otros, y permitirán revelar en forma visual los patrones de comportamiento de la variable bajo estudio.

3.1.1 Gráfico de barras Un gráfico de barras es un conjunto de barras (horizontales o verticales) que tienen las siguientes características: a. La cantidad de barras debe ser igual al número de categorías de la variable, deben ser estas categorías mutuamente excluyentes.

18

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

b. La altura de cada barra representa al conteo o porcentaje de cada categoría, y el ancho debe ser igual para todas. Las barras deben estar igualmente espaciadas. c. Debe ser fundamentalmente ilustrativo, es decir, tratar de trasmitir al usuario, gráficamente y de la mejor forma posible, lo que está ocurriendo en la muestra.

3.1.2 Gráfico circular Un gráfico circular es un círculo dividido en sectores de manera proporcional al conteo o porcentaje de las observaciones. Las características de un gráfico circular son: a. La cantidad de sectores circulares debe ser igual al número de cate­gorías de la variable, ellos deben ser mutuamente excluyentes. b. El tamaño de cada sector circular es proporcional al total de la muestra.

CASO: Puntualidad de pago de clientes El gerente de una tienda por departamentos ha recopilado datos correspondientes a 250 clientes activos que poseen una tarjeta de crédito emitida por la tienda; las variables consideradas para el estudio son las siguientes: Género:

Género del cliente

Edad: Edad del cliente I. Familiar:

Ingreso familiar mensual del cliente

L. Crédito:

Línea de crédito del cliente

Zona:

Zona de análisis donde reside el cliente: Lima o Provincias

D. Efectivo:

Si el cliente ha realizado o no disposición de efectivo durante los últimos 3 meses.

N° Visitas:

N.° de visitas, en las cuales hizo uso de su tarjeta de crédito, en los últimos 3 meses.

M. Compras: Monto de compras, en soles, del cliente durante los últimos 6 meses. M. Ofertas:

Monto de compras, en soles, correspondiente a ofertas durante los últimos 6 meses.

Clasificación: Clasificación del cliente de acuerdo a su puntualidad histórica de pagos de la tarjeta: Puntual Anticipado (P. A.), Puntual (P), Impuntual (I) Los datos recopilados se presentan en el archivo del software Minitab Clientes.mtw, y serán de utilidad para algunos ejemplos brindados en el presente capítulo.

Capítulo 1. Estadística descriptiva

19

Ejemplo 1 En el archivo Clientes.mtw, a partir de los datos correspondientes a la clasificación de acuerdo a la puntualidad en los pagos de los 250 clientes en análisis, realice lo siguiente según se indique: a. Obtenga la tabla de distribución de frecuencias. Solución i. Ingresar a Stat> Tables> Tally Individual Variables (véase la figura 2).

Figura 2. Acceso al comando Tally Individual Variables.

ii. Seleccionar la variable Clasificación, y elegir las opciones Counts y Percents (véase la figura 3).

Figura 3. Cuadro de diálogo del comando Tally Individual Variables.



20

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

iii. Presionar el botón OK, luego de lo cual se obtendrá el siguiente reporte: Tally for Discrete Variables: Clasificación Clasificación Impuntual

Count

Percent

55

22.00

32

12.80

163

65.20

Puntual

Puntual anticipado N =



250

Nota: En el reporte obtenido la etiqueta Count representa a los conteos, es decir, al número de clientes correspondientes a cada clasificación, mientras que Percent representa a los porcentajes correspondientes. Adecuando las etiquetas se podría tener la siguiente tabla: Clasificación (Ci)

Conteo de clientes (Oi)

Porcentaje de clientes (%) (Pi)

Impuntual

35

22.0

Puntual

32

12.8

Puntual anticipado

163

65.2

Total

250

100

Tabla 2. TDF para la variable Clasificación.

Interpretación: El 22 % de los clientes presentan un pago impuntual, 12.8 % presentan un pago puntual, mientras que un 65.2 % realizan un pago puntual anticipado. b. Elabore el gráfico de sectores asociados a la variable de estudio. Solución i. Ingresar a Graph> Pie Chart… ii. Elegir la opción Chart count of unique values y seleccionar la variable Clasificación. iii. Presionar el botón Labels… iv. Pulsar sobre la pestaña Slice Labels y seleccionar Category name, Frequency, y Percent (véase la figura 4).

Capítulo 1. Estadística descriptiva

21

Figura 4. Cuadro de diálogo del comando Pie Chart: Labels.



Nota: Si se desea personalizar el título de la gráfica se debe ingresar a la pestaña Titles/Footnotes.

v. Presionar el botón OK, se obtendrá el gráfico de sectores, y luego de borrar la leyenda, quedará como se muestra en la figura 5.

Pie Chart of Clasificación Impuntual 55, 22.0 %

Figura 5. Gráfico de sectores correspondiente a la variable Clasificación. Puntual anticipado 163, 65.2 %

Puntual 32, 12.8 %

Ejemplo 2 En el archivo Clientes.mtw, a partir de los datos correspondientes al ingreso familiar de los clientes en análisis, realice lo siguiente: a. Codifique los ingresos familiares de acuerdo al siguiente criterio: Menos de S/ 2800 : < S/ 2800 De S/ 2800 a menos de S/ 3600 : S/ 2800 – S/ 3600 De S/ 3600 a menos de S/ 4400 : S/ 3600 – S/ 4400 De S/ 4400 a menos de S/ 5200 : S/ 4400 – S/ 5200 De S/ 5200 a más: > = S/ 5200

22

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Solución i. Ingresar a Data> Code> To Text… ii. En Code values in the following columns, seleccionar I. Familiar iii. En Method, seleccionar Code range of values e ingresar los valores de referencia. iv. En Endpoints to include, seleccionar Lower endpoint only de tal forma que el intervalo considere solamente el límite inferior (intervalo cerrado a la izquierda). v. En Storage location for the coded columns, seleccionar In specified columns of the current worksheet. En Columns, señalar la columna C12. Todo lo señalado se puede apreciar en la figura 6.

Figura 6. Cuadro de diálogo del comando Code: To Text.

vi. Presionar el botón OK, luego de lo cual, en la columna C12, se almacenarán los resultados de la codificación realizada. Si se desea, se puede asignar una etiqueta a la columna C12, tal como por ejemplo Intervalo ingresos.

Capítulo 1. Estadística descriptiva

23

b. Elabore el gráfico de barras para los resultados de la codificación realizada. Solución i. Ingresar a Graph> Bar Chart… ii. En Bars represent, seleccionar la opción Counts of unique values. Seleccionar el gráfico Simple. Presionar el botón OK. iii. En Categorical variables seleccionar la variable ya codificada Intervalo ingresos. iv. Presionar el botón Chart Options. En Percent and Accumulate, seleccionar la opción Show Y as Percent. Presionar OK. v. Presionar el botón Labels... vi. Seleccionar la pestaña Data Labels y seleccionar Use Y-value labels. Presionar OK (Véase la figura 7).

Figura 7. Cuadro de diálogo del comando Bart Chart: Labels.



vii. Presionar el botón OK, luego de lo cual se obtendrá el gráfico de barras respectivo tal como se muestra en la figura 8.

Figura 8. Gráfico de barras correspondiente a la variable Intervalo ingresos.



24

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

3.2. Distribución de frecuencias de variable cuantitativa En la sección 2 se mencionó que las variables cuantitativas pueden ser discretas o continuas, las cuales presentan una diferente estructura en su tabla de distribución de frecuencias. En la interpretación de la distribución de frecuencias de variable cuantitativa y de su correspondiente gráfica deben tenerse presente los siguientes aspectos: a. Simetría de la distribución. b. Variabilidad de los datos. c. Presencia de valores discordantes o extremos (outliers) Aspectos que se explicarán en los puntos posteriores del presente capítulo.

3.2.1 Distribución de frecuencias de variable cuantitativa discreta Sea X una variable cuantitativa discreta, conformadas por k valores diferentes: x1, x2, …, xk–1, xk ; observados a partir de una muestra de tamaño n. Los diferentes valores de la variable pueden organizarse de la forma que se aprecia en la tabla 3: Variable (Xi)

Frecuencia Absoluta (fi)

Frecuencia absoluta acumulada (Fi)

Frecuencia relativa porcentual (hi %)

Frecuencia relativa porcentual acumulada (Hi %)

x1

f1

F1 = f1

h1

H1= h1

x2

f2

F2 = f 2 + F1

h2

H2 = h 2 + H1

:

:

:

:

:

x k–1

fk–1

Fk–1 = fk–1 + Fk–2

xk

fk

Fk = fk + Fk–1 = n

Total

n

 

hk–1

Tabla 3. Estructura de una TDF para variable cuantitativa discreta.

Hk–1 = hk–1 + Hk–2  Hk = hk + Hk–1 = 100 %

hk 100 %

Donde: fi :

Conteo de datos observado por cada valor de la variable. La suma de



las frecuencias absolutas es igual al tamaño de la muestra (n): ∑ fi = n.

k

i =1

hi%: Porcentaje de datos observado por cada valor de la variable. La suma de k



las frecuencias relativas es igual a la unidad: ∑ hi = 1. Generalmente



se expresan en porcentaje, entonces la suma es igual al 100 %.

Fi:

Se obtiene sumando las frecuencias absolutas de los valores inferiores o



iguales al valor indicado de la variable. Entonces: Fi = ∑ f j . La última



frecuencia absoluta acumulada es igual al tamaño de la muestra (n).

i =1

i

j =1

Hi%: Se obtiene sumando las frecuencias relativas de los valores inferiores i



o iguales al valor indicado de la variable. Entonces: Hi % = ∑ h j %.



La última frecuencia relativa acumulada es igual al 100 %.

j =1

Capítulo 1. Estadística descriptiva

25

3.2.1.1 Gráfico de bastones El gráfico de bastones es similar a un gráfico de barras utilizado para representar una variable cualitativa, pero en lugar de una barra se utiliza una línea, también llamada bastón, con una altura que sería proporcional a la frecuencia absoluta o relativa que se desee representar. Ejemplo 3 En el archivo Clientes.mtw se dispone de los datos correspondientes al número de visitas a la tienda por departamentos en las cuales los clientes hicieron uso de su tarjeta de crédito, durante los últimos 3 meses. A partir de los mencionados datos realice lo que se solicite. a. Obtenga la tabla de distribución de frecuencias. Solución i. Ingresar a Stat> Tables> Tally Individual Variables… ii. Seleccionar la variable N.° Visitas, y elegir las opciones Counts, Percents, Cumulative counts, y Cumulative percents. iii. Presionar el botón OK para obtener el siguiente reporte. Tally for Discrete Variables: N° Visitas N° Visitas 2 3 4 5 6 7 8 9 10 N=



Count Percent 24 9.60 17 6.80 26 10.40 47 18.80 34 13.60 34 13.60 25 10.00 32 12.80 11 4.40 250

CumCnt CumPct 24 9.60 41 16.40 67 26.80 114 45.60 148 59.20 182 72.80 207 82.80 239 95.60 250 100.00

Nota: La etiqueta CumCnt representa la frecuencia absoluta acumulada, y CumPct a la frecuencia relativa acumulada expresada en porcentaje.

Interpretaciones: • f 2: 17 clientes, durante los 3 últimos meses, han realizado 3 visitas a la tienda. • F5: 148 clientes, durante los 3 últimos meses, han realizado hasta 6 visitas a la tienda. • h3%: 10.40 % de los clientes, durante los 3 últimos meses, ha rea­lizado 4 visitas a la tienda. • H4%: 45.60 % de los clientes, durante los 3 últimos meses, ha realizado hasta 5 visitas a la tienda.

26

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

b. Elabore el gráfico de bastones para el número de visitas. Solución i.

Ingresar a Graph> Bar Chart…

ii. En Bars represent, seleccionar la opción Counts of unique values. Seleccionar el gráfico Simple. Pulse el botón OK. iii. Seleccionar la variable N.° Visitas. iv. Presionar el botón Chart Options, en Percent and Accumulate seleccionar la opción Show Y as Percent. Hacer clic en OK. v. Presionar el botón Labels… vi. Seleccionar la pestaña Data Labels y Seleccionar Use y-value labels. Pulsar OK. vii. Seguidamente, Presionar el botón Data View…, desmarcar la opción Bars y Seleccionar la opción Project lines. Pulsar OK. viii. Presionar el botón OK, luego de lo cual se obtendrá el gráfico de bastones correspondiente tal como se muestra en la figura 9.

Figura 9. Gráfico de bastones correspondiente a la variable Número de visitas.



Si la variable cuantitativa discreta a representarse en forma tabular o gráfica posee una gran cantidad de valores distintos, entonces esta puede ser trabajada como si fuera una variable cuantitativa continua; cuyo procedimiento se detalla a continuación.

3.2.2 Distribución de frecuencias de variable cuantitativa continua Los siguientes términos básicos deben tenerse presente para la descripción numérica y gráfica de una variable cuantitativa discreta con muchos valores y de una variable cuantitativa continua (datos agrupados):

Capítulo 1. Estadística descriptiva

27

a. Clase: es el conjunto de valores agrupados de la muestra de acuerdo a cierto criterio. b. Intervalo de clase: es el intervalo que contiene a la clase; en el presente texto se trabajarán con intervalos cerrados por la izquierda y abiertos por la derecha: [… , …〉. c. Límite superior de clase: límite superior del intervalo de clase; se denota por LS. d. Límite inferior de clase: límite inferior del intervalo de clase; se denota por LI. e. Amplitud de la clase: es el ancho del intervalo, determinado por la diferencia entre el límite superior e inferior de la clase. Se trabajarán con intervalos de igual amplitud; se denota por C. f. Marca de clase (yi): La marca de clase es el punto medio del intervalo de clase. Si las clases de una distribución tienen el mismo ancho o amplitud, el intervalo de clase común, denominado intervalo de clase de la distribución; por lo tanto, la diferencia entre dos marcas de clase consecutivas es igual a la amplitud. La estructura de la distribución de frecuencias para este tipo de variable se aprecia en la tabla 4:

Tabla 4. Estructura de una TDF para variable cuantitativa continua.

Intervalo (i)

Marca de clase (yi)

Frecuencia absoluta (fi )

Frec. Absoluta acumulada (Fi )

Frec. Relativa porcentual (hi %)

Frec. Relativa porcentual acumulada (Hi %)

1

y1

f1

F1 = f1

h1

H1 = h1

2

y2

f2

F2 = f 2 + F1

h2

H2 = h2 + H1

:

:

:

:

:

:

k

yk

fk

n = fk +Fk–1

hk

100 %= hk + Hk –1

Total

n

100 %

Donde: fi, hi%, Fi y Hi% , se encuentran asociados al i-ésimo intervalo de clase en los que se han dividido los valores de la variable, y representan lo mismo que lo señalado en la TDF para variable cuantitativa discreta. Las consideraciones a tomarse en cuenta en la construcción de una tabla de frecuencias de datos agrupados son: a. Cada observación debe ser estar contenida solo en una clase, es decir, las clases deben ser mutuamente excluyentes. b. En lo posible, las clases deben tener la misma amplitud. c. Tener presente que las marcas de clase representan a todos los valores contenidos en sus respectivas clases.

28

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

A continuación, se presenta el procedimiento para la construcción de la distribución de frecuencias asociada a la variable cuantitativa continua: Paso 1. Calcular el valor del rango, recorrido o amplitud de los datos con la siguiente fórmula: R = Valor máximo – Valor mínimo Nótese que el rango indica la distancia numérica que separa al valor mínimo hasta el valor máximo de las observaciones. Amplitud

Valor mínimo

Valor máximo

Figura 10. Rango de un conjunto de datos.

Paso 2. Calcular el número de intervalos (clases) k usando la regla de Sturges, la fórmula es:

k = 1 + 3.32 log10 (n) El valor de k es común redondearlo al entero más cercano; por ejemplo, para n = 60, resulta = k 6.8678 ≈ 7. Lo que se busca en este paso es determinar la cantidad apropiada de clases en que se debe dividir el rango de datos R. La regla de Sturges no es recomendable utilizarla de manera irrestricta porque proporciona valores de k inapropiados en algunos casos. Un valor pequeño de k condensa excesivamente los datos, perdiéndose información. Por otro lado, un valor grande de k, no permite conocer el patrón de comportamiento de las observaciones. R k Debe tratarse de que C tenga el mismo número de posiciones decimales que poseen los datos. Para facilitar las comparaciones, es preferible trabajar con un valor de C constante para todos los intervalos, salvo en aquellos casos que por la naturaleza misma de los datos no puede hacerse. Verificar que se cumple la condición (C )( k ) ≥ R; lo cual asegura que ninguna observación quede fuera de la distribución de frecuencias.

Paso 3. Calcular la amplitud de la clase C usando la siguiente fórmula: C =

Paso 4. Construir la tabla de distribución de frecuencias considerando el valor mínimo como el límite inferior de la primera clase a distribución de frecuencias. A este límite inferior se le debe agregar el valor de C para obtener el límite superior. El límite superior de la primera clase es el límite inferior de la siguiente clase. Continuar agregando C hasta la última clase que señala k. Tenga presente que la interpretación de las clases es cerrada a la izquierda y abierta a la derecha, a excepción del último intervalo que puede ser cerrado por ambos extremos.

Capítulo 1. Estadística descriptiva

29

Amplitud Clase 2 Figura 11. Clases y sus límites.

Clase 3

Clase 4

Valor mínimo

Valor máximo Límite inferior de la clase

Límite superior de la clase

La distribución de frecuencias presenta el número de observaciones de la muestra que caen dentro de cada una de las clases. El término distribución de frecuencias se abrevia normalmente como distribución. ¿Para qué se estudia la distribución de frecuencias? En estadística, el objetivo principal es conocer la población que generó la muestra. Al construir la distribución de frecuencias se busca conocer (estimar) el comportamiento de los datos poblacionales de tal forma que podamos extraer (usando los datos muestrales previamente colocados en la distribución de frecuencias) algunas conclusiones con respecto a lo que realmente ocurre en la población. Los tipos de gráficos más importantes de una tabla de frecuencias de datos agrupados son: a. Histogramas b. Polígono de frecuencias relativas

3.2.2.1 Histograma El histograma es un conjunto de rectángulos, todos ellos, generalmente, del mismo ancho (C), y con una altura proporcional a la frecuencia absoluta o relativa. En otras palabras, el área de cada rectángulo, en relación con todos los otros, muestra la proporción del número total de observaciones que ocurren en esa clase. Un histograma que usa las frecuencias relativas, recibe el nombre de histograma de frecuencias relativas, y tiene la misma forma que el histograma de frecuencias absolutas. El procedimiento para la construcción de un histograma es: 1. Trazar dos ejes, un eje para las marcas de clase yi (eje X) y el otro para las frecuencias absolutas o frecuencias relativas. 2. Trazar rectángulos para cada una de las clases consideradas en la tabla de frecuencias, con ancho igual al C y largo proporcional a la frecuencia absoluta (fi) o relativa porcentual (hi%). Los rectángulos, a diferencia del diagrama de barras para variables cualitativas, deben ser adyacentes, es decir, cada barra debe estar junta a la que precede o antecede. En la figura 12 se presentan algunos tipos de histogramas.

30

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Histogramas normales

10 10 0 10 10 10 0 10 10 10 0 0 0 0 0 0

Histogramas de doble pico

10 10 10 0 10 10 0 10 0 10 10 10 0 10 10 0 0 0 0 0 0 0 Histogramas “Cliff” (Precipicio)

Histogramas con islas aisladas

Figura 12. Tipos de histogramas.

10 10 0 10 10 10 10 0 10 10 10 10 0 0 0 0 10 0 0 10 0 0 0 0

10 10 10 10 0 10 0 0 10 0 10 10 0 10 10 0 0 0 0 0

Histograma “rueda dentada”

10 10 0 10 10 10 10 0 10 10 0 10 0 10 0 0 0 10 0 0 0 0

El histograma de la muestra debe tener una distribución cuya forma es muy similar a aquella de la población de la cual se tomó la muestra. La principal ventaja del histograma de frecuencias relativas es que permite comparar datos de diferentes tamaños de muestra.

3.2.2.2 Polígono de frecuencias (absolutas o relativas) El procedimiento para la construcción de un polígono de frecuencias (absolutas o relativas) consiste en unir mediante líneas rectas los pares de valores de marcas de clase y frecuencias absolutas o relativas: (yi, fi) o (yi, hi%) respectivamente. Luego, añadir clases, con frecuencia cero, en cada extremo de la escala de marcas de clase para cerrar la gráfica y de esta manera obtener el polígono de frecuencias. Las principales ventajas de un polígono de frecuencias son: a. Es una representación más sencilla y clara que su histograma correspondiente. b. Ofrece un esquema más claro del patrón de datos. c. El polígono se vuelve cada vez más suave y curvo a medida que crece el número de clases y de observaciones. d. El polígono de frecuencias relativas es utilizado para comparar la distribución de frecuencias correspondientes a dos o más poblaciones.

Capítulo 1. Estadística descriptiva

31

Ejemplo 4 En el archivo Clientes.mtw se dispone de los datos correspondientes al monto de compras de los clientes, durante los últimos 6 meses. A partir de los mencionados datos realice lo que se solicite. a. Obtenga la tabla de distribución de frecuencias. Solución Paso 1. Determinar el rango de la variable. i. Stat> Basic Statistics> Display Descriptive… ii. Seleccionar la variable M. Compras. iii. Pulsar el botón Statistics, seleccionar Minimum, Maximum, Range, y N total. Presionar el botón OK. Se obtiene el siguiente reporte: Descriptive Statistics: M. Compras Total Variable Count Minimum Maximum M. Compras 250 1200.0 4530.0

Range 3330.0

El rango de la variable monto de compras es: R = 4530 – 1200 = S/ 3330 Paso 2. Determinar el número de intervalos. i. Cantidad de datos: n = 250

1 + 3.32 log10 ( 250) = 8.961 ≈ 9 ii. k = Paso 3. Determinar la amplitud de la clase. C=



Tabla 5. Intervalos para la variable montos de compra.

32

R 3330 = = S / 370 k 9

Paso 4. Construir los intervalos. Se tiene en cuenta que el valor mínimo de los montos de compra, durante los últimos 6 meses, es de S/ 1200 y la amplitud de los intervalos es S/ 370 para obtener los límites superiores inferiores de cada uno de los 9 intervalos, tal como se presenta en la tabla 5. Intervalo (Ii )

Límite inferior

Límite superior

1

1200

1570

2

1570

1940

3

1940

2310

4

2310

2680

5

2680

3050

6

3050

3420

7

3420

3790

8

3790

4160

9

4160

4530

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Paso 5. Obtener el histograma de la variable monto de compras de acuerdo a los intervalos elaborados y de ahí construir la tabla de distribución de frecuencias correspondiente. i. Graph> Histogram… ii. Seleccionar la opción Simple iii. Seleccionar la variable M. Compras. El histograma obtenido se presenta en la figura 13.

Figura 13. Histograma correspondiente a la variable Monto de compras.



El presente histograma cuenta con 18 intervalos, y en el eje horizontal aparecen las marcas de clase, lo que el software Minitab denomina como “midpoints”, es decir, los puntos medios de los intervalos. Modificar el histograma

Figura 14. Cuadro de diálogo del comando Histogram – Edit Bars.

i. Hacer doble click sobre cualquier columna del histograma. ii. Pulsar sobre la pestaña Binning. iii. Seleccionar Cutpoint, y en Midpoint/ Cutpoint positions señalar el mínimo valor (1200) y al límite superior del primer intervalo (1570), dejando un espacio vacío entre ambos valores, tal como se muestra en la figura 14. Pulsar OK. iv. Si aparece un cuadro de diálogo con el mensaje Bins extended to encompass all data, pulsar sobre Aceptar.

Capítulo 1. Estadística descriptiva

33

v. En el histograma editado presionar el botón derecho del mouse y pulsar sobre Add, luego sobre Data Labels…, verificar que se encuentre marcada la opción Use y-value labels. Pulsar OK.

El histograma ya editado se presenta en la figura 15.

Figura 15. Histograma editado correspondiente a la variable Monto de compras.



A partir de las frecuencias absolutas representadas en el histograma elaborado se obtienen las frecuencias absolutas acumuladas, las frecuencias relativas simples y las acumuladas, tal como se presenta en la tabla 6. Intervalo (Ii)

Límite inferior

Límite superior

Marca de clase (yi)

Frecuencia absoluta (f i)

1

1200

1570

1385

16

2

1570

1940

1755

3

1940

2310

2125

4

2310

2680

2495

38

15.2

113

45.2

5

2680

3050

2865

38

15.2

151

60.4

6

3050

3420

3235

31

12.4

182

72.8

7

3420

3790

3605

28

11.2

210

84.0

8

3790

4160

3975

26

10.4

236

94.4

9

4160

4530

4345

14

5.6

250

100.0

250

100.0

---

---

Total =

Frec. Absoluta acumulada (Fi)

Frec. Relativa porcentual acumulada (Hi %)

6.4

16

6.4

27

10,8

43

17.2

32

12.8

75

30.0

Tabla 6. TDF para la variable Monto de compras.

34

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Frec. Relativa porcentual (hi %)

Interpretaciones: • f6: 31 clientes, durante los 6 últimos meses, han presentado un monto de compras comprendido entre 3050 (inclusive) y 3420 soles. • F4: 113 clientes, durante los 6 últimos meses, han presentado un monto de compras inferior a S/ 2680. • h2%: 10.8 % de los clientes, durante los 6 últimos meses, han presentado un monto de compras comprendido entre 1570 (inclusive) y 1940 soles. • H7%: 84.0 % de los clientes, durante los 6 últimos meses, han presentado un monto de compras comprendido entre 1200 (inclusive) y 3790 soles. Las demás frecuencias, aparte de la frecuencia absoluta obtenida en el histograma elaborado, se pueden obtener a través de los cálculos correspondientes, o a través de la modificación del histograma para así visualizar los valores de las demás frecuencias necesarias para completar la tabla. Modificación del histograma i. Dar doble click sobre el eje vertical para que aparezca la ventana de diálogo de edición de escala. ii. Seleccionar la pestaña Type, en dicha pestaña se puede cambiar la escala de frecuencia (Frequency) a porcentajes (Percent). iii. Si se desea obtener la presentación de los valores acumulados se debe seleccionar la opción Accumulate values across bins. Por ejemplo, en la figura 16, se presenta las opciones seleccionadas para obtener las frecuencias relativas acumuladas, mientras que en la figura 17 se presentan los resultados obtenidos.

Figura 16. Cuadro de diálogo del comando Histogram – Edit Scale.



Capítulo 1. Estadística descriptiva

35

Figura 17. Histograma de la variable Monto de compras – Frecuencia relativa porcentual acumulada.



La tabla de distribución de frecuencias de una variable cuantitativa continua es de datos agrupados porque los datos están formando clases o grupos. Nótese también que las clases son igualmente espaciadas. Las marcas de clase yi son los valores representativos de cada clase y serán utilizados en el cálculo de las medidas de tendencia central y de dispersión.

b. Obtenga el polígono de frecuencias. Solución i. En el archivo Clientes.mtw, ingresar en las columnas C14 y C15, respectivamente, los valores de las marcas de clase y de las frecuencias relativas (en forma de proporción y no como porcentaje); considerando unas marcas de clase ficticias antes y después de la primera y úl­tima marca de clase respectivamente. Etiquete adecuadamente las columnas empleadas:

36



C14: Marca de clase



C15: Frecuencia relativa



Nota: Considerar frecuencia relativa cero para marca de clase ficticia, tal como se muestra en la figura 18.

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Figura 18. Cuadro de diálogo del comando Scatterplot.



ii. Graph> Scatterplot… iii. Elegir la opción With Connect Line. Pulsar OK. iv. Ingresar los datos tal como aparecen en la figura 19.

Figura 19. Cuadro de diálogo del comando Scatterplot.



v. Pulsar el botón Labels… e ingresar a la pestaña Data Labels y seleccionar la opción Use y-value labels. Pulsar OK. vi. Pulsar el botón Data View…, se observa que la opción Symbols ya se encuentra seleccionada, en forma adicional se debe seleccionar la opción Connect line, tal como se muestra en la figura 20. Pulsar OK.

Capítulo 1. Estadística descriptiva

37

Figura 20. Cuadro de diálogo del comando Scatterplot: Data View.



vii. Pulsar OK para obtener el polígono de frecuencias asociado a la variable monto de compras, tal como se muestra en la figura 21.

Figura 21. Polígono de frecuencias correspondiente a la variable Monto de compras.



3.3 Diagrama de Pareto El diagrama de Pareto es una gráfica que permite identificar las causas que afectan en un porcentaje significativo a un problema. Una vez identificadas las causas se procede a resolverlas para reducir en un gran porcentaje la ocurrencia del problema en estudio. Esto contribuye a mejorar la calidad del producto o servicio que se ofrece. El diagrama de Pareto también sirve para separar y atender (o resolver) las causas que son “vitales” de aquellas que son “triviales” lo que permitirá una reducción significativa del problema.

38

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Ejemplo 5 En la cafetería de un Centro de Convenciones se viene presentando un alto número de fallas en la prestación del servicio: demoras, quejas, insatisfacción, etc. Para determinar las principales causas de estas fallas se realizó un estudio donde se consultaba al personal de atención directo (meseros, supervisores, jefe) e indirecto (personal de cocina y apoyo), así como a los propios clientes sobre cuál era al origen de las fallas en la prestación del servicio. A continuación, en la tabla 7, se presenta un resumen de las causas identificadas, y la frecuencia con que fueron mencionadas. Cód.

Descripción

A

Alto número de clientes

Frecuencia 28

B

Cocinas domésticas, no industriales

C

Demora del mesero en la toma del pedido

5

D

Doble ingreso de pedido del cliente

1

E

Equipo de cómputo con deficiencias

5

19

F

Error de digitación de pedido del cliente

G

Falta de orden en el ambiente de la cocina

23

H

No se cuenta con insumos suficientes

I

No se verifica la boleta antes de imprimirla

3

J

Pocas mesas de atención

2

6

Tabla 7. Resumen de las opiniones recabadas sobre las causas de las fallas en el servicio.

28

a. Obtenga el diagrama de Pareto asociado a las causas de las fallas en el servicio. Solución i. Ingresar los datos proporcionados en una hoja de trabajo del software Minitab. ii. Ingresar a Stat> Quality Tools> Pareto Chart… iii. Completar el cuadro de diálogo tal como se presenta en la figura 22.

Figura 22. Cuadro de diálogo del comando Pareto Chart.



Capítulo 1. Estadística descriptiva

39

En Defects or attribute data in se puede seleccionar la columna C1 Cód., tal como se presenta en la figura 22, o se puede seleccionar la columna C2 Descripción. Lo preferible es trabajar con etiquetas cortas, tal como aparece en la columna C1, ya que, si se utilizan etiquetas extensas, como la descripción completa de las causas, estas ocupan demasiado espacio en la gráfica, reduciendo el espacio para el propio diagrama de Pareto. En la figura 23 se aprecia el diagrama obtenido.

Figura 23. Diagrama de Pareto para las causas de las fallas en el servicio.



b. Indique cuáles son las principales causas detectadas en las fallas del servicio de la cafetería en el Centro de Convenciones. Solución [A] Alto número de clientes ( 23.3 %), [H] No se cuenta con insumos suficientes ( 23.3 %), [F] Error de digitación de pedido del cliente (19.2 %) y la [C] Demora del mesero en la toma del pedido (15.8 %). Causas que en conjunto representan el 81.7 % de las causas señaladas por los informantes.

4. Medidas de tendencia central Las medidas de tendencia central cuantifican la forma de agrupamiento o tendencia de los datos respecto a ciertos valores. Las medidas de tendencia central pueden calcularse para la población (bajo ciertas condiciones) como para la muestra. La relación entre las medidas de tendencia central calculadas en la muestra (estadísticos) y sus correspondientes medidas de tendencia central a nivel de población (parámetros) radica en que los valores de los estadísticos son utilizados para estimar los valores de los parámetros. Las principales medidas de tendencia central de una muestra (a nivel de población también existen y se denominan parámetros) son:

40

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

a. Media o promedio aritmético. b. Mediana. c. Moda. Para cada medida de tendencia central se tienen fórmulas para calcular sus valores dependiendo si los datos están o no agrupados. A continuación, se presentan las medidas de tendencia central que se calculan en una muestra.

4.1 Media aritmética (promedio) La media muestral es un punto de equilibrio entre los valores que están por debajo y por encima de ella. La media muestral, o simplemente media, si no hay confusión alguna, se denota por x . Los tipos de media muestral son: a. Media simple. b. Media ponderada. Las fórmulas para calcular la media son: Datos no agrupados

Datos agrupados k

∑ yi fi

Media y = i =1

n

∑ xi

Media simple x = i =1

n

k

= ∑ yi hi i =1

Donde: yi son los valores de la variable o las marcas de clase fi son las frecuencias absolutas hi son las frecuencias relativas

n

k

∑ wi xi

Media ponderada x = i =1

k

∑ wi

Donde: wi son los pesos o ponderaciones.

i =1

Las propiedades de la media muestral son: a. La media es única, puede asumir cualquier valor real y siempre existe.

xi ± a, entonces y= x ± a, para a constante. b. Si y= i c. Si yi = axi , entonces y = ax. d. Si una muestra se divide en k submuestras de tamaño ni para cada submuestra; la media de la muestra es igual a la suma de las medias ponderadas de las submuestras, dividido entre el tamaño de muestra total: k

∑ xi ni x n + x n + ... + x n 1 1 2 2 i =1 k k . Lo señalado se conoce como media x = = k n ∑ ni i =1



de medias.

Capítulo 1. Estadística descriptiva

41

n

0 e. ∑ ( xi − x ) = i =1

f. La media es afectada por los valores extremos.

4.2 Mediana La mediana se define como el valor que divide en dos partes iguales al conjunto ordenado de observaciones. La mediana se denota por Me y se calcula de la siguiente manera: Datos no agrupados a. Ordenar los datos de menor a mayor, x(1), x(2), …, x(n) b. Si n es impar, entonces la mediana es:

Me = x n+1 

Datos agrupados a. Calcule n/2 para ubicar la clase mediana. b. Luego, aplique la siguiente fórmula

   2 

Si n es par, entonces la mediana es:

x n  + x n Me =

= Me LI Me

  +1 2 

  2

n   2 − FMe −1  +C   f Me     

2

donde: x(i) es el valor de la i-ésima observación después de i) LIMe es el límite inferior de la clase donde se encuentra que los datos han sido ordenados la mediana ii) FMe-1 es la frecuencia acumulada absoluta de la clase anterior a la clase donde se encuentra la mediana. iii) fMe es la frecuencia absoluta de la clase donde se encuentra la mediana.

Las propiedades de la mediana son: 1. La mediana es única y siempre existe.

xi ± a, entonces Me = ( y) Me( x) ± a , para a constante. 2. Si y= i 3. Si yi = axi , entonces Me( y) = a Me( x), para a constante. 4. La mediana no es afectada por los valores extremos. Esta propiedad significa que la mediana debe ser usada en lugar de la media cuando se tengan datos con valores extremos. Esta propiedad de la mediana es conocida como robustez. 5. La mediana puede asumir cualquier valor real.

4.3 Moda La moda se define como el valor de la variable que posee la mayor frecuencia; también es conocida como el valor más común o el valor típico de las observa­ ciones. La moda se denota por Mo y se calcula de la siguiente manera:

42

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

a) Determine el valor que posee la mayor frecuencia. b) En caso de existir más de un valor con la mayor frecuencia, entonces, todos esos valores son considerados valores modales.

Datos no agrupados

Las propiedades de la moda son: a. A diferencia de la media y de la mediana, la moda se puede calcular para datos cuantitativos y para datos cualitativos. b. La moda puede o existir para un conjunto de datos, y de existir no siempre es única. c. La moda no es afectada por los valores extremos. d. La moda puede asumir cualquier valor real. e. La moda debe ser utilizada cuando se desea reportar el valor de la variable que posee la mayor posibilidad de ocurrencia.

CASO: Financiera En una agencia financiera se dispone de 10 cajeros destinados a la atención al público, cuando cada uno de ellos termina sus labores realiza el cierre de caja correspondiente. Los tiempos empleados, en minutos, por cada uno de los cajeros al momento de realizar el cierre correspondiente al día anterior se presentan a continuación: 25

19

25

24

27

25

22

26

20

23

La entidad financiera tiene un contrato con una institución de educación superior, y durante la presente semana debe recabar los pagos de pensiones de los alumnos ingresantes en el presente período académico. Los mencionados pagos se presentan en 5 categorías distintas. A continuación, se presenta la distribución de los pagos realizados por los primeros 81 ingresantes: Categorías de pensiones

Monto de pago (S/) ( yi )

A

380

7

B

420

15

C

470

28

N.° de ingresantes ( fi )

D

540

21

E

600

10

Total

81

Capítulo 1. Estadística descriptiva

43

Ejemplo 6 En relación al caso Financiera, se solicita lo siguiente con respecto a los tiempos empleados: a. En forma manual, calcule el tiempo promedio diario empleado en el cierre de caja por parte de los cajeros de la entidad financiera. Solución Aplicando la fórmula: n

∑ xi 25 + 19 + 25 + 24 + 27 + 25 + 22 + 26 + 20 + 23 =1 x i= = = 23.6 10 n

Interpretación: El promedio de los tiempos empleados para el cierre de caja por parte de los 10 cajeros es de 23.6 minutos. b. En forma manual, determine el valor de la mediana asociada al tiempo empleado diariamente en el cierre de caja por parte de los cajeros de la entidad financiera. Solución Para calcular la mediana se aplica el siguiente procedimiento: i. Ordenar los datos de menor a mayor: 19

20

22

23

24

25

25

25

26

27

x(1)

x(2)

x(3)

x(4)

x(5)

x(6)

x(7)

x(8)

x(9)

x(10)

ii. Como el número de datos (n) es par, entonces se identifican los dos valores centrales para calcular la mediana: x n  + x n = Me( x)

  2

  +1 2 

= 2

x 10  + x 10    2

  +1  2 

= 2

x(5) + x( 6) 24 + 25 = = 24.5 2 2

Interpretación: El 50 % de los cajeros presentó tiempos de cierre de a lo más 24.5 minutos, mientras que el restante 50 % presentó tiempos de cierre de por lo menos 24.5 minutos. c. En forma manual, determine el valor de la moda asociada al tiempo empleado diariamente en el cierre de caja por parte de los cajeros de la entidad financiera. Solución

44

Para determinar el valor de la moda solamente se debe identificar el valor que más se repite en la serie de datos, de lo cual se observa que un tiempo de 25 minutos fue el tiempo de cierre presentado por un mayor número de cajeros ( 3 en total).

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Por lo tanto: Mo( x) = 25 Interpretación: El tiempo de cierre que más frecuentemente se repite entre los cajeros fue de 25 minutos. d. Haga uso del software Minitab para obtener los valores de la media, mediana y moda. Solución

Para calcular los valores de la media, la mediana y la moda mediante el software Minitab, se deben ingresar los datos en una columna y luego aplicar el siguiente procedimiento: i. Digite los datos en la columna C1, y etiquételos como Tiempo cierre. ii. Ingresar a Stat> Basic Statistics> Display Descriptive Statistics… iii. Seleccionar la variable Tiempo cierre iv. Presionar el botón Statistics… v. Seleccione las siguientes estadísticas descriptivas: mean (media), median (mediana), y mode (moda). Pulse el botón OK vi. Presionar el botón OK.

Figura 24. Cuadro de diálogo del comando Display Descriptive Statistics: Statistics.

El reporte obtenido se presenta a continuación: Descriptive Statistics: Tiempo cierre N for Variable Mean Median Mode Mode Tiempo cierre 23.600 24.500 25 3

Capítulo 1. Estadística descriptiva

45

Ejemplo 7 En relación al caso Financiera, se solicita lo siguiente con respecto a los montos de pago, en soles, de los 81 ingresantes a la institución de educación superior: a. Calcule el monto promedio, por concepto de pago de pensiones, que la financiera recabó por cada ingresante. Solución

Debido a que los datos se presentan en una tabla resumen, para calcular el monto promedio se debe utilizar la fórmula de la media ponderada: k

∑ yi fi 380(7) + 420(15) + 470( 28) + 540( 21) + 600(10) i =1 M(Y )= y= = = 487.16 7 + 15 + 28 + 21 + 10 n



Interpretación: El promedio de los montos por concepto de pago de pensiones es de S/ 487.16 . a.1 Todos los ingresantes además realizaron un pago por concepto de un curso de informática, el cual tenía un costo único de S/ 90, ¿cuál es el promedio del monto de pago incluyendo el pago por el mencionado curso?, y ¿cuál sería el monto total del pago recibido por parte de los 81 ingresantes? Solución

Y * : Monto de pago incluyendo el curso



Monto promedio de pago incluyendo el pago del curso:

Y * = Pago pensión + Pago curso ⇒ Y * =Y + 90



* M(Y= ) M(Y + 90) = M(Y ) + 90 = 487.16 + 90 =

S / 577.16 k

* Monto total del pago recibido por los 81 ingresantes: ∑ yi fi i =1

k

* Como: M(Y ) =

* ∑ yi fi

i =1

81

k

⇒ ∑ yi* fi = M(Y * )(81) = 577.16(81) ≈ 46 750 i =1

a.2 Los montos de pago por concepto de pensiones se incrementarán en un 5 % a partir del próximo mes, en cada una de las categorías de pago. Si ya se hubiera efectuado el mencionado incremento, ¿cuál hubiera sido el nuevo monto promedio por concepto de pago de pensiones? Solución W: Nuevo monto de pago considerando el incremento del 5 %

46

W = (1 + 0.05)Y Nuevo monto promedio:

= M (W ) M = (1.05Y ) 1= .05M(Y ) 1.05= ( 487.16)

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

S/ 511.52

b. Determine e interprete los valores de la mediana y la moda correspondientes a los montos por concepto de pago de pensiones. Solución Mediana: Para determinar el valor de la mediana se aplica el siguiente procedimiento: i. Determinar las posiciones que ocupan cada uno de los datos, los cuales ya aparecen en forma ordenada en la tabla resumen, para lo cual se obtienen las frecuencias absolutas acumuladas: Monto de pago (S/) (xi)

N.° de ingresantes (fi)

N.° acumulado ingresantes (Fi)

380

7

7

420

15

22

470

28

50

540

21

71

600

10

81

Total

81

ii. Como el número de datos (n) es impar, entonces, se identifica el valor central: Me= ( X ) x n= x 81= x= 470 ( 41) +1  +1     2 

   2 

Nota: El tercer valor de los 5 distintos montos de pago ( x3 = 470) corresponde, de acuerdo a las frecuencias acumuladas, a los valores ordenados desde la posición 23 a la posición 50 de los 81 pagos recibidos ( x( 23) a x50 ).

Interpretación: El 50 % de los ingresantes realizó pago por concepto de pensiones fue por un monto de a lo más S/ 470, mientras que el restante 50 % realizó pagos de por lo menos S/ 470.



Moda: Para determinar el valor de la moda se observa el valor que más se repite, es decir, el que presenta mayor frecuencia, siendo dicho valor el de S/ 470. Por lo tanto: Mo( x) = 470



Interpretación: El monto por concepto de pago de pensiones que más frecuentemente realizaron los ingresantes fue de S/ 470.

Capítulo 1. Estadística descriptiva

47

Escenario: Caso Financiera La entidad financiera también realiza la compra y venta de moneda extranjera, y durante el presente día se han realizado 200 transacciones de compra de euros. Los montos asociados a las compras de euros se resumen en la siguiente tabla de distribución de frecuencias: Intervalo (Ii)

Monto de euros comprados (€) Límite inferior

Límite superior

Marca de clase (yi)

Frecuencia absoluta (fi)

1

0

600

300

16

2

600

1200

900

32

3

1200

1800

1500

68

4

1800

2400

2100

44

5

2400

3000

2700

28

6

3000

3600

3300

12

Total

200

Ejemplo 8 En relación al escenario presentado sobre las 200 transacciones de compra de euros, se solicita lo siguiente: a. Calcule el monto promedio de euros comprados por cada transacción. Solución Debido a que los datos se presentan en una tabla resumen para datos agrupados, se debe utilizar la fórmula correspondiente y trabajar con la marca de clase y las frecuencias absolutas: k

∑ yi fi 300(16) + 900(32) + 1500(68) + 2100( 44) + 2700( 28) + 3300(12) k =1 y = = = 1716 16 + 32 + 68 + 44 + 28 + 12 n



Interpretación: El promedio de los montos de compra en cada transacción es de 1716 euros.

b. Calcule la mediana asociada al monto de euros comprados por cada transacción. Solución

Para determinar el valor de la mediana se aplica el siguiente proce­dimiento: i. Obtener las frecuencias absolutas acumuladas.

48

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Intervalo (Ii)

Monto de euros comprados (€) Límite inferior

Límite superior

Marca de clase (yi)

Frecuencia absoluta (fi)

Frec. Absoluta acumulada (Fi)

1

0

600

300

16

16

2

600

1200

900

32

48

3

1200

1800

1500

68

116

4

1800

2400

2100

44

160

5

2400

3000

2700

28

188

6

3000

3600

3300

12

200

Total

200

ii. Identificar el intervalo mediano, el cual es el intervalo cuya frecuencia acumulada sea mayor o igual a la mitad de los datos que conforman la muestra. n 200 Determinar i, tal que Fi ≥ = = 100. 2 2

Se observa que F3 = 116 ≥ 100 ⇒ [1200, 1800〉 es el intervalo mediano.

iii. Aplicar la fórmula correspondiente.

n   2 − FMe -1   100 − 48  1200 + 600  Me( y ) = LI Me + c  =  = 1658, 82  68   f Me   

Interpretación: El 50 % de las transacciones implicó la compra de a lo más 1656 , 8 euros, mientras que el restante 50 % implicó la compra de por lo menos el mencionado valor.

4.4 Relaciones entre la media, la mediana y la moda Si la variable en estudio es cuantitativa, el cálculo de x , Me y Mo se realizan de la manera indicada en las secciones anteriores. Las relaciones entre estas medidas de tendencia central se presentan en la figura 25.

Media > Mediana > Moda

Media = Mediana = Moda

Figura 25. Relaciones entre la media, la mediana y la moda.

Media < Mediana < Moda

Capítulo 1. Estadística descriptiva

49

5. Medidas de posición Las medidas de posición dividen al conjunto de datos, previamente ordenado, en grupos con determinada cantidad de observaciones. Las principales medidas de posición son: a. Cuartiles. b. Percentiles.

5.1 Cuartiles Los cuartiles son valores que dividen al conjunto ordenado de observaciones en cuatro partes iguales. Los cuartiles son denotados por Q1, Q2 y Q3. La figura 27 representa el significado de los cuartiles.

Q1 25 % Figura 26. Cuartiles y porcentajes de observaciones.

Q2

Q3 25 %

25 %

25 %

50 % 50 % 75 %

Obsérvese que el 25 % de las observaciones son menores que Q1 y el 75 % de observaciones son al menos igual a Q1. También nótese que Q2 asume el mismo valor de la mediana (Me) y su interpretación es la misma, es decir, 50 % de las observaciones son menores que la mediana y 50 % de las observaciones son mayores que la mediana. Por otro lado, el 75 % de las observaciones son menores que Q3 y el 25 % son mayores que Q3.

50

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

CASO: Patio de juegos El Gerente de una cadena de juegos infantiles y familiares se encuentra analizando las actividades diarias de tres de sus principales locales ubicados en modernos centros comerciales de Lima Metropolitana. Entre las principales características en estudio se encuentran las siguientes: – Número de niños por grupo (grupo familiar o grupo de amigos) que ingresan simultáneamente al patio de juegos. – Tiempo de permanencia, en minutos, del grupo de niños. – Monto total gastado, en soles (S/), por el grupo de niños (tickets, canjes, etc.). – Número de juegos totales utilizados por el grupo de niños. Se ha recabado los datos correspondientes a 220 grupos de niños, los cuales se presentan en el archivo: Juegos.mtw. Ejemplo 9 En el archivo Juegos.mtw, a partir de los datos correspondientes al número de niños por grupo, así como al número de juegos totales utilizados, realice lo solicitado: a. En relación al número de niños por grupo, obtenga los valores correspondientes al primer y al tercer cuartil, y su interpretación. Solución i. Ingresar a Stat> Basic Statistics> Display Descriptive Statistics… ii. Seleccionar la variable N.° de niños iii. Presionar el botón Statistics… iv. Seleccione las siguientes estadísticas descriptivas: first quartile (primer cuartil), y third quartile (tercer cuartil). Pulse el botón OK v. Presionar el botón OK El reporte obtenido se presenta a continuación: Descriptive Statistics: N.° de niños Variable Q1 Q3 N° de niños 2.250 4.750

Interpretación: • El 25 % de los grupos familiares o grupos de amigos ingresó con menos de 3 niños al patio de juegos (≤ 2.25). • El 75 % de los grupos familiares o grupos de amigos ingresó con menos de 5 niños al patio de juegos (≤ 4.75).

Capítulo 1. Estadística descriptiva

51



Nota: El cuartil 1 divide a un 25 % inferior y a un 75 % superior, asimismo, el cuartil 3 divide a un 75 % inferior y a un 25 % superior; por lo tanto, se pueden brindar las siguientes interpretaciones equivalentes: • El 75 % de los grupos familiares o grupos de amigos ingresaron con por lo menos 3 niños al patio de juegos (≥ 2.25). • El 25 % de los grupos familiares o grupos de amigos ingresaron con por lo menos 5 niños al patio de juegos (≥ 4.75).

b. Para el local de Santiago de Surco, señale el número de juegos por debajo del cual se encuentra el 25 % de los grupos de niños con menor cantidad de juegos utilizados. Solución

Proceder de similar manera que el ítem anterior (a) y desagregar por la variable Local (By variables). El reporte obtenido se presenta a continuación: Descriptive Statistics: Nº juegos Variable Local Q1 Nº juegos Independencia 4.000 Santa Anita 6.000 Santiago de Surco 3.000

Conclusión: En el local de Santiago de Surco el 25 % de los grupos de niños utilizaron a lo más 3 juegos.

5.2 Percentiles Los percentiles xp(p = 1, 2, ..., 99) dividen al conjunto ordenado de datos en 100 partes iguales. De tal forma que p% de las observaciones son menores que el percentil xp y (100 – p)% de observaciones son al menos iguales a xp. Los percentiles son importantes en áreas como investigación de mercados pues permiten la segmentación de estos. En el presente texto, la obtención de los cuartiles y percentiles se trabajará a partir de la base de datos mediante el uso del software Minitab. Ejemplo 10 En el archivo Juegos.mtw, a partir de los datos correspondientes al tiempo de permanencia, calcule los percentiles P35 y P65. Solución i. Etiquetar a la columna C8 como k y en dicha columna digitar los valores de asociados a los percentiles solicitados: 0.35 y 0.65, para los percentiles P35 y P65, respectivamente.

52

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

ii. Ingresar a Calc> Calculator… iii. En Store result in variables señalar a la columna C9 iv. En Expression ingresar y editar la función del percentil (Percentile), la cual se puede buscar en Functions. La edición de la función se puede apreciar en la siguiente figura:

Figura 27. Cuadro de diálogo del comando Calculator: Percentile.

Nota: Si solamente se deseaba obtener un percentil, entonces, se podría omitir el trabajo con la columna k, y editar la función, por ejemplo, de la siguiente forma: PERCENTILE(‘Tiempo’,0.35) v. Presionar el botón OK.

El resultado aparecerá en la columna C9 que fue seleccionada, tal como aparece en la siguiente figura:

Figura 28. Resultados del comando Calculator: Percentile.

Los valores de los percentiles son: P35 = 50.235 y P65 = 56.3; los cuales indican que el 35 % y 65 % de los grupos de niños permanecieron a lo más 50.235 y 56.3 minutos respectivamente.

Capítulo 1. Estadística descriptiva

53

6. Medidas de dispersión Las medidas de dispersión son valores que sirven para cuantificar la homogeneidad (uniformidad, variabilidad) de los datos, es decir, sirven para medir la proximidad que tienen los datos entre sí. Las medidas de dispersión también son conocidas como medidas de variabilidad. Para el cálculo de algunas de las medidas de dispersión se toma un punto de referencia que generalmente es la media. Las medidas de dispersión a nivel de la muestra (a nivel de la población también existen las mismas medidas) son: a. Medidas de dispersión absolutas: i. Rango o Amplitud. ii. Rango intercuartílico. iii. Varianza iv. Desviación estándar

Se denominan medidas de dispersión absolutas porque presentan similares unidades de medida que poseen las observaciones.

b. Medidas de dispersión relativa: Coeficiente de variación. Se denomina medida de dispersión relativa porque no tiene unidades de medida. Siempre debe usarse, como mínimo, una medida de tendencia central y una medida de dispersión para describir el comportamiento de un conjunto de datos.

6.1 Rango o amplitud El rango muestral es la medida de dispersión más simple y se denota por R; el rango es la primera medida de dispersión que debe usarse porque permite conocer el intervalo de variación de los datos. Las fórmulas para calcularlo se indican a continuación. Datos no agrupados R = Valor máximo – valor mínimo

Datos agrupados

= R LSk − LI1

Las propiedades del rango muestral son: a. Fácil de calcular. b. El rango siempre asume valores positivos. c. La principal desventaja del rango es que no describe la variabilidad de los datos que se encuentran comprendidos entre los valores mínimo y máximo.

54

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

6.2 Rango intercuartílico La diferencia entre el tercer y el primer cuartil (Q3 – Q1 ) es conocido como el rango (o amplitud) intercuartílico; dentro del mencionado rango se encuentra el 50 % central de las observaciones. Las propiedades del rango intercuartílico son: a. El rango intercuartílico siempre asume valores positivos. b. El rango intercuartílico se utiliza cuando se presentan datos discordantes. c. El rango intercuartílico no se ve afectado por la existencia de datos discordantes.

6.3 Varianza La desviación de una observación con respecto a la media se define como: xi − x, y puede asumir valores positivos o negativos dependiendo si el valor xi se encuentra por encima o por debajo de la media. La figura 29 ilustra este concepto.

xi

xk

x

Xi − X Desviación negativa

Figura 29. Desviación de una observación con respecto a la media.

Xk − X Desviación positiva

La varianza muestral ( S 2 ) cuantifica la dispersión de los valores xi con respecto a x . Las fórmulas para calcular el valor de S 2 se presentan a continuación:

Datos no agrupados 2 2 n  n 2 ∑ xi − x  ∑ xi  − nx  i =1  =1 = S2 i = n −1 n −1

(

)

Datos agrupados 2  k 2   ∑ yi fi  − ny i =1  S2 =  n −1

La varianza muestral asume un valor grande cuando los valores xi se alejan del promedio y un valor pequeño cuando los valores xi se ubican alrededor del promedio. Las propiedades de la varianza muestral son: a. La varianza muestral S2 es única y siempre existe. b. La varianza muestral S2 siempre es positiva. c. Si y= xi ± a, entonces Sy2 = Sx2 , para a constante. i

Capítulo 1. Estadística descriptiva

55

d. Si yi = axi, entonces, Sy2 = a 2 Sx2 , para a constante. e. La varianza muestral S2 es afectada por los valores extremos. f. El mayor inconveniente de la varianza muestral S2 es que su unidad de medida es el cuadrado de la unidad de medida de los datos originales.

6.4 Desviación estándar La desviación estándar muestral, denotada por S, cuantifica la dispersión de los datos xi con respecto a la media. La fórmula para calcular el valor de la desviación estándar muestral S es la misma para datos agrupados y no agrupados y se define como: S = S2

Donde: S2 es la varianza muestral calculada previamente para datos agrupados o no agrupados. La desviación estándar muestral es la medida de dispersión más utilizada junto con la media muestral ( x ). Estas dos medidas descriptivas poseen un conjunto de propiedades estadísticas que las hacen de suma utilidad en el análisis de datos. Las propiedades de la desviación estándar muestral son: a. La desviación estándar muestral S es única y siempre existe. b. La desviación estándar muestral S siempre es positiva.

xi ± a , entonces, Sy = Sx para a constante. c. Si y= i d. Si yi = axi , entonces, S y = aSx , para a constante. e. La desviación estándar muestral S es afectada por los valores extremos. f. La desviación estándar muestral S tiene su unidad de medida igual a la unidad de medida de los datos originales, esta propiedad la hace útil para analizar la dispersión de los datos. g. En el caso de que se desee comparar la variabilidad de dos o más conjuntos, la desviación estándar muestral S puede usarse únicamente si se cumplen las siguientes dos condiciones: i. Los conjuntos de datos a comparar tienen las mismas unidades de medida. ii. Las medias muestrales de los conjuntos de datos tiene valores próximos entre sí. Si no se cumplen estas condiciones, no debe usarse S como medida de comparación.

56

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

6.5 Coeficiente de variación El coeficiente de variación, denotado por C.V., cuantifica la dispersión relativa que tienen los datos expresándola como el porcentaje de la desviación estándar (S) con respecto al valor absoluto de la media ( x ), es decir, si x es el 100 %, entonces el coeficiente de variación es el porcentaje de la desviación estándar muestral con respecto a x. Luego, C.V . =

S 100 % x

La fórmula de cálculo de C.V. es la misma para datos agrupados y no agrupados. Las propiedades del coeficiente de variación son: a. El coeficiente de variación no tiene unidad de medida. b. El coeficiente de variación es útil para juzgar si un conjunto de datos es homogéneo o heterogéneo. Para este fin, se deben utilizar valores de referencia. Algunos autores hacen uso de valores de referencia, que se muestran en la tabla 8, para interpretar el valor del coeficiente de variación: Valor del C.V.

Interpretación

0 < C.V . ≤ 5

Los datos son muy homogéneos.

5 < C.V . ≤ 10

Los datos son homogéneos.

10 < C.V . ≤ 15

Los datos son regularmente homogéneos.

15 < C.V . ≤ 20

Los datos son regularmente heterogéneos.

20 < C.V . ≤ 25

Los datos son heterogéneos.

25 < C.V .

Tabla 8. Valores de referencia para la interpretación del coeficiente de variación.

Los datos son muy heterogéneos.

c. El coeficiente de variación es útil para comparar la dispersión de dos o más conjuntos de datos que tienen los mismos o diferentes unidades o promedios.

xi − a, entonces, C.V .y > C.V .x , d. Si y= i C.V .Z < C.V .X , para a constante.

y si

y= xi + a, i

entonces,

e. Si yi = axi , entonces, C.V .y = C.V .x.

Capítulo 1. Estadística descriptiva

57

Ejemplo 11 El monto de consumo efectuado por los primeros 6 clientes de una heladería ubicada dentro de un centro comercial se muestran a continuación: 33

12

24

18

35

16

a. En forma manual, calcule el rango de los montos de consumo por parte de los primeros 6 clientes. Solución Max = 35, Min = 12 Rango = Max –= Min 35 = – 12 23

Interpretación: La diferencia entre el mayor y menor monto de consumo, de los primeros 6 clientes, fue de S/ 23.

b. En forma manual, determine el valor de la varianza y de la desviación estándar asociados a los montos de consumo. Solución Realizando los cálculos previos: 6

∑ xi 33 + 12 + 24 + 18 + 35 + 16 i =1 x = = = 23 6 6 6

2 2 2 2 2 2 2 ∑ xi = 33 + 12 + 24 + 18 + 35 + 16 = 3614

i =1

Aplicando la fórmula de la varianza:

 n 2 2  ∑ xi  − nx 3614 − 6( 232 ) 1 = i   = = = 88 soles 2 S2 6 −1 n −1 Obteniendo la respectiva desviación estándar: = S



= S2

88 ≈ S /. 9.38

Interpretación: La dispersión de los montos de consumo, con respecto a su valor promedio es de S/ 9.38.

c. En forma manual, determine e interprete el valor del coeficiente de variación de los montos de consumo. Solución A partir de los valores ya calculados, se tiene que:

= C.V .

58

S 9.38 = 100 % 100 % ≈ 40.78 % 23 x

Interpretación: Los montos de consumo presentan valores muy heterogéneos, es decir, son muy distintos entre sí.

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

CASO: Cable TV Una empresa que brinda el servicio de instalación de televisión por cable se encuentra realizando un análisis de la cantidad de cable coaxial que se utilizó en las últimas 100 instalaciones realizadas; los datos recabados se resumieron en la siguiente tabla de distribución de frecuencias: Intervalo (Ii)

Cable coaxial utilizado (metros) Límite inferior

Límite superior

Marca de clase (yi)

Frecuencia absoluta (fi)

1

10

14

12

4

2

14

18

16

10

3

18

22

20

26

4

22

26

24

42

5

26

30

28

18

Total

100

Ejemplo 12 En relación a los datos de las 100 instalaciones de televisión por cable realizadas por la empresa, responda según se solicite: a. Calcule el rango de la cantidad de cable coaxial utilizado en las instalaciones en análisis. Solución Debido a que los datos se presentan en una tabla resumen para datos agrupados, se debe utilizar la fórmula correspondiente y trabajar con los límites extremos de los intervalos: LS5 = 30, LI1 = 10 A = LS5 – LI1 = 30 − 10 = 20 Interpretación: La diferencia entre el mayor y menor cantidad de cable coaxial utilizado fue de 20 metros. b. Calcule la desviación estándar y el coeficiente de variación asociado a la cantidad de cable coaxial utilizado en las instalaciones en análisis. Solución Utilizando la fórmula correspondiente a datos agrupados, en la cual se hace uso de la marca de clase y las frecuencias absolutas, se tiene lo siguiente. Realizando los cálculos previos:

Capítulo 1. Estadística descriptiva

59

k

∑ yi fi 12( 4) + 16(10) + 20( 26) + 24( 42) + 28(18) =1 y i= = = 22.4 4 + 10 + 26 + 42 + 18 n 5

2 2 2 2 2 2 ∑ yi fi =12 ( 4) + 16 (10) + 20 ( 26) + 24 ( 42) + 28 (18) =51 840

i =1



Aplicando la fórmula de la desviación estándar:

= S

 k 2  2  ∑ yi fi  − ny  i =1  = n −1

51 840 − 100( 22.42 ) ≈ 4.1 metros 100 − 1



Interpretación: La dispersión de cantidad de cable coaxial utilizado en las instalaciones, con respecto a su valor promedio, es de aproximadamente 4.1 metros.



Aplicando la fórmula del coeficiente de variación: = C.V .



S 4.1 = 100 % 100 % ≈ 18.3 % 22.4 y

Interpretación: Los montos de consumo presentan valores regularmente heterogéneos, es decir, son regularmente distintos entre sí.

CASO: Usuarios de equipos de cómputo Una revista tecnológica ha realizado un estudio para conocer el uso de los equipos de cómputo en los hogares. Para el mencionado estudio se recabaron datos asociados a 160 equipos de cómputo que disponen los residentes de Santiago de Surco. Las variables de interés para el estudio fueron las siguientes: Equipo:

Tipo de equipo de cómputo (PC Escritorio, Portátil).

N.° usuarios: Cantidad de usuarios que han configurado el sistema operativo. Almacenamiento:

Cantidad de información digital almacenada (GB).

Los datos recabados se presentan en el archivo: Usuarios.mtw

Ejemplo 13 a. En relación a la cantidad de información digital almacenada por los usuarios, obtenga e interprete los valores correspondientes a rango, rango intercuartílico, varianza, desviación estándar y coeficiente de variación. Interprete el rango intercuartílico y la desviación estándar.

60

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Solución i. Ingresar a Stat> Basic Statistics> Display Descriptive Statistics… ii. Seleccionar la variable Almacenamiento iii. Presionar el botón Statistics… iv. Seleccione las siguientes estadísticas descriptivas: Standard deviation (desviación estándar), Variance (varianza), Coefficient of variation (coeficiente de variación), range (rango) e Interquartile range (rango intercuartílico). Pulse el botón OK v. Presionar el botón OK

Figura 30. Selección de medidas de dispersión.



El reporte obtenido se presenta a continuación: Descriptive Statistics: Almacenamiento Variable StDev Variance CoefVar Almacenamiento 232.8 54206.4 38.17

Range 982.8

IQR 388.0

Interpretaciones: • El 50 % central de la cantidad de información digital almacenada por los usuarios presenta un rango de 388 GB. • La dispersión de la cantidad de información digital almacenada por los usuarios, con respecto a su valor promedio, es de aproximadamente 232.8 GB. b. En relación a los resultados del ítem anterior (a), responda según se solicite: i. Si en la cantidad de información digital almacenada en todos los usuarios se desea considerar una cantidad reservada de 4 GB para la papelera de reciclaje, ¿cuál sería el nuevo valor de la desviación estándar?

Capítulo 1. Estadística descriptiva

61

Solución Sea Y : Cantidad de información digital almacenada y reservada considerando 4 GB adicionales. Se sabe que: S( X ) = 232.8 GB Por lo tanto:

S(Y )=

S( X + 4) =

S( X )= 232.8 GB

ii. Exprese el valor de la varianza en terabytes (TB). NOTA: 1 TB = 1024 GB. Solución Sea Y : Cantidad de información digital almacenada expresada en terabytes. Se sabe que: V ( X ) = 54 206.4 GB2. Por lo tanto:

= V (Y ) V= (0.001X ) 0.0012 V ( X ) = 0.000001(54 206.4) 1 GB = 0.001 TB V (Y) = 0.0542064 TB2 iii. Al expresar la cantidad de información digital almacenada en terabytes, ¿cómo se modifica el valor del coeficiente de variación? Solución

Sx = 100 % 38.17 % x Aplicando el factor de conversión se tiene lo siguiente:

El coeficiente de variación fue: = C.V .( X )

M(0.001X ) = 0.001M( X ), y S(0.001X ) = 0.001S( X ) El nuevo coeficiente de variación: = C.V .(0.001X )

0.001Sx = 100 % 38.17 %. 0.001 x

Nota: El valor del coeficiente de variación no ha cambiado luego de aplicar el factor de conversión, ya que la transformación aplicada es del tipo Y = kX, y por lo tanto la constante k se anula en el cálculo del coeficiente de variación, ya que aparece en el numerador y en el denominador. Si la transformación hubiese sido del tipo Y= X ± k, sí se modificaría el valor del mencionado coeficiente. c. En relación al número de usuarios que han configurado el sistema operativo, ¿en cuál tipo de equipo presenta una distribución más homogénea? Solución

62

Proceder de similar manera que el ítem (a) y desagregar por la variable “Equipo”. El reporte obtenido se presenta a continuación:

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Descriptive Statistics: N° Usuarios Variable Equipo CoefVar N° Usuarios PC Escritorio 35.84 Portátil 47.57

Conclusión: En las PC de escritorio, el número de usuarios que han configurado el sistema operativo presenta una distribución más homogénea, ya que a pesar de que ambos tipos de equipos poseen altos valores del coeficiente de variación, en las PC de escritorio se obtiene un menor valor en comparación al de los equipos portátiles.

7. Medidas de forma Las medidas de forma sirven para cuantificar la desviación que tiene la distribución de los datos con respecto a la distribución simétrica y unimodal conocida como distribución normal. Las medidas de forma son: a. Coeficiente de asimetría. b. Coeficiente de curtosis (apuntamiento).

7.1 Coeficiente de asimetría Los principales coeficientes de asimetría son el de Pearson y el de Fisher, cuyas fórmulas se presentan posteriormente. La interpretación del coeficiente de asimetría (C.A.), ya sea el de Pearson o el de Fisher, es la siguiente: a. Si C.A. < 0, entonces la distribución es asimétrica a la izquierda (negativa). b. Si C.A. = 01, entonces la distribución es simétrica. c. Si C.A. > 0, entonces la distribución es asimétrica a la derecha (positiva).

Figura 31. Tipos de asimetría. CA = 0

CA > 0

CA < 0

1 En la práctica es difícil obtener un valor igual a cero, así que se trabaja con valores aproximados a cero.

Capítulo 1. Estadística descriptiva

63

7.1.1 Coeficiente de asimetría de Pearson Este coeficiente se utiliza para juzgar si un conjunto de datos con distribución acampanada es simétrico o no, para lo cual se aplica la siguiente fórmula: C.A.Pearson =

3 ( x − Me ) Sx

Recuérdese que una distribución es simétrica y unimodal cuando= x Me = Mo. Nota: El coeficiente de asimetría de Pearson debe utilizarse sólo en aquellos datos unimodales con distribución acampanada.

7.1.2 Coeficiente de asimetría de Fisher Es la medida de asimetría más utilizada, ya que no presenta ninguna condición previa y se aplica a cualquier tipo de distribución. A continuación, se presenta la fórmula poblacional del coeficiente de asimetría de Fisher: 3

x −x n∑  i  i =1  Sx  C.A. Fisher = (n − 1)(n − 2) n

La fórmula muestral del coeficiente de asimetría de Fisher hace uso de la media y de la desviación estándar muestral, así como de un factor de corrección. En el presente texto, se aplicará directamente el software para el cálculo correspondiente.

7.2 Coeficiente de curtosis La curtosis cuantifica la cantidad de observaciones que se agrupan alrededor de las medidas de tendencia central de la distribución de los datos. La interpretación del valor del coeficiente de curtosis K es: n

= K

∑ ( xi − µ)

i =1

s4

4

−3

a. Si K > 0 la distribución es leptocúrtica (apuntalada) b. Si K = 0 la distribución es mesocúrtica (normal) c. Si K < 0 la distribución es platicúrtica (aplanada)

Platicúrtica

Mesocúrtica

Figura 32. Tipos de curtosis.

Leptocúrtica

64

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Nota: Los coeficientes de asimetría y de curtosis son índices, y por lo tanto no poseen unidades de medida.

CASO: Aplicativo móvil para el monitoreo de la actividad física Una empresa de artículos deportivos ha desarrollado un aplicativo móvil para el monitoreo de la actividad física, y ha convocado a 240 personas para monitorear sus caminatas y actividad física de mayor esfuerzo (trotar y correr). Luego de una semana se recabaron las siguientes características: Valoración: Valoración del aplicativo móvil elegido: Deficiente, Aceptable, Excelente Recorrido: Recorrido, medido en kilómetros (km), monitoreado durante la semana. Los datos recabados se presentan en el archivo: Ejercicios.mtw. Ejemplo 14 a. En relación al recorrido monitoreado, obtenga los coeficientes de asimetría de Pearson y de Fisher. Brinde su interpretación. Solución i. Ingresar a Stat> Basic Statistics> Display Descriptive Statistics… ii. Seleccionar la variable Recorrido iii. Presionar el botón Statistics… iv. Seleccione las siguientes estadísticas descriptivas: media, mediana, desviación estándar, y coeficiente de asimetría (skewness). Pulse el botón OK v. Presionar el botón OK

El reporte obtenido se presenta a continuación: Descriptive Statistics: Recorrido Variable Recorrido

Mean 29.972

StDev 5.033

Median 29.000

Skewness 0.76

Para el cálculo del coeficiente de asimetría de Pearson se hará uso de la media, mediana y desviación estándar obtenidas en el reporte, ya que en el software Minitab no se puede calcular directamente dicho coeficiente. C.A.= Pearson

3 ( x − Me ) 3( 29.972 − 29) = ≈ 0.579 5.033 S

C.A. Fisher = 0.76

Capítulo 1. Estadística descriptiva

65



Interpretación: Los datos del recorrido monitoreado durante la semana, mediante el aplicativo móvil, presentan una distribución asimétrica positiva, ya que el valor del coeficiente es positivo.

b. Obtenga e interprete la curtosis asociada al recorrido monitoreado mediante el aplicativo móvil, según la valoración del aplicativo realizada por el participante. Solución i. Ingresar a Stat> Basic Statistics> Display Descriptive Statistics… ii. Seleccionar la variable Recorrido iii. By variables: Valoración iv. Presionar el botón Statistics… v. Seleccione Kurtosis. Pulse el botón OK vi. Presionar el botón OK El reporte obtenido se presenta a continuación: Descriptive Statistics: Recorrido Variable Recorrido

Valoración Aceptable Deficiente Excelente

Kurtosis -0.18 -0.43 0.32

Interpretaciones: • Los participantes que valoraron el aplicativo como Deficiente o Aceptable presentaron un recorrido que se distribuye en forma platicúrtica (aplanada). • Los participantes que valoraron el aplicativo como Excelente presentaron un recorrido que se distribuye en forma leptocúrtica (apuntalada)

8. Análisis exploratorio de datos El análisis exploratorio de datos consiste de una serie de técnicas estadísticas, de tipo gráfico, propuestas por Tukey (1977) con la finalidad de detectar lo siguiente: i. Asimetría de la distribución. ii. Presencia de valores extremos (outliers) iii. Dispersión de los datos. iv. Violación de alguna suposición.

66

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Las técnicas de análisis exploratorio de datos son: a. Tallos y hojas (stem and leaf). b. Gráfico de cajas (boxplot). En el presente texto solamente se abordará al gráfico de cajas, ya que es el de mayor aplicación y difusión.

8.1 Gráfico de cajas Un gráfico de cajas es un rectángulo (caja) que es construido sobre los valores del primer cuartil, de la mediana y del tercer cuartil. El gráfico de caja es una poderosa herramienta visual que permite comparar diversos conjuntos de datos simultáneamente respecto a simetría, variabilidad, valores extremos y violación de suposiciones. La figura 33 describe las partes de una caja. Primera cuartil Q1

Tercer cuartil Q3

Mediana

Figura 33. Partes de un gráfico de cajas.

* Valor extremo Q1 – 1.5(Q3 – Q1 )

Q3 + 1.5(Q3 – Q1 )

Las características del gráfico de caja son: a. La localización de la caja es dada por la línea que atraviesa la caja y que representa la mediana. b. La dispersión es dada por el largo de la caja, así como por la distancia entre los extremos de los bigotes. c. El sesgo (asimetría) se observa en la desviación que existe entre la línea que representa la mediana y los extremos de los bigotes. d. Los valores extremos (atípicos, discordantes, outliers) son representados mediante asteriscos.

CASO: Consumo de electricidad Un programa de apoyo social ha recabado datos asociados al consumo de energía eléctrica, en kilovatios-hora al mes (kW.h /mes), de las viviendas de las zonas de mayor densidad poblacional en 4 distritos del cono norte. Estos datos se presentan en el archivo: C_Electricidad.mtw

Capítulo 1. Estadística descriptiva

67

Ejemplo 15 a. Obtenga el gráfico de cajas asociado al consumo de electricidad y brinde una interpretación. Solución i. Ingresar a Graph> Boxplot… ii. Seleccionar la opción One Y – Simple.

Figura 34. Selección del gráfico de cajas simple de una sola variable.



iii. Pulse el botón OK iv. Seleccionar a la variable C. Electricidad v. Presionar el botón OK

Nota: Si se desea que el gráfico de cajas se muestre en horizontal, entonces, se debería haber pulsado el botón Scale, y marcar la opción Transpose value and category scales. Para editar el gráfico de cajas obtenido, se debe realizar lo siguiente: i. Presionar el click derecho del mouse con el cursor sobre la caja. ii. Seleccionar Add> Data Labels… iii. En la pestaña Outliers, seleccionar la opción Use y-value labels iv. Pulsar OK. El gráfico editado se presenta a continuación:

68

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Figura 35. Gráfico de cajas simple de una sola variable.

Interpretación: Se observan 3 datos atípicos o discordantes (outliers), 2 inferiores y 1 superior, los cuales indican que existen 2 viviendas con consumos mensuales de electricidad muy bajos ( 12.00 y 12.68 kW.h/mes); asimismo, existe una vivienda con un consumo muy alto ( 30 kW.h/mes) en comparación a las demás viviendas de la muestra. b. Obtenga gráficos de cajas del consumo de electricidad pero considerando los diferentes distritos en análisis. Solución i. Ingresar a Graph> Boxplot… ii. Seleccionar la opción One Y – With Groups

Figura 36. Selección del gráfico de cajas simple con grupos.



iii. Pulse el botón OK iv. Seleccionar a la variable a ser graficada C. Electricidad v. Seleccionar a la variable cualitativa (categórica) Distrito.

Capítulo 1. Estadística descriptiva

69

Figura 37. Cuadro de diálogo del gráfico de cajas simple con grupos.



vi. Presionar el botón OK.

Luego de obtenido el gráfico, editar para etiquetar los datos atípicos. El gráfico editado se presenta a continuación:

Figura 38. Gráfico de cajas simple con grupos.



Interpretación: Se aprecia que en las viviendas de Carabayllo y Comas que conforman la muestra no existen datos discordantes; mientras que en los distritos de Independencia y San Martín de Porres sí existen datos discordantes.

70

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

9. Problemas resueltos 1. En relación a la cantidad de megabytes (MB) consumidos mensualmente por los usuarios prepago de una empresa de telecomunicaciones que adquieren paquetes de datos; se realizará una estimación del consumo promedio de megabytes en base a 200 usuarios elegidos al azar. A cada una de las expresiones que se presentan, hágales corresponder uno de los siguientes términos estadísticos: A. Unidad de análisis

B. Población

C. Muestra

D. Muestreo

E. Variable

F. Dato

G. Parámetro

H. Estadístico

Para realizar la correspondencia entre las expresiones y los términos estadísticos, coloque dentro de los paréntesis la letra correspondiente. Expresiones en evaluación: i.

( ) La cantidad de MB consumidos mensualmente por un usuario prepago.

ii.

( ) Un usuario prepago consumió 124 MB en un mes.

iii.

( ) Los 200 usuarios prepago seleccionados.

iv.

( ) La cantidad promedio de MB consumidos por todos los usuarios prepago.

v.

( ) La cantidad promedio de MB consumidos por los 200 usuarios prepago.

vi.

( ) Un usuario prepago de la empresa de telecomunicaciones.

vii. ( ) Todos los usuarios prepago de la empresa de telecomunicaciones. viii. ( ) El procedimiento utilizado para seleccionar a los 200 usuarios prepago. Solución i. (E) v. (H)

ii. (F) vi. (A)

iii. (C) vii. (B)

iv. (G) viii. (D)

2. Una revista electrónica dedicada a temas tecnológicos realizó un estudio dirigido a los jóvenes de algunos distritos de la zona residencial de Lima Metropolitana. Para el estudio se realizó la selección al azar de 800 jóvenes de los mencionados distritos. Los principales resultados obtenidos fueron los siguientes: El 42 % de los encuestados posee un smartphone de gama alta, y el 19 % usa el sistema operativo móvil iOS; además, en promedio, acceden desde su smartphone, 2.5 horas diariamente a las redes sociales, y se determinó que la mayoría de los jóvenes se encuentra suscrito a 3 redes sociales.

Capítulo 1. Estadística descriptiva

71

De acuerdo al contexto presentado: a. Identifique la unidad de análisis, población, muestra, variables y tipos de variables. b. Presente un ejemplo de dato y de estadístico. Solución a. De acuerdo al contexto se tiene lo siguiente: Unidad de análisis: Joven residente en alguno de los distritos residenciales de Lima Metropolitana. Población: Todos los jóvenes residentes en los distritos residenciales de Lima Metropolitana. Muestra: 800 jóvenes residentes en los distritos residenciales de Lima Metropolitana. Variable 1: Posesión de smartphone (cualitativo nominal). Variable 2: Sistema operativo móvil que usa el smartphone (cualitativo nominal). Variable 3: Tiempo de acceso diario, desde el smartphone, a las redes sociales (cuantitativo continuo). Variable 4: Número de redes sociales a las que está suscrito (cuantitativo discreto). b. Se pueden brindar los siguientes ejemplos: Dato: Un joven encuestado señaló que el sistema operativo de su smart­ phone es Android. Estadístico: El 42 % de los encuestados posee un smartphone de gama alta.

3. Para cada uno de los siguientes estudio, indique la unidad de análisis, la variable y el tipo de variable que debería ser utilizado para resumir la información: a. Conocer el número de hijos de los operarios de una empresa manu­ facturera. b. Determinar el nivel de satisfacción de asegurados de una AFP. c. Identificar el país de procedencia de los turistas que visitan la reserva de Paracas. Solución a. Unidad de análisis:

72

Operario de una empresa manufacturera.

Variable:

Número de hijos.

Tipo de variable:

Cuantitativo discreto.

b. Unidad de análisis:

Asegurado de la AFP.

Variable:

Nivel de satisfacción.

Tipo de variable:

Cualitativa ordinal.

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

c. Unidad de análisis:

Turista que visita la reserva de Paracas.

Variable:

País de procedencia.

Tipo de variable:

Cualitativa nominal.

4. En base a una muestra de 320 personas de la población económicamente activa, se elaboró una gráfica circular asociada al nivel de satisfacción con la oferta turística:

a. Determine el porcentaje de encuestados que señalaron un nivel de satisfacción medio. b. Indique el número de encuestados que señalaron un alto nivel de satisfacción. c. De los encuestados que señalaron un nivel de satisfacción medio con la oferta turística, un 37.5 % laboran en el sector público. ¿Cuántas personas señalaron un nivel de satisfacción medio y laboran en el sector privado? Solución a. La suma de todos los porcentajes debe ser igual al 100 %, entonces:

X + 12.5 % + 27.5= % 100 % ⇒ = X 60.0 % El 60.0 % de los encuestados señalaron un nivel de satisfacción medio. b. El 12.5 % de los 320 encuestados señalaron un nivel de satisfacción alto, entonces: 0.125(320) = 40 encuestados: c. Nivel de satisfacción Medio: 0.60 × 320 = 192 encuestados

De los 192 encuestados, el 37.5 % labora en el sector público, entonces:



0.375(192) = 72 encuestados La diferencia con respecto a los 192 encuestados nivel de satisfacción medio, corresponden al sector privado: 192 − 72 = 120 encuestados.

Capítulo 1. Estadística descriptiva

73

5. Se realizó una tabla cruzada asociada a las variables de rendimiento y local asociadas a los trabajadores de una empresa del rubro tecnológico, tal como se muestra a continuación. Rendimiento

Local

Total

L1

L2

L3

L4

Bajo

2

3

1

2

8

Medio

9

14

20

7

50

Alto

3

7

9

3

22

Total

14

24

30

12

80

Responda a las siguientes preguntas: a. ¿Cuántos y que porcentaje de trabajadores eran del local L1 y tuvieron un rendimiento medio? b. De los trabajadores con un rendimiento medio, ¿qué porcentaje corresponden al local L3? Justifique cuantitativamente. c. De los trabajadores con un rendimiento alto, ¿qué porcentaje no corresponden al local L4? Justifique cuantitativamente. d. De los trabajadores del local L4, ¿es o no correcto afirmar que más de la cuarta parte tuvo un rendimiento alto? Justifique cuantitativamente. Solución a. ¿Cuántos y que porcentaje de trabajadores eran del local L1 y tuvieron un rendimiento medio? 9 de 80 trabajadores, es decir, 11.25 %. b. De los trabajadores con un rendimiento medio, ¿qué porcentaje corresponde al local L3? Justifique cuantitativamente. De los trabajadores con un rendimiento medio, el 40 % corresponde al local L3. c. De los trabajadores con un rendimiento alto, ¿qué porcentaje no corresponde al local L4? Justifique cuantitativamente. De los trabajadores con un rendimiento alto, el 86.36 % ([3 + 7 + 9] / 22) no corresponde al local L4. d. De los trabajadores del local L4, ¿es o no correcto afirmar que más de las tres décimas partes tuvieron un rendimiento alto? Justifique cuantitativamente.

No es correcto afirmar que, de los trabajadores del local L4, más de las tres décimas partes tuvieron un rendimiento alto, ya que los trabajadores con este nivel de rendimiento representan el 25 % (3/12 ≅ 25% < 30% ≅ 3/10).

6. En una muestra de 160 personas, entre hombres y mujeres, que realizaron compras en un centro comercial, se observó la forma de pago (efectivo, tarjeta de débito, tarjeta de crédito); luego de lo cual se resumió lo siguiente:

74

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

• 35 % de las personas pagaron con tarjeta de débito. • Los hombres que pagaron con efectivo representan la décima parte del total de personas en estudio. • De las 64 mujeres, el 18.75 % pagó con efectivo. • De los hombres, el 31.25 % pagó con tarjeta de débito. a. A partir de la información brindada, obtenga y presente la tabla de contingencia correspondiente. b. De las personas que pagaron con tarjeta de crédito, ¿qué porcentaje fueron hombres? Justifique cuantitativamente. Solución a. Tabla de contingencia: • 56 personas pagaron con tarjeta de débito: 0.35 × 160 = 56.

16. • 16 hombres que pagaron con efectivo: 0.10 × 160 = • De las mujeres, 12 pagaron con efectivo: 0.1875 × 64 = 12. • De los hombres, 30 pagaron con tarjeta de débito: 0.3125 × 96 = 30. Los demás valores de la tabla se obtuvieron por diferencia. Sexo

7.

Medio de pago

Total

Efectivo

T. Débito

T. Crédito

Hombre

16

30

50

96

Mujer

12

26

26

64

Total

28

56

76

160

Un investigador ha realizado un estudio sobre los grupos de personas que asisten a funciones artísticas o de entretenimiento. En relación a la variable correspondiente al número de individuos que conforman el grupo de personas que asisten a la función artística, se tiene, en forma incompleta, la siguiente tabla de distribución de frecuencias asociada a una muestra de 160 grupos de personas. Frecuencia absoluta (fi )

Frecuencia absoluta acumulada (Fi )

i

N.° de personas (yi )

1

2

15

2

3

40

3

4

79

4

5

116

5

6

142

6

7

Frecuencia relativa porcentual (hi %)

Frecuencia relativa porcentual acumulada (Hi %)

Total

Capítulo 1. Estadística descriptiva

75

Responda adecuadamente a las siguientes preguntas: a. Complete la tabla presentada. b. ¿Cuántos grupos de personas se encontraban conformados por más de 4 personas? c. Calcule e interprete el valor de F5 – F3. d. ¿Es cierto que los grupos de 4 personas representan un poco más de la cuarta parte de los grupos en estudio? e. ¿Qué porcentaje de grupos se encontraban conformados por hasta 6 personas? f. ¿Qué porcentaje de participantes indicaron que su grupo lo conformaban 4 o más personas? g. Si los grupos de 2 a 3 personas son considerados como “Reducidos”; los de 4 a 5 personas son considerados “Numerosos”, y los de 6 a más como “Muy numerosos”; ¿cuál de dichas categorías es la de mayor porcentaje? Solución a. Tabla de distribución de frecuencias:

i

N° de personas (yi)

Frecuencia absoluta (fi)

Frec. Absoluta acumulada (Fi)

Frec. Relativa porcentual (hi %)

Frec. Relativa porcentual acumulada (Hi %)

1

2

15

15

9.38

9.38

2

3

25

40

15.63

25.00

3

4

39

79

24.38

49.38

4

5

37

116

23.13

72.50

5

6

26

142

16.25

88.75

6

7

18

160

11.25

100.00

Total

160

100.00

b. f4 + f5 + f6 = 37 + 26 + 18 = 81 participantes

81 participantes. De forma similar: 160 – F3 = 160 − 79 =

c. F5 – F3 = 142 − 79 = 63 grupos se encontraban conformados de 5 a 6 personas. d. La cuarta parte (1/ 4) es el 25 %, y se tiene que:

= h3 % 24.38 % < 25 % Por lo tanto, no es cierto lo que se señala, ya que, en realidad, un poco menos de la cuarta parte de los grupos en estudio se encontraban conformados por 4 personas.

e. H5 % = 88.75 % de los grupos se encontraban conformados por hasta 6 personas.

76

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

f. 100 % − H 2 % = 100 % − 25 % = 75 %

de los grupos se encontraban conformados de 4 a más personas.

g. Grupos “Reducidos”: H 2 % = 25.0 %

Grupos “Numerosos”: H 4 % − H 2 % = 72.5 % − 25.0 % = 47.5 %



Grupos “Muy numerosos”: 100 % − H 4 % = 100 % − 72.5 % = 27.5 %.

Por lo tanto, los grupos “Numerosos” ( 47.5 %) representan el mayor porcentaje.

8. Los directivos de una empresa distribuidora de energía eléctrica se encuentran realizando un estudio para analizar el monto asociado al consumo anual de energía eléctrica. Para la realización de un estudio piloto se seleccionaron a 32 hogares de los distritos de Ate, Comas y Lince, los cuales presentaron los siguientes montos de consumo: 2300

2890

2960

3100

2880

1700

1880

3200

3050

2030

2380

2140

2650

2820

1780

2340

3800

3350

1800

3050

3560

3720

2450

3010

2740

2420

2540

2300

2580

2070

2080

1850

a. Realice la siguiente codificación:

Bajo: consumos menores a S/ 2400



Estándar: consumos mayores o iguales a S/ 2400 pero menores de S/ 2800.



Elevado: consumos mayores o iguales a S/ 2800 pero menores de S/ 3200.



Muy elevado: consumos o mayores a S/ 3200



¿Cuál es el porcentaje de hogares correspondiente a cada categoría de la presente clasificación?

b. Utilizando el criterio de Sturges, construya la tabla de distribución de frecuencias correspondiente. Solución a. Luego de digitar los datos en la hoja de trabajo del software Minitab, se realizará una codificación de numérico a texto:

0 : 2399.99 ⇒ Bajo

2400 : 2799.99 ⇒ Estándar



2800 : 3199.99 ⇒ Elevado 3200 : 99999 ⇒ Muy elevado

Luego de lo cual se obtienen los porcentajes correspondientes: Tally for Discrete Variables: Monto consumo Pago Count Percent Bajo 13 40.63 Elevado 8 25.00 Estándar 6 18.75 Muy elevado 5 15.63 N= 32

Capítulo 1. Estadística descriptiva

77

b. Se obtienen las estadísticas descriptivas correspondientes Descriptive Statistics: Monto consumo annual Total Variable Count Minimum Maximum Range Pago anual 32 1700 3800 2100

Luego de obtenido el rango, se determina el número de intervalos, aplicando la fórmula de Sturges:

k= 1 + 3.32(log10 (32)) = 5.9971 ≈ 6



2100 = 350 . 6 A continuación, se hace uso del software Minitab para obtener el histograma correspondiente: Por lo tanto, la amplitud del intervalo es: = C



A partir del cual se construye la tabla de distribución de frecuencias de los montos del consumo anual de energía eléctrica, tal como se muestra a continuación:

78

Límite inferior

Límite superior

Marca de clase (yi )

Frecuencia absoluta (fi )

Frecuencia relativa porcentual (hi %)

Frecuencia absoluta acumulada (Fi )

Frecuencia relativa porcentual acumulada (Hi %)

1700

2050

1875

6

18.750

6

18.750

2050

2400

2225

7

21.875

13

40.625

2400

2750

2575

6

18.750

19

59.375

2750

3100

2925

7

21.875

26

81.250

3100

3450

3275

3

9.375

29

90.625

3450

3800

3625

3

9.375

32

100.000

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

9. En un taller mecánico autorizado de una marca de automóviles, se ha recabado el kilometraje recorrido por los automóviles que ingresan al taller para una reparación en el motor. A continuación, se presenta, en forma incompleta, la tabla de distribución de frecuencias asociada a 250 automóviles: Nota: Intervalos de igual amplitud. Intervalo de kilómetros (S/)

i

Marca de Clase ( yi )

N.º Autos (fi )

N.º Acum. Autos (Fi )

1

[





2

[





112

3

[





172

4

[





5

[

– 22 000〉

% Autos (hi %)

% Acum. Autos (Hi %)

16.00

19.20 20 000

Total

250

100

Realice o responda según se solicite. a. Complete la tabla de distribución de frecuencias. b. ¿Cuál es la amplitud de los intervalos? c. ¿Cuál es la marca de clase correspondiente al primer intervalo? d. ¿Qué porcentaje de autos no se encuentran comprendidos en el primer intervalo? e. ¿Cuántos autos presentaron un kilometraje de por lo menos 6000 km pero por debajo de los 18 000 km? Solución a. Complete la tabla de distribución de frecuencias. i

Intervalo de kilómetros (S/)

Marca de Clase (yi)

N.º Autos (fi)

N.º Acum. Autos (Fi)

% Autos (hi %)

% Acum. Autos (Hi %)

1

[ 2000 – 6000〉

4 000

40

40

16.00

16.00

2

[6000 – 10 000〉

8 000

72

112

28.80

44.80

3

[10 000 – 14 000〉

12 000

60

172

24.00

68.80

4

[14 000 – 18 000〉

16 000

48

220

19.20

88.00

5

[18 000 – 22 000〉

20 000

30

250

12.00

100.00

Total

250

100 %

Capítulo 1. Estadística descriptiva

79

b. ¿Cuál es la amplitud de los intervalos?

40 000 km. c. ¿Cuál es la marca de clase correspondiente al segundo intervalo? 8000 km. d. ¿Qué porcentaje de autos no se encuentran comprendidos en el primer intervalo? 84 % 100 % − 16 % = e. ¿Cuántos autos presentaron un kilometraje de por lo menos 6000 km pero por debajo de los 18 000 km?



72 + 60 + 48 = 180 automóviles.

10. En una galería comercial especializada en la venta de muebles para el hogar se ha realizado una encuesta para determinar los motivos de insatisfacción de los clientes, y se ha elaborado el siguiente diagrama de Pareto.

a. Si cada cliente insatisfecho emitió una opinión sobre su motivo de insatisfacción, ¿cuántos clientes insatisfechos fueron considerados para el estudio? b. Obtenga los valores faltantes correspondientes a las frecuencias absolutas y relativas acumuladas. c. ¿Cuáles motivos de insatisfacción empezaría por tratar de solucionar?, ¿por qué criterio?

80

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Solución a. Como una frecuencia absoluta de 60 corresponde a un porcentaje (frecuencia relativa) de 40 %, entonces se tiene que:

60 = 0.40, entonces, n = 150 clientes insatisfechos fueron los consin derados para el estudio.

f2 39= , f5 9= , f6 4 b. = = H 4 % 89 = .33 %, H6 % 98.00 % c. ¿Cuáles motivos de insatisfacción empezaría por tratar de solucionar?, ¿por qué criterio? Se empezaría por tratar de solucionar los siguientes motivos: inadecuada explicación del producto, pocos modelos, y diseños antiguos, ya que son los de mayor frecuencia, y juntos representan el 79.33 % de la totalidad de opiniones emitidas.

11. En un hotel ubicado en Moyobamba, se ha elaborado una gráfica de bastones asociada al número de noches de estadía en el hotel, por parte de 128 clientes, tal como se muestra a continuación:



Basado en el gráfico de bastones, obtenga e interprete adecuadamente las siguientes medidas estadísticas solicitadas. a. La media. b. La mediana. c. La moda. Solución a. Cálculo de la media. 5

∑ yi fi 1 22 + 2 50 + 3 32 + 4 18 + 5 6 ( ) ( ) ( ) ( ) (=) 320 = = 2.5 y i =1 = n 128 128

Capítulo 1. Estadística descriptiva

81

La cantidad promedio de noches de estadía en el hotel fue de 2.5 noches. b. La mitad de 128 es 64, así que se ubican los datos que ocupan las posiciones 64 y 65 el cual en ambos casos es 2 noches.

x( 64 ) + x( 65) 2 + 2 = = 2 noches, ya que n es par. 2 2

Me= (X )

El 50 % de los clientes encuestados tuvieron a lo más una estadía de 2 noches en el hotel. c. Mo( X ) = 2

El tiempo de estadía más frecuente es de 2 noches.

12. A un grupo de 12 jóvenes se les consultó sobre el número de tarjetas de crédito que posee. Se determinó que 1 joven no poseía tarjeta de crédito, y que 6, 3, 1 y 1 jóvenes poseían 1, 2, 3 y 4 tarjetas de crédito, respectivamente. a. Obtenga e interprete el valor de la mediana asociada al número de tarjetas de crédito que poseen los jóvenes en estudio. b. ¿Cómo mínimo, cuántos jóvenes con 3 tarjetas de crédito se deberían añadir al grupo de jóvenes en estudio, para que la mediana cambie de valor? c. Si se añade la mínima cantidad de jóvenes con 3 tarjetas de crédito que se determinó en el ítem anterior (b), ¿cuál tipo de distribución presentaría la nueva muestra de jóvenes en relación al número de tarjetas de crédito que poseen? Justifique. Solución a. Presentando los datos ordenados. 0

1

1

1

1

1

1

2

2

2

3

4

x(1)

x(2)

x(3)

x(4)

x(5)

x(6)

x(7)

x(8)

x(9)

x(10)

x(11)

x(12)

n = 12 Como n es par, entonces:



x +x n n     + 1 x(6) + x(7) 1 + 1 2 2 =  Me(= X) = = 1 2 2 2 Interpretación: El 50 % de los jóvenes encuestados posee a lo más 1 tarjeta de crédito.

b. Si se añaden jóvenes con 3 tarjetas de crédito, estos ocuparán la posición x( 11) en adelante, y por lo tanto el tamaño de la muestra (n) aumentaría. Entonces, si se desea que la mediana se modifique, debería ser mayor que 1.

82

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Si se añaden jóvenes con 3 tarjetas de crédito, entonces, la nueva mediana por lo menos debería encontrarse entre x y x . (7)



( 8)

x +x n n     + 1 x(7) + x(8) 1 + 2 2 2 =  (X ) Me= = = 1.5 2 2 2 Lo cual ocurriría si x n  = x(7 ) , es decir si n = 14.   2

Por lo tanto, para que la mediana cambie de valor, por lo menos 14 − 12 = 2 jóvenes con 3 tarjetas de crédito se deberían añadir al grupo. c. Añadiendo 2 jóvenes con 3 tarjetas de crédito se tiene lo siguiente:

Moda = 1 tarjeta



Mediana = 1.5 tarjetas



∑ yi fi 0(1) + 1(6) + 2(3) + 3(1 + 2) + 4(1) 25 y i =1 = = ≈ 1.786 Media = = n 12 + 2 14

5

La nueva muestra de jóvenes, en relación al número de tarjetas de crédito que poseen, presenta una asimetría positiva (cola derecha), ya que moda < mediana < media

13. En un club de campo, se hizo el siguiente gráfico asociado al tiempo de uso de los servicios libres que ofrece el club por parte de los usuarios que se han hospedado en las cabañas durante los fines de semana.



a. Obtenga e interprete el tiempo promedio de uso de los servicios libres que ofrece el club de campo. b. Si el club de campo se encuentra ofreciendo ofertas y promociones para la realización de actividades, por lo cual se espera que el tiempo de uso de los servicios libres disminuya en un 20 %, ¿cuál será el nuevo tiempo de uso promedio?

Capítulo 1. Estadística descriptiva

83

Solución a. A partir de la gráfica de frecuencias absolutas acumuladas, se obtiene la tabla de distribución de frecuencias correspondiente:



Intervalos

Marca de clase (yi)

Frecuencia absoluta (fi)

[60 − 120〉

90

10

[120 − 180〉

150

64

[180 − 240〉

210

97

[240 − 300〉

270

100

[300 − 360]

330

49

Total

-----

320

Cálculo de la media:

= M (Y ) = M (Y )

90 (10 ) + 150 ( 64 ) + 210 ( 97 ) + 270 (100 ) + 330 ( 49 ) 1 k = ∑ yi fi n i =1 320 74 040 = 231.375 minutos 320

Interpretación: Los usuarios del club de campo que se han hospedado en las cabañas durante los fines de semana usan los servicios libres un promedio de 231.4 minutos, aproximadamente.

b. Haciendo uso de las propiedades de la media:

M = (0.80Y ) 0.80 = M (Y ) 0.80 ( 231.375 ) 185.1 minutos. El nuevo tiempo promedio de uso de los servicios libres del club de campo será de 185.1 minutos.

14. Una entidad especializada en el financiamiento de pequeños negocios posee 2 agencias en un distrito del cono este. Las agencias A y B disponen de 4 y 6 promotores de crédito, respectivamente, quienes visitan a los pequeños emprendedores de la zona para ofrecerles financiamiento. La entidad financiera emitió el siguiente informe relacionado a la colocación de créditos, por parte de los promotores, durante el último mes: Tipo de créditos

Promedio de los montos de crédito por asesor Agencia A

Agencia B

Nuevos créditos

S/ 68 300

S/ 70 200

Renovación de créditos

S/ 94 500

S/ 88 600

Nota: Crédito total colocado = Créditos nuevos + Créditos renovados

84

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

a. Determine el promedio del monto de los nuevos créditos colocados por los promotores de crédito de ambas agencias en conjunto. b. Si el monto promedio de nuevos créditos colocados por los promotores en la Agencia A se encontraba errado (no era S/ 68 300 ); de forma tal que el promedio del monto de nuevos créditos colocados por los promotores de ambas agencias en conjunto es de S/ 69 500, ¿cuál era el verdadero monto promedio de nuevos créditos colocados en la Agencia A? c. Determine el promedio del monto de los créditos totales colocados por los promotores de la agencia A. d. Determine el promedio de los créditos totales colocados por los promotores de crédito de ambas agencias. Solución a. Sea, X: Monto de los nuevos créditos.

Se tiene: x A = 68 300 , xB = 70 200 , nA = 4 , nB = 6



Se sabe que:

x =



nA x A + nB xB 4(68 300) + 6(70 200) 694 400 = = = S/ 69 440 n A + nB 4+6 10

b. Se sabe que: x = nA x A + nB xB n A + nB

= x



4 x A + 6(70 200) 4 x A + 421 200 = = 69 500 4+6 10

xA =



69 500(10) − 421 200 = S/ 68 450 4

c. Sea,

X: monto de los nuevos créditos,



Y : monto de renovación de créditos, y



Z: monto total de créditos.



Haciendo uso de las propiedades de la media:



Se tiene: M ( X A ) = 68 300 , M (YA ) = 94 500 M(ZA ) = M( X A + YA ) = = M( X A ) + M(YA ) = 68 300 + 94 500 = S / 162 800

M ( ZB ) = M( XB + YB ) = = M( XB ) + M(YB ) = 70 200 + 88 600 = S / 158 800 d. zB = nA z A + nB zB 4(162 800) + 6(158 800) 1 604 000 = z = = = S / 160 400 nA + nB 4+6 10

15. En una fábrica de electrodomésticos, los operarios A y B fueron evaluados en su velocidad para ensamblar un modelo de ventilador. La evaluación se realizó en 2 turnos: mañana y tarde. Se obtuvo los siguientes resultados:

Capítulo 1. Estadística descriptiva

85

Tiempo promedio (seg.) de ensamble Turno

Operario A

Operario B

Ambos operarios

Mañana

170.0

172.0

170.96

Tarde

170.2

171.4

170.77

Los promedios fueron calculados con diferentes tamaños de muestra (número de ventiladores) para cada turno y para cada operario. a. Si en el turno de la mañana la muestra total de ventiladores ensamblados por ambos operarios fue de 125 ventiladores, ¿cuántos ventiladores fueron ensamblados por cada operario? b. En el turno de la tarde, ¿qué porcentaje de la muestra corresponde a cada operario? Solución a. Sea, X: tiempo de ensamblaje del operario durante el turno de la mañana.

125 , entonces = n= Se tiene: x A = 170, xB = 172, nA + nB = B 125 − nA

= x

n A x A + nB x B = n A + nB

nA (170) + (125 − nA )172 = 170.96 125

170nA − 172nA + 21 500 = 21 370 ⇒ n= 65. A

El número de ventiladores que fueron ensamblados por cada operario en el turno de la mañana es: nA = 65 y nB = 60. b. Sea, Y : tiempo de ensamble del operario durante el turno de la tarde.

De la fórmula del promedio general (media de medias) se deduce lo siguiente:

y =



n A y A + nB y B nA = n A + nB n A + nB

yA +

nB n A + nB

yB = p A y A + pB y B , donde p es la

proporción de la muestra que corresponde a cada operario.

1 pB =− 1 p A . Por lo Se tiene: y A = 170.2 , y = 171.4 , p A + pB =⇒ B tanto: y = p A 170.2 + (1 − p A )171 = .4 170.2 p A − 171.4 p A + 171 = .4 170.77 ⇒ = p A 0.525

Los porcentajes de la muestra que corresponden a cada operario son de 52.5 % y 47.5 %, para los operarios A y B, respectivamente.

86

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

16. Se han recabado los datos asociados a 80 usuarios de los principales servicios de acceso a contenidos vía streaming, es decir, servicios de reproducción de contenido digital en paralelo mientras se descarga sin almacenarse. En el archivo Streaming.mtw, se presentan los datos asociados a las siguientes variables: Servicio

Servicio de streaming del cual es usuario activo.

Nivel manejo

Nivel de manejo de las funcionalidades del servicio.

H. Conexión

Horas de conexión mensual para el uso del servicio.

En relación a las horas de conexión mensual responda a las siguientes preguntas: a. Según el nivel de manejo de las funcionalidades del servicio, ¿en cuál de los niveles los usuarios presentan un mayor promedio de horas de conexión? b. Para las horas de conexión mensual se consideró el tiempo de búsqueda de contenidos y el tiempo de reproducción. Si se considera un tiempo constante de 2.14 horas al mes para la búsqueda de contenidos. Para los usuarios de Deezer, ¿cuál es el nuevo valor promedio de las horas de conexión mensual sin considerar la búsqueda de contenidos? c. ¿Cuál es el valor de las horas de conexión por debajo del cual se encuentra el 50 % de usuarios de Spotify con menores tiempos de conexión? d. Complete el siguiente párrafo: El 25 % de los usuarios encuestados con horas de menores tiempos de conexión, presenta como máximo conexión mensual, el mismo valor que coincide para los usuarios de . Mientras que el 25 % de los usuarios de Netflix, con mayores tiemde 29.6 horas. pos de conexión, presenta un tiempo de conexión e. Halle el tiempo máximo de horas de conexión mensual del 65 % de los usuarios de Netflix con menores tiempos de conexión. Solución a. Se obtiene los promedios asociados a las horas de conexión, en forma desagregada por nivel de manejo de las funcionalidades del servicio. Descriptive Statistics: H. Conexión Nivel Total manejo Count Mean Alto 9 30.41 Bajo 26 18.373 Medio 45 25.984

Los usuarios con un nivel de manejo alto de las funcionalidades del servicio presentan un mayor promedio de horas de conexión (30.41 horas). b. Se obtiene los promedios asociados a las horas de conexión, en forma desagregada por el servicio de streaming.

Capítulo 1. Estadística descriptiva

87

Además, se obtienen los valores de la mediana y los cuartiles para responder las preguntas posteriores. Descriptive Statistics: H. Conexión Total Variable Servicio Count Mean H. Conexión Deezer 16 25.86 Netflix 32 24.27 Spotify 32 22.83

Q1 23.25 18.50 19.20

Median 25.80 25.15 20.55



Aplicando las propiedades de la media se tiene lo siguiente:



M( XDeezer – 2.14) = M( XDeezer ) – 2.14



Q3 29.10 29.60 25.95

M( XDeezer − 2.14) = 25.86 − 2.14 = 23.72 horas

c. De acuerdo al reporte obtenido se observa que el 50 % de usuarios de Spotify con menores tiempos de conexión presentan a lo más 20.55 horas de conexión al mes, ya que ese es el valor de la mediana. d. Se obtienen las medidas de posición en forma general, sin considerar ningún tipo de desagregación. Descriptive Statistics: H. Conexión Variable H. Conexión

Total Count 80

Q1 19.200

Median 23.700

Q3 29.100

Se observa que los valores asociados a los espacios a completar se encuentran a asociados a (en orden de aparición): [1] Cuartil 1 general: 19.2 horas, [2] Cuartil 1 asociado a Spotify: 19.2 horas, [3] Cuartil 3 asociado a Netflix. El párrafo completado queda de la siguiente forma: El 25 % de los usuarios encuestados con menores tiempos de conexión presenta como máximo 19.2 horas de conexión mensual, el mismo valor que coincide para los usuarios de Spotify. Mientras que el 25 % de los usuarios de Netflix, con mayores tiempos de conexión, presenta un tiempo de conexión mínimo de 29.6 horas. e. Se tiene que dividir la hoja por la variable Servicio: Split by Servicio. En la hoja asociada al servicio de Netflix, se ingresa a la calculadora del software Minitab y se obtiene el percentil 65 : PERCENTILE(‘H. Conexión’, 0.65) Con lo que se concluye que el tiempo máximo de horas de conexión mensual del 65 % de los usuarios de Netflix con menores tiempos de conexión, es de 27.53 horas.

88

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

17. Se dispone de la siguiente información sobre las notas, en escala centesimal, obtenidas por los asistentes a una capacitación, los cuales se dividieron en 2 grupos: Grupo A

Grupo B

Asistentes evaluados = 30 30

30

i =1

i =1

∑ xi = 2100 , ∑

xi2

Asistentes evaluados = 28 28

28

i =1

i =1

2 ∑ xi = 2100 , ∑ xi = 174 375

= 158 600

Mediana = 75 puntos

Mediana = 70 puntos

a. Determine cuál grupo obtuvo puntajes más homogéneos. b. ¿Es cierto que la distribución de las notas del grupo B es más asimétrica que la distribución de las notas del grupo B? Solución a. Se debe obtener la media y la desviación estándar para calcular el coeficiente de variación correspondiente. Grupo A

Grupo B

n

M(X)

∑ xi

2100 = 70 30

i =1

n

S(X)

C.V.%

2  n 2  ∑ xi  − nx  i =1  n −1

S(X ) 100 % x

158 600 − 30(70) 2 = 20 30 − 1

 20   100 % = 28.57 %  70 

2100 = 75 28

174 375 − 28(75) 2 = 25 28 − 1

 25   100 % = 33.33 %  75 

Los asistentes del Grupo A obtuvieron puntajes más homogéneos, ya que este grupo presentó el menor coeficiente de variación ( 28.57 %). b. En base a los promedios calculados y a los valores medianos proporcionados, se procede a calcular el coeficiente de asimetría de Pearson. Grupo A Coef. Asimetría Pearson

3( x − Med) S( X )

3(70 − 75) = − 0.75 20

Grupo B

3(75 − 70) = 0.60 25

La distribución de las notas de la sección B NO es más asimétrica que la distribución de las notas de la sección A, ya que el valor absoluto de su coeficiente de asimetría es menor, es decir, es más simétrica.

Capítulo 1. Estadística descriptiva

89

18. Los montos de compra, en soles, gastados por los clientes que han adquirido prendas de vestir en una tienda por departamentos se han representado en la siguiente tabla: Monto de compra

N.° acumulado de clientes (fi )

[0 − 80〉

12

[80 − 160〉

37

[1600 − 240〉

97

[240 − 320〉

132

[320 − 400〉

152

[400 − 480]

160

a. Considerando los datos, ¿cuál es el tipo de asimetría que presentan los montos de compra asociados a las prendas de vestir? b. Si se prevé que los montos de compra se incrementan en un 4 % más un adicional de 5 soles, calcule el coeficiente de variación de los montos de compra considerando el mencionado incremento, e indique cómo ha variado. Solución a. A partir de los datos se obtiene el monto promedio y el valor mediano, así como la desviación estándar, que sirven para calcular el coeficiente de asimetría de Pearson. Monto de compra (S/)

yi

N.° de clientes (fi)

N.° acumulado de clientes (Fi)

[0 − 80〉

40

12

12

480

19 200

[80 − 160〉

120

25

37

3000

360 000

[1600 − 240〉

200

60

97

12 000

2 400 000

[240 − 320〉

280

35

132

9800

2 744 000

[320 − 400〉

360

20

152

7200

2 592 000

[400 − 480]

440

8

160

3520

1 548 800

36 000

9 664 000

160 k

90



∑ yi fi 36 000 =1 = = 225 M(Y ) i = 160 n



Intervalo mediano: [1600 − 240〉

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

yifi

(yi)2fi



1  1     n − FMe -1    160 − 37  2 2 = = S / 217.333 160 + 80    Me(Y ) = LI Me + c        60 f Me        

= S(Y )



2  k 2   ∑ yi fi  − nx  i =1  = n −1

Coef . As . Pearson =

9 664 000 − 160( 225)2 ≈ S/ 99.179 160 − 1

3( y − Med) 3 ( 225 − 217.333) = ≈ 0.2319 99.179 S(Y )

Los montos de compra asociados a las prendas de vestir presentan asimetría positiva. b. Se aplica las propiedades de la media y de la desviación estándar para hallar sus nuevos valores y del correspondiente coeficiente de variación: Cálculos: Y Media (Y ) =

1.04(Y) + 5 225.000

S (Y ) = C.V. (Y )% =



99.179 44.08 %

Media(1.04 (Y ) + 5) =

239.000

S(1.04 (Y ) + 5) =

103.146

C.V. (1.04 (Y ) + 5)% =

43.16 %

El coeficiente de variación ha disminuido.

19. En relación a los ingresos mensuales de una muestra de 150 ejecutivos se determinó lo siguiente: Me( X ) = S/ 3225.42 , C.V .%( X ) = 18 % , y Coef . As. Pearson(X ) = 0.075

De acuerdo a lo señalado, ¿cuál es el valor de la suma total de los ingresos mensuales de los ejecutivos que conformaron la muestra? Solución (1) C.V .%( X ) = (2)

S( X ) 100 % = 18 % ⇒ S( X ) = 0.18x x

Coef . As. 3 * ( x − Med) 3( x − 3225.42) = = = 0.075 ⇒ 0.075S( X ) = 3x − 9676.26 Pearson S( X ) S( X ) Reemplazando (1) en (2):

0.075 ( 0.18x ) = 3x − 9676.26 ⇒ x = 3240

Capítulo 1. Estadística descriptiva

91



150

Se solicita ∑ xi : i =1

150



x=

∑ xi

i =1

150

150

= 3240 ⇒ ∑ xi = S/ 486 000 i =1

20. Sean los siguientes indicadores asociados a los tiempos de atención en las ventanillas de una agencia bancaria: Q1: 70 segundos Q3: 150 segundos Uno de los datos registrados corresponde a un tiempo de atención de 4 minutos con 55 segundos ( 4 : 55) : ¿es un dato discordante? Justifique. Solución Sería considerado como un dato discordante superior si se cumple que:

xi > Q3 + 1.5RIQ xi = 295 segundos ( 4= : 55 4(60) + 55) RIQ = 150 − 70 = 80 segundos 300 Se observa que: 295 < 180 + 1.5(80) = Por lo tanto dicho dato NO será considerado como un dato discordante.

21. Se ha realizado un estudio sobre el tiempo de residencia en algunos departamentos nuevos ubicados en el distrito de Santiago de Surco. Para la realización del estudio se recopilaron los datos asociados a 40 propietarios de los departamentos habitacionales del distrito en estudio, presentados a continuación: 34

16

26

34

29

31

41

19

26

40

4

7

31

14

16

22

38

39

30

6

17

32

57

25

22

37

31

33

11

21

37

12

23

43

28

30

27

24

35

25

a. Elabore y presente el gráfico de cajas relacionado al número de meses de residencia en los nuevos departamentos. b. Considerando los valores de los cuartiles que se muestran en el gráfico de cajas, ¿a partir de qué valor se ubican los datos discordantes superiores? Solución a. Se digitan los valores en una hoja de trabajo del software Minitab, y se obtiene el gráfico solicitado.

92

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

b. Aplicando la fórmula se tiene que:

Q3 + 1.5(Q3 – Q1 ) = 34 + 1.5(34 − 19.5) = 34 + 1.5(14.5) = 55.75 Conclusión: Considerando los valores de los cuartiles que se muestran en el gráfico de cajas, se tiene que un tiempo de residencia de por lo menos 56 meses ya sería considerado un dato discordante superior.

10. Problemas propuestos 1. En los siguientes párrafos se han dejado vacíos algunos paréntesis, donde deberá colocar el término estadístico adecuado. Términos recomendados: Unidad de análisis, Dato, Característica, Población, Muestra, V. Cualitativa nominal, V. Cualitativa ordinal, V. Cuantitativa discreta, V. Cuantitativa continua, Parámetro, Estadístico, Media, Cuartil 1, Mediana, Cuartil 3, Moda, Percentil. Nota: El término recomendado puede ser usado en singular o plural según se requiera en el contexto. ) en estudio “ClienEn una investigación, sobre la ( tes del supermercado Vival que poseen tarjeta de fidelización”, se se) que se encontraba conformada por leccionó una ( ) se re480 clientes fidelizados de Vival. De cada ( ): tiempo empleado en reacabaron las siguientes ( lizar las compras, monto de su última cuota de la tarjeta de fidelización, número de tarjetas adicionales, si consumió o no en el área de comidas, y distrito de residencia. Por lo tanto, no se consideró ninguna variable

Capítulo 1. Estadística descriptiva

93

( ). Como en total se analizaron 5 variables relacionadas a los 480 clientes, entonces, en total se recabaron 2400 ). ( ) se determinó el siguienEn relación a las variables ( ): El 35 % de los clientes residen en los distritos del te ( cono este de Lima. Además, uno de los objetivos fue el de estimar el si): tiempo promedio poblacional requerido por guiente ( los clientes fidelizados de Vival al momento de realizar sus compras con un error máximo de 12 minutos. Otro de los resultados obtenidos, señalaba que la mayoría de los clientes fidelizados poseía 2 tarjetas adicionales, y que el 25 % de dichos clientes con menores valores de las cuotas a pagar presentaron un valor de a lo más )y S/ 280; lo cual representa, respectivamente, a la ( ) de las características número de tarjetas adicionales ( y monto de su última cuota.

2. El editor de una revista desea realizar un estudio para analizar diversos aspectos relacionados a las presentaciones teatrales. Para el estudio, se seleccionará una muestra de las presentaciones teatrales que se realizan en diversos escenarios ubicados en los principales departamentos del país; los encargados del trabajo de campo se contactarán con los representantes de la obra teatral y recabarán la siguiente información: número de asistentes, monto total de ingreso en boletería, tipo de obra teatral (infantil, clásico, comedia, etc.), número de actores, despliegue escenográfico (bajo, medio, alto), y duración del espectáculo teatral. En los departamentos en análisis, se estima que se presentan aproximadamente 60 obras teatrales, y el estudio se realizará entre todas las presentaciones realizadas durante los 3 días de fin de semana, se asume una presentación diaria de cada obra teatral. Se ha determinado que se seleccionarán a 4 de cada 15 unidades de análisis disponibles durante el siguiente fin de semana. En cada una de las siguientes preguntas, marque con un aspa (X) la alternativa correcta o responda adecuada y justificadamente. Preguntas Identifique adecuadamente a la unidad de análisis.

Seleccionar una alternativa ( ) Local donde se realiza la obra teatral ( ) Presentación teatral ( ) Obra teatral ( ) 60 locales

Señale el tamaño de la población en estudio.

( ) 60 obras teatrales ( ) 180 obras teatrales ( ) 60 presentaciones teatrales ( ) 180 presentaciones teatrales

94

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

( ) 48 presentaciones teatrales Determine el tamaño de la muestra ( ) 16 locales empleado en el presente ( ) 48 obras teatrales estudio ( ) 48 locales ( ) 16 presentaciones teatrales Presente dos estimadores que se podrían obtener del presente estudio (uno cualitativo y uno cuantitativo)

3. En un estudio de investigación del mercado gastronómico realizado en los principales restaurantes ubicados en los distritos turísticos de la capital; de una muestra de tamaño 160 se ha recabado las siguientes características relacionada a los jefes de cocina de los mencionados restaurantes: Escuela:

Institución donde realizó su formación.

Residencia:

Zona de Lima donde reside.

Experiencia:

Tiempo de experiencia, en años cumplidos, en el cargo (jefe de cocina)

G. Capacitación: Gasto (S/) en capacitación realizado en el último año Capacidad:

Nivel de capacidad de atención del restaurant donde labora.

a. Defina adecuadamente a la unidad de análisis. b. ¿Sería conveniente considerar que la unidad de análisis sea el restaurante ubicado en los distritos turísticos de la capital? Justifique. c. Defina la muestra asociada al presente estudio, clasifique cada una de las variables e indique el parámetro y el estadístico correspondiente a cada una de las variables. Muestra: Variable

Clasificación

Escuela Variables

Residencia Experiencia G. capacitación Capacidad

Variable elegida

Parámetro Estadístico

4. El gerente de una microfinanciera se encuentra analizando las deudas de clientes morosos que ya fueron canceladas en su totalidad. Para el mencionado estudio se seleccionó como muestra a las últimas 120 deudas canceladas. A continuación se presenta el diagrama de columnas elaborado.

Capítulo 1. Estadística descriptiva

95

Si se sabe que el 65.833 % corresponde a los clientes morosos de las zonas B y C en conjunto, y que los clientes morosos de la zona D fueron uno más que los de la zona A. a. ¿Cuántos fueron los clientes morosos de la zona A? b. Si los clientes morosos de la zona B fueron 33, ¿cuál es el porcentaje correspondiente a la zona C?

5. El gerente de una tienda de artículos deportivos realizó un estudio para el que seleccionó al azar a 96 de sus clientes que realizaron excursionismo de leve a intenso en localidades de las principales provincias del departamento de Lima. Alguna de las características consideradas en el estudio fueron las siguientes: sexo, provincia donde se practicó el excursionismo, y kilómetros recorridos; esto último fue medido con una pulsera especial que comercializa la tienda. Los datos recabados se presentan en el archivo Trekking.mtw. Realice la siguiente codificación en relación a los kilómetros recorridos: Menos de 5 km Leve De 5 km a menos de 6 km

Moderado

De 6 a más km

Intenso

La mencionada clasificación almacénela en la variable Intensidad. a. ¿Qué porcentaje de clientes realizaron un recorrido considerado como intenso? b. Complete la siguiente tabla. Intensidad

Provincia Canta

Leve Moderado Intenso Total

96

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Cañete

Huarochirí

Yauyos

Total

c. Procese adecuadamente y complete la siguiente gráfica.

6. Sobre la base de una muestra de 150 usuarios del servicio de televisión por cable o satelital, residentes en alguno de los 3 distritos considerados para el estudio, se ha determinado lo siguiente: • La muestra fue recogida equitativamente en los tres distritos. • De los usuarios que residen en Pueblo Libre, el 20 % paga tarifas mensuales por señal de cable o satelital entre 50 y 100 soles. • De los usuarios que residen en Magdalena, el 20 % paga entre 100 y 150 soles. • De los que viven en Los Olivos, el 30 % paga entre 150 y 200 soles. • De los 40 usuarios que pagan entre 50 y 100 soles, 10 residen en Los Olivos, y de los 60 que pagan entre 100 y 150 soles, igual cantidad de entrevistados reside en Pueblo Libre y Los Olivos. a. Elabore y presenta la tabla de contingencia asociada las variables distrito de residencia y la tarifa mensual por señal de cable o satelital 50 - 100

100 - 150

150 - 200

Total

Pueblo Libre Magdalena Los Olivos Total

b. ¿Cuál es el porcentaje de usuarios Los Olivos y que paga entre 100 y 150 soles?

Capítulo 1. Estadística descriptiva

97

c. De los usuarios que residen en Los Olivos, ¿qué porcentaje de ellos paga de 100 soles a más? d. De los usuarios que pagan menos de 150 soles, ¿qué porcentaje reside en Pueblo Libre?

7.

En un estudio sobre los jóvenes universitarios que realizan prácticas preprofesionales en las áreas operativas de una empresa, se recabaron datos asociados a los inconvenientes laborales, asociados a los mencionados practicantes, reportados por los responsables del departamento de recursos humanos (Archivo: Practicantes.mtw). Indique cuáles fueron los principales inconvenientes laborales que se deberían solucionar. Justifique adecuadamente.

8. En un estudio realizado para conocer el uso de dispositivos móviles para el acceso a contenidos multimedia por parte de los jóvenes del distrito de San Isidro, se trabajó con una muestra de 160 jóvenes, y a partir de los datos recabados se elaboró la siguiente gráfica:

Si se sabe que el 62.5 % de los jóvenes encuestados acceden a contenidos multimedia desde, a lo más, dos dispositivos distintos, responda según se solicite. a. ¿Cuántos jóvenes encuestados acceden a contenidos multimedia desde 4 dispositivos? b. ¿Cuál es el porcentaje de jóvenes encuestados que accede a contenidos multimedia desde 2 a 3 dispositivos? c. ¿Cuál es el porcentaje de jóvenes encuestados que accede a contenidos multimedia desde por lo menos 2 dispositivos?

9. Se ha realizado un estudio de 200 familias del distrito de Santiago de Surco que realizaron recientemente un viaje de vacaciones al interior del país. En base al monto gastado para todo el viaje, en soles, se elaboró el siguiente

98

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

histograma de frecuencias relativas con intervalos de igual amplitud, donde se han representado las marcas de clase de cada intervalo:



64 familias, responda a las siguientes preguntas: Si se sabe que F4 − F2 = a. ¿Cuál es la amplitud de los intervalos? b. ¿Entre cuáles valores se encuentra el último intervalo? c. ¿Cuántas familias conforman el cuarto intervalo?

2800, 4500 4600〉 ? d. ¿Cuántas familias gastaron un monto comprendido entre [2700,

10. El gerente general de Fruti Fresh, cadena de juguerías ubicadas en centros comerciales, se encuentra realizando un estudio piloto en uno de sus principales locales. Para el estudio se ha determinado que cada cierto tiempo se seleccionará a uno de los empleados que se encuentra preparando alguno de los productos que conforman algún pedido realizado, y se recaba los datos asociados a las siguientes características: Presentación:

Normal o frozen

T. Atención:

Tiempo de atención, en segundos, empleado en la atención del producto

Los datos recabados en relación a 120 productos atendidos se presentan en el archivo Fruti.mtw. a. Al trabajarse con el criterio de Sturges para representar la variable “Tiempo de atención”. a.1 ¿Cuántos intervalos se deben utilizar? a.2 Determine los intervalos a ser considerados y elabore el histograma de frecuencias. b. Usando la misma cantidad de intervalos determinada en el ítem (a), elabore un histograma múltiple, de frecuencias relativas, para representar la variable “Tiempo de atención” según la variable “Presentación”.

Capítulo 1. Estadística descriptiva

99



Nota: Edite el histograma múltiple para que considere los mismos intervalos elaborados para el histograma original.

c. Con respecto al histograma de frecuencias relativas del tiempo de atención de los productos en presentación normal, señale el porcentaje de productos comprendidos desde el segundo al cuarto intervalo inclusive.

11. En un restaurante se determinó lo siguiente en relación al monto de consumo de las mesas durante el presente día: n = 160 y x = S/ 95.498

Pero de dicho grupo, se retiró de los cálculos a quienes pagaron con tarjeta de crédito o débito, de tal forma que, en relación a las 120 mesas restantes, en donde se pagó en efectivo, el promedio del monto de consumo fue de S/ 95.255, ¿cuál fue el monto total de consumo por parte de las mesas que fueron retiradas de la muestra?

12. De un grupo de ejecutivos que laboran en el distrito de Miraflores se ha determinado que el ingreso mensual presenta una media de S/ 3950 y un valor mediano de S/ 3800. Asimismo, en el distrito de Santiago de Surco se ha determinado que el ingreso mensual de los ejecutivos presenta una media de S/ 3900 y un valor mediano de S/ 3750. Si la desviación estándar de los ingresos mensuales de los ejecutivos que laboran en Miraflores es menor con respecto a los que laboran en Santiago de Surco, de acuerdo al coeficiente de asimetría de Pearson, ¿en cuál de los 2 distritos el ingreso mensual de los ejecutivos presenta una mayor asimetría?

13. A partir de lo manifestado por 80 participantes en un estudio se determinó lo siguiente, en relación a la característica [Y] “Gasto”, en soles, en artículos de oficina: 80

80

i =1

i =1

2 ∑ yi = 9040 , ∑ y i = 1 048 200 ; además se sabe que Me(y)=115.

Determine el valor del coeficiente de asimetría de Pearson correspondiente a la variable Y .+ 2.

14. De acuerdo a un seguimiento realizado a 200 asistentes a una feria tecnológica, se obtuvo los datos asociados a su tiempo de permanencia, en horas, con lo cual se determinó lo siguiente, luego de organizarlos en una tabla de distribución de frecuencias: • Los intervalos son de igual amplitud y la tabla se encuentra compuesta por 6 intervalos. • El primer intervalo corresponde a los tiempos de permanencia cuyo valor varía de [2.0, 2.8〉 horas.

100

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

• El 6 %, 25 % y 12 % de los asistentes pertenecen al primer, cuarto y sexto intervalo respectivamente. • 32 asistentes presentaron un tiempo de permanencia perteneciente al segundo intervalo. • Hasta el cuarto intervalo hay acumulados 134 asistentes. a. Complete la siguiente tabla de distribución de frecuencias de acuerdo a la información brindada. i

Intervalos de tiempo de permanencia (horas)

Marca de clase (yi )

Asistentes (fi )

Acumulado de asistentes (Fi )

(yi )(fi )

(yi )2(fi )

1 2 3 4 5 6

b. Determine el valor de la desviación estándar correspondiente. c. Obtenga el valor del coeficiente de asimetría de Pearson.

15. Un fabricante de detergentes desea adquirir una máquina empaquetadora para el llenado de bolsas de aproximadamente 150 gramos. Se deberá escoger entre dos tipos de máquinas empaquetadoras que le ofrecen en iguales condiciones económicas. Para tomar una decisión, se realizaron 20 mediciones con la máquina A y 25 con la máquina B, y se obtuvo los siguientes resultados: Máquina A (Pesos en g)

143

145

146

148

149

150

150

150

150

152

150

150

150

150

153

151

152

154

155

156

Máquina B (Pesos en g)

yi

fi

[131, 139〉

135

2

[139 , 147〉

143

4

[147 , 155〉

151

13

[155, 163〉

159

4

[163, 171]

167

Total =

2 25

Capítulo 1. Estadística descriptiva

101

a. Halle los promedios de cada máquina e indique en cuál de ellas el promedio difiere más del valor especificado (150 gramos). b. ¿Hay mayor homogeneidad en la distribución en la distribución de los pesos de la máquina B? Justifique numéricamente. c. El inspector de la calidad informó que el equipo de medición que se empleó para medir los pesos de bolsas producidas por la máquina A estaba descalibrado. El verdadero peso de las bolsas en la máquina A es un 98 % del peso anterior más una constante de 2.7 gramos, ¿cuál será la verdadera desviación estándar del peso de las bolsas obtenido en dicha máquina?

16. En relación a la característica “kilometraje recorrido”, durante el último fin de semana, se elaboró el siguiente histograma de frecuencias relativas correspondiente a 40 automóviles.

a. ¿Cuál es el valor del kilometraje recorrido promedio? b. ¿El kilometraje recorrido presenta una distribución homogénea?

17. Una entidad bancaria ha implementado en sus agencias 3 tipos de ventanillas de atención: [A] Usuarios no clientes, [B] Clientes, y [C] Exclusiva. En una agencia ubicada en el distrito de Miraflores, se ha determinado lo siguiente en relación al tiempo promedio de atención en dichas ventanillas: N.° personas (ni)

Tiempo promedio (seg.)

A

33

128.16

B

60

107.92

C

67

107.56

Tipo ventanilla

102

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

( xi )

En otra agencia, ubicada en el distrito de Jesús María, donde se recabó un mismo tamaño de muestra distribuido de similar forma, se determinó lo siguiente: las ventanillas de atención tipo A presentan un 20 % menos de tiempo de atención que los de la agencia de Miraflores, mientras que en las ventanillas tipo B y C presentan un 10 % más de tiempo de atención. En general, ¿cuál es el tiempo de atención promedio en la agencia de Jesús María?

18. En una empresa, el ingreso mensual de sus técnicos especializados tiene una media de USD 750 y una desviación estándar de USD 220; mientras que al personal de servicios de mantenimiento les paga sueldos cuyo promedio es S/ 900 con una desviación estándar de S/ 80. a. Mediante un acuerdo con la gerencia, se realiza un incremento de 20 % a los ingresos mensuales de los técnicos especializados con una bonificación adicional de USD 50 por concepto de movilidad, ¿es cierto que con esta modificación el ingreso mensual de los técnicos especializados se ha vuelto más heterogéneo? Justifique adecuadamente su respuesta. b. Si a cada trabajador de los servicios de mantenimiento se le aumentará k soles para el próximo mes, determine el valor de k para que el nuevo valor del coeficiente de variación sea igual al 8 %.

19. En un centro de idiomas se ha recabado los datos correspondientes a los puntajes obtenidos en la última evaluación (de 0 a 100). Los estudiantes que conformaron parte del estudio corresponden a los 3 niveles de estudios (básico, intermedio y avanzado). En base a los datos recopilados se elaboró el siguiente diagrama de cajas, desagregado por nivel de estudios: Boxplot of Puntaje

95.9

95

Puntaje

90 85

82.5

81.7

82.1

80 75 70

71.7 Avanzado

Básico Nivel

Intermedio



De acuerdo al diagrama de cajas presentado marque con un aspa (X) la opción correcta.

Capítulo 1. Estadística descriptiva

103

i. [ ] En el nivel avanzado, la mediana se encuentra más alejada del Cuartil 3, y presenta un dato discordante. ii. [ ] En el nivel básico, la mediana se encuentra más alejada del Cuartil 3, y no presenta datos discordantes. iii. [ ] En el nivel intermedio, la mediana se encuentra más alejada del Cuartil 3, y presenta un dato discordante. iv. [ ] En el nivel básico, la mediana se encuentra más alejada del Cuartil 1, y no presenta datos discordantes. v. [ ] En el nivel avanzado, la mediana se encuentra más alejada del Cuartil 1, y no presenta un dato discordante.

20. El gerente de operaciones de un parque de diversiones ha realizado un estudio para determinar la acogida que ha tenido el mencionado parque de diversiones. Para tal efecto en la entrada del recinto se solicitó la colaboración de 200 asistentes, quienes se comprometieron a brindar información de interés luego de su visita al parque de diversiones (Archivo: P_Diversiones.mtw). Las características recabadas se presentan a continuación: Ocasión:

Primera visita o ya ha venido antes al parque de diversiones.

Edad:

Rango de edad, en años, del asistente encuestado.

N.° juegos: Número de juegos o atracciones a las que ha accedido. Gasto:

Monto total gastado en su visita (juegos, consumo, suvenir).

a. Obtenga las medidas de tendencia central y de posición de la característica N.° juegos, en general y desagregado por rango de edades. Responda a las siguientes preguntas. i. ¿En cuál de los rangos de edades la moda es distinta a la moda general? Justifique. ii. De las medias obtenidas en forma general, interprete de acuerdo al contexto el valor del tercer cuartil. iii. A los participantes del estudio con menos de 18 años, al momento de comprometerse a participar en el estudio, se les regaló un boleto para una de las atracciones del parque de diversiones. Luego de recabar los datos se observó que los participantes menores de 18 años habían incluido en sus respuestas al regalo otorgado, lo cual no debió ser, ¿cuál sería el verdadero valor promedio general relacionado a la característica “N.° juegos”? b. Obtenga las medidas de dispersión asociadas a la característica “Gasto”, en forma general y desagregada por la característica “Ocasión”. Responda a las siguientes preguntas. i. ¿Cuántos de los participantes del estudio que han asistido por primera vez pertenecen al intervalo que permitió determinar al rango intercuartílico correspondiente?

104

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

ii. El tipo de cambio es de S/ 3.1 por dólar. Si el gasto es expresado en dólares, ¿cuál sería la desviación estándar general de la característica “Gasto”? iii. ¿Cuáles participantes, presentan una mayor homogeneidad con respecto a la característica “Gasto”, los que han asistido por primera vez o los que ya han asistido antes? c. Determine el monto del gasto, en soles, por debajo del cual se encuentra el 35 % de participantes, de 40 a más años, que presentaron los menores gastos en su visita al parque de diversiones. d. Obtenga el diagrama de cajas, relacionado a la característica “Gasto”, en forma general desagregada por rango de “Edad”. Responda a las siguientes preguntas. i. En el rango de edad donde se presentan datos discordantes, ¿cuál es el rango de edad y cuáles son los valores extremos de los bigotes? ¿Cuáles son los rangos de edad que presenta un valor mediano por debajo del presentado en el diagrama de cajas general y cuál de ellos presenta una similar distribución al de la caja general?

Capítulo 1. Estadística descriptiva

105

Capítulo

2

Probabilidad Sabes

En los procesos de ingeniería, así como en la gestión empresarial y de negocios, surgen situaciones de incertidumbre sobre los diferentes resultados de un proyecto o de una actividad en general para las cuales se requiere de una medición sobre la posibilidad de que ocurra uno u otro evento. La teoría de la probabilidad brinda una respuesta a las inquietudes planteadas, a partir de lo cual se brinda un sustento formal a la toma de decisiones, en diferentes contextos de aplicación.

Capacidades adquiridas 9 Diferenciar las diferentes técnicas de conteo. 9 Comprender los conceptos y fundamentos de la probabilidad. 9 Calcular e interpretar las probabilidades de ocurrencia de un evento. 9 Deducir y relacionar los teoremas de probabilidad.

Piensas Conocimientos previos Estadística descriptiva, teoría de conjuntos, manejo de notación matemática

Competencias por lograr 9 Identificar la técnica de conteo adecuada a cada contexto. 9 Reconocer las situaciones de uso de los diferentes teoremas de probabilidad.

Secciones 1. C onceptos básicos 2. Técnicas de conteo 3. Probabilidad 4. Teoremas de probabilidad

Haces Habilidades por desarrollar 9 Aplicar técnicas de conteo en diferentes situaciones. 9 Plantear expresiones de probabilidad. 9 Aplicar los teoremas de probabilidad.

1. Conceptos básicos 1.1 Experimento aleatorio o al azar Es aquella acción tal que, bajo determinado conjunto similar de condiciones iniciales, no siempre da el mismo resultado. Es lo contrario a un experimento determinista, donde se conoce el resultado antes de realizar la acción (conocimiento a priori). Comúnmente se le denota a un experimento aleatorio con ε. En consecuencia, un experimento aleatorio ε debe cumplir las siguientes condiciones: a) Debe tener más de un posible resultado el cual no se puede predecir con seguridad. b) Es posible describir el conjunto de todos los resultados posibles. c) Puede repetirse infinitas veces. Ejemplo 1 A continuación se presentan algunos experimentos aleatorios: i. Lanzar un dado y observar el lado superior. ii. Elegir 2 artículos de una línea de producción y observar si son defectuosos o no defectuosos. iii. Seleccionar a un elector y determinar su candidato presidencial preferido entre dos candidatos posibles.

1.2 Espacio muestral Un espacio muestral es el conjunto de todos los resultados posibles de un experimento aleatorio (ε). El espacio muestral es denotado por Ω (también por S). Un espacio muestral puede ser clasificado como:

Capítulo 2. Probabilidad

109

Discreto: si contiene un número finito o infinito numerable de elementos, o Continuo: si contiene un número infinito no numerable de elementos. El número de elementos de un Ω es denotado por n(Ω). Ejemplo 2 A continuación, se presentan los espacios muestrales asociados a los experimentos aleatorios definidos en el ejemplo 1 : i. Lanzar un dado y observar el lado superior. Ω ={1, 2, 3, 4, 5, 6} ii. Elegir dos artículos de una línea de producción y observar si son defec­tuosos (D) o no defectuosos ( D).

Ω ={( D , D), ( D , D), ( D , D), ( D , D)} iii. Seleccionar a un elector y determinar su candidato presidencial de preferencia entre dos candidatos posibles.

Ω ={candidato A, candidato B}

1.3 Suceso Cada elemento del espacio muestral (Ω) se denomina suceso y se designa por w. En todo espacio muestral se observa que: a. Cada w que pertenece a Ω es un resultado del experimento aleatorio. b. A cada resultado del experimento aleatorio le corresponde un, y solo un, w ∈ Ω. Ω ={w1 , w2 , . . . , wn }

1.4 Evento Un evento es cualquier subconjunto del espacio muestral (Ω). Un evento es denotado por letras latinas en mayúsculas: A, B, C, etc., y la cantidad total de elementos que conforman un evento es denotado por n(A). Eventos especiales i. Evento elemental

Tiene solo un resultado: E = {wi }

ii. Evento seguro

Es el que siempre ocurre. Coincide con el espacio muestral Ω

iii. Evento imposible

Es el que nunca ocurre, se denota por ∅

iv. Evento opuesto o contrario

Si no ocurre el evento E, entonces ocurre su complemento E

= E

110

{w i / w i ∈ Ω

∧ wi ∉ E}

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

v. Eventos simultáneos

Ocurren a la vez; los eventos E y F son simultáneos si E  F ≠ ∅.

vi. Eventos incompatibles o disjuntos

No ocurren a la vez (son mutuamente excluyentes), es decir: E  F = ∅.

vii. Eventos colectivamente exhaustivos

Dos o más eventos disjuntos son colectivamente exhaustivos si la unión de todos ellos coincide con Ω; es decir: E1  E2  ...  Ek = Ω , siempre que E1  E2 = ∅ para i ≠ j.

Ejemplo 3 En relación al experimento aleatorio de lanzar un dado y observar el lado superior, se definen los siguientes eventos: i.

A: Sale número 6.

A = {6}

ii. B: Se obtiene un número par.

B = {2, 4, 6}

iii. C: Se obtiene un número impar.

C = {1, 3, 5}

iv. D: Se obtiene un número mayor que 3. D = {4, 5, 6} v. E: Se obtiene un número mayor que 7. E = ∅ vi. F: Se obtiene un número menor que 7. C = {1, 2, 3, 4, 5, 6} Con los eventos así definidos, se procede a identificar a cada uno de los eventos especiales señalados: i.

Evento elemental.

A = {6}

ii. Evento seguro. F = {1, 2 , 3, 4, 5, 6} = Ω iii. Evento imposible.

E= ∅

iv. Evento opuesto o contrario.

C = B , ya que B = {1, 3, 5}

v. Eventos simultáneos.

C y D, ya que C  D = {5} ≠ ∅

vi. Eventos incompatibles o disjuntos.

A y C, ya que A  C = ∅

vii. Eventos colectivamente exhaustivos. B  C = ∅ ∧ B  C =Ω

B y C, ya que

Ejemplo 4 Una empresa constructora se encuentra evaluando si se presenta a alguna de 3 licitaciones; un evaluador brindará su recomendación sobre las licitaciones a cuáles presentarse, donde la decisión por cada de ellas puede ser: Sí se presenta a la licitación (S) o No se presenta (N), de tal forma que el espacio muestral queda definido de la siguiente forma: Ω ={NNN, NNS, NSN, NSS, SNN, SNS, SSN, SSS}

Se definen los siguientes eventos en relación a la recomendación sobre las tres licitaciones a presentarse:

Capítulo 2. Probabilidad

111

i.

A: No se presenta a licitación.



A = {NNN}

ii. B: Se presenta a la 2da licitación.

B = {NNN, NSS, SSN, SSS}

iii. C: Se presenta por lo menos a una. C = {NNS, NSN, NSS, SNN, SNS, SSN, SSS} iv. D: Se presentan a lo más a 3. D = {NNN, NNS, NSN, NSS, SNN, SNS, SSN, SSS} v. E: Se presentan a 4 licitaciones.

E= ∅ vi. F: Se decide lo mismo en las tres.

F = {NNN,SSS}

Con los eventos así definidos, se procede a identificar a cada uno de los eventos especiales señalados: i.

Evento elemental.

A = {NNN}

ii. Evento seguro. D = Ω iii. Evento imposible.

E= ∅

iv. Evento opuesto o contrario.

A = C , ya que C ={NNN}

v. Eventos simultáneos.

B y F, ya que B=  F {SSS} ≠ ∅

vi. Eventos incompatibles o disjuntos.

A y B, ya que A  B = ∅

vii. Eventos colectivamente exhaustivos. A  B =∅ ∧ A  C =Ω

A y C, ya que

2. Técnicas de conteo Para el cálculo de probabilidades es importante cuantificar el espacio muestral de un experimento aleatorio; sin embargo, en muchos casos, esta cuantificación se torna difícil puesto que, por lo general, los experimentos aleatorios tienen gran cantidad de resultados posibles. De ahí surge la necesidad de utilizar técnicas que permitan determinar el número de resultados posibles de un experimento aleatorio que se esté estudiando sin necesidad de hacer una lista o relación de todos los posibles resultados.

2.1 Principio de adición Suponga que un procedimiento, designado como P1, puede realizarse de n1 maneras, y que un segundo procedimiento, designado como P2, puede realizarse de n2 maneras. Además, no es posible que ambos procedimientos, P1 y P2, se realicen simultáneamente. Entonces, el número de maneras en que se puede hacer P1 o P2 es de: n1 + n2 maneras.

112

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Ejemplo 5 Un estudiante desea comprar una laptop, para lo cual considera que puede seleccionar de entre las marcas R, S y T. La laptop de la marca R se presenta con dos tipos de procesador (core i5, core i7), mientras que la laptop de la marca S se presenta con tres tipos de procesador (core i3, core i5 y core i7), y la laptop de la marca T se presenta en sólo un tipo de procesador (core i5), ¿de cuántas maneras puede esta persona hacer la compra de la laptop? Solución • Compra de una laptop de la marca R: 2 maneras • Compra de una laptop de la marca S: 3 maneras • Compra de una laptop de la marca T: 1 manera Por el principio de adición, la compra de una laptop se puede realizar de 2 + 3 +1 = 6 maneras.

2.2 Principio de multiplicación Suponga que un procedimiento, designado como P1, puede hacerse de n1 maneras, y que un segundo procedimiento, designado como P2, puede hacerse de n2 maneras. Además, cada una de las maneras de efectuar el procedimiento P1 puede ser seguida por cualquiera de las maneras de efectuar el procedimiento P2. Entonces, el número de maneras en que se puede realizar P1 seguido de P2 es de: (n1)(n2) maneras. Ejemplo 6 En una clínica se utilizan cinco símbolos para clasificar las historias clínicas de sus pacientes, de manera que los dos primeros son letras y los 3 últimos son dígitos. Suponiendo que hay 25 letras (incluyendo las cinco vocales), ¿cuántas historias clínicas podrían identificarse si: a. Las letras y los números se pueden repetir. Solución • Para el primer símbolo se podrán utilizar 25 letras disponibles. • Para el segundo símbolo se podrán utilizar 25 letras disponibles. • Para el tercer símbolo se podrán utilizar 10 dígitos disponibles. • Para el cuarto símbolo se podrán utilizar 10 dígitos disponibles. • Para el quinto símbolo se podrán utilizar 10 dígitos disponibles. Por el principio de multiplicación, el número de posibles identificaciones de historias clínicas es de: ( 25)( 25)(10= )(10)(10) (= 252 )(103 ) 625 000 maneras distintas.

Capítulo 2. Probabilidad

113

b. Solamente una de las letras es una vocal y dos números son iguales. Solución • Colocar una vocal entre los 2 primeros símbolos: 2 maneras – En la posición elegida se pueden utilizar 5 vocales disponibles. – En la otra ubicación se pueden utilizar 20 letras (no vocales) disponibles. • Colocar un número que no se repita entre los 3 últimos símbolos: 3 maneras. – En la ubicación elegida para el número que no se repite se pueden utilizar 10 dígitos disponibles. – En una de las 2 posiciones restantes, para los números que se van a repetir, se podrán utilizar 9 dígitos restantes. – En la otra de las posiciones se podrá utilizar solamente el número que se va a repetir. Por el principio de multiplicación, el número de identificaciones de las historias clínicas con las condiciones señaladas es de: ( 2)(5)( 20)(3)(10)(9)(1) = 54 000 maneras distintas.

2.3 Permutaciones 2.3.1 Permutación de n elementos sin repetición Se tiene n objetos diferentes y se desea saber de cuántas maneras pueden ser ordenados, por ejemplo, en una línea, sin que los elementos se repitan. Aplicando el principio de multiplicación, se observa que cualquiera de estos n objetos puede ocupar la primera posición, restarán (n-1) objetos para la segunda posición, (n − 2) para la tercera posición y así sucesivamente hasta llegar a (n − (n − 1)) para la última posición; luego, el número de posibles ordenamientos de n objetos en una línea que consta de n posiciones es: Pn = n (n − 1)(n − 2)(n − 3)...( 2)(1) = n ! n

Factorial El factorial de un número se define como el producto de los n primeros enteros positivos, es decir: n ! = n(n − 1)(n − 2)... ( 2)(1), con 0 ! = 1. Nota: El factorial de n representa el número de maneras diferentes en las que n elementos pueden ordenarse uno detrás de otro.

114

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

2.3.2 Permutación de n elementos sin repetición tomados de k en k Siguiendo un razonamiento similar, se determina que el número de maneras diferentes en que k elementos pueden elegirse y ordenarse uno detrás de otro a partir de un total de n elementos es:

Pkn

=

n! (n − k )!

Ejemplo 7 Para un examen en aula de cómputo se espera la llegada de a lo más 6 alumnos, quienes serán ubicados por orden de llegada, de izquierda a derecha, en una fila donde hay 6 computadoras. Para los siguientes casos, indique el número de maneras en que los diferentes alumnos pueden ser ubicados, en las computadoras disponibles: a. Llegan los 6 alumnos, uno tras otro. Solución • La primera computadora será ocupada por uno de 6 alumnos posibles. • La segunda computadora será ocupada por uno de los 5 alumnos restantes. • Se procede de forma similar hasta que la sexta computadora será ocupada por el único alumno restante. Por el principio de multiplicación, la cantidad de maneras distintas de ubicar a los 6 alumnos es de: (6)(5)( 4)(3)( 2)(1) = 720 En resumen, dado que interesa el orden de llegada de los alumnos, el 6 número de maneras de ubicarlos es: P6= 6= ! 720 b. Solo llegan 4 alumnos de los 6 convocados, uno tras otro. Solución • La primera computadora será ocupada por uno de 6 alumnos posibles. • La segunda y la tercera computadora serán ocupadas, respectivamente, por uno de 5 y 4 alumnos restantes. • La cuarta computadora será ocupada por uno de los 3 alumnos restantes. Por el principio de multiplicación, la cantidad de maneras distintas de ubicar a los 4 alumnos es de: (6)(5)( 4)(3) = 360 En resumen, se consideran permutaciones de n elementos tomados k de ellos; es decir: 6 P= 4

6! 6! = = 360 (6 − 4)! 2 !

Nota: Este ejemplo (7.b) puede ser resuelto de una forma alterna, que se detallará más adelante.

Capítulo 2. Probabilidad

115

c. Llegan los 6 alumnos, sin embargo 2 de ellos no deben sentarse uno al lado del otro, ¿de cuántas maneras se puede ubicar a los 6 alumnos en las computadoras disponibles? Solución

Se definen los eventos:

A: dos alumnos deben ser ubicados uno al lado del otro, y

A : dos alumnos no se ubicarán uno al lado del otro. Por practicidad se determinará la cantidad de maneras distintas que se puede presentar el evento A, para luego determinar la cantidad de maneras del evento contrario. • Los dos alumnos que serán ubicados uno al lado del otro serán considerados como un bloque, y con los 4 restantes se tendrán 5! maneras de ubicarlos. • Los dos alumnos que permanecerán juntos se podrán ubicar de 2! maneras. Por lo tanto, el número de casos a favor del evento A es: n= ( A) 2= ! P55 240. Tomando en cuenta el resultado del ítem a), donde se señala que el número de maneras de ubicar a los 6 alumnos es de P66= 6=! 720 , entonces, la cantidad de maneras en que los 2 alumnos señalados no se sientan uno al lado del otro será: n( A) =P66 − 2 ! P55 =720 − 240 =480

2.3.3 Permutación con elementos iguales El número de maneras diferentes en las que se puede ordenar n elementos, de los cuales n1, n2, ..., nk son iguales entre si para efectos del ordenamiento, con n = n1 + n2 + ... + nk , es dado por: Pnn , n 1

2 ,..., nk

=

n! n1 ! n2 ! ... nk !

Ejemplo 8 ¿Cuál es el total de posibles arreglos que se pueden hacer con las letras de la palabra PROBABILIDAD? Solución • La palabra consta de 12 letras de las cuales 8 letras son distintas. • Entre las 12 letras hay algunas que se repiten 2 veces: A, B, D, I, y las demás son diferentes. • Por lo tanto, el total de posibles arreglos de las letras que conforman la palabra es: 12 ! 12 ! P212, 2 , 2 , 2 ,1= = = 29937 600 ,1,1,1 2 ! 2 ! 2 ! 2 !1!1!1!1! ( 2 !)4

116

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

2.4 Combinaciones En las permutaciones, el objetivo es determinar el número de posibles arreglos ordenados de objetos. Cuando el orden no importa, sino sólo el número de formas distintas de extraer de n objetos k de ellos a la vez; entonces, se trata de una combinación. El número de grupos diferentes de k elementos que pueden formarse a partir de un total de n elementos sin importar el orden de la selección es:

 n n! =   k  k !(n − k )!

Ckn =  La expresión

i.

C 1n = n

 n  tiene las siguientes propiedades: k

Ckn = 

ii.

C nn−1 = n

n

iii. C n

=1

n

iv. C 0

=1

Ejemplo 9 Luis tiene 10 amigos, de los cuales invitará a una reunión solamente a 7 de ellos. a. ¿De cuántas maneras puede Luis invitar a sus amigos? Solución Como no interesa el orden en que elija a sus invitados, Luis tiene: 10  10 ! =  = 120 maneras distintas de hacer las invitaciones.  7  7 ! 3!

b. ¿De cuántas maneras puede Luis invitar a sus amigos si dos de ellos están enemistados y no pueden asistir juntos? Solución • Luis puede invitar a uno o ninguno de los amigos enemistados; por tanto: • Maneras de no invitar a ninguno de los 2 amigos, e invitar a 7 de los

 2  8  8 restantes:    = (1)( 8 ) = 8  0  7     • Maneras de invitar a uno de los 2 amigos, e invitar a 6 de los 8  2  8  restantes:    = ( 2 )( 28 ) = 56  1  6     Por el principio de la adición, número de maneras =  2  8   2  8  64 +   =8 + + 58 56 ==64        0  7   1  6 

Capítulo 2. Probabilidad

117

Ejemplo 10 Del ejemplo 7b, indique si sólo llegan 4 alumnos de los 6 convocados, uno tras otro, ¿cuál será el número de maneras en que los diferentes alumnos pueden ser ubicados? Solución • Maneras en que se presentarán los 4 alumnos de 6 posibles (no interesa 6! 6 el orden): = C 4 = 15 4 !(6 − 4)! 4 • Maneras distintas de ubicar a los 4 alumnos que llegan es de: P4= 4=! 24 (ver ejemplo 7a)

En resumen, se ubicarán de= C46 P44 (15 = )( 24) 360, maneras distintas, resultado que coincide con lo presentado en el ejemplo 7b. Ejemplo 11 Para hacer visitas de trabajo a 3 sucursales de provincias en grupos de 5, se dispone de 6 mujeres y 9 hombres. a. ¿Cuántos grupos distintos se pueden formar? Solución Como no interesa el orden para formar los 3 grupos, entonces: • Maneras de seleccionar a 5 de 15 personas posibles:

15  15 ! =   = 3003  5  5 !(15 − 5)!   • Maneras de seleccionar a 5 de 10 personas restantes:

10  10 ! =   = 252  5  5 !(10 − 5)!  

 5 5! = • Maneras de seleccionar a 5 de 5 personas restantes:   = 1 − 5)! 5 !( 5  5

Por el principio de la multiplicación, número de maneras de formar los



15 10  5  15 ! = 756 756 3 grupos de 5 personas en cada grupo =   =    5  5  5  5 ! 5 ! 5 !    

b. ¿De cuántas maneras pueden formarse tales grupos de modo que en cada uno de ellos estén siempre dos mujeres? Solución

Cada grupo de 5 personas estará integrado por 3 hombres y 2 mujeres; es decir: • Primer grupo: 3 hombres de 9 posibles y 2 mujeres de 6 posibles. • Segundo grupo: 3 hombres de 6 posibles y 2 mujeres de 4 posibles. • Tercer grupo: 3 hombres de 3 posibles y 2 mujeres de 2 posibles.

118

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios





Por el principio de la multiplicación, número de maneras de formar los 3 grupos con las condiciones señaladas =  9  6    6  4                3   2    3  2  

 3  2       = (1260)(120) = 151 200   3   2  

3. Probabilidad 3.1 Introducción La probabilidad es una rama de las matemáticas que estudia a los experimentos aleatorios y permite tener una medida de la incertidumbre, de tal forma que se pueda dar un soporte adecuado a la toma de decisiones.

3.2 Probabilidad clásica o a priori Si un experimento aleatorio tiene n(Ω) posibles resultados, todos ellos igualmente probables, y si n(E) de estos resultados pertenecen a un evento E, entonces la probabilidad de ocurrencia del evento E es: P= ( E)

n( E) número de casos a favor de E = n(Ω) número de casos posibles

El nombre a priori se debe a que no es necesario realizar el experimento para calcular la probabilidad, sino que este cálculo ha sido hecho sólo en base al empleo del razonamiento lógico. Por ejemplo, en un mazo de 52 cartas bien barajadas se saca una de ellas, la probabilidad de sacar una carta de espadas es 13/ 52 = 0.25, porque se sabe que dentro del mazo hay 13 cartas que son espadas. Ejemplo 12 Cinco fabricantes producen un determinado dispositivo electrónico cuya calidad varía de un fabricante a otro. Si usted eligiera tres fabricantes al azar, ¿cuál es la probabilidad de que la selección contenga exactamente dos de los tres mejores? Solución Puesto que en la elección no interesa el orden, el número de maneras de elegir a los 3 fabricantes es:

 5 n(Ω= )  = 10  3    Se define E: la selección contiene a dos de los 3 mejores. • Seleccionar a 2 de 3 mejores fabricantes, y • Seleccionar a 1 de los 2 no mejores

Capítulo 2. Probabilidad

119

Por el principio de la multiplicación, el número de maneras en que puede ocurrir E es:

 3  2  = n( E)   = 3)( 2) 6  (=  2  1  ) La probabilidad solicitada es: P( E=

n( E) 6 = = 0.6 n(Ω) 10

Ejemplo 13 La Municipalidad de Lima ha convocado a 3 licitaciones para construir intercambios viales. A la licitación 1 (L1) se han presentado las empresas A, B y D; a la licitación 2 (L2) se han presentado las empresas A, B, C y E y a la licitación 3 (L3) se han presentado las empresas A, B, C, D y E. Todas tienen la misma probabilidad de ser elegidas. a. ¿De cuantas maneras se puede elegir a los ganadores de las 3 licitaciones? Solución

= n(Ω) (3)( = 4)(5) 60 maneras b. ¿Cuál es la probabilidad de que la empresa B gane solo una de las licitaciones? Solución Sea E: empresa B gana solo una licitación • La licitación 1 se puede otorgar a una de 3 empresas posibles, la licitación 2 se puede otorgar a una de 4 empresas posibles, y la licitación 3 se puede otorgar a una de 5 empresas posibles. En todas las licitaciones participa la empresa B. • La empresa B gana solamente la licitación 1, y las otras licitaciones alguna de las empresas restantes: (1)(3)( 4) = 12, o • La empresa B gana solamente la licitación 2, y las otras licitaciones alguna de las empresas restantes: ( 2)(1)( 4) = 8, o • La empresa B gana solamente la licitación 3, y las otras licitaciones alguna de las empresas restantes: ( 2)(3)(1) = 6. Por el principio de la adición, el número de maneras en que la empresa B gana solo una licitación:

n( E) = (1)(3)( 4) + ( 2)(1)( 4) + ( 2)(3)(1) = 12 + 8 + 6 = 26

120

P( E ) =

n( E) 26 = = 0.4333 n(Ω) 60

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

c. ¿Cuál es la probabilidad de que la empresa A no gane ninguna de las licitaciones? Solución Sea F: empresa A no gana ninguna licitación = n( F ) (= 2)(3)( 4) 24

P( F = )

24 = 0.40 60

Ejemplo 14 Una compañía ha decidido comprar 6 computadoras de las cuales 3 deben ser portátiles y 3 fijas, y para realizar la compra se han presentado varias propuestas. De la empresa Teledata se ha evaluado 3 modelos portátiles y 3 fijos, de la empresa Dataservice se ha evaluado 4 modelos portátiles y 5 fijos. Si todas las computadoras tienen la misma probabilidad de ser elegidas, responda. a. ¿De cuantas maneras diferentes se puede hacer la compra? Solución • En total se ha evaluado 7 modelos portátiles y 8 modelos fijos. • Adquirir 3 computadoras portátiles de 7 posibles, y 3 fijas de 8 posibles:

= n(Ω)

(C = )(C )

(35 = )(56) 1960 b. ¿Cuál es la probabilidad de que todas las computadoras compradas sean de la misma empresa? 7 3

8 3

Solución Sea A: Todas las computadoras compradas son de la misma empresa. • Teledata: Adquirir 3 portátiles de 3 evaluadas, y 3 fijas de 3 evalua das: C33C33 , o • Dataservice: Adquirir 3 portátiles de 4 evaluadas, y 3 fijas de 5 eva luadas: C34C35 P( A) =

(C )(C = ) + (C )(C ) 3 3

3 3

n(Ω)

4 3

5 3

(1)(1) + ( 4)(10) = 0.0209 1960

3.3 Probabilidad relativista Al igual que la probabilidad a priori, se basa en el cociente entre resultados favorables observados sobre resultados totales del experimento en estudio. Su diferencia con la probabilidad clásica radica en que se calcula a través de datos experimentales.

Capítulo 2. Probabilidad

121

Si un experimento aleatorio se repite n veces bajo las mismas condiciones n y nE es el número de resultados favorables a un evento E, entonces: P( E) = E n Ejemplo 15 De la producción de una máquina se ha observado que pueden ocurrir dos tipos de defectos. El defecto del tipo A ocurre un 7 % de las veces, el defecto del tipo B un 5 % de las veces, y en el 90 % de las veces no ocurre ninguno de los dos. Hallar la probabilidad de que al elegir un producto al azar tenga solo uno de estos defectos. Solución w = 0.90 A

B

Haciendo uso del diagrama de Venn, se tiene:

x

y

z

P( A) = x + y = 0.07 P( B) = y + z = 0.05 P ( A  B) = w= 0.90 ⇒ P( A  B) = 0.10 Se sabe que: P( A  B) = P( A) + P( B) − P( A  B) = 0.10 Entonces: ( x + y) + ( y + z) − ( y)= 0.07 + 0.05 − y= 0.10

w = 0.90 A

B y = 0.02

x = 0.05

z = 0.03

∴y = 0.02

P( A  B) 0= .10 – 0.02 0.08 P(Solo un= defecto) P( A  B) –=

3.4 Definición axiomática Sea e un experimento aleatorio y Ω su espacio muestral. Una función P que asigna un número real a cada evento A de Ω , denotada por P(A), es denominada probabilidad si satisface los siguientes axiomas: (i) P( A) ≥ 0 (ii) P(Ω) =1 (iii) Si A1, A2, ... son eventos mutuamente excluyentes dos a dos, entonces: ∞  ∞ P   Ai  = ∑ P( Ai )  i =1  i =1

122

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

De los axiomas anteriores se deducen otras proposiciones de la probabilidad:

P(∅) =0 P( A)= 1 − P( A)

P( A  B) = P( A) + P( B) − P( A  B) P( A= − B) P( A =  B) P( A) − P( A  B)

4. Teoremas de probabilidad 4.1 Probabilidad condicional Sean A y B dos eventos de un espacio muestral Ω , tal que P( B) > 0; luego, la probabilidad condicional de ocurrencia del evento A dado que (sabiendo que) ocurrió el evento B, está definida por: = P( A | B)

P( A  B) ; P( B) > 0 P( B)

De manera similar, la probabilidad de que ocurra el evento B sabiendo que ocurrió el evento A es: = P( B| A)

P( A  B) ; P( A) > 0 P( A)

La definición de probabilidad condicional satisface los axiomas de probabilidad, es decir: a. P( B| A) ≥ 0 b. P(Ω | A) = 1 c. Si B1, B2, B3, ... son eventos mutuamente excluyentes dos a dos, entonces ∞  n P   Bi | A  = ∑ P ( Bi | A )  i =1  i =1

Ejemplo 16 Con el propósito de conocer las causas por las que los estudiantes no consumen productos naturales enlatados, la consultora Data Mining Today aplicó una encuesta a 400 estudiantes de diferentes instituciones educativas de Lima. Los resultados obtenidos en relación al género se muestran en la siguiente tabla de contingencia. Género

Calidad (C)

Difusión (D)

Frescura (F)

Precio (P)

Variedad (V)

Otros (O)

Total

Hombre (H)

4

25

73

76

38

7

223

Mujer (M)

5

8

67

61

27

9

177

Total

9

33

140

137

65

16

400

Capítulo 2. Probabilidad

123

Si se selecciona un estudiante al azar, ¿cuál es la probabilidad de los siguientes casos? a. Que sea hombre o afirme que el motivo del no consumo de productos naturales sea la frescura. Solución = P( H  F )



223 + 140 − 73 = 0.7250 400

b. Que afirme que la causa es la variedad si se eligió a una mujer. Solución

P(V | M = )

P ( V  M ) 27 = = 0.1525 177 P(M)

c. Que no haya sido elegido un hombre si afirma que el motivo es la calidad o el precio. Solución

P[ M |(C =  P )]

5 + 61 = 0.45205 9 + 137

4.2 Teorema de la multiplicación El teorema de la multiplicación (regla de multiplicación) de probabilidades es muy útil para aquellos experimentos que son ejecutados en etapas sucesivas. Supóngase que un experimento tiene n etapas y sea Aj un evento definido en términos de la etapa j del experimento; entonces: P[ A j | A1  A2  ...  A j −1 ] es la probabilidad condicional de un evento en la etapa j condicionado a lo que sucede en las etapas 1, 2, ..., j − 1.

Teorema.- Sean ε un experimento aleatorio y Ω su espacio muestral correspondiente. Sean los eventos A1, A2, ..., An para los cuales se tiene que P[ A1  A2  ...  An−1 ] > 0 entonces: P[ A1  A2  ...  An ] = P[ A1 ] P[ A2|A1 ] P[ A3|A1  A2 ]... P[ An|A1  A2  ...  An−1 ]

En forma particular, sean los eventos A1 y A2, tal que P( A1  A2 ) > 0 , entonces: P( A1  A2 ) = P( A1 ) P( A2 |A1 )

Lo señalado es una consecuencia directa de la probabilidad condicional, ya que: = P( A | B)

124

P( A  B) ; P( B) > 0 ⇒ P( A  B) = P( B) P( A | B) P( B)

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

= P( B| A)

P( A  B) ; P( A) > 0 ⇒ P( A  B) = P( A) P( B| A) P( A)

Donde la P( A  B) es denominada probabilidad conjunta, mientras que P( A ) y P( B ) se denomina probabilidades marginales.

4.3 Teorema de la probabilidad total Si {A1, A2, ..., AK} es una partición del espacio muestral (Ω) y B es un evento contenido en el mismo espacio muestral; entonces, la probabilidad de ocurrencia de B se puede obtener mediante la siguiente expresión:

P( B) = P ( A1  B)  ( A2  B)  ...  ( AK  B) =

K

K

= ∑ P( Ai  B) ∑ P( Ai )P( B| Ai )

=i 1 =i 1

4.4 Teorema de Bayes Si {A1,A2,...,AK} es una partición de Ω , y B es cualquier otro evento no vacío del mismo espacio muestral Ω; entonces, la probabilidad de ocurrencia de un evento Ai dado que ocurrió el evento B se define mediante: = P( Ai | B)

P( Ai ∩ B) = P( B)

P( Ai ) P( B| Ai )

K

∑ P( Ai ) P( B| Ai )

i =1

Estas probabilidades P( Ai | B) , son denominadas probabilidades a posteriori y son útiles porque permiten comparar las probabilidades obtenidas después de la ocurrencia del evento B de interés. Ejemplo 17 De los reportes sobre una operación financiera, se tiene la siguiente información: • La probabilidad de ganar menos de 20 000 soles es de 0.35; • El 40 % de las veces se gana entre 20 000 y 40 000 soles; • Cuando se gana menos de 20 000 soles, la probabilidad de no lograr la meta es de 0.2; ; • Si se gana entre 20 000 y 40 000 soles, la probabilidad de que se logre la meta es de 0.6; • Cuando se gana más de 40 000 soles, la probabilidad de no lograr la meta es de 0.01.

Capítulo 2. Probabilidad

125

a. Halle la probabilidad de que se logre la meta. Solución Sean los eventos: Gi: ganancia se encuentra en un intervalo i, y M: lograr la meta. Se tiene que:

= P(G1 ) 0= .35, P(G2 ) 0.40, y por diferencia se tiene que P(G3 ) = 0.25 = P( M|G1 ) 0= .80, P( M|G2 ) 0.60 = , y P( M|G3 ) 0.99 P( M ) = P(G1 ) P( M |G1 ) + P(G2 ) P( M |G2 ) + P(G3 ) P( M |G3 ) =, = (0.35)(0.80) + (0.40)(0.60) + (0.25)(0.99) = 0.7675

Forma alterna de solución: Las probabilidades conjuntas [ P(Gi  M )] se obtienen al multiplicar las probabilidades marginales [ P(Gi )] con las probabilidades condicionales [ P( M |Gi )]. Luego de los cálculos se elabora la siguiente tabla: M

M

Total

P(Gi  M) = (0.35)(0.80) 0.2800

0.0700

0.35

0.2400

0.1600

0.40

Ganancia G1: < 20 G2: 20 – 40 G3: > 40

0.2475

0.0025

0.25

Total

0.7675

0.2325

1.00

b. Si se logró la meta, ¿en cuál de los tres intervalos mencionados es más probable que se encuentre la ganancia en la operación? Solución P(G = 1|M )

P(G1  M ) P(G1 )P( M |G1 ) (0.35)(0.80) 0.28 = = = = 0.3645 P( M ) P( M ) 0.7675 0.7675

= P(G2|M ) 0= .24 / 0.7675 0.3127 = P(G3|M ) 0= .2475/ 0.7675 03224

Es más probable que la ganancia se encuentre en el primer intervalo, es decir, que sea inferior a 20 mil soles. Ejemplo 18 Del análisis de los registros (“log”) se concluye que las fallas habituales en una máquina que viene dando problemas están relacionadas con tres procesos del sistema, P1, P2 y P3. Las fallas relacionadas con cada proceso son el 20 %, 45 % y 35 % respectivamente. Sólo alguna de estas fallas conlleva un apagado repentino de la máquina. De las fallas causadas por el primer

126

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

proceso, el 30 % conlleva un apagado de la máquina, de las del segundo proceso un 55 % y de las del tercer proceso un 10 %. a. Muestre la información proporcionada en un diagrama de árbol Solución

P( A|P1 ) = 0.30

A

P( A|P1 ) = 0.70

A

P( A|P2 ) = 0.55

A

P1

P( P1 ) = 0.20 P( P2 ) = 0.45

P2 P( A|P2 ) = 0.45

P( P3 ) = 0.35

A

P( A|P3 ) = 0.10

A

P( A|P3 ) = 0.90

A

P3

b. ¿Cuál es la probabilidad de que la próxima falla produzca un apagado repentino de la máquina? Solución

P( A) =P( P1 )P( A | P1 ) + P( P2 )P( A | P2 ) + P( P3 )P( A | P3 ) P( A) = (0.2)(0.3) + (0.45)(0.55) + (0.35)(0.10) P( A) =0.06 + 0.2475 + 0.035 =0.3425

c. Si la siguiente falla produce un apagado repentino de la máquina, ¿cuál de los procesos es más probable que haya fallado? Solución = P( P1 |A)

P( P1  A) (0.2)(0.3) = = 0.1752 P( A) 0.3425

= P( P2 |A)

P( P2  A) (0.45)(0.55) = = 0.7226 P( A) 0.3425

= P( P3 |A)

P( P3  A) (0.35)(0.01) = = 0.1021 P( A) 0.3425

El proceso 2 tiene mayor probabilidad de falla.

Capítulo 2. Probabilidad

127

Ejemplo 19 Una empresa tiene 3 vendedores: A, B y C. Durante el último mes, estos vendedores han realizado, respectivamente, el 30 %, 20 % y 50 % de las operaciones de venta de la empresa. Del total de operaciones de venta realizadas por el vendedor A, el 1 % tiene error en la orden de compra. Del total de operaciones de venta realizadas por el vendedor B, el 3 % tiene error en la orden de compra. Del total de operaciones de venta realizadas por el vendedor C, el 90 % no tiene error en la orden de compra. a. Si se selecciona al azar una operación de venta, halle la probabilidad de que ésta tenga error en la orden de compra. Solución

P( A) = 0.30

P( B) = 0.20

P( E|A) = 0.01

E

P( E|A) = 0.99

E

P( E|B) = 0.03

E

P( E|B) = 0.97

E

A

B

P( E|C ) = 0.10

P(C ) = 0.50

C P( E|C ) = 0.90

E

E

P( E) = P( A)P( E| A) + P( B)P( E| B) + P(C )P( E|C ) P( E) = (0.30)(0.01) + (0.20)(0.03) + (0.50)(0.10) P( E) = 0.003 + 0.006 + 0.050 = 0.059

b. Si se selecciona al azar una operación de venta y ésta tiene error en la orden de compra; determine la probabilidad de que la operación de venta corresponda al vendedor B. Solución

P(= B|E)

P( B  E) 0.006 = = 0.1017 P( E) 0.059

4.5 Probabilidad de eventos independientes La independencia de eventos es la propiedad necesaria para que la probabilidad de la intersección se obtenga al multiplicar las probabilidades individuales. En el ejemplo A, la multiplicación brindó la probabilidad correcta porque los eventos eran independientes. En el ejemplo B, los eventos no son independientes y la multiplicación brinda una respuesta distinta.

128

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Definición Se dice que dos eventos son independientes si, y sólo si, cualquiera de las siguientes proposiciones es verdadera: • P( A | B) = P( A) • P( B| A) = P( B) • P( A  B) = P( A) P( B) Lo anterior significa que dos eventos son independientes si la ocurrencia (o no ocurrencia) de uno no afecta la probabilidad de ocurrencia del otro. Algunas veces es sencillo determinar la independencia de eventos, pero en otros casos es difícil, especialmente cuando los eventos que se desean analizar son combinaciones de otros eventos. Por ejemplo: a. La compra de un producto por un cliente A no tiene ningún efecto sobre la decisión de compra o no de otro cliente B, es decir, son independientes. b. Sean los eventos: A: tener una cuenta de ahorros en el Banco GGG, y B: recibir un préstamo en el Banco GGG El hecho de que una persona tenga una cuenta de ahorros en el Banco GGG puede aumentar la probabilidad de que la persona reciba un préstamo del Banco GGG, lo cual ocurre en la práctica, por lo tanto los eventos A y B no son independientes. Para una mejor comprensión del concepto de independencia, se menciona el siguiente caso: Caso de análisis: Sean: A: aparece el número 4 en un dado rojo, y B: aparece el número 4 en un dado azul. Si ambos dados se lanzan una vez, ¿cuál es la probabilidad de que ocurran dos números 4 ? P( A) = 1/ 6 , P( B) = 1/ 6 y P( A  B) = 1/ 36.

Nótese que el producto (1/ 6)(1/ 6) = 1/ 36 permite obtener la respuesta correcta. Pero no siempre es así. Si se lanzan los dos dados, se tiene que:

P(suma de ambos dados sea 8 y los dos números sean iguales) = 1/ 36.

Sin embargo:

P(suma de ambos dados sea 8 ) = 5/ 36



P(dos números iguales) = 6/ 36

Si se multiplican dichas probabilidades se obtiene: (5/ 36)(6/ 36) = 5/ 216. Luego, las probabilidades halladas no coinciden.

Capítulo 2. Probabilidad

129

Ejemplo 20 Los alumnos A y B han sido designados para resolver un problema de elevada dificultad, y trabajarán en forma separada. Se estima que A tiene una probabilidad de 0.85 de resolverlo correctamente, ymientras que B tiene una probabilidad de 0.75. Hallar la probabilidad de que: a) El problema quede resuelto correctamente. Solución El problema quedará resuelto cuando al menos uno de ellos lo puede resolver; es decir:

P( A  B) P( A) + P( B) – P( A)( A  B)



Por independencia



P( A  B) = P( A) + P( B) – P( A)P( B) = 0.85 + 0.75 – (0.85)(0.75) = 0.9625

b) Solo uno de ellos lo resuelva. Solución Se define el evento S: sólo un alumno resuelve el problema P(S) = P( A  B) + P( A  B) = (0.85)(0.25) + (0.15)(0.75) = 0.325

Ejemplo 21 Un empresario invierte en 3 proyectos diferentes: P1, P2 y P3. Por información anterior, el empresario sabe que las probabilidades de éxito en estos proyectos son de 0.6 , 0.7 y 0.9 , respectivamente, y, además, que los resultados de estos proyectos son independientes. a. Calcule la probabilidad de que este empresario tenga éxito en solo uno de estos proyectos. Solución Sean: P1: Éxito en el proyecto 1.

P( P1 ) = 0.60,

P2: Éxito en el proyecto 2.

P( P2 ) = 0.70, P( P2 ) = 0.30

P3: Éxito en el proyecto 3.

P( P3 ) = 0.90,

P( P1 ) = 0.40 P( P3 ) = 0.10 ,

P(Solo uno) = P( P1  P2  P3 ) + P( P1  P2  P3 ) + P( P1  P2  P3 )

= (0.6)(0.3)(0.1) + (0.4)(0.7)(0.1) + (0.4)(0.3)(0.9) = 0.154

b. Halle la probabilidad de que el empresario tenga éxito en, a lo más, dos de estos proyectos. Solución Se definen los eventos

130

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

T : tiene éxito en a lo más dos proyectos, y T : tiene éxito en los tres proyectos, = P(T ) P= ( P1  P2  P3 ) (= 0.6)(0.7)(0.9) 0.378, luego :

P(T ) = 1 − 0.378 = 0.622 P(T ) = 1 − 0.378 = 0.622 Ejemplo 22 El gerente de logística de una empresa afirma que el desabastecimiento del insumo A ocurre con probabilidad 0.1, el del insumo B ocurre con probabilidad 0.08 y el del insumo C ocurre con probabilidad 0.05. Considerando independencia para el abastecimiento de estos insumos en un momento de operación elegido al azar, halle las probabilidades para los siguientes eventos: a. E1: que los tres insumos registren abastecimiento. Solución Sean: A: Desabastecimiento del insumo A.

P(A) = 0.10, P( A) = 0.90

B: Desabastecimiento del insumo B.

P(B) = 0.08, P( B) = 0.92

C: Desabastecimiento del insumo C.

P(C) = 0.05, P( B) = 0.95

= P ( E1 ) P= ( A  B  C ) (0.90)(0.92)(0.95) = 0.7866 b. E2: que solo el insumo B registre desabastecimiento. Solución

= P ( E2 ) P= ( A  B  C ) (0.9)(0.08)(0.95) = 0.0684 c. E3: Que el desabastecimiento se produzca solo para los insumos A y C. Solución = P( E3 ) P= ( A  B  C ) (0.10)(= 0.92)(0.05) 0.0046

d. E4: Que el insumo A o el B estén desabastecidos, pero no el insumo C. Solución = P( E4 ) P= [( A  B)  C ] P( A  B)P(C )

P ( E4 ) = [ 0.10 + 0.08 − (0.10)(0.08) ] (0.95) = 0.1634 Ejemplo 23 En una empresa de estudios de mercado se forman dos grupos de encuestadores. El primer grupo está compuesto por 15 hombres y 5 mujeres, y el segundo grupo por 16 hombres y 6 mujeres. a) Si se selecciona al azar una persona de cada grupo, ¿cuál es la probabilidad de que al menos una sea mujer?

Capítulo 2. Probabilidad

131

Solución P( H1 ) =

15 20

H

Grupo 1

P( H 2 ) =

16 22

P( M 2 ) =

6 22

H

Grupo 2 P( M1 ) =

5 20

M

M

E: elegir al menos a una mujer.

E : ninguna mujer es elegida  15  16  = P( E) P= ( H1  H 2 ) P( H =   0.5454 1 ) P( H 2 ) =  20  22 

P(E) = 1 – P( E ) = 1 – 0.5454 = 0.4546

5. Problemas resueltos 1. Una caja contiene 20 fichas blancas numeradas de 1 a 20, 10 fichas rojas numeradas de 1 a 10, 40 fichas amarillas numeradas de 1 a 40, y 10 fichas azules numeradas de 1 a 10. Suponga que todas las fichas tienen igual probabilidad de ser elegidas y que se extrae una ficha al azar. a. ¿Cuál es la probabilidad de que la ficha sea azul o blanca? Solución

Ω ={B1, …, B20, R1, …, R10, Am1, …, Am40, Az1, …, Az10}; n(Ω) =80

Blancas = {B1, …, B20}

n(B) = 20

Rojas = {R1, …, R10}

n(R) = 10

Amarillas = {Am1, …, Am40}

n(Am) = 40

Azules = {Az1, …, Az10}

n(Az) = 10

En este caso, no interesa el número de la ficha sino el color P( A =  B) P( A) + P( B) ya que son mutuamente excluyentes (o se da uno o se da el otro, pero no ambos simultáneamente)

El total de fichas en la caja es 80: n(Ω) = 80 El total de total de fichas azules: n(Az) = 10 y de fichas blancas: n(B) = 20; luego,

P( A  B) =

20 10 30 + = = 0.375 80 80 80

b. ¿Cuál es la probabilidad de que la ficha tenga el número 10, 11, 12 o 25? Solución

132

Ahora no interesa el color sino el número. Con el número 10 hay 4 fichas, con el 11 y 12 hay 2, y con el 20 sólo 1. Entonces

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios



P(10  11  12  25) = P(10) + P(11) + P(12) + P( 25) =

4 2 2 1 9 + + + = = 0.1125 80 80 80 80 80

c. ¿Cuál es la probabilidad que la ficha sea roja o amarilla y que tenga el número 3, 4, o 5? Solución Para cada Colori se tiene que P(Color= i)

1 = 0.0125 80

6 P( R3 ) + P( R4 ) + P( R5 ) + P( A3 ) + P( A4 ) + P( A5 ) = = 0.075 80

d. ¿Cuál es la probabilidad de que el número sea divisible por 3? Solución

Las fichas blancas contienen a 6 divisibles por 3.



B 3 = {B3, B6, B9, B12, B15, B18}



Las fichas rojas contienen a 3 divisibles por 3. R 3 = {R3, R6, R9}



Las fichas amarillas contienen a 13 divisibles por 3.



Am 3 = {Am3, Am6 , …, Am36 , Am39}



Las fichas azules contienen a 3 divisibles por 3. Az 3 = {Az3, Az6, Az9}









La probabilidad de escoger un número que sea divisible por 3 se reduce a: 



P(3) =

6 + 3 + 13 + 3 25 = = 0.3125 80 80

2. En una empresa se han elaborado tarjetas con el nombre de cada colaborador, así como un código para un sorteo; el mencionado código se encontraba conformado por 5 posiciones: las 2 primeras posiciones eran figuras de la baraja (♦ ♣ ♥ ♠), y las 3 últimas eran valores numéricos (dígitos del 1 al 3). Cada figura, así como los números, podía repetirse en el código. a. Hallar la probabilidad de que el código para el sorteo se encuentre conformado por figuras y dígitos distintos. Solución

El código se puede conformar de (42)(33) = (16)(27) = 432 códigos distintos



A: el código tiene figuras y dígitos distintos. • Ordenar 2 figuras, sin repetición, de 4 posibles:

P24 =

4! ( 4)(3)( 2 !) = 12, y = ( 4 − 2)! 2!

• Ordenar 3 dígitos, sin repetición, de 3 posibles: P3 = 3! = (3)(2)(1) = 6 • Número de casos a favor del evento A: n(A) = P24 P3 = (12)(6) = 72

Capítulo 2. Probabilidad

133



Por lo tanto, la probabilidad de que ocurra A es: = P( A)



P24 P3 (12)(6) = ≈ 0.16667 2 3 432 ( 4 )(3 )

b. ¿Cuál es la probabilidad de que el dígito central no se repita? Solución

B: el dígito central no se repite. • Ordenar 2 figuras, con repetición, de 4 posibles: 42 • Elegir al dígito que no se repite: C13 = 3 • Ordenar 2 dígitos, con repetición, de 2 posibles: 42 = 4 Por lo tanto, la probabilidad de que ocurra B es: 2

P ( B= )

(4 )(3)(4) 12 = ≈ 0.44444 2 3 27 (4 )(3 )

3. Un ingeniero de sistemas que trabaja para una compañía de computación dedicada al desarrollo de software está diseñando la clave de acceso a su programa aplicativo. La clave debe estar formada por una palabra de cinco letras, elegidas entre cuatro vocales y ocho consonantes disponibles. a. Hallar la probabilidad de que la clave esté formada por 2 vocales al inicio y 3 consonantes al final, tal que las vocales y consonantes no se repitan. Solución • El total de posibles claves que puede formar el ingeniero con las 12 letras disponibles es: n(Ω) =125. • Se define el evento D: la clave tiene 2 vocales distintas al inicio y 3 consonantes distintas al final. El número de casos a favor de D es: 4 8 n= ( D) P= (12)(336) = 4032 . 2 P3 4032 Por lo tanto, la probabilidad de que ocurra D es: P= ( D) = 0.0162 125 b. ¿Cuál es la probabilidad de que el ingeniero forme una clave que contenga dos vocales iguales y tres consonantes iguales? Solución

Se define el evento E: la clave tiene dos vocales iguales y tres consonantes iguales. Como para formar la clave interesa el orden, hay 4 maneras de elegir una vocal y 8 maneras de elegir una consonante, la vocal y la consonante elegidas se repetirán 2 y 3 veces respectivamente. Los casos a favor de E son:

   (5)( 4)(3!)  5! n( E) ( 4)(8= ) P25, 3 (32)  )(10) 320. = = = =  (32)   (32  ( 2 !)(3!) ( 3!)   ( 2 !)(3!)   

( )

134

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

La probabilidad de que ocurra E es: P= ( E)

320 = 0.001286 125

4. En una empresa hay 3 subgerencias vacantes. Para cubrir estas vacantes, la empresa decide elegir al azar a tres de sus ejecutivos aptos para asumir cada uno de estos cargos. La empresa tiene cuatro sucursales: San Isidro, con 5 ejecutivos, Miraflores, con 8 ejecutivos; San Miguel, con 4 ejecutivos; y La Molina: con 3 ejecutivos. a. ¿Cuál es la probabilidad de que los 3 subgerentes elegidos sean de la misma sucursal? Solución

n(Ω= ) C320= 1140 E: los 3 ejecutivos elegidos son de la misma sucursal

P= ( E)

C35 + C38 + C34 + C33 10 + 56 + 4 + 1 71 = = = 0.0622 20 1140 1140 C3

b. ¿Cuál es la probabilidad de que ninguno de los elegidos sea de la sucursal de Miraflores? Solución F: Ningún ejecutivo de Miraflores es elegido

= P( F )

C08 C12 3 = 0.19298 C320

P( F ) =

C08C12 (1)( 220) 3 = = 0.19298 20 1140 C3





c. Hallar la probabilidad de que más de uno de los elegidos sea de la sucursal de San Isidro. Solución M: elegir a más de un ejecutivo de San Isidro P(= M)



C25C115 + C35C15 (10)(15) + (10)(1) 160 0 = = = 0.14035 20 1140 1140 C3

5. En una reunión de trabajadores con sus directivos (gerente y subgerente) se han ocupado totalmente 4 mesas con capacidad para 10 personas; además, se sabe que en la mesa 1 no se ha ubicado ni al gerente ni al subgerente, quienes se han ubicado en mesas diferentes. Se selecciona 3 trabajadores.

Capítulo 2. Probabilidad

135

a. ¿Cuál es la probabilidad de que a lo más se seleccione a un trabajador de la mesa 1? Solución • Seleccionar a 3 de los 38 trabajadores: C338 = 8436 Luego: Seleccionar a 0 trabajadores de la mesa 10 28 1 (10 trabajadores), y a 3 de las mesas = )(3276) 3276 C 0 C 3 (1= restantes (28 trabajadores). Seleccionar a 1 trabajador de la mesa 10 28 1 (10 trabajadores), y a 2 de las mesas = = )(378) 3780 C1 C 2 (10 restantes (28 trabajadores).

• Probabilidad solicitada:

10 28 10 28 3276 + 3780 C 0 C= 3 + C1 C 2 ≈ 0.8364 38 8436 C3

b. En la mesa 2 tampoco se ha ubicado ni al gerente ni al subgerente, ¿cuál es la probabilidad de que por lo menos se seleccione a 2 trabajadores de la mesa 1 o de la mesa 2, pero no a trabajadores de ambas mesas a la vez? Solución Del procedimiento anterior: • Seleccionar a 3 de las 38 trabajadores: C 38 3 = 8436 Luego: Seleccionar a 1 de las 2 mesas (mesa 1 o mesa 2)

2 C1 = 2

De la mesa elegida previamente, seleccionar a 2 trabajadores de la mesa (10 trabajadores), y a 1 de las mesas 3 o 4 (18 trabajadores), o

10 18 = 45)(18) 810 C 2 C1 (=

De la mesa elegida previamente, seleccionar a 3 trabajadores de la mesa (10 trabajadores), y a 0 de las mesas 3 o 4 (18 personas)

10 18 = (120 = )(1) 120 C 3 C0

(

)

C1 C 2 C1 + C 3 C 0 2(810 + 120) = ≈ 0.2205 • Probabilidad solicitada: 38 8436 C3 2

136

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

10 18

10 18

6. Una empresa transnacional requiere seleccionar practicantes de ingeniería para el verano del año siguiente. El perfil solicitado indica tener tres características: pertenecer al tercio superior, dominar el idioma inglés, y dominar Excel. Se presentaron al proceso de selección 500 estudiantes de diferentes universidades, y luego de la primera revisión de los currículos, se observó que: Pertenecen al tercio superior 186 Son del tercio superior y dominan inglés: 83 Dominan inglés 329 Dominan inglés y Excel: 217 Dominan Excel 295 Son del tercio superior y dominan Excel: 63 Todos los postulantes tienen al menos una de las tres características. Si se elige al azar a un postulante, determine la probabilidad de que: a. Tenga el perfil solicitado. Solución

Tercio superior: n(T) = 186 Tercio superior y domina inglés: n(T  I )=83



Domina inglés: n(T) = 329 Dominan inglés y Excel: n( I  E) = 217



Domina Excel: n(E) = 295 Tercio superior y domina Excel: n(T  E)=63



n(Ω) =500 n(T  I  E) = n(T ) + n( I ) + n( E) – n(T  I ) – n( I  E) – n(T  E) + n(T  I  E)



500 = 186 + 329 + 295 – (83 + 217 + 63) + n(T  I  E)

Entonces, n(T  I  E) = 53

Diagrama de Venn: n(Ω) =500 T

I 30

93

82

53 10

164 68 E



P(Perfil) = P(T  I = E)

53 = 0.106 500

Capítulo 2. Probabilidad

137

b. Tenga solo una de las tres características. Solución S: el estudiante tiene solo una de las 3 características.       P(S) = P[(T  I  E)  (T  I  E)  (T  I  E)] =

93 + 82 + 68 243 = = 0.486 500 500

c. Domine el idioma inglés y Excel, pero no pertenezca al tercio superior. Solución  164 P[( I  E) − T ]= P( I  E  T )= = 0.328 500

7. Se han encuestado a 160 profesionales de la construcción y acabados, y se ha recabado información sobre su edad, la tienda de su preferencia, así como el motivo de dicha preferencia (Servicio o Variedad). A partir de los datos recabados se elaboró la siguiente tabla resumen: Servicio

Edad De 40 a más

Variedad

Total

Maestro

Promart

Sodimac

Maestro

Promart

Sodimac

5

5

4

8

15

12

49

Menos de 40

21

18

15

6

26

25

111

Total

26

23

19

14

41

37

160

a. Si se selecciona un encuestado al azar para una verificación telefónica, obtenga las siguientes probabilidades. a.1) ¿Cuál es la probabilidad de que el encuestado prefiera la tienda Sodimac? Solución P(Sodimac = )

19 + 37 56 = = 0.35 160 160

a.2) ¿Cuál es la probabilidad de que el encuestado no prefiera la tienda Promart? Solución P( Promart ) = 1 − P( Promart ) = 1−

23 + 41 64 = 1− = 0.40 160 160

a.3) ¿Cuál es la probabilidad de que el encuestado tenga de 40 a más años o que valore la Variedad? Solución P(De 40 a más  Variedad) = P(De 40 a más) + P(Variedad) – P(De 40 a más  Variedad)

138

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

49 14 + 41 + 37 8 + 15 + 12 106 P(De 40 a más  Variedad) = + − = = 0.6625 160 160 160 160

b. Si se elige al azar a 4 profesionales de 40 a más años, ¿cuál es la probabilidad de que exactamente 2 hayan valorado el Servicio? Solución • Seleccionar a 6 de los 49 profesionales de 40 a más años: 49 ! 49 ! = C449 = = 211 876 4 !( 49 − 4 )! ( 4 !)( 45 !)



De los 49 profesionales de 40 a más años, hay 14 profesionales que valoraron el Servicio y 35 profesionales que valoraron la Variedad.

• Seleccionar 2 de los 14 profesionales que valoraron el Servicio y 2 de los 35 profesionales que valoraron la Variedad:  14 !  35 !  35 C14 1)(595) 54 145 =   =  (9= 2 C2  ( 2 !)(12 !)  ( 2 !)(33!)  35 C14 54 145 2 C2 • Probabilidad solicitada: = ≈ 0.25555 49 211 876 C4

c. Si se elige al azar a 3 profesionales que prefieren la tienda Maestro, ¿cuál es la probabilidad de que por lo menos uno haya valorado la Variedad? Solución • Seleccionar a 3 de los 26 + 14 = 40 profesionales que prefieren la tienda Maestro: C 40 = 9880

3 • De los 40 profesionales que prefieren la tienda Maestro, hay 26 profesionales que valoraron al Servicio y 14 profesionales que valoraron la Variedad.

• Seleccionar 2 de los 26 profesionales que valoraron al Servicio y 1 de los 14 profesionales que valoraron la Variedad: C 26C14 = (325)(14) = 4550

2 1 • Seleccionar 1 de los 26 profesionales que valoraron al Servicio y 2 de los 14 profesionales que valoraron la Variedad:

C126C14 2 = ( 26)(91) = 2366 • Seleccionar 0 de los 26 profesionales que valoraron al Servicio y 3 de los 14 profesionales que valoraron la Variedad: C026C14 3 = (1)(364) = 364 26 14 C 26C14 + C126C14 7280 2 + C 0 C3 • Probabilidad solicitada: 2 1 = ≈ 0.7368 40 C3

9880

Capítulo 2. Probabilidad

139

8. Se compran 20 computadoras de una marca A y 30 de una marca B. De la marca A hay 2 que no funcionan; y de la marca B hay 3 que no funcionan. a. Si se elige al azar una de las computadoras, ¿cuál es la probabilidad de que no funcione? Solución P(computadora no funciona) =

5 = 0.10 50

b. Si para una inspección se elige al azar y sin reposición 5 computadoras, ¿Cuál es la probabilidad de que: b.1) Solo una de ellas sea de la marca A. Solución  50  n(= Ω)  =  2 118 760 5

S: solo una computadora elegida es de la marca A

 20  • Seleccionar una computadora de la marca A de 20 disponibles:   1  30  • Seleccionar 4 computadoras de la marca B de 30 disponibles:   4  20  30     1  4  = P(S) = 0.2587 2118760

b.2) A lo más una de ellas sea defectuosa. Solución A: a lo más una computadora elegida es defectuosa. • Seleccionar ninguna computadora defectuosa, y 5 no defectuosas:

 5  45     , o  0  5 

• Seleccionar una computadora defectuosa, y 4 no defectuosas:  5  45     1 4   

 5  45   5  45     +    0  5   1  4  = P( A) = 0.9282 2118760

9. Suponga que por la aduana de un aeropuerto deben pasar 20 embarques. Para cada uno de ellos, el responsable del embarque debe presionar un botón que emitirá una luz de color rojo (R), una luz de color ámbar (A) o una luz de co-

140

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

lor verde (V). Si se emite luz roja, el embarque será revisado totalmente. Si se emite luz ámbar, el embarque se revisará parcialmente. Si se emite luz verde, el embarque no será revisado. a. Si se desea identificar la luz emitida para cada uno de los 20 embarques, determine el número de elementos que tiene el espacio muestral. Solución

Con cada uno de los 20 embarques se tiene 3 opciones al presionar un botón, por lo tanto el total de posibles resultados es:

20 N(Ω) =3 b. Halle la probabilidad de que la mitad de los embarques sean revisados totalmente y que cinco de los embarques sean revisados parcialmente.

Solución

M: la mtad de los embarques son revisados totalmente (R), y cinco de los embarques sean revisados parcialmente (A) Aplicando permutaciones con elementos iguales, se tiene que: 20 = n( M ) P= 10 , 5 , 5

20 ! = 46 558 512 10 ! 5 ! 5 !

Por lo tanto, la probabilidad de que ocurra el evento M es:

= P( M )

46 558 512 = 0.01335 320

10. En el depósito de la empresa Fabritext S.A hay dos lotes de cierto producto: • El lote 1 contiene 5 unidades de buena calidad, 4 de regular calidad y 3 de mala calidad. • El lote 2 contiene: 8 unidades de buena calidad, 6 de calidad regular y 4 de mala calidad. Un comprador debe elegir al azar 4 unidades, y si elige al menos 2 unidades de buena calidad, compra los dos lotes. Sean las siguientes estrategias: i. Estrategia 1: de cada lote se eligen, al azar, sin reemplazo y sin considerar el orden, dos unidades. ii. Estrategia 2: se juntan los dos lotes; luego, se seleccionan, al azar y sin reemplazo, cuatro unidades. iii. Estrategia 3: de cada lote se eligen, al azar y con reemplazo, dos unidades. ¿Con cuál de las estrategias se tiene una mayor probabilidad de que se compre los dos lotes?

Capítulo 2. Probabilidad

141

Solución Para la estrategia 1 La cantidad de sucesos del espacio muestral viene dada por: 12 18  = n(Ω)  =   10 098  2  2 

Lote 1: 5 unidades de buena calidad, y 7 de otras calidades Lote 2: 8 unidades de buena calidad, y 10 de otras calidades Sean A: elegir al menos dos unidades de buena calidad

A: elegir a lo más una unidad de buena calidad  5   7   8   10   5   7   8   10   5   7   8   10  n( A) =         +         +         = 4200  0 2 0 2   0 21 1  1 1  0 2 

4200 P( A) = 1 − P( A) = 1− = 0.58407 10098

Para la estrategia 2 El espacio muestral viene dado por:  30  n( Ω = )  = 27 405   4

13  17  13  17  n( A) =     +     = 11 220  0  4   1  3 

11220 P( A) = 1 − P( A) = 1− = 0.59058 27405

Para la estrategia 3 El espacio muestral viene dado por: 2 = n(Ω) (12= )(182 ) 46 656

n(A ) = (7)(7)(10)(10) + ( 2)(5)(7)(10)(10) + ( 2)(7)(7)(8)(10) = 19 740 19740 P( A) = 1 − P( A) = 1− = 0.57690 46656

Hay mayor probabilidad de concretar la compra usando la estrategia 2.

11. En una fábrica de pantalones, se trabaja con 3 máquinas (M1, M2, M3). La

producción de la máquina M1 equivale a la producción de M2 y M3 juntas y además la producción de M2 es la quinta parte del total. El 60 % de la producción de cada máquina corresponde a operarios antiguos y el resto a operarios nuevos. Si de la producción de la semana anterior (con las condiciones dadas), se selecciona un pantalón al azar, halle la probabilidad de que:

142

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

a. Haya sido confeccionado en la máquina M3. Solución Se sabe que:

P= ( M1 ) P( M 2 ) + P( M3 )

1 = 0.20 5

(1),

y

P ( M 2 )=

(3) De (2) y (4) se deduce que:

y

P( M 2 ) + P( M3 ) = 0.5 (4)

(2)

De (1) se deduce que:

P( M1 ) = 0.50

P( M3 ) = 0.3

(5)



b. Haya sido confeccionado en la máquina M2 y por un operario antiguo. Solución Sea:

A: Es un operario antiguo



Se sabe que:



= P( A | Mi ) 0= .60, i 1, 2, 3

(6)

De (2) y (6) se tiene que:

P( M 2  A) = P( M 2 = )P( A | M 2 ) (= 0.20)(0.60) 0.12 Siguiendo un similar procedimiento se puede completar la siguiente tabla: Antiguos (A)

Nuevos (N)

Total

Máquina 1 (M1)

0.30

0.20

0.50

Máquina 2 (M2)

0.12

0.08

0.20

Máquina 3 (M3)

0.18

0.12

0.30

Total

0.60

0.40

1.00

c. Haya sido confeccionado por un operario nuevo o en la máquina M1. Solución Sea: N: Es un operario nuevo Entonces:

P( N  M1 ) =+ P( N ) P( M1 ) – P( N  M1 ) = 0.40 + 0.50 – 0.20 = 0.70

12. En un examen de Matemáticas solo 75 % de los alumnos respondió todas las preguntas. De aquellos que lo hicieron, 80 % aprobó, pero de los que no lo respondieron en su totalidad, solo aprobó 50 %. a. Si se elige al azar a un estudiante que aprobó, ¿cuál es la probabilidad de que haya respondido todas las preguntas?

Capítulo 2. Probabilidad

143

Solución

Se definen los eventos:



R: responder todas las preguntas.



A: aprobar el examen



Se sabe que:

= P( R) 0= .75, P( R) 0.25= , P( A | R) 0.80= , P( A | R) 0.50 Se registra la información proporcionada en la siguiente tabla: A R

P( R  A) = P( R)P( A|R) (0.75)(0.80) = 0.600

A

Total

0.150

0.75

R

0.125

0.125

0.25

Total

0.725

0.275

1.00



Se solicita: P( R|A)



De la tabla se tiene que: P ( R = | A)

P ( R  A) 0.60 = = 0.8276 P ( A) 0.725

b. Si el estudiante elegido no aprobó, ¿cuál es la probabilidad de que no haya respondido todas las preguntas? Solución



Se solicita: P ( R | A) De la tabla anterior, se tiene: P( R= | A)

P( R  A) 0.125 = = 0.4545 P( A) 0.275

13. En una empresa se realizó una capacitación a los operarios de la Planta A y de la Planta B, y se tiene conocimiento de que los operarios capacitados provenientes de la Planta A son el doble que los provenientes de la Planta B. Se sabe que el 5 % de los operarios de la Planta A y el 10 % de los operarios de la Planta B obtuvieron una clasificación deficiente en la evaluación realizada luego de la capacitación. Si de una de las plantas se selecciona al azar 2 operarios, responda a las siguientes preguntas. Nota: Los resultados de la evaluación son independientes. a. Hallar la probabilidad de que los 2 operarios hayan obtenido una clasificación aceptable (no deficiente). Solución Pi: Los 2 operarios son de la Planta i.

i = A, B

C: Los 2 operarios seleccionados obtuvieron una clasificación aceptable.

144

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios



Nota: Como los operarios capacitados de la Planta A son el doble que la Planta B: 2 1 = P( PA ) = , y P( PB ) 3 3 Planta

Clasificación

2 P ( PA = | PA ) 0.95 = 0.9025

2 P( PA ) = 3

1 P( PB ) = 3

C

PA

C

2 P ( PA = | PA ) 0.90 = 0.81

PB

C

C

2 1 P(C = )   (0.9025) +   (0.81= ) 0.871667 3  3 b. Si los 2 operarios seleccionados obtuvieron una clasificación aceptable, ¿cuál es la probabilidad de que sean de la Planta B? Solución



1 (0.81) P( PB  C B )  3  = P( PB |C ) = = 0.30975 P(C ) 0.871667

14. Suponga que la SUNAT ha clasificado a las empresas por sectores (S1, S2 y S3), y también según el índice del pago del impuesto a la renta del 2014 en tres categorías (A1, A2 y A3). Considerando las clasificaciones antes mencionadas el 30 % de las empresas son del sector S1 y de la categoría A1, el 10 % son del sector S1 y de la categoría A2, el 60 % de las empresas son del sector S1, el 20 % de las empresas son del sector S2 y de la categoría A1, el 5% de las empresas son del sector S2 y de la categoría A3, y el 35 % de las empresas son del sector S2. Además, se conoce que de las empresas que son del sector S3, el 60 % pertenecen a la categoría A1; y de las que son de la categoría S3, el 20 % son de la categoría A2. Se selecciona al azar una empresa.

Capítulo 2. Probabilidad

145

a. Determine la probabilidad de que pertenezca a la categoría A2 o pertenezca a S3. Solución

A continuación se resume la información proporcionada:



= P(S1  A1) 0.30 , P= (S1  A2) 0= .10 , P(S1) 0.60

(Grupo 1)

(Grupo 2) P(S2  A1) 0.20 , P = (S2  A3) 0= .05, P(S2) 0.35 = = P( A1|S3) 0= .60, P( A2 |S3) 0.20 (Grupo 3) (1) Del (Grupo 1) y del (Grupo 2) se deduce que: P(S3) = 0.05 De (1) y del (Grupo 3) se deduce que:

P( A1  S3) P( A1  S3) = = 0.60 ⇒ ( A1  S3)= 0.03 P(S3) 0.05

P( A1|S3)=



De igual forma: P( A2  S3) = 0.01



A partir de lo señalado se completa la siguiente tabla: A1

A2

A3

Total

S1

0.30

0.10

0.20

0.60

S2

0.20

0.10

0.05

0.35

S3

0.03

0.01

0.01

0.05

Total

0.53

0.21

0.26

1.00



Se solicita: P( A2  S3)



De la tabla elaborada se tiene:



P( A2  S3) = P( A2) + P(S3) – P( A2  S3) = 0.21 + 0.05 – 0.01 = 0.25

b. Si se sabe que es de la categoría A2, halle la probabilidad de que no pertenezca al sector S1. Solución De la tabla anterior, se tiene:

(

)

P S1 | A = 2

0.11 = 0.5238 0.21

c. Si la empresa elegida no pertenece al sector S2, ¿cuál es la probabilidad de que tampoco pertenezca a la categoría A3? Solución De la tabla anterior, se tiene:

(

)

P A3 |= S2

146

0.44 = 0.5238 0.65

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

15. En un supermercado se viene analizando la compra de los clientes, y se recabó la siguiente información. • Todos los clientes adquirieron por lo menos un producto de la sección de artículos de limpieza. • 70 % de los clientes adquirieron más de un producto de la sección de artículos de limpieza. • 20 % de los clientes adquirieron el producto de limpieza en oferta. • De aquellos clientes que compraron más de un producto de la sección de artículos de limpieza, 15 % adquirieron el producto de limpieza en oferta. Calcule la probabilidad de que un cliente seleccionado al azar adquiriera exactamente un producto de la sección de artículos de limpieza y que dicho producto no sea el que se encontraba en oferta. Solución L: Adquiere solamente un producto de la sección de artículos de limpieza (caso contrario adquiere más de 1 producto, ya que todos adquirieron por lo menos 1). O: Se adquiere el producto en oferta. Cantidad artículos de limpieza

Prod. Oferta

P(O|L) = k P( L) = 0.30

O

L

O P(O|L) = 0.15 P( L ) = 0.70

O

L

O P(O= ) 0.30( k ) + (0.70)(0.15= ) 0.20 ⇒ k= 0.31667 Por lo tanto: P(O|L = ) 1= – k 1 – 0.31667 = 0.68333 Se solicita: = P( L  O) P= ( L)P(O | L) (0.30 = )(0.68333) 0.205

16. En un municipio, un regidor tiene en pendiente la aprobación de 2 proyectos que ha presentado: A y B. Se estima que el proyecto A tiene una probabilidad de 0.7 de ser aprobado antes de la próxima sesión de Concejo, mientras que el proyecto B tiene una probabilidad de 0.9 de ser aprobado en el mismo plazo. Si la aprobación de un proyecto no influye en el otro, ¿cuál es la probabilidad de que...

Capítulo 2. Probabilidad

147

a. Se aprueben los 2 proyectos antes de la próxima sesión de Concejo? Solución

Se tiene que:



P( A) = 0.7 y P( B) = 0.90

P( A  B) P= ( A)P( B) (0.70 = )(0.90) 0.63 = b. Se apruebe solamente el proyecto A antes de la próxima sesión de Concejo?

Solución

P( A  B) P= ( A)P( B) (0.= 70)(0.10) 0.07 = c. Se apruebe al menos uno de los dos proyectos antes de la próxima sesión de Concejo? Solución Sea: N: No aprobar ninguno de los 2 proyectos

P( N ) = P( A  B) = P( A  B) P= ( A)P( B) (0.= 30)(0.10) 0.03 Luego por la probabilidad de evento contrario

1 − P( A  B) = 1 − 0.03 = 0.97 P(Aprobar al menos 1) =

17. En una tienda de calzado, el 40 % de las personas que ingresan al local realiza una compra, y se sabe que la decisión de compra es independiente de una persona a otra. Sobre los próximos 3 clientes que ingresarán a la tienda, responda las siguientes preguntas: a. ¿Cuál es la probabilidad de que los 3 clientes efectúen una compra? Solución Ci: Cliente i realiza una compra.

i = 1, 2, 3

= P(C1  C2  C3 ) P= (C1 )P(C2 )P(C3 ) 0.43 = 0.064 b. ¿Cuál es la probabilidad de que por lo menos 2 de las personas realicen una compra? Solución

P(≥ 2) = P(C1  C2  C3 ) + P(C1  C2  C3 ) + P(C1  C2  C3 ) + P(C1  C2  C3 ) 3 P(≥ 2= ) (3)(0.42 )(0.6) + 0.4= 0.288 + 0.064 = 0.352

c. ¿Cuál es la probabilidad de que se realice por lo menos una venta? Solución

1 − P(0) = 1 − P(C1  C2  C3 ) = 1 − 0.63 = 1 − 0.216 = 0.784

148

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

18. Según su gravedad, los accidentes de trabajo están clasificados en tres grupos: leves, moderados y severos. La probabilidad de que ocurra un accidente leve es 0.5, de que ocurra un accidente moderado, 0.4; y de que ocurra un accidente severo, 0.1. a. Cinco accidentes ocurrieron independientemente en un mes: a.1) Calcule la probabilidad de que ninguno sea severo Solución Sean: L: Ocurre un accidente de trabajo de gravedad leve.

P( L) = 0.50

M: Ocurre un accidente de trabajo de gravedad moderado. P( M ) = 0.40 M: Ocurre un accidente de trabajo de gravedad severo. P(S) = 0.10 Se solicita: P(Ninguno severo)

= P(S1  S2  S3  S4 =  S5 ) ( = 0.9)5 0.5905 P(Ninguno severo) a.2) Halle la probabilidad de que a lo más uno sea moderado Solución A: a lo más un accidente moderado P( A) = P(ninguno moderado) + P(solo uno moderado)

P( A) = P( M1  M 2  M3  M 4  M5 ) + C15 P( M1  M 2  M3  M 4  M5 ) = (0= .6)5 + 5(0.6)(0.4)4 0.15456 a.3) ¿Cuál es la probabilidad de que todos tengan la misma gravedad? Solución T: Todos los accidentes de la misma gravedad

P(T ) = P( L1  L2  L3  L4  L5 ) + P( M1  M 2  M3  M 4  M5 ) + P(S1  S2  S3  S4  S5 ) P(T ) = (0.5)5 + (0.4)5 + (0.1)5 = 0.0415 b. Halle la probabilidad de que el cuarto accidente que ocurre sea el primero de severa gravedad Solución E: El cuarto accidente es el primero severo

= P( E) P(S1  S2  S = 0.9)3 0.1 0.0729 3  S4 ) ( =

19. Un grupo empresarial decide ejecutar tres planes de inversión: 1, 2 y 3. Los tres planes serán tratados en forma independiente. Para cada plan de inversión se ha considerado tres posibilidades: Fracaso (F), Recuperación de la inversión en tres años o menos (RT) y Recuperación de la inversión en más de tres años pero en cinco años o menos (RC). Para el plan de inversión

Capítulo 2. Probabilidad

149

1 se consideran las siguientes probabilidades: P( F1 ) = 0.10, P( RT1 ) = 0.35 y P( RC1 ) = 0.55. Para el plan de inversión 2 se consideran las siguientes probabilidades: P( F2 ) = 0.15, P( RT2 ) = 0.50 y P( RC2 ) = 0.35. Para el plan de inversión 3 se consideran las probabilidades siguientes: P( F3 ) = 0.05, P( RT3 ) = 0.065 y P( RC3 ) = 0.30. a. ¿Cuál es la probabilidad de que sólo en uno de los planes se recupere la inversión? Solución Se define: Ri: Recuperar la inversión sólo en el plan i, i = 1, 2, 3 De lo señalado se deduce: P(R1) = P(RT1) + P(RC1) = 0.35 + 0.55 = 0.90, P( R1 ) = 0.10 P(R2) = P(RT2) + P(RC2) = 0.50 + 0.35 = 0.85, P( R2 ) = 0.15 P(R3) = P(RT3) + P(RC3) = 0.65 + 0.30 = 0.95, P( R3 ) = 0.05 Sea: A: solo en un plan de inversión se recupera la inversión P( A) = P( R1  R2  R3 ) + P( R1  R2  R3 ) + P( R1  R2  R3 ) P( A) = P( R1  R2  R3 ) = (0.9)(0.15)(0.05) + (0.1)(0.85)(0.05) + (0.10)(0.15)(0.95) = 0.02525

b. Sabiendo que en solo uno de los planes se recuperó la inversión, ¿cuál es la probabilidad de que haya sido el segundo? Solución P( R = 1  R2  R3 |A)

(0.1)(0.85)(0.05) = 0.1683 0.02525

c. Determine la probabilidad de que no fracase el plan de inversión 1 o no fracase el plan de inversión 2. Solución

P( F1  F2 ) = P( F1 ) + P( F2 ) − P( F1  F2 ) = 0.90 + 0.85 – (0.90)(0.85) = 0.985



20. Tres equipos de futbol compiten en un triangular. El campeón será aquel equipo que logre ganar sus dos partidos. Si los equipos son A, B, C y no existen los empates, se tiene que: P(A gane a B) = 0.70; P(B gane a C) = 0.80; P(C gane a A) = 0.90 a. ¿Cuál es la probabilidad de que A sea el campeón? Solución De los datos proporcionados se tiene que:

150

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

P(A gane a C) = 1 – P(C gane a A) = 1 – 0.90 = 0.10 Para que A sea el campeón tiene que ganar a B y a C; es decir: P(A es el campeón) = P(A gane a B)P(A gane a C) = (0.70)(0.10) = 0.07 b. ¿Cuál es la probabilidad de que B sea el campeón? Solución Procediendo de manera similar al inciso a), se tiene: P(B gane a A) = 1 – P(A gane a B) = 1 – 0.70 = 0.30 P(B es el campeón) = P(B gane a A)P(B gane a C) = (0.30)(0.80) = 0.24

6. Problemas propuestos 1. El testigo de un accidente de tránsito le indica al policía que la placa de circulación del automóvil tenía las letras DUH seguidas por tres dígitos, el primero de los cuales era un cinco. Si el testigo no puede recordar los otros dos dígitos, pero asegura que los tres eran diferentes, encuentre el número máximo de placas que debe verificar la policía.

2. Se dispone de los siguientes dígitos 0, 1, 2, 3, 4, 5, y 6; para conformar números de 3 dígitos, tal que cada dígito solo puede usarse una vez: a. ¿Cuántos números distintos pueden formarse? b. ¿Cuántos números pares distintos pueden formarse? c. ¿Cuántos números distintos mayores que 330 pueden formarse?

3. Ocho personas, cuatro mujeres y cuatro hombres, compraron 8 lugares para un concierto. Considerando cada uno de los siguientes casos, ¿en cuántas formas diferentes pueden ubicarse en los lugares disponibles? a. Sin restricciones. b. Si se sientan por parejas (hombre y mujer). c. Si todos los hombres se sientan juntos a la izquierda de todas las mujeres.

4. Una caja de 12 baterías recargables contiene una defectuosa, ¿de cuántas maneras un inspector puede seleccionar tres de las baterías y a. obtener la defectuosa. b. no obtener la defectuosa?

5. El gerente de una fábrica desea determinar el número de maneras en que puede asignar trabajadores al primer turno. Cuenta con 12 hombres que pueden servir como operadores, 8 que pueden desempeñarse en mantenimiento y 4 que pueden ser supervisores. Si el turno requiere 6 operadores, 2

Capítulo 2. Probabilidad

151

trabajadores de mantenimiento y 1 supervisor, ¿de cuántas maneras puede integrarse el primer turno?

6. Un equipo de fútbol tiene 3 arqueros y 15 jugadores de campo. a. ¿Cuántas alineaciones distintas se pueden formar? b. Manuel y Jorge son amigos y jugadores de campo. ¿En cuántos casos se podrá formar el equipo, si al menos uno de los amigos debe jugar?

7. Con la intención de difundir temas relacionados a la protección y uso racional del medio, el Ministerio del Ambiente tiene previsto difundir 5 spots (rotulados con las letras A, B, C, D y E) con información alusiva al tema durante los tres intermedios de un sintonizado programa informativo este domingo. ¿De cuántas maneras puede programarse la transmisión de los spots durante los tres intermedios si solo se puede programar un spot en cada intermedio y si: a. En los tres intermedios se puede difundir el mismo spot. b. Los tres spots difundidos son distintos. c. Un spot es difundido en dos intermedios. d. De los tres spots diferentes por difundir, uno de ellos es el spot B?

8. Una tienda tiene 3 vitrinas para mostrar sus productos, se puede colocar 1 o más artículos en una vitrina cualquiera. Si en cierto momento hay 4 artículos para exhibición. ¿Cuál es la probabilidad de que se utilicen solo 2 de las 3 vitrinas para los 4 artículos?

9. Los resultados de las prácticas I y II de un curso indican lo siguiente: el 70 % aprobó la práctica I, el 60 % aprobó la práctica II y el 10 % no aprobó ninguna de las 2 prácticas. a. ¿Qué porcentaje aprobó solo una de las 2 prácticas? b. Si un alumno aprobó la práctica I, ¿cuál es la probabilidad de que no haya aprobado la práctica II? c. ¿Son independientes los eventos: A1: aprobar la práctica I, A2: aprobar la práctica II?

10. Un lote de producción tiene 100 unidades, de las cuales se sabe que 20 están defectuosas. Una muestra aleatoria de 4 unidades se selecciona sin reemplazo. ¿Cuál es la probabilidad de que la muestra contenga a lo más dos unidades defectuosas?

11. Suponga que usted rinde un examen de 10 preguntas de selección múltiple sobre una materia de la cual usted no sabe absolutamente nada. 5 de las 10 preguntas tienen 4 respuestas posibles (a, b, c y d), de las cuales solo una es

152

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

la correcta. Las restantes 5 preguntas son del tipo verdadero - falso, por lo que tienen solo dos alternativas. Si usted contesta el examen completamente al azar, y cada pregunta bien contestada tiene un valor de 2 puntos, ¿cuál es la probabilidad de obtener la nota 18?

12. En unos grandes almacenes se tomó una muestra aleatoria de 10.000 compras a lo largo de un año. Esas compras se clasificaron según la forma de pago y el importe de las mismas. Se diferenciaron dos formas de pago: Contado (B1) y Crédito (B2). Los importes se agruparon en tres categorías: menos de 50 soles (A1), entre 50 y 500 soles (A2) y más de 500 soles (A3). Para estos eventos se sabe que: P(A1) = 0.3, P(A3) = 0.32, P(B1|A1) = 2/3, P(B1|A2) = 2/19, P(B1|A3) = 1/32 a. Si se elige una compra al azar y su importe se ha abonado al contado, ¿cuál es la probabilidad de que su valor sea inferior a 50 soles? b. ¿Los eventos forma de pago e importe de la compra son independientes? Compruebe.

13. Un cierto tipo de pólizas incluyen pagos hospitalarios. El 85 % de las pólizas incluyen pagos de consultas externas o pagos de operaciones quirúrgicas. El 25 % de las pólizas no incluyen pagos de operaciones quirúrgicas. Considere la independencia entre estos dos eventos. Si se elige una póliza al azar: a. Calcule la probabilidad de que incluya pagos en consultas externas. b. Halle la probabilidad de que incluya sólo uno de estos tipos de pólizas. c. Si una póliza no incluye pagos de operaciones quirúrgicas, halle la probabilidad de que incluya pagos por consultas externas .

14. El gerente de un restaurante sabe que el porcentaje de clientes que pide aperitivo es 30 %. Por otro lado, la tercera parte de los clientes que piden aperitivo consume carne. De aquellos que no piden aperitivo, el 60 % consume carne. Si un cliente pide aperitivo y carne, la probabilidad de que pida postre es 0.80. Si pide aperitivo, pero no pide carne, entonces la probabilidad de que pida postre es 0.60. Si no pide aperitivo, pero sí carne, la probabilidad de que pida postre es 0.50. Por último, la probabilidad de que un cliente que no pide ni aperitivo ni carne pida postre es 0.25. a. ¿Cuál es la probabilidad de que un cliente elegido al azar pida postre? b. ¿Cuál es la probabilidad de que un cliente que pide postre pida también aperitivo? c. ¿Cuál es la probabilidad de que un cliente que no pide postre no pida tampoco aperitivo?

Capítulo 2. Probabilidad

153

15. Estudios sobre posibles pérdidas o utilidades con dos proyectos de inversión efectuados por un analista financiero indicaron que invirtiendo en el proyecto A se pueden obtener los siguientes resultados, en miles de soles, –20, 0, 40 con probabilidades respectivas 0,1; 0,30; 0,60. Invirtiendo en el proyecto B las probabilidades para los resultados –20, 0, 40 son 0,30; 0,40; 0,30 respectivamente. Considere independientes los resultados de los dos proyectos. ¿Cuál es la probabilidad de lo siguiente?: a. ¿Solo en uno de los dos proyectos se obtenga pérdidas? b. ¿En ambos proyectos se obtenga el mismo resultado económico?

16. Una cervecería utiliza dos máquinas embotelladoras, pero no operan simultáneamente. La segunda máquina opera como sistema de respaldo de la primera y opera sólo cuando la primera se descompone durante las horas de trabajo. La probabilidad de que la primera máquina se descomponga en horas de trabajo es 0.20. Si, efectivamente, la primera máquina se descompone, se enciende la segunda máquina y tiene la probabilidad de descomponerse de 0.30. a. ¿Qué probabilidad hay de que el sistema embotellador de la cervecería no esté funcionando en horas de trabajo? b. La confiabilidad del proceso de embotellado es la probabilidad de que el sistema esté operando en horas de trabajo. Calcule la confiabilidad del proceso.

17. De tres eventos A, B y C, se sabe que: • A y C son independientes • B y C son independientes • A y B son disjuntos • P(A  C) = 2/3; P(B  C) = 3/4; P(A  B  C) = 11/12. Hallar P(A), P(B) y P(C).

18. A altas horas de la madrugada, un individuo regresa a su casa ebrio. Solo puede abrir la puerta con una determinada llave de entre las cinco que tiene en su llavero. El portal de la casa está oscuro y no puede distinguir las llaves entre sí. El mejor método para abrir la puerta sería ir probando las llaves de una en una, eliminando las que no abran. Pero esta feliz idea se le ocurre solo con probabilidad 0.1 debido al lamentable estado en que regresa. El otro método consiste en probar llaves al azar hasta abrir la puerta, sin eliminarlas. a. ¿Cuál es la probabilidad de que abra la puerta al tercer intento? b. Si abre la puerta al tercer intento, ¿qué método es el más probable que haya utilizado?

154

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

19. Un sistema está compuesto por 3 componentes que operan de manera independiente. Para que el sistema funcione, al menos dos de los componentes deben funcionar. Suponiendo que la confiabilidad del componente 1 es 0.95, la del componente 2 es 0.9 y la del componente 3 es 0.8 a. ¿Cuál es la probabilidad de que el sistema funcione? b. Sabiendo que el sistema funciona, ¿cuál es la probabilidad de que exactamente dos componentes funcionen? c. Dado que el componente 1 funciona, ¿cuál es la probabilidad de que el sistema funcione?

20. En el sistema de cómputo de una gran empresa pueden ocurrir fallas de tres tipos: de hardware, de software o eléctricas (alimentación). Nunca se presenta más de una falla en un día. Cuando se presentan problemas de hardware, se debe suspender el servicio con probabilidad de 0.73. Cuando ocurren problemas con el software, se suspende el servicio con probabilidad de 0.12. Cuando se presentan fallas eléctricas, la probabilidad de suspender el servicio es de 0.8. Históricamente, los ingenieros de mantenimiento han observado que una falla de software es cinco veces más probable que un problema de hardware y 2.5 veces más frecuente que una falla eléctrica. a. ¿Cuál es la probabilidad de que el sistema no suspenda su servicio en un día? b. Si el sistema ha dejado de prestar su servicio, ¿cuál es la causa más probable de suspensión?

21. Al poner a la venta un producto, el administrador responsable ha determinado que solo puede presentarse una de las siguientes cuatro situaciones de la demanda: muy desfavorable, desfavorable, favorable y óptima. También ha calculado las probabilidades siguientes: • 1/8 de que la demanda sea muy desfavorable. • 1/9 de que la demanda sea muy desfavorable y no se logre los resultados deseados. • 1/4 de que la demanda sea desfavorable. • 0,15 de que la demanda sea desfavorable y se logre los resultados deseados. • 1/4 de que la demanda sea favorable. • 0,18 de que la demanda sea favorable y se logre los resultados deseados. • 0,1 de que la demanda sea óptima y no se logre los resultados deseados. a. Halle la probabilidad de que se logre los resultados deseados sabiendo que la demanda fue óptima. b. Si no se logró los resultados deseados, ¿cuál es la probabilidad de que la demanda sea desfavorable o muy desfavorable?

Capítulo 2. Probabilidad

155

Capítulo

3

Variable aleatoria Sabes

La variable aleatoria resume en un número la información que contiene el resultado de un experimento aleatorio, lo que permite su análisis y posterior modelamiento. En la práctica, las variables aleatorias se ajustan a ciertos modelos probabilísticos en los cuales nos basamos para realizar inferencias estadísticas que utilizan datos obtenidos de una muestra aleatoria y es necesario aproximar una distribución de probabilidad.

Capacidades adquiridas 9 Calcular medidas de posición y de dispersión. 9 Conocer las propiedades y los teoremas acerca de las probabilidades. 9 Graficar una función matemática. 9 Calcular la derivada y la integral de una función.

Piensas Competencias por lograr

Conocimientos previos Estadística básica, teoría de conjuntos, funciones matemáticas, probabilidades.

9 Definir una variable aleatoria y construir su función de probabilidad. 9 Verificar las propiedades que debe tener una función de probabilidad de una variable aleatoria. 9 Construir la función de probabilidad acumulativa. 9 Calcular la esperanza matemática y la varianza de una variable aleatoria.

Secciones

9 Interpretar apropiadamente la E(X), V(X) y CV(X) de una variable aleatoria.

1. Definición. 2. Tipos de variables aleatorias 3. Esperanza matemática y varianza de una variable aleatoria 4. Interpretación de la E(X), V(X) y CV(X)

Haces Habilidades por desarrollar 9 Identificar las características de un experimento aleatorio. 9 Escoger el modelo probabilístico adecuado para resolver un problema real.

1. Definición Una variable aleatoria es una función cuyo dominio es el espacio muestral Ω asociado a un experimento aleatorio ε , y su rango pertenece a los números reales. Se denota comúnmente por las letras X, Y, W, etc. La variable aleatoria tiene como objetivo transformar un conjunto no siempre numérico (Ω), en un conjunto siempre numérico; es decir, asigna un número real a cada elemento del espacio muestral. Esquemáticamente se representa en la figura 1.



Rx ∈ �

w1

X(w1) = x1

w2

X(w2) = x2

wn

X(wn) = xn

Figura 1. Representación gráfica de una variable aleatoria.

Ejemplo 1 Supóngase que el experimento (ε), consiste en escoger tres artículos al azar de un proceso de producción y se analiza la calidad de cada uno de ellos, donde b: bueno y d: defectuoso. a. Determine el espacio muestral. Solución El espacio muestral es:

Ω ={bbb, bbd, bdb, dbb, bdd, dbd, ddb, ddd}

Capítulo 3. Variable aleatoria

159

b. Sea la variable aleatoria X: número de artículos defectuosos. Determine el rango (valores) de X. Solución Los valores que toma X son: X = {0, 1, 2, 3}. En efecto: X(bbb) = 0; X(bdb) = X(dbb) = X (bbd) = 1; X (bdd) = X (dbd) = X (ddb) = 2; X (ddd) = 3 Ejemplo 2 ABC es una empresa importadora de laptops de última generación. Para su campaña universitaria compra 10 laptops exclusivas en tamaño y presentación. Después de 3 meses de exposición, la laptop queda desactualizada. Sea la variable aleatoria X: número de laptops vendidas en el trimestre. Determine el rango de X. Solución Los valores de la variable aleatoria X son:

X = {0, 1, 2, 3, 3, 4, 5, 6, 7 , 8, 9, 10}. Ejemplo 3 Una empresa textil dispone de seis máquinas bordadoras computarizadas. Sea X la variable aleatoria que representa al número de máquinas bordadoras en uso en un momento específico de la jornada productiva. Determine los valores (rango) de la variable X. Solución Los valores de la variable aleatoria X son:

X = {0, 1, 2, 3, 3, 4, 5, 6}. Ejemplo 4 Suponga que la variable aleatoria X es el tiempo que demora un alumno en responder un examen que tiene un tiempo máximo de 90 minutos de duración. Determine el rango de X. Solución Los valores que toma X son: RX = {x / 0 < x ≤ 90} minutos.

160

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

2. Tipos de variables aleatorias Una variable aleatoria puede ser discreta o continua.

2.1 Variable aleatoria discreta 2.1.1 Definición Una variable aleatoria X es discreta si sus valores constituyen un conjunto contable o numerable; tales como los presentados en los ejemplos 1, 2 y 3. El conjunto contable puede ser finito o infinito.

2.1.2 Función de probabilidad de una variable aleatoria discreta Sea ε un experimento aleatorio y Ω su espacio muestral. Sea X una variable aleatoria discreta definida en Ω y Rx su rango. Se denominará “función de probabilidad” a la función P definida en el rango de X, tal que:

P : Rx → [0, 1] y que satisface las siguientes condiciones: i) 0 ≤ p(xi) ≤ 1 ∀ xi ∈ RX. ii)



∀ xi ∈ RX

p( xi ) = 1

Nota. 1. p(xi) representa la probabilidad de que la variable aleatoria X tome el valor de xi; es decir: p(xi) = P(X = xi). 2. La función de probabilidad de una variable aleatoria discreta también es llamada “función de cuantía de la variable aleatoria X”. 3. En la práctica, una función de probabilidad de una variable aleatoria discreta se puede representar de dos maneras: a. Utilizando una tabla cuyo formato se puede representar de la siguiente manera: xi

x1

x2

x3



xn

….

Total

P(X = xi)

p(x1)

p(x2)

p(x3)



p(xn)

….

1

b. Utilizando una fórmula matemática que toma la siguiente forma: Dominio: Se especifican los valo-

P(X = xi) = p(xi) = Expresión matemática; res de X para los cuales es válida la

expresión matemática.

Capítulo 3. Variable aleatoria

161

Ejemplo 5 Una variable X tiene la siguiente función de probabilidad: x

1

2

3

4

Total

P(X = x)

0.30

C

C/2

C/4

1

a. Hallar el valor de la constante C Solución Para hallar el valor de la constante C se usa la segunda condición de la definición. En efecto: ∑ p( xi ) = 1 ∀X ∈R i

X

Por lo tanto: p(1) + p( 2) + p(3) + p( 4) = 1 ⇒ 0.3 + C + C/ 2 + C/ 4 = 1, de donde: C = 0.4. b. Calcular: i. P( X < 2),

ii. P( 2 < X ≤ 4),

iii. P( X ≤ 3 / X > 1)

Solución i. P( X < 2) = P( X =1) = 0.30. ii. P( 2 < X ≤ 4) = P( X = 3) + P( X = 4) = 0.20 + 0.10 = 0.30 iii. P( X ≤ 3 / X > 1= )

P(1 < X ≤ 3) 0.60 = = 0.857143. P( X > 1) 0.70

Ejemplo 6 Una pizzería tiene cinco líneas telefónicas. Sea X la variable aleatoria que representa al número de líneas en uso en un momento específico. Supóngase que la función de probabilidad de X está dada en la siguiente tabla: x

0

1

2

3

4

5

Total

p(x)

0.05

0.15

0.20

0.15

0.25

0.20

1

Calcule la probabilidad de cada uno de los siguientes eventos: a. A = “a lo sumo 2 líneas están en uso” b. B = “menos de 4 líneas están en uso” c. C = “por lo menos 3 líneas están en uso” d. D = “entre 2 y 4 (inclusive) líneas están en uso” e. E = “entre 2 y 5 (inclusive) líneas no están en uso” f. F = “por lo menos 3 líneas no están en uso”

162

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Solución Sea la variable aleatoria X: número de líneas en uso en un momento es­pecífico, entonces:

P( X ≤ 2) = P( X =+ 0) P( X =+ 1) P( X = 2) = 0.05 + 0.15 + 0.20 = 0.40. a. P( A) = b. P( B) = P( X < 4) = P( X ≤ 3) = P( X = 0) + P( X = 1) + P( X = 2) + P( X = 3) = 0.55.

P( X ≥ 3) = P( X = 3) + P( X = 4) + P( X = 5) = 0.60. c. P(C ) = P( 2 ≤ X ≤ 4) = P( X = 2) + P( X = 3) + P( X = 4) = 0.60. d. P( D) = e. Sea Y : número de líneas que no están en uso; entonces: P( E)= P( 2 ≤ Y ≤ 5)= P(0 ≤ X ≤ 3)= 0.55. f. P( E)= P(Y ≥ 3)= P( X ≤ 2)= 0.40. Nota. Para responder a los incisos e) y f) se usó el criterio del evento complementario. Otra manera de responder a las preguntas sería construyendo la función de probabilidad de Y , para luego en base a ella calcular las probabilidades pedidas. Ejemplo 7 La Facultad de Ingeniería acaba de recibir 5 módulos tecnológicos para fines de enseñanza. Se dispone de 3 ambientes para colocarlos (hay la posibilidad de que más de 1 módulo se coloque en un mismo ambiente). Construir la función de probabilidad de la variable aleatoria, X: Número de ambientes elegidos para colocar los 5 módulos. Solución Como se define X: número de ambientes elegidos para colocar los 5 módulos, los valores que toma X son: 1, 2 y 3. Se determina el número de casos posibles: n(Ω) =3 × 3 × 3 × 3 × 3 = 243 Luego, se calcula la probabilidad para cada valor que toma X: i. Seleccionar a 1 de 3 ambientes, y luego seleccionar a 5 de los 5 módulos.



 3  5     1 5 3 P( X = 1)=   = 243 243

ii. Seleccionar a 2 de 3 ambientes, y luego seleccionar a: – 1 de los 5 módulos para el primer ambiente y a 4 de los 4 módulos restantes para el segundo ambiente, o – 2 de los 5 módulos para el primer ambiente y a 3 de los 3 módulos restantes para el segundo ambiente, o así sucesivamente.

P( X= 2=)

 3    2

 5  4   5  3   5  2   5  1      +     +     +       1  4   2  3   3  2   4 1  = 3(5 + 10 + 10 + 5) = 90 243 243 243

Capítulo 3. Variable aleatoria

163

iii. Seleccionar a 3 de 3 ambientes, y luego seleccionar a: – 1 de los 5 módulos para el primer ambiente y a 1 de los 4 módulos restantes para el segundo ambiente, y a 3 de los 3 módulos restantes para el tercer ambiente, o – 1 de los 5 módulos para el primer ambiente y a 2 de los 4 módulos restantes para el segundo ambiente, y a 2 de los 2 módulos restantes para el tercer ambiente, o así sucesivamente.  3   5  4  3   5  4  2   5  4  1  5  3  2   5  3  1  5  2  1        +     +     +     +     +       3   1  1  3   1  2  2   1  3  1  2  1  2   2  2 1  3  1  1  P( X= 3= ) 243



1 (5)( 4)(1) + (5)(6)(1) + (5)( 4)(1) + (10)(3)(1) + (10)(3)(1) + (10)( 2)(1) 

P( X= 3= ) P( X= 3=)

243 20 + 30 + 20 + 30 + 30 + 20 150 = 243 243

Por lo tanto, la función de probabilidad de X es:

x

1

2

3

Total

P( X = x)

3 243

90 243

150 243

1

2.1.3 Función de distribución Es la función de probabilidad acumulada (menor o igual que). Sea X una variable aleatoria discreta con función de probabilidad p(x), se define a la función de distribución F, como: F : � → � tal que:

F( x)= P (X ≤ x)=

∑ p( x)

X≤x

Ejemplo 8 Sea X una variable aleatoria cuya función de probabilidad es:

164

x

1

2

3

4

5

Total

p(x)

0.05

0.25

0.30

0.25

0.15

1

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

a. Grafique la función de probabilidad Solución

La gráfica de la función de cuantía es un diagrama de bastones, que se presenta en la figura 2.

Figura 2. Función de probabilidad (cuantía).

b. Construya la función de distribución Solución Para calcular la función de distribución se usa la definición, es decir:

F( x)= P ( X ≤ x)=

∑ p( x).

X ≤x

Por ejemplo:

F( −= 1) P( X ≤ −1) = 0; F= (0) P( X ≤= 0) 0; F(0.9999) = P( X ≤ 0.9999) = 0; lo que se puede sintetizar y decir que F(X) = 0, si X < 1. Análogamente: F(1) =

F(1= ) P( X ≤ 1= ) 0.05; F(1.5= ) P( X ≤ 1.5= ) P( X ≤ 1= ) 0.05;

F(1.99) = P( X ≤ 1.99) =

P( X ≤ 1) = 0.05; de lo cual se tiene que: F( x) = 0.05, si 1 ≤ X < 2. P( X ≤ 1.99) = Finalmente, la función de distribución es:

x <1 0.00, 0.05, 1 ≤ x < 2  0.30, 2 ≤ x < 3 F ( x=) P ( X ≤ x=)  0.60, 3 ≤ x < 4 0.85, 4 ≤ x < 5  x≥5 1.00, c. Grafique la función de distribución Solución La gráfica de la función de distribución se presenta en la figura 3.

Capítulo 3. Variable aleatoria

165

Figura 3. Función de distribución.

Ejemplo 9 Una tienda de electrodomésticos ofrece a sus clientes diferentes opciones para el pago de sus cuotas. Para un cliente seleccionado al azar, sea X, la variable aleatoria que representa al número de meses para el pago de las cuotas. Si la función de probabilidad acumulada (distribución) está dada por:

x <1 0.00, 0.39, 1 ≤ x < 4  0.53, 4 ≤ x < 6 F ( x)= P ( X ≤ x)=  0.69, 6 ≤ x < 8 0.80, 8 ≤ x <12  x ≥ 12 1.00, a. Construir la función de cuantía (probabilidad) de X. Solución Considerando que: P(X = x) = F(x) – F(x – 1), la función de probabilidad es: x

1

4

6

8

12

Total

p(x)

0.39

0.14

0.16

0.11

0.20

1

b. Calcule la probabilidad de que el número de meses elegidos para el pago de las cuotas sea estrictamente mayor que 4, pero menor o igual que 12. Solución

P( 4 < X ≤ 12)= P( X= 6) + P( X = 8) + P( X = 12) = 0.16 + 0.11 + 0.20 = 0.47. c. Calcule la probabilidad de que el número de meses elegidos para el pago de las cuotas sea estrictamente menor que 4 o mayor o igual que 8. Solución

P( X < 4) + P( X ≥ 8) = P( X =+ 1) P( X =+ 8) P( X = 12) = 0.39 + 0.11 + 0.20 = 0.70.

166

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

d. Utilice valores F(x) para calcular la probabilidad de que el número de meses elegidos para el pago de las cuotas se encuentre entre 4 y 8 meses (ambos inclusive). Solución

P( 4 ≤= X ≤ 8) F(8)= – F(1) 0.80= – 0.39 0.41.

2.2 Variable aleatoria continua 2.2.1 Definición Una variable aleatoria X es continua si sus valores pertenecen a los números reales. Puede ser un intervalo, una unión de intervalos o todos los reales; tal es el caso del ejemplo 4 (tiempo de demora en responder un examen), donde RX ={ x / 0 < x ≤ 90} minutos.

2.2.2 Función de densidad de probabilidad de una variable aleatoria continua Sea X una variable aleatoria continua. Se llama función de densidad de pro­ babilidad a la función:

f : � → � y satisface las siguientes condiciones: i) f ( x) ≥ 0 , ∀x ∈ � . ∞

ii) ∫ f ( x) dx = 1 −∞

Nota 1. f ( x) no representa un valor de probabilidad, es la ordenada para un valor de x, y puede tomar un valor mayor a la unidad. 2. La gráfica de la función f ( x) siempre debe estar encima del eje X. 3. A diferencia del caso discreto, donde un evento puede ser un valor particular que tome X, en el caso continuo, un evento debe ser necesariamente un intervalo. 4. Sea el evento A, tal que ocurre cuando la variable X ∈ 〈 a , b〉 , entonces:

P( A) =

f ( x) dx ∫=

A

b

∫ f ( x) dx. La probabilidad de un evento, en este caso,

a

constituye el área bajo la curva de la función f ( x), su representación gráfica se muestra en la figura 4.

Capítulo 3. Variable aleatoria

167

Figura 4. Representación gráfica de la probabilidad del evento A.

Ejemplo 10 Según el RENIEC, una persona debe esperar como máximo una hora para obtener el duplicado de su documento nacional de identidad (DNI), siendo este tiempo una variable continua con la siguiente función de densidad: 3  c(1 − x ), 0 ≤ x ≤ 1 f ( x) =  otro caso   0,

a. Hallar el valor de la constante c Solución

Para hallar el valor de la constante c, se utilizará la segunda condición de la definición, es decir: ∞

∫ f ( x)dx = 1. En efecto:

−∞

1

 x4  1; de donde: c  x −  = 1 ∫ c(1 − x )dx = 4  0  0 1

3

⇒ c=

4 . 3

b. Si un ciudadano ingresó a pedir su DNI a las 11 a.m., ¿cuál es la probabilidad de que aún esté allí a las 11 y 45? Solución

De 11:00 a.m. a 11:45 a.m. han transcurrido 45 minutos, es decir, tres cuartos de hora (0.75 horas).



168

1

4 4 x4  = 0.105469. P( x ³ 0.75) = ∫ (1 − x3 )dx =  x −  3  4  0.75 3 0.75 1

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Ejemplo 11 El ingreso diario que tienen las tiendas que comercializan juguetes en las galerías del centro de la ciudad, en el mes de diciembre, es una variable aleatoria, expresada en miles de soles, cuya función de densidad de probabilidad es la siguiente:  3x 3x 2 − ,  f ( x) =  2 4  0, 

0<x<2 otro caso

a. Hallar la probabilidad de que en un día las tiendas tengan ingresos superiores a 1000 soles Solución 2

 3x 3x 2   3x 2 x3  P(1 < x ≤ 2 ) = ∫  dx =  − −   = 0.50.  4  4  1  2  4 1 2

b. Si el ingreso de una de las tiendas en un día es superior a 900 soles, ¿cuál es la probabilidad de que no sobrepase los 1500 soles? Solución

P( X ≤ 1.5 / X > 0.= 9)

1.5  3x 3x 2  −  dx ∫  4  0.9  2 0.41850 = = 0.7281. 2  2  0.57475 3x 3x −  dx ∫  4  0.9  2

P(0.9 < X ≤ 1.5) = P( X > 0.9)

c. Si se sabe que hay 100 tiendas con ingresos inferiores a 800 soles. Determine cuántas tiendas que comercializan juguetes tienen ingresos superiores a 800 nuevos soles. Solución Para calcular el número de tiendas que tienen ingresos mayores de 800 nuevos soles, se calcula primero el total de tiendas. Para ello, se usa la siguiente identidad:



Dónde: P( x < 0.8 ) = tiene:

100



P(X < 0.8)

n



1 0.8

0.8

 3x 3x 2   3x 2 x3  dx − = −     = 0.352. Luego, se ∫  4  4  0  2  4 0 100



0.352

n



1

Entonces: n = 284 tiendas en total, por lo tanto, el número de tiendas que tienen ingresos superiores a 800 soles es de 184.

Capítulo 3. Variable aleatoria

169

2.2.3 Función de probabilidad acumulativa (distribución) Sea X una variable aleatoria continua con función de densidad de probabilidad f ( x), se define a la función de distribución F como:

F : � → � tal que: F( x)= P( X ≤ x)=

x

∫ f (t )dt

−∞

Nota. Para calcular la probabilidad de un evento en el caso continuo (debe ser un intervalo) se pueden utilizar dos procedimientos: 1. Integrando la función de densidad de probabilidad en el intervalo donde está definido el evento. 2. Utilizando la función de distribución en base a las siguientes identidades:

F ( a) 2.1 P( x < a) = 1 – F ( a) 2.2 P( x > a) = F ( b) – F ( a ) 2.3 P( a < x < b) =

Figura 5. Relación gráfica entre la función de densidad de probabilidad y de distribución.

Ejemplo 12 El departamento de marketing de una firma distribuidora de automóviles considera que el tiempo, en años, que transcurre para la renovación de un automóvil por parte de un cliente típico es una variable aleatoria que puede representarse por la función:  x2  , f ( x) =  72  0, 

0<x<6 otro caso

a. Construya la función de distribución de X Solución Usando la definición de función de distribución se tiene:

170

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

x

t2 t3 x3 dt = F( x)= P( X ≤ x)= ∫ = , de donde: 216 216 0 72 x





0

 0, x≤0  3  x F( x)= P( X ≤ x)=  , 0<x<6  216  1, x≥6 

b. ¿Cuál es la probabilidad de que un vehículo se renueve después de 4 años? Solución

P( x < 4) =− 1 F ( 4) = 1−

43 =0.7037. 216

c. Suponiendo que han pasado más de tres años desde la compra del vehículo, ¿cuál es la probabilidad de tardar más de cinco años en renovarlo? Solución 3) Se solicita: P( X > 5 | X >=

P( X > 5) 1 − F (5) 0.4213 = = = 0.4815 P( X > 3) 1 − F (3) 0.875

3. Esperanza matemática y varianza de una variable aleatoria 3.1 Esperanza matemática 3.1.1 Definición Sea X una variable aleatoria con función de probabilidad p( x) o f ( x). A la esperanza matemática de X denotada por E(X) o µ x se define por:  xi p( xi ),  ∀x ∑  i ∈ RX E( X ) = µ =  ∞  x f ( x)dx , ∫   −∞

si X es discreta si X es continua

3.1.2 Propiedades 1. La esperanza matemática de una constante es la misma constante, es decir: E(C ) = C.

E(C X ) C E( X ); C ≠ 0 2. = 3. E( X ± Y )= E( X ) ± E(Y ) 4. Sea X una variable aleatoria discreta con función de cuantía p(x) y Y = G( X )

una función de X; entonces: E [G( X )] =



∀ xi ∈RX

G ( xi ) p( xi )

Capítulo 3. Variable aleatoria

171

5. Sea X una variable aleatoria continua con función de densidad de probabi∞

lidad f ( x) y Y = G( X ) una función de X; entonces: E [G( x)] = ∫ G( x) f ( x)dx −∞

Ejemplo 13 La variable aleatoria X, definida como el número de refrigeradoras vendidas por día en cierta casa comercial, tiene la siguiente función de probabilidad: x

1

2

3

4

5

6

p(x)

c

c

1/8

1/8

2c

2c

a. Determine el valor de la constante c. Solución Usando la segunda condición de la definición se tiene: 6 2 1 ∑ p( x) = 1.0 ⇒ 6c + = 1 de donde: c = . 8 8 x =1

b. Si se vendieron más de 2 refrigeradoras en un día, ¿cuál es la probabilidad de que se hayan vendido menos de 5? Solución

P( X < 5|X > 2)=

P(3 ≤ X ≤ 4) 2 / 8 1 = = P( X > 2) 6/8 3

c. Si la ganancia diaria de la casa comercial se encuentra representada por: = Y 100X − 150 (en soles), hallar la ganancia esperada diaria de la casa comercial. Solución Se halla primero la esperanza de X: 1 1 E( X )= 1  + 2   + . . . + 8   8

1 6  = 4 8

= E [Y ] 100= E [ X ] – 150 100 = ( 4) – 150 250. = Y 100X − 150, entonces, Como La casa comercial espera tener una ganancia diaria de 250 soles. d. ¿Cuál es la probabilidad de que la ganancia de la casa comercial sea menor que 250 soles? Solución P(Y < 250)= P(100X −150 < 250)= P( X < 4)= P( X ≤ 3)=

172

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

3 = 0.375 8

Ejemplo 14 Un inversionista está considerando tres estrategias para una inversión de 4000 dólares. Se estima que los posibles rendimientos son los siguientes: • ESTRATEGIA 1: Una utilidad de 9000 dólares con probabilidad 0.35 y una pérdida de 2000 dólares con probabilidad 0.65. • ESTRATEGIA 2: Una utilidad de 5000 dólares con probabilidad de 0.60 y una pérdida de 3000 dólares con probabilidad de 0.40. • ESTRATEGIA 3: Una utilidad segura de 1800 dólares. ¿Cuál de las tres estrategias aconsejaría usted al inversionista? Solución Se debe calcular la ganancia esperada para cada estrategia para determinar cuál estrategia es la mejor para invertir. En efecto, se define la variable G = ganancia de la inversión, entonces:

= (0.35) – 2000(0.65) 1850 dólares • Para= la estrategia 1: E(G) 9000 = (0.6) – 3000(0.4) 1800 dólares • Para = la estrategia 2: E(G) 50008 • Para la estrategia 3 como la utilidad es segura, su ganancia esperada es de 1800 dólares. Si solamente se considera el criterio de la mayor ganancia esperada, entonces, el inversionista debería escoger la estrategia 1, pues su ganancia esperada es mayor. Ejemplo 15

C 3X + 5X 2 , sienEl costo de un proyecto en miles de dólares está dado por = do X el tiempo empleado en meses, que es una variable aleatoria que verifica: = E[( X – ½)2 ] 13 = / 4 , y E[( X – 1)2 ] 2

a. Determinar la media y la desviación estándar de X. Solución Utilizando los datos se tiene:

E[( X – 1/ 2)2 ] = 13/ 4, entonces:  1 13  1  1 2 E[( x − 1/ 2)2 ] E X 2 – 2X = E( X ) −= E( X ) + =  2  + 4 4 4    

(1)

Por otro lado, de:

E[( X – 1)2 ] = 2, se tiene: 2 E[( X − 1)= ] E[X 2 − 2X += 1]

Operando se tiene: E( X 2 ) − E( X ) = 3

E( X 2 ) − 2 E( X ) + = 1 2

(2)

(1)

E( X ) − 2E( X ) = 1 (2); de donde: 2

= E( X 2 ) 5= y E( X ) 2.

Capítulo 3. Variable aleatoria

173



( X ) E( X 2 ) – ( E(= X ))2 5= – 22 1, y por lo tanto De lo cual se tiene que V= S( X ) = 1.



En conclusión, E( X ) = 2; y S( X ) = 1.

b. Calcular el costo esperado del proyecto. Solución

E(C ) = E(3X + 5X 2 ) = 3E( X ) + 5E( X 2 ) = 3( 2) + 5(5) = 31. Por lo tanto, el costo esperado del proyecto es de 31 000 dólares. Ejemplo 16 Las pérdidas (en millones de soles) debido a incendios en una galería comercial se pueden considerar una variable aleatoria X con función de probabilidad: c( 20 − x), 0 < x ≤ 20 f ( x) =  0, en otro caso  a. Determine el valor de la constante c y construya la función de distribución de X. Solución Usando la segunda condición de la definición se tiene:

 20 x2  c ( 20 − x ) dx = 1 ⇒ c 20 x − ∫ 0  2 0 

20

20 

0

1 = 1 ⇒ c( 400 − 200) = 1 ⇒ c= .  200 

Basándonos en la definición de la función de distribución: F ( x) =

x



o

1 x2 ( 20= − t ) dt 0.1x − ; 0 < x ≤ 20 400 200

 0   x2 F ( x = ) P ( X ≤ x ) = 0 . 1 x − De donde:  200  1  

,

x≤0

, 0 < x < 20 ,

x ≥ 20

b. Al producirse un incendio, ¿cuál es la probabilidad de que las pérdidas superen los 8 millones de soles? Solución

P( X >= 8) 1 – P( X ≤= 8) 1 – F= (8) 1 – (0.80 – 0.= 32) 0.52

c. El administrador de una galería afirma que al producirse un incendio se espera una pérdida de 10 millones de soles. ¿Encuentra usted exagerada la afirmación del administrador de la galería? Justifique.

174

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Solución Se calcula la esperanza de la pérdida:



20



1 1  ( 20 − x) dx = E( X ) = µ = ∫ x 10 x 2  200 200 0



20 0

x3 − 3

20 

0

 = 6.667  

La afirmación del administrador es exagerada, pues se espera una pérdida de 6.667 millones de soles.

3.2 Varianza 3.2.1 Definición Sea X una variable aleatoria con función de probabilidad p(x) o f ( x) y esperanza matemática E(X) o µ x . Se define a la varianza por:  ( xi − µ)2 p( xi ), ∑  ∈ ∀ R x  i X V ( X ) =s2x = ∞  ( x − µ)2 f ( x)dx ,  −∫∞ 

Si X es discreta Si X es continua

3.2.2 Propiedades i. La varianza de una constante es cero, es decir: V(C) = 0. ii. V ( X ) ≥ 0. iii. = V (CX ) C 2 V ( X ); C ≠ 0.

) V ( X ) + V (Y ); (si X e Y son variables aleatorias independientes) iv. V ( X ± Y= v. V ( X ) = E( X 2 ) – [ E( X )]2 , donde



 x 2 p( xi ),  ∀x ∑ i  i ∈RX E( x 2 ) =  ∞  x 2 f ( x)dx ,  −∫∞ 

Si X es discreta Si X es continua

Nota. En la práctica, se utiliza esta propiedad para calcular la varianza de una variable aleatoria.

Ejemplo 17 Un concesionario compra 5 motos de alta cilindrada a un precio al por mayor de 2.5 miles de soles cada moto, y las vende a 4.0 miles de soles. Después de

Capítulo 3. Variable aleatoria

175

un trimestre, debido al lanzamiento de otros modelos, las motos que no se vendieron se devuelven al distribuidor recibiendo de éste las 4/5 partes del precio de compra. Si la distribución de probabilidad de la variable aleatoria X= número de motos que no se vendieron en el trimestre es: x P(X = x)

0

1

2

3

4

5

1

2

2

3

4

3

15

15

15

15

15

15

Total 1

a. Hallar la probabilidad de que se vendan menos de 3 motos. Solución X: número de motos que no se vendieron en el trimestre. Se define la variable:

Y : número de motos vendidas en el trimestre, entonces: Y = 5 – X Luego:

P(Y < 3) = P(5 – X < 3) = P( X > 2) = 10/15 = 2/ 3 = 0.667 b. Calcule la ganancia trimestral esperada y la desviación estándar del número de motos vendidas. Solución

Se calcula primero la esperanza y varianza de las motos que no se vendieron en el trimestre:

E( X ) = 3.0667;

V ( X ) = 2.3289 ⇒ sX = 1.526.

Ganancia esperada: Se define la variable G: ganancia del concesionario, entonces:

G= ( 4 – 2.5)(5 – X ) + (( 4 / 5)( 2.5) – 2.5)X = 1.5(5 − X ) – 0.5X = 7.5 – 2X Luego:

E = (G) 7.5 – 2E = ( X ) 7.5 – 2(3.0667) ⇒ E = (G) 1.367 miles de soles. V = (G) V (7.5 –= 2X ) 2 2 V = ( X ) 4( 2.3289 = ) 9.3155 ⇒ = sG 3.052 miles de soles.

c. ¿Cuál es la probabilidad de que la ganancia trimestral sea de, al menos, 3500 de soles? Solución

P(G ≥ 3.5) = P(7.5 − 2X ≥ 3.5) = P( X ≤ 2) =

5 = 0.333 15

Ejemplo 18 El pago, en miles de soles, que debe realizar una aseguradora por gastos médicos ambulatorios de un asegurado a una clínica es una variable aleatoria

176

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

con función de densidad de probabilidad:  x( 4 − x) , 0<x<3  f ( x) =  9  0 , otro caso 

a. Construya la función de distribución acumulada de X. Solución

Basándonos en la definición de la función de distribución se tiene: x

1x 1  4t 2 t 3  2 x 2 x3 F( x) = ∫ t( 4 − t ) dt =  −  = − . Luego: 90 9  2 3  9 27 0  0 ,  2  2x x3 F( x) = P( X ≤ x ) =  − , 27  9  1 ,

x≤0 0<x<3 x≥3

b. El gerente financiero de la aseguradora afirma que los pagos por este concepto son muy heterogéneos, puesto que el coeficiente de variación supera el 30 %. Verifique esta afirmación. Solución 3

E( X )=

13 2 1 4 3 1 4 x − x  = 1.75 ∫ x ( 4 − x) dx= 90 9  3 4 0 3

13 1 1  E( X ) = ∫ x3 ( 4 − x) dx =  x 4 − x5  = 3.6 90 9 5 0 2

V ( X ) = 3.6 −1.752 = 0.5375 ⇒ C.V =

0.5375 ×100 = 41.89 % 1.75

Se verifica la afirmación dada por el gerente financiero. c. Si 81 asegurados son atendidos de manera ambulatoria en la clínica, ¿en cuántos casos se espera que el gasto no sea superior a 1000 soles? Solución

Se calcula primero la probabilidad de que un asegurado atendido de manera ambulatoria tenga un gasto que no supere los 1000 soles:

P( X ≤ 1) = F(1) =

2 ×12 13 5 − = = 0.1852 9 27 27

Por lo tanto, de 81 asegurados, se espera que en 81(0.1852) = 15 de ellos el gasto no supere los 1000 soles.

Capítulo 3. Variable aleatoria

177

4. Interpretación de la esperanza matemática, varianza y coeficiente de variación de una variable aleatoria

Los valores de esperanza matemática y la varianza de la variable aleatoria X son las medidas de tendencia central y de dispersión de X, respectivamente. A la E(X) y V(X) generalmente se les conoce como los parámetros de la distribución de probabilidades de la variable aleatoria X; por lo tanto, E(X) y V(X) representan los valores constantes que caracterizan a la población de los valores de X. Una segunda interpretación es de tipo frecuentista que se aprecia, en el siguiente ejemplo. Ejemplo 19 Tomando como base datos históricos, la distribución de las ventas diarias de paquetes de un producto en una tienda es como sigue: Número de paquetes vendidos (x)

10

11

12

13

14

Total

p(x)

0.2

0.4

0.2

0.1

0.1

1.0

Calcule e interprete el número esperado, la varianza y el coeficiente de variación del número de paquetes vendidos. Solución Utilizando las fórmulas definidas anteriormente para su cálculo obtenemos: E( X )= 11.5; V ( X )= 133.7 − 11.52 = 1.45; C.V =

1.45 × 100= 10.471 % 11.5

El valor de E(X) = 11.5 se interpreta como sigue: si la tienda registrara las ventas de los paquetes de un gran número de días, el promedio de estos valores será un valor cercano a 11.5, es decir, E(X) = 11.5 es un valor de convergencia si se registran las ventas de un número muy grande de días, dicho de otro modo, en un grupo de días (muestra) el promedio puede ser mayor, mientras que en otra muestra podrá ser menor, pero en general convergerán hacia 11.5. Aunque E(X) recibe también el nombre de valor esperado, de ninguna manera debe entenderse como el valor esperado de las ventas que ocurren en un día cualquiera. Nótese que esto es imposible desde que las ventas diarias asumen valores diferentes de 11.5. La V(X) = 1.45 no tiene una interpretación directa. En cambio, la desviación estándar igual a 1.204 sí la tiene. El valor de la desviación estándar se puede interpretar como la desviación promedio de los datos con respecto al valor medio (11.5 paquetes). Finalmente, el valor del coeficiente de variación: CV(X) = 10.471 %, indica que las ventas diarias son moderadamente homogéneas. Por lo tanto, se puede decir que existe regularidad en las ventas diarias.

178

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Ejemplo 20 Sea X una variable aleatoria que representa el peso de un líquido y su función de densidad de probabilidad está dada por:  x , 0 < x <5  f ( x ) =  25  x - 5 , 5 < x <10  25

Nota: f(x) representa una distribución triangular. a. Construir la función de distribución de X. Solución Basándonos en la definición de la función de distribución:

t = dt 25

x

F ( x) = ∫

o

5

F ( x) = ∫

o

5

F ( x) = ∫

o

x2 ; 0< x ≤ 5 50

x t − 5 x2 t x − ; 5 < x ≤ 10 dt + ∫ dt =1 + 25 50 5 5 25 x t − 5 x2 t x − ; 5 < x ≤10 dt + ∫ dt =1 + 5 25 25 50 5

De donde: F ( x )= P ( X ≤ x ) =

 0 , x≤0  2  x , 0< x ≤ 5  50  2 1 + x − x , 5 < x < 10  5 50  1 , x ≥ 10 

b. Al pesar el líquido se comete un error a causa de ciertas inexactitudes en el instrumento de medida. Hallar la probabilidad de que, para cualquier medida en particular, el error sea superior al 1 % respecto al valor verdadero si el peso correcto es 5. Solución

P( X ­ 5 > 0.01(5= )) P( X < 4.95) + P( X > 5.05 =) F( 4.95) +1 − F(5.05) =

4.952 +1− 50

 2  1 + 5.05 − 5.05  = 0.9801 50 5    

Ejemplo 21 Sea la demanda anual de aceite lubricante (en miles de galones) una variable aleatoria continua X con función de densidad dada por:

1  , f ( x) =  2 0 , 

2≤x≤4 otro caso

Capítulo 3. Variable aleatoria

179

a. ¿Cuál es la probabilidad que la demanda no sobrepase los 2750 galones? Solución

P( X = ≤ 2.75 )

2.75

1

2

2



2.75

x  2 2

dx= = 

0.375.

b. Calcule la demanda esperada y la desviación estándar Solución Usando la definición se tiene: 4

 x2  1 E( X ) =µ = ∫ x dx =   = 3 y= E( X 2 ) 4 2 2   2 4

4

 x3  1 x dx   = 9.333 ∫= 2 o  6  2

2

2

V ( X ) = s2 = 9.333 − 32 = 0.3333 ⇒ s = 0.5773 c. Hallar: P(µ x − s x ≤ X ≤ µ x + s x ) Solución Reemplazando los valores de la media y la desviación estándar se tiene: P( µ − s ≤ X ≤= µ − s)

3.5772

3.5772 1 x P( 2.4227 ≤ X ≤= 3.5772 ) = dx = 0.57725. ∫ 2 2.4227 2   2.4227

d. Por cada millar de galones vendidos se obtiene una utilidad de 300 dólares, mientras que cada millar no vendido produce una pérdida de 100 dólares. Un fabricante decide producir este tipo de aceite para todo un año, ¿cuál debe ser la producción óptima que logre maximizar su utilidad esperada? Solución X: demanda anual de aceite lubricante (en miles de galones) y tiene por función de densidad de probabilidad:

1  f ( x) =  2 0 

2≤x≤4 otro caso

Se define: k = la cantidad a producir en el año (en miles de galones)

La variable aleatoria:

U = Utilidad del fabricante La utilidad depende de la cantidad vendida, de acuerdo a la demanda, y se define como: 300 x −100 ( k − x ) , x ≤ k , de donde: U ( x) =  300 k , x>k 

180

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

 400 x − 100 k U ( x) =  300k

x≤k x>k

El valor de k que maximiza la utilidad esperada se obtiene de: d( E [ U ( x)]) = 0 dk

Se halla primero la esperanza de la utilidad, en efecto: k 4 1 1 E(U ) = ∫ u( x) f ( x) dx = ∫ ( 400 x − 100 k )   dx + ∫ 300 k   dx = ∀∈ Rx 2 k 2 2 k

4 = 100x 2 − 50kx  + 150kx  k = − 100k 2 + 700k − 400  2

Por lo tanto: E(U ) = −100 k 2 + 700 k − 400 Ahora:

d( E [ U ( x)]) d( − 100k 2 + 700k − 400 ) = 0⇒ = 0; de donde: dk dk

−200k + 700 = 0 ⇒ k = 3.5 Por lo tanto, deberían producirse 3500 galones para maximizar la utilidad esperada.

1. Problemas resueltos 1. Identifique las siguientes variables como discretas o continuas: a. El valor estimado (en dólares) de un departamento para vivienda. b. El número de practicantes en los estudios contables. c. El tiempo que se necesita para realizar un trabajo de auditoría. d. El número de clientes que entran a un restaurante en un día. e. La vida útil de una computadora. Solución a. Continua

b. Discreta

c. Continua

d. Discreta

e. Continua

2. Determine el valor de la constante c de modo que cada una de las siguientes funciones represente una función de probabilidad de una variable aleatoria discreta X.

( x) a. p=

c( x 2 + 4) , para x = 0, 2, 3.

Solución Para hallar el valor de la constante c se usa la segunda condición de la definición, es decir:

Capítulo 3. Variable aleatoria

181

3 1 y la función de ∑ p ( x ) = 1.0 ⇒ 4c + 8c + 13c = 1 de donde : c = i 25 i =1

probabilidad es: X

0

2

3

Total

P(x)

0.16

0.32

0.52

1

Nota. Se usó la definición de la función: p(0) = P( X = 0) = c(02 + 4) = 4c p( 2) = P( X = 2) = c( 22 + 4) = 8c p(3) = P( X = 3) = c(32 + 4) = 13c  3  4  b. P ( x) c= =    ; para x 0 , 1, 2  x  4 − x 

Solución Usando la segunda condición de la definición se tiene: 3

∑ p ( x)= 1.0 ⇒ c + 12c + 18c= 1 de donde : c=

x =1

1 y la función de pro31

babilidad es: X

0

1

2

Total

P(x)

0.0323

0.3871

0.5806

1

Nota. Se usó la definición de la función:  3  4   3  4   3  4  = P (0) c= c ; P (1) c= c; P ( 2) c=    18c    =    12=  2  2   0  4   1  3 

3. Una caja contiene 7 fichas, de las cuales 3 son rojas y 4 son azules. Se seleccionan al azar y sin reemplazo 2 fichas. Si las fichas son del mismo color se obtiene una utilidad de $ 2, en caso contrario, se pierde $ 1. a. Construir la función de probabilidad de la variable aleatoria X: Ganancia en el juego Solución La variable es X: ganancia en el juego y los valores que toma son –1 y 2. 3 2 4 3 3 P( X = 2) = P( R  R ) + P( A  A ) = × + × = 1 2 1 2 7 6 7 6 7 3 4 1 P( X = −1) =− = 7 7

182

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

La función de probabilidad de X es: X

–1

2

Total

P(X = x)

4/7

3/7

1

b. ¿Cuál es la ganancia esperada? Solución

4 E( X ) = − 1  + 7

3 2 2  = 7 7

4. Un embarque de 8 computadoras contiene 3 defectuosas. Aleatoriamente, 4 de estas computadoras son colocadas en una oficina. Si X es el número de computadoras defectuosas que se coloca en la oficina: a. Construya la función de probabilidad de X. Solución Como se define X: número de computadoras defectuosas colocadas; los valores que toma son: 0, 1, 2 y 3. 8 Se determina el número de casos posibles: n(Ω= )  =  70  4 Luego, se calcula la probabilidad para cada valor que toma X:

 3  5     0  4  5   P( x= 0= ) = ; 70 70  3  5     1  3  30 P( x= 1= )    = 70 70  3  5     2 2 30 P( = x 2= )   = ; 70 70  3  5     3 1 5 P( x= 3= )   = 70 70 Por lo tanto, la función de probabilidad de X es: x

0

1

2

3

Total

P(X = x)

5/70

30/70

30/70

5/70

1

b. Hallar la probabilidad de que se haya colocado una computadora defectuosa sabiendo que se colocó a lo más una con defectos. Solución P( X= 1 / X ≤1)=

P( X =1) 30 / 70 = = P( X ≤1) 35 / 70

6 7

Capítulo 3. Variable aleatoria

183

c. El tiempo T que toma realizar un trabajo es una variable que viene expresada por T= 8 + 0.5X , calcular la desviación estándar de la variable T Solución Primero, se calcula las características de la variable aleatoria X: = E( X ) 105 = / 70 1.5 E( X 2 ) = 195 / 70 = 2.7857 V ( X ) = 0.5357 Luego: V (T ) = V (8 + 0.5X ) = 0.52 V ( X ) = 0.52 (0.5357) = 0.1339 La desviación estándar de T es: 0.3659

5. Para la señalización de emergencia de un hospital se ha instalado dos indicadores que funcionan independientemente. La probabilidad de que el indicador A se accione durante la avería es de 0.90, mientras que para el indicador B, la probabilidad es de 0.88. a. Determinar la probabilidad de que durante una avería se accione solo un indicador. Solución P(Acciona sólo un indicador) =

P( A  B) + P( A  B) = 0.90 × 0.12 + 0.10 × 0.88 = 0.196 b. Si se sabe que durante una avería no se accionó el indicador A, ¿cuál es la probabilidad de que tampoco se haya accionado el indicador B? Solución Nos piden: ( B /= A) P= ( B) 0.12 , debido a que los eventos son independientes. c. Un experto en seguridad afirma que cuando un indicador no se acciona es porque está fallado y por lo tanto el costo de su reparación es de $ 85. Si C denota el costo de reparación cuando se han instalado los dos indicadores, halle el costo esperado. Solución Sea Y : el número de indicadores defectuosos Los valores que toma Y = {0, 1, 2}

P(Y =0 ) =P( A  B) =0.90 × 0.88 =0.792 P(Y = 1) = P( A  B) + P( A  B) = 0.196

P(Y =2) =P( A  B) =0.10 × 0.12 = 0.012

184

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

La función de probabilidad de Y es: Y

0

1

2

P(Y = y)

0.792

0.196

0.012

Como se define C: Costo de reparación cuando se han instalado los dos indicadores, Entonces: C = 85Y y aplicando propiedades de valor esperado:

= E(C ) 85 = E(Y ) 85= (0.22) 18.7 dólares

6. El gerente de COMPUDATA indica que el número de computadoras portátiles (notebooks) que vende por día es una variable aleatoria X con función de distribución acumulada dada por:  0  0.05 0.20  F( x) = 0.48 0.72  0.92  1

, x<2 , 2 ≤ x<3 , 3≤ x < 4 , 4≤ x<5 , 5 ≤x<6 , 6≤ x<7 , x≥7

a. Construya la función de cuantía (probabilidad) de X. Solución

= x= ) F( x) – F( x ­ 1), se tiene: Usando que: P( X x

2

3

4

5

6

7

Total

p(x)

0.05

0.15

0.28

0.24

0.20

0.08

1

b. Si en un día vende más de 2 notebooks, ¿cuál es la probabilidad de que venda menos de 7? Solución P( X < 7 / X > 2= )

P(3 ≤ X ≤ 6) = P( X > 2)

0.87 = 0.95

0.9157

c. Si por cada notebook vendida, COMPUDATA gana 300 soles, hallar el valor esperado y la desviación estándar de la ganancia. Solución Se define la variable, G = ganancia de la empresa; entonces: G = 300X = E( X ) 4= .63, E( X 2 ) 23.15 V ( X ) =23.15 − ( 4.63)2 = 1.7131,

s = 1.3088

Capítulo 3. Variable aleatoria

185

Luego: = E(G) 300 = E( X ) 300 = ( 4.63) 1389

= sY 300= (1.3088) 392.64 d. Si se observan las ventas de 3 días considerándolas como eventos independientes, hallar la probabilidad de que en sólo uno de ellos se haya vendido menos de 4 notebooks. Solución Se define los eventos Ai = {en el día i se vendieron menos de 4 notebook}, P( Ai ) = 0.20.

B = {solo en un día se vendieron menos de 4 notebook}

= P ( B) 3 P= ( A A A ) 3= (0.20)(0.80)2 0.384 Nos piden: i i i

7. Una fábrica tiene dos líneas de producción que trabajan en forma independiente. Según estudios realizados, la probabilidad de que, en un día, la línea de producción 1 tenga problemas en su funcionamiento es de 0.1; mientras que, para la línea de producción 2, la probabilidad correspon­ diente es de 0.05. a. Si se selecciona al azar un día, construya la función de probabilidad y la función de distribución de la variable aleatoria X: Número de líneas de producción que tuvieron problemas en su funcionamiento en dicho día. Solución Como la variable aleatoria se define por: X = Número de líneas de producción que tuvieron problemas en su funcionamiento en dicho día; entonces, los valores que toma la variable X son: 0, 1 y 2. Se conoce que:

= P( F1 ) 0= .10, P( F2 ) 0.05 , entonces: P( X = 0) = P( F1  F2 ) = 0.9 × 0.95 = 0.855 P( X =1) =P( F1  F2 ) + P( F1  F2 ) =0.1 × 0.95 + 0.9 × 0.05 =0.14

P( X = 2) = P( F1  F2 ) = 0.1 × 0.05 = 0.005 Por lo tanto, la función de probabilidad es: x

0

1

2

Total

p(x)

0.855

0.14

0.005

1.00

La función de distribución es:

 0.0 x<0   0.855 0 ≤ x < 1 F ( x) =   0.995 1 ≤ x < 2  1.0 x≥ 2

186

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

b. Suponga que la pérdida económica, en un día, por problemas en las Y 5X + 2 . líneas de producción (en miles de soles), está definida por = Determine los valores de la media y el coeficiente de variación de la distribución de Y. Interprete sus resultados. Solución Se calcula primero, la esperanza y varianza de X.

E( X ) = 0 × 0.855 + 1 × 0.14 + 2 × 0.005 = 0.15 E( X 2 ) = 02 × 0.855 + 12 × 0.14 + 22 × 0.005 = 0.16

V ( X ) =0.16 − 0.152 =0.1375. Y 5X + 2; entonces: Luego, como = E(Y ) = 5E[X ] + 2 = 5 × 0.15 + 2 = 2.75 V (Y ) = 52 V [X ] = 52 × 0.1375 = 3.4375; sY = 1.854

Luego: C.V (Y )=

1.854 × 100= 67.418 % 2.75

8. Computadoras América S. A. es una empresa importadora de laptops de última generación. Para su campaña universitaria, compra 5 laptops al precio unitario de 1200 dólares y las vende a 1700 dólares la unidad. Después de 1 mes de exposición, las laptops que no se hayan vendido tienen que ser retiradas del mercado y devueltas al distribuidor, quien entrega a Computadoras América S.A. una cantidad igual a 80 % del precio unitario al que se le vendió. Se ha demostrado mediante una investigación de mercado que la tabla de la función de probabilidad de X: número de laptops vendidas es la siguiente: X

0

1

2

3

4

5

P(X = x)

0.05

0.15

0.05

0.20

0.30

0.25

Calcular e interpretar el valor esperado y el coeficiente de variabilidad para la utilidad neta de la empresa por la venta de las laptops. Solución Se define la variable Y = utilidad por la venta, entonces:

Y= 500 X − 240(5 − X ) ⇒ Y= 740X − 1200 Se calcula primero la esperanza y varianza de X. En efecto: E( X ) = 0 × 0.05 + 1 × 0.15 + (...) + 5 × 0.25 = 3.3

E( X 2 ) = 13.2 V ( X ) = 13.2 − 3.32 = 2.31. Luego: E(Y ) = 740E( X ) – 1200 = 740 × 3.3 – 1200 = 1242 dólares V= (Y ) V (740X − 1200 = ) 7402 × 2= .31 1 264 956 = s 1 124.7

Capítulo 3. Variable aleatoria

187

Por lo tanto: C.V (Y= )

1124.7 × 100= 90.56 % 1242

9. Una persona desea invertir en una de dos carteras de inversión: A o B. Ella estima que las probabilidades y los rendimientos monetarios para un año de cada cartera, considerando las condiciones económicas del país, serían como se muestran en las siguientes tablas. Condición económica

Cartera A

Cartera B

Probabilidad

Rendimiento monetario

Probabilidad

–300

0.2

–500

0.1

Estabilidad

500

0.3

400

0.4

Crecimiento moderado

1000

0.4

1200

0.3

Auge repentino

2000

0.1

2800

0.2

Rendimiento monetario

Recesión

a. ¿En cuál de las dos carteras esperaría un mejor rendimiento monetario? Solución Se debe calcular el valor esperado en caso. En efecto: E(Rendimiento A) = 690 E(Rendimiento B) = 1030 En la cartera B se espera mejor rendimiento. b. En términos relativos, ¿cuál de las dos carteras ofrece rendimientos más heterogéneos? Solución Se debe calcular el coeficiente de variación para cada cartera. En efecto: V(rendimiento A) = s2A = 416 900 V(rendimiento B) = s2B = 1 028 100 s A = 645.678, CV (A) = 93.57 % s B = 1013.952, CV (B) = 98.44 %

La cartera B tiene rendimientos más heterogéneos. c. Si esta persona decidiera invertir en las dos carteras, considerando independientes los rendimientos monetarios de cada una de ellas, hallar la probabilidad de que en al menos una de ellas el rendimiento monetario sea negativo. Solución Usando el criterio del evento complementario se tiene:

188

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

P(al menos una tenga un rendimiento es negativo) = 1 – P (ninguna tenga un rendimiento negativo)

P( A  B) =− 1 P( A  B) =− 1 P( A) × P( B) =− 1 0.8 × 0.9 = 0.28

10. Un inversionista tiene la posibilidad de colocar sus activos en dos títulos financieros distintos. Si compra acciones de “A”, la ganancia será de US$ 420 o la pérdida de US$ 110, en el lapso de una semana. Si compra acciones de “B”, la ganancia será de US$ 650 o la pérdida de US$ 300, en el lapso de una semana. Si existe la misma posibilidad de obtener ganancia para ambas acciones, ¿cuál debería ser el valor de probabilidad para que el inversionista se encuentre indiferente entre una u otra acción? Solución Sea p = P(obtener ganancias), entonces la probabilidad de obtener ganancias en ambos tipos de acciones es p. Sea X: Ganancia por la inversión, la distribución de probabilidades es: Acciones A

Acciones B

x

p(x)

x × p(x)

x

p(x)

x × p(x)

–110

1–p

–110(1 – p)

–300

1–p

–300(1 – p)

420

P

420p

650

p

650p

Total

1

–110 + 530p

Total

1

–300 + 950p

Para que el inversionista encuentre indiferente invertir en cualquiera de las dos acciones su ganancia esperada deber ser la misma, por lo tanto:

E( X A ) = E( XB ) ; entonces: –110 + 530p = –300 + 950p, de donde: P = 0.4524

11. El señor Arias quiere asegurar su casa por US$ 80 000. La compañía de seguros estima en 0.004 la probabilidad de que ocurra una pérdida total; en 0.01 la de que sufra una pérdida de US$ 40 000 y en 0.03 de que la pérdida sea del US$ 20 000. Si la aseguradora no pagará indemnización por otras pérdidas parciales; ¿cuál sería la ganancia esperada de la compañía en pólizas de este tipo si el cliente paga US$ 1500 por dicha póliza? Solución Se define la variable aleatoria: X: ganancia por póliza (dólares), los valores que toma X y su función de probabilidad son: X

–78 500

–38 500

–18 500

1500

p(x)

0.004

0.01

0.03

0.956

Por lo tanto: E(X) = 246 dólares

Capítulo 3. Variable aleatoria

189

12. Los accidentes registrados por una compañía de seguros de automóviles aportan la siguiente información. La probabilidad de que un asegurado tenga un accidente es de 0.15. Si un accidente ocurre, el daño del vehículo representa el 20 % de su valor en el mercado con una probabilidad de 0.80, un 60 % de su valor en el mercado con una probabilidad de 0.12 y representa una pérdida total con probabilidad de 0.08. ¿Cuál tendría que ser el valor de la prima que deberá cobrar la compañía para un automóvil cuyo valor es de 12 000 dólares para que su ganancia esperada sea de 50 dólares? Solución Se define la variable X = ganancia de la compañía por un seguro anual P = prima a cobrar por un seguro Entonces, la distribución de probabilidad de la variable X es: X

p(x)

x × p(x)

P – 12 000

0.012

0.012P – 144

P – 7200

0.018

0.018P – 129.6

P – 2400

0.120

0.12P – 288

P

0.850

0.85P

Total

1

P – 561.6

Se debe obtener un valor de P tal que: E(X) = 50, de donde: P – 561.6 = 50, entonces: P = 611.6 La prima a cobrar debe ser de 611.6 dólares. Nota. Para calcular las probabilidades p(x) se usó: P(X = P – 12000) = P(tenga un accidente y una pérdida total) =

= P(tenga un accidente) × P(pérdida total/tenga un accidente)



= 0.15 × 0.08 = 0.012

13. Los impulsos provenientes de una fuente emisora tienen una intensidad (en kg.m2/s) que es considerada una variable aleatoria X cuya función de distribución acumulada es: 0 , x≤0  4 x = F( x )  , 0 < x < 3  81 x ≥3 1, 

a. Calcular la probabilidad de que la fuente emisora tenga un impulso con intensidad entre 1 y 2 Solución P(1 <= x < 2) F( 2= ) – F(1)

190

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

24 14 15 − = = 0.1851 81 81 81

b. Si se observan 5 de estos impulsos cuyas intensidades se consideran independientes, ¿cuál es la probabilidad de que a lo más uno de ellos tenga una intensidad superior a 2? Solución Se define los eventos:

Ai = {El impulso i tiene una intensidad superior a 2} B = {A lo más un impulso tiene una intensidad superior a 2}

P( Ai ) =P( X > 2) =1 − F( 2) =1 − 0.1975 =0.8025.

P( A i ) = 0.1975

Nos piden: P ( B) =P( A i A i A i Ai A i ) + 5 P( Ai A i A i A i A i ) = = (0.1975)5 + 5(0.8025)(0.1975)4 = 0.006405 c. ¿Cuál es la desviación estándar de la intensidad de un impulso? Solución Primero se halla la función de densidad de probabilidad: 3 d  x4  4 x = ; 0 < x < 3. Entonces,   81 dx  81 

= f ( x)

4 x5 4 x3 E( X ) = dx = ∫x × 81 405 0 3

3

2.4 = 0

4 x6 4 x3 E( X ) = x × dx = ∫ 81 486 0 3

2

3

6 =

2

0

V (X) = 6 − ( 2.4) = 0.24; luego: s =0.4898. 2

14. En un laboratorio de pruebas, el error al medir la temperatura (en oC) es una variable aleatoria X con función de densidad de probabilidad: = f ( x) kx 2

−1 < x ≤ 2

a. Halle el valor de k y construya la función de distribución acumulada de X. Solución Usando la segunda condición de la definición para hallar k se tiene: 2

∫ k x dx = 1, 2

−1

x3 ⇒ k 3

2

= 1, ⇒ k = −1

1 3

Basándonos en la definición de la función de distribución tenemos: F= ( x)

x

x3 + 1 1 2 t3 = = t dt , ∫ 9 3 −1 3 x

luego:

−1

Capítulo 3. Variable aleatoria

191

x ≤ -1  0 ,  3  x +1 , ­1 < x < 2 = F( x)   9  1 , x ≥2 

b. Si se hacen 50 mediciones independientes de la temperatura, ¿en cuántas de ellas se espera un error de medición no mayor a 1.25? Solución Se calcula primero la probabilidad de que una medición tenga un error de medición no mayor a 1.25; p =P( x ≤ 1.25) =0.3281. Por lo tanto, de las 50 mediciones, se espera que en 50(0.3281) ≈ 16 de ellas tenga un error de medición no mayor a 1.25

15. El recorrido (en kilómetros) que los automovilistas logran con cierto tipo de neumáticos es una variable aleatoria con función de distribución acumulada dada por:

F( x) =P( X ≤ x) =1 − e - x / 20000 ; x > 0 a. ¿Qué porcentaje de neumáticos duran más de 10 000 kilómetros? Solución P( X > 10 000) = 1 – F(10 000) = e − 0.5 = 0.6065

b. En términos del enunciado, ¿cómo interpreta el valor del primer cuartil? Solución

P( X ≤ a)= F( a)= 0.25, donde a = Q1 Usando la función de distribución: F( a) =1 − e − a / 20000 =0.25 ⇒ a =Q1 =5754 km Hay un 25% de neumáticos (los de menor duración) con un recorrido inferior a 5754 km. c. El costo unitario de producción es de 50 dólares, pero si con el neumático se logra recorrer menos de 1500 kilómetros el costo es de 80 dólares. Halle el costo unitario esperado. Solución Se define la variable: Y = costo unitario (US$) Y

Condición

Probabilidad

50

X ≥ 1500

0.92774

80

X < 1500

0.07226

Luego, E(Y ) = 52.1678 dólares

192

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

16. En un estudio realizado sobre el tiempo de duración (en años) de ciertos equipos, se determinó que el tiempo de vida de estos equipos es una variable aleatoria X que tiene una función de densidad de probabilidad dada por:

 2x 0≤x≤7  , f ( x) =  49  0, en otro caso a. Si de estos equipos se elige al azar a 4 de ellos, hallar la probabilidad de que dos de los equipos elegidos tengan un tiempo de vida de entre 5 y 5.9 años. Solución Se define los eventos: Ai = {El equipo i tiene una vida entre 5 y 5.9 años} B = {Dos de los equipos tienen una vida entre 5 y 5.9 años} 5.9 2 x

5.9

x2 P(Ai) = P(5 < X < 5.9) = ∫ = dx = 0.2002; P( A ) = 0.7998. i 49 5 49 5

Nos piden:

= P ( B) 6= P( Ai Ai Ai Ai ) 6 (0.2002 = )2 (0.7998)2 0.23952

b. Si se elige al azar un equipo, del cual se conoce que tiene un tiempo de duración superior a 2.8 años, ¿cuál es la probabilidad de que su tiempo de duración no supere los 5 años? Solución

X≤ 5  P( 2.8 < X ≤ 5) 0.6390 P = = = 0.7595  2 8 X . > P( X > 2.8) 0.8413  

17. La empresa INNOVA LIGHT S. A. fabrica bombillas LED y acaba de recibir un pedido con 320 semiconductores. Un semiconductor es adecuado si su longitud es superior a 1 mm. Si esta longitud es inferior, se desecha. Sabiendo, además, que la longitud del semiconductor tiene un comportamiento aleatorio cuya función de densidad de probabilidad es:

x  , 0 <x ≤ 4 f (x ) =  8 0 , otro caso  a. Determine el número de semiconductores correctos que se espera tenga el pedido Solución Se calcula la probabilidad de que un semiconductor sea correcto: 4

x x2 P( X >1= ) ∫ dx = = 0.9375 16 18 4

1

Capítulo 3. Variable aleatoria

193

Por lo tanto, el número de semiconductores correctos que se espera tenga el pedido es: 320(0.9375) = 300. b. ¿Cuál es la longitud mínima del 20 % de semiconductores considerados los de mayor longitud? Solución Se debe hallar un valor a tal que: 4

x x2 P( X > a) = 0.2, ⇒ ∫ dx= 0.2 ⇒ = 0.2 ⇒ a = 3.2 16 a8 4

a

Por lo tanto, la longitud mínima del 20 % que duran más es de 3.2 mm.

18. Un consultor financiero cobra mensualmente honorarios fijos de 100 dólares más una comisión del 5 % sobre el beneficio que su empresa obtiene por las gestiones de consultoría que realiza. El beneficio que la empresa recibe mensualmente (en miles de dólares) es una variable aleatoria X con función de probabilidad: x − 2 2 < x ≤ 3  f ( x) =  4 − x 3 < x ≤ 4  0 otro caso 

a. ¿Cuál es el ingreso esperado del consultor? Solución Se define la variable, Y = Ingreso del consultor, entonces:= Y 100 + 0.05X

x3 E( X ) = ∫ x( x − 2) dx + ∫ x( 4 − x) dx = 3 2 3 3

4

3

−x

2

3 2

+ 2x

2

2

4 3

x3 − 3

4

= 3. 3

E(Y ) = 100 + 0.05(3000) = 250 dólares. b. Hallar la probabilidad de que el consultor obtenga un ingreso inferior a 240 dólares. Solución 2.8

P(Y < 240) =P (100 + 0.05X < 240) =P( X < 2.8) = ∫ ( x − 2) dx = 0.32 2

194

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

19. Los gastos médicos anuales (en miles de dólares) en que incurren los empleados de una empresa son una variable aleatoria X con función de densidad de probabilidad:

x  ( 4 ­ x) f ( x) =  9 0 

0< x<3 otro caso

a. Construya la función de distribución de X. Solución Usando la definición de la función de distribución se tiene:

t 2t 2 F( x) = ∫ ( 4 − t ) dt = 9 09 x

x 0

x

t3 − , luego: 27 0 x≤0

 0 ,  2 x3  2x − )  , F( x= 27  9  1 , 

0<x<3 x≥3

b. Si la compañía de seguros cubre los gastos hasta un máximo de 1000 dólares, ¿cuál es la probabilidad de que el seguro cubra estos gastos? Solución

P( X ≤ 1)= F(1)= 0.1852 c. Determine el porcentaje de empleados cuyos gastos médicos superan al promedio en más de 500 dólares. Solución Se calcula primero el valor esperado de X, en efecto: 3 x  E( x)= ∫ x  ( 4 − x) dx= 1.75 9  0 

Luego, P( X > 1.75 + 0.5) = P( X > 2.25) = 1 – F( 2.25) = 1 – 0.7032 = 0.2968. Por lo tanto, el porcentaje de empleados cuyos gastos médicos superan al promedio en más de 500 dólares es del 29.68%.

20. El retraso o adelanto (en minutos) de un vuelo de Lima a Trujillo es una variable aleatoria cuya función de densidad de probabilidad se encuentra dada por:  1 (36 − x 2 )  f ( x) =  288  0 

−6 < x < 6 otro caso

Donde los valores negativos son indicativos de que el vuelo llega adelantado y los valores positivos señalan que el vuelo llega retrasado. Determine:

Capítulo 3. Variable aleatoria

195

a. La probabilidad de que uno de los vuelos llegará cuando menos dos minutos antes. Solución 0

0

1 36x x3 − = 0.259 P( −2 ≤ X ≤ = 0) ∫ (36 − x 2 ) = dx 288 2 864 −2 288 0

−2

b. La probabilidad de que uno de los vuelos llegará entre uno y tres minutos retrasado, dado que se sabe llegó retrasado. Solución

3 1 (36 − x 2 ) dx ∫ 288 0.2199 1 ≤ X ≤ 3  P(1 ≤ X ≤ 3) 1 P = = 0.4398  = P( X = > 0 ) X > 0 6 0.5000   1 (36 − x 2 ) dx ∫ 0 288 c. Suponga que por cada vuelo que llega retrasado, se multa a la aerolínea con US$ 150, ¿cuál es la probabilidad de que en 5 vuelos que realice el avión, la multa sea de US$ 300? Solución Se define los eventos: Ai = {El vuelo i llega retrasado} B = {La multa por retrasos es de US$ 300} 6

1 (36 − x 2= ) dx 0.5 P(= Ai ) 0.5 0 288

P( Ai ) = P ( x = > 0) ∫ Nos piden:

= P ( B) 10 P( Ai= Ai Ai Ai Ai ) 10 = (0.5)2 (0.5)3 0. 3125

21. Los pesos de un artículo (kg) se consideran una variable aleatoria con función de densidad:

 3x 2   20  x = f ( x)   10  0  

0< x< 2 2 ≤ x<4 en otro caso

a. Construir la función de distribución de X Solución Basándonos en la definición de la función de distribución:

196

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

x 3t 2

F= ( x) ∫

= dt 20

0

= F ( x)

x3 ; 1< x < 2 20

x t 3t 2 dt + ∫ = dt ∫ 1 20 2 10

2

x2

20

+

1 ; 2≤x<4 5

 0 , x≤0  3 x , 0≤x<2  De donde: F( x)= P( X ≤ x) =  20 2 x + 1 , 2≤x<4  20 5  , x≥ 4 1 b. Hallar P( X < 3 / X > 1) Solución

X< 3  P(1< X < 3) 0.60 P = = = 0.6316  1 X > P( X > 1) 0.95   c. Hallar e interpretar: µ x , s x , CV ( X ). Solución

= E( X )

2 3x 2 4 x = dx + ∫ x dx 2.467 ∫x 20 o 2 10

= E( X 2 )

2

3x 2 20

4

x 10

x2 dx + ∫ x 2 dx 6.96 ∫=

o

2

V ( X ) = 6.96 − 2.467 2 = 0.8739 → C.V =

0.8729 × 100 = 37.89 % 2.467

Los pesos de los artículos presentan una alta variabilidad. d. Si el costo por artículo es = C 4X + 3 soles, hallar µC , sC . Solución µC = E( 4X + 3) = 4E( X ) + 3 = 4 × 2.467 + 3 = 12.904 3.7393. V (C ) = V ( 4X + 3) = 42 V ( X ) = 16 × 0.8729; por la tanto: sC =

e. Si la utilidad neta por artículo (en soles) es una función tal que:

−1,   4, = Y g= ( x)  −2,  0, 

si 0 < x < 1 si 1 ≤ x ≤ 3 si 3 < x < 4 en otro caso

Halle e interprete los valores de µY y CV (Y ).

Capítulo 3. Variable aleatoria

197

Solución La distribución de probabilidad de Y es: y

p(y)

y × p(y)

y2 × p(y)

–2

0.35

–0.70

1.40

–1

0.05

–0.05

0.05

4

0.60

2.40

6.40

Total

1.00

1.65

7.85

Por lo tanto: µY = 1.65

V (Y ) = 7.85 − 1.652 = 5.1275 → C.V =

5.1275 ×100 = 137.24 % 1.65

Nota. En este caso el valor del coeficiente de variación es superior al 100 %. Esto se debe a que los valores de la variable aleatoria Y son negativos y positivos.

22. La cantidad de harina (en toneladas) que se utiliza diariamente en una panadería es una variable aleatoria X con función de densidad de la forma: −0.25 x 0.25e f ( x) =   0

x≥0 otro caso

a. ¿En qué porcentaje de días la cantidad utilizada no sobrepasa las tres toneladas? Solución

Hay que calcular la probabilidad de que la cantidad de harina utilizada no sea mayor de 3 toneladas:

= P( X ≤ 3 )

3

3

o

0

− 0.75 = e −0.25 x dx  − e −0.25 x  = − e= + e − 0 0.5276. ∫ 0.25  

El porcentaje de días en los cuales la cantidad de harina que se utiliza no sobrepasa las tres toneladas es del 52.76 %. b. ¿Qué cantidad se debe tener en stock para cubrir la demanda con una probabilidad de 0,9? Solución Hay que hallar un valor k tal que:

P( X ≤ k ) = 0.9; entonces: k

k

P( X ≤ k ) = 0.9 , ⇒ ∫ 0.25 e −0.25 x dx =  − e −0.25 x  = − e − 0.25 k + e − 0 = 0.9   0 o ⇒= K

198

ln(0.1) = 9.21034. De donde = k 9.21034 − 0.25

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

1. Problemas propuestos 1. Identifique las siguientes variables como discretas o continuas: a. El número de pacientes que llegan en un día a un hospital. b. La estatura de una persona. c. El contenido de glucosa de una solución. d. El porcentaje de hierro de un material. e. El tiempo de duración de una bombilla de luz.

2. Suponga que un experimento (ε) consiste en lanzar un tetraedro que tiene las caras marcadas por las letras A, B, C y D, hasta que aparezca en la cara superior la cara C. a. Determine el espacio muestral. b. Sea la variable aleatoria X: número de lanzamientos necesarios para que aparezca la cara C en la parte superior. Determine el rango (valores) de X.

3. Un comerciante tiene 20 unidades de cierto artículo, de los cuales 14 están aptos para su venta y otros 6, no. Al llegar un cliente para comprar cuatro de tales artículos el comerciante escoge al azar sin reposición 5 de los 20 artículos, se define, entonces la variable aleatoria X: número de artículos buenos escogidos. Determine la función de probabilidad de X.

4. Se tiene 3 depósitos: en el depósito 1, todos los artículos son de la marca A; en depósito 2, de 500 artículos, 300 son de la marca A y el resto de la marca B; y en el depósito 3 hay la misma proporción de artículos de cada una de las dos marcas. Para inspección, se escoge al azar un artículo de cada depósito. Se define la variable X: número de artículos de la marca A escogidos. Construir la función de probabilidad de X.

5. Para integrar un proyecto se requiere de los servicios de 2 administradores y 3 ingenieros. En la revisión de expedientes presentados por 5 administradores y 7 ingenieros, se comprobó que todos ellos tienen la misma capacidad profesional para formar parte del proyecto por lo que la elección de los integrantes se hará al azar. El hermano de uno de los ingenieros es administrador. Sea X la variable que indica el número de hermanos elegidos para integrar el proyecto. Construir la función de probabilidad de X.

6. Se sabe que un grupo de 5 componentes contiene dos defectuosos. Un inspector prueba los componentes uno por uno hasta encontrar los dos defectuosos. Una vez encontrado el segundo, concluye la prueba. Se defina a X, como el

Capítulo 3. Variable aleatoria

199

número de pruebas necesarias hasta encontrar el segundo defectuoso. Construya la función de probabilidad de X.

7. La probabilidad de que el pedido de un cliente no se despache a tiempo es de 0.10. Un cliente realiza 3 pedidos, que pueden considerarse como eventos independientes. Si X es el número de pedidos que se envían a tiempo. a. Determine la función de probabilidad de X. b. ¿Cuál es la probabilidad de que todos los pedidos se envíen a tiempo? c. ¿Cuál es la probabilidad de que exactamente uno de ellos no se envíe a tiempo? d. ¿Cuál es la probabilidad de que dos o más pedidos no se envíen a tiempo?

8. Una compañía de seguros ofrece a una persona de 50 años una póliza por un año de US$ 150 000 por una prima anual de US$ 1500. Asuma que el número de muertes en este grupo de edad es de 8 por cada 1000. ¿Cuál es la ganancia esperada para la compañía de seguros con una póliza de estas condiciones?

9. La publicidad de ciertos fondos de inversión de alto riesgo afirma que la probabilidad de doblar la cantidad invertida es de 40 %, la probabilidad de triplicarla es de 10 %, la de perder la mitad es de 35 % mientras que sólo un 15 % de los clientes han perdido todo lo invertido. ¿Cuál es la ganancia esperada si decido invertir 10 000 soles?

10. El gerente financiero de una compañía está considerando dos propuestas de inversión. La propuesta A señala ganancias netas de S/ 20 000, S/ 30 000 y S/ 50 000 con probabilidades respectivas de 0.2, 0.4 y 0.4. En el caso de la propuesta B, el gerente piensa que existe un 50 % de oportunidades de una inversión exitosa, que podría producir ganancias netas de S/ 100 000 y que, si resultara mala, se podría alcanzar el punto de equilibrio, sin ganar o perder dinero. Asumiendo que cada propuesta requiere la misma cantidad de inversión, ¿cuál sería preferible, considerando el retorno monetario esperado?

11. La gerencia de una compañía minera debe decidir si continuar una operación en cierto lugar. Si la continúa y tiene éxito ganará S/ 1 000 000 y si fracasa perderá S/ 600 000; si abandona un lugar que les habría dado éxito, esto supondrá una pérdida de S/ 400 000 (por razones competitivas); y si no continúa en un lugar donde de todas maneras hubiese fracasado, esto representa S/ 100 000 para la compañía (debido a que los fondos destinados para la operación permanecen intactos). ¿Qué decisión maximizaría las uti-

200

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

lidades esperadas de la compañía, si las probabilidades a favor y en contra del éxito son, respectivamente, 0.40 y 0.60?

12. El señor Arias quiere asegurar su casa por US$ 80 000. La compañía de seguros estima en 0.004 la probabilidad de que ocurra una pérdida total; en 0.02 la de que sufra una pérdida del 50 %, y en 0.08 que la pérdida sea del 25 %. Si la aseguradora no pagará indemnización por otras pérdidas parciales; ¿qué prima debe pagar el señor Arias cada año si la empresa de seguros quiere lograr una ganancia promedio de US$ 500 anuales en todas las pólizas de ese tipo?

13. En cierto juego de dados se lanza 4 de ellos, y un jugador apuesta sobre la salida de un número que el elige; gana 1 sol cuando el número aparece en un dado, 2 soles cuando el número aparece en dos dados; 3 soles si sale el número en tres dados; 5 soles si sale el número en los cuatro dados y pierde 1 sol cuando el número no coincide en ninguno de los dados. ¿Le conviene jugar?

14. Un contratista estima las probabilidades del número de días necesarios para concluir un proyecto como sigue:

X

27

28

29

30

31

32

P(x)

0.05

0.15

0.25

0.40

0.10

0.05

Total 1.0

El proyecto tiene un costo fijo de US$ 2 000 y debe concluirse en 30 días. Si termina en menos de 30 días habrá un ahorro de US$ 200 por cada día por debajo de 30; pero si se termina en más de 30 días habrá un sobrecosto de US$ 300 por cada día por encima de 30. Calcule el costo esperado del proyecto y su desviación estándar.

15. Una caja contiene 4 caramelos de sabor fresa y 6 de sabor naranja. Se extraen 3 caramelos sucesivamente con reemplazo. Si se gana US$ 5.0 por cada caramelo de sabor fresa y US$ 3.0 por cada caramelo de sabor naranja extraído ¿cuánto se debería pagar por el derecho de jugar para que el juego sea equitativo?

16. Un anuncio luminoso consta de 100 bombillas iguales. Se sabe que la función de probabilidad de la variable aleatoria X: número de bombillas que se queman en un día es:

P( X = x= )

x 5050

x= 0 ,1 , 2 , . . . , 100

Capítulo 3. Variable aleatoria

201

a. Determinar la probabilidad de que el número de bombillas inutilizadas en un día se encuentre entre 50 y 75 (ambos inclusive). b. Calcule e interprete el valor esperado de X.

17. El contenido de magnesio de una determinada aleación es una variable aleatoria X dada por la siguiente función de densidad de probabilidad:

x 0< x ≤ 6  f ( x) = 18  0 otro caso  a. ¿Cuál es la probabilidad de que una aleación tenga un contenido de magnesio entre 2.2 y 4.8? b. ¿Cuál es el contenido máximo de magnesio que se observará en una aleación con una probabilidad de 0.90? c. Calcular e interpretar la mediana de la variable X. d. La utilidad (en soles) que se obtiene de esta aleación es U = 10 + 2X. Se pide: b.1 Calcular el valor esperado, la desviación estándar y el coeficiente de variación de la variable U. b.2 ¿Cuál es la probabilidad de que la utilidad sea superior a 20 soles?

18. Sondeos de mercado realizados por un fabricante para uno de sus productos indican que la demanda proyectada debe considerarse una variable aleatoria X con valores entre 0 y 25 toneladas. La función de probabilidad de X es.

f= ( x)

3x 2 253

0 ≤ x ≤ 25

a. Construir la función de distribución de X. b. ¿Cuál es la probabilidad de tener una demanda entre 10 y 20 toneladas? c. Hallar la demanda esperada y su variación relativa.

19. La temperatura, en grados centígrados con la que se produce la reacción en un experimento químico es una variable aleatoria con la siguiente función de densidad:

= f ( x)

x2 3

si − 1 < x < 2

a. Construir la función de distribución de X. b. Calcular la probabilidad de que la temperatura sea negativa. c. Calcular e interprete el valor esperado y el coeficiente de variación de X.

202

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

20. Para una investigación se ha considerado a todas las pequeñas empresas con capital X inferior a 10 000 dólares. Se supone que X, expresada en miles de dólares es una variable aleatoria con función de densidad:

f (= x)

k x

; 0 < x ≤ 10

a. Calcular el porcentaje de empresa con capital inferior a 6000 dólares b. Si el capital de una empresa es superior a 3000 dólares, ¿cuál es la probabilidad que no sobrepase los 7000 dólares? c. Calcule e intérprete: E(X), s x y el C.V. de X d. ¿Qué porcentaje de empresas tienen capitales superiores a la media?

21. El porcentaje de contaminante presente en una muestra de aire es una variable aleatoria con función de densidad dada por: f ( x) = a + bx 2 0 < x < 1 a. Si E(X) = 3/5. Calcular el valor de a y b para que f sea función de densidad. b. Hallar la probabilidad de que el porcentaje de contaminante en una muestra sea mayor a 0.6.

22. Cierto aparato registra el nivel de saturación de la red eléctrica en una comarca. El error relativo porcentual de la medida dada por el aparato es una variable aleatoria continua X con función de distribución 0 , si x ≤ 0  F( x) = 1 − (1 − x)2 , si 0 < x < 1 1 , si x ≥ 1 

Determinar: a. La función de densidad de probabilidad de la variable X. b. La probabilidad de que una medida tenga un error entre el 0.1 % y el 0.2 %. c. El error relativo esperado.

23. La función de distribución de una variable aleatoria X está dada por:  0  3 x F( x= ) P( X ≤ x= )  + 128  1 

,

x≤- 4

1 , 2 ,

−4< x< 4 x≥4

a. Calcular el valor del cuartil superior b. Si se realizan 5 observaciones de X, hallar la probabilidad de que solo una de ellas sea negativa.

Capítulo 3. Variable aleatoria

203

24. Suponiendo que la duración en horas de cierto tipo de componente es una variable aleatoria T, con función de densidad de dada por:

c  , f ( t ) = t2 0 , 

t > 200 t ≤ 200

Hallar: a. El valor de c y P(t < 400/t > 300) b. Si se instalan 5 focos, ¿cuál es la probabilidad de que después de 300 horas tenga que reemplazarse uno de ellos?

25. El peso de un artículo (en kg) tiene una distribución con función de densidad:  3x 2 ,   20 f ( x) =  13x  50 ,   0 ,

1< x < 2 2 ≤x<3 otro caso

a. Construir la función de distribución de X. b. Hallar P(X < 2/ X > 1.5).

26. Una empresa que se dedica a la fabricación de cierto componente, ha determinado que la vida útil en años del componente es una variable aleatoria con función de densidad:  1 − x /10 , x>0  e f ( x) = 10  otro caso 0, 

a. Hallar la función de distribución. b. Si se elige al azar un componente, ¿cuál es la probabilidad de que dure por lo menos 6, pero a lo más 18 años? c. Si se eligen 100 componentes, ¿cuántos de estos componentes se espera que tengan una duración superior a 5 años?

27. El tiempo medido en horas que un telar automático está en funcionamiento antes de que se le acabe el hilo y pare es una variable aleatoria cuya función de densidad de probabilidad es: 1  , f ( x) =  30  0, 

204

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

90 ≤ x ≤ 120 otro caso

Al poner el telar en funcionamiento, el encargado debe decidir cuándo volverá a inspeccionarlo. Si vuelve antes de que se acabe el hilo incurre en un costo de 3 soles por cada hora que pierde hasta que se pare el telar; sin embargo, si cuando llega ya se ha acabado el hilo, el costo es de 9 soles por cada hora que el telar esté parado. ¿Al cabo de cuántas horas le aconsejarías que volviese a revisar el telar?

28. En una empresa fabricante de artefactos, para cierto modelo, se tiene la siguiente función de probabilidad, para la cantidad de unidades fabricadas en una semana (X). x

100

120

150

180

200

p(x)

1/10

1/10

2/10

3/10

3/10

Si la utilidad neta semanal (en soles) para el modelo antes mencionado está determinada por: = Y 2850 − 10X; determine los valores de la media y el coeficiente de variabilidad de la utilidad neta semanal. ¿Qué nos indican los valores hallados?

29. Se hace un orificio en una lámina de metal y luego se inserta un eje. La diferencia entre el radio del orificio y el radio del eje es una variable aleatoria X (en mm) cuya función de probabilidad es f ( x)= k(1 − x 4 ) 0 < x ≤ 1 a. Hallar el valor de k y luego construir la función de distribución acumulada. b. Calcular que la diferencia este entre 0.3 y 0.6. c. Hallar la diferencia promedio y la desviación estándar.

30. El tiempo (en minutos) que necesita un vendedor para atender a un cliente es una variable aleatoria, T. Su función de distribución acumulada es: F= (t ) 0.01(t − 5)2 , para 5 < t < 15

a. ¿Cuál es la probabilidad de que el vendedor requiera más de 10 minutos para atender a un cliente? b. En promedio, ¿cuantos minutos necesita el vendedor para atender a un cliente? c. El vendedor ha estado atendiendo a un cliente durante 10 minutos y aún no ha terminado, ¿cuál es la probabilidad de que termine dentro de los próximos 2 minutos? d. El costo C, de atender a un cliente se encuentra en función al tiempo T como sigue: C = 5 + 0.5T2. ¿Cuál es el costo promedio de atención a un cliente?

Capítulo 3. Variable aleatoria

205

31. Ricardo vende equipos médicos cuyo precio mínimo es de US$ 200 000. Él tiene un salario de US$ 6000 dólares anuales. Si vende 5 o menos de estos equipos en un año, no obtiene comisión (gana sólo US$ 6000). Cuando Ricardo vende 6 o más equipos en un año, su ingreso total está dado por la siguiente fórmula: Y = US$ 6000 + US$ 5000(X – 5)2 para X ≥ 6 Donde X es la variable aleatoria que indica el número de equipos que puede vender en un año. Por ejemplo, si Ricardo vende 7 equipos en un año, su ingreso será de US$ 26 000. La distribución de probabilidad de X es: x

3

4

5

6

7

8

P(x)

0.10

0.20

0.30

0.20

0.15

0.05

a. ¿Cuál es la probabilidad que Ricardo tenga un ingreso anual superior a US$ 11 000? b. Halle el valor esperado y la desviación estándar del ingreso anual de Ricardo.

32. La función de probabilidad del tiempo en horas para terminar una tarea es = f (t ) 3t 2 / 117 ,

2
a. Hallar la función de distribución acumulada.

=C = 5050+ +3030t.t. Hallar b. El costo en dólares C para terminar esta tarea esC P(C < 140). c. Si al término de 4 horas un operario A no es capaz de terminar la tarea, se llama a otro operario B para que la termine. ¿Cuál es la probabilidad de que se tenga que llamar al operario B? d. ¿Cuál es el tiempo promedio que necesita el operario A para terminar la tarea?

206

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Distribuciones de probabilidad

Capítulo

4

El objetivo de este capítulo es conocer las características de las distribuciones de probabilidad de variables aleatorias discretas y continuas; así como aprender a calcular las probabilidades de las más importantes distribuciones de probabilidad de variables aleatorias discretas y continuas. La utilidad de los modelos de probabilidad más empleados radica en que de ellos se puede determinar y evaluar las propiedades de la distribución de probabilidad de una estadística que se utiliza en la estadística inferencial.

Conocimientos previos Probabilidades básicas, variables aleatoria discreta y continua, función de probabilidad matemática.

Sabes Capacidades adquiridas 9 Identificar una variable aleatoria como discreta o continua. 9 Calcular la esperanza y la varianza de una variable aleatoria y aplicar sus propiedades. 9 Calcular las probabilidades asociadas a las variables aleatorias discretas y continuas.

Piensas Competencias por lograr 9 Identificar las características para la utilización de los modelos de distribución de probabilidad como el binomial, de Poisson, hipergeométrica, el exponencial, el normal etc. 9 Calcular probabilidades de las distribuciones de probabilidad. 9 Interpretar los valores de probabilidad. 9 Calcular la esperanza matemática y la varianza de una distribución de probabilidad.

Secciones

9 Utilización de software para el cálculo de probabilidades.

1. Distribuciones de probabilidad. 2. D istribuciones de probabilidad discreta. 3. Distribuciones continuas. 4. Problemas resueltos. 5. Problemas propuestos.

Haces Habilidades por desarrollar 9 Escoger el modelo probabilístico adecuado para resolver un problema real. 9 Aprender a simplificar el tratamiento estadístico de fenómenos reales utilizando estas distribuciones de probabilidad.

1. Distribuciones de probabilidad La importancia de las distribuciones de probabilidad radica principalmente en su aplicabilidad en la ingeniería, en física, etc., así como en el diagnóstico por imágenes y el procesamiento de señales entre otros. Estas distribuciones son de dos tipos: discretas y continuas.

2. Distribuciones de probabilidad de variables aleatorias discretas 2.1 Distribución de Bernoulli Jacob Bernoulli, (Suiza, 1654 - 1705) fue un matemático de renombre, estudió las pruebas independientes con probabilidades iguales de éxito, perteneció a la primera generación de la familia Bernoulli, quienes realizaron grandes aportes a la teoría de probabilidad.

Un experimento de Bernoulli es aquel que tiene dos resultados mutuamente excluyentes que se denotan por éxito y fracaso con probabilidades p y q = 1 – p , respectivamente.

Función de probabilidad de Bernoulli Si X es una variable aleatoria con una distribución de Bernoulli; entonces, su distribución de probabilidad está dada por: x 1− x  0 ,1  p (1 − p) , x = = x= P( X )  otro caso  0 ,

Donde, 0 < p < 1

Capítulo 4. Distribuciones de probabilidad

209

Esperanza y varianza de una distribución de Bernoulli E( X ) = µ = p V ( X ) =s2 =p(1 − p)

Gráfica de una distribución de Bernoulli:

Figura 1. Gráfico de la distribución de Bernoulli. 0

1

Características para definir una distribución Bernoulli • El experimento se ejecuta una sola vez • El experimento tiene dos resultados posibles; éxito y fracaso. Ejemplo 1 Se sabe que un software que procesa datos produce un error en el 0.1 % de los procesamientos realizados. Se elige al azar un proceso de datos para comprobar si no existe error. ¿Cómo se distribuye la variable X?, ¿cuáles son la media y la varianza? Solución  1 si el proceso no tiene error X=  0 si el proceso tiene error

La función de probabilidad es: x 1− x  0 ,1 0.999 (1 − 0.999) , x = = x= P( X )  en otro caso  0 ,

Dónde: = E( X ) 0.999= y V ( X ) 0= .999(0.001) 0.000999

2.2 Distribución binomial La distribución binomial es una de las distribuciones discretas más importantes: se utiliza en producción, control de calidad, en investigación de mercados, etc. Está asociada a un experimento aleatorio de Bernoulli cuyos resultados en cada prueba son dos: éxito y fracaso. Un experimento binomial se puede caracterizar como la extracción de n elementos uno a uno con reposición, de una población finita (N) o infinita dividida en dos categorías.

210

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Características de una distribución binomial • El experimento aleatorio se repite n veces con idénticas condiciones. • El resultado de cada prueba es independiente de las demás. • Cada una de las pruebas es un experimento de Bernoulli. • La probabilidad (p) de éxito permanece constante en cada prueba. • La variable X de interés es el número de éxitos en los n ensayos de Bernoulli.

Función de probabilidad binomial La distribución binomial se denota por: B (n, p). Tiene dos parámetros, n y p, donde n representa el número de veces que se repite el experimento (tamaño de la muestra) y p, la probabilidad de que se produzca un éxito y se mantiene constante en cada ensayo. Su función de probabilidad está dada por:  n  x n− x   p q , x = 0 , 1, 2 , ..., n Donde, 0 < p < 1; q =1 − p P( X )  x  = x=  en otro caso 0 ,

Esperanza y varianza de una distribución binomial La esperanza viene dada por la siguiente expresión: E(X) = np La varianza viene dada por la siguiente expresión: V(X) = npq

Gráfica de una distribución binomial

Figura 2: Gráfico de la distribución binomial con n = 12 y p = 0.4.

Capítulo 4. Distribuciones de probabilidad

211

Ejemplo 2 Los operarios de un taller descansan un 10 % del tiempo de trabajo. Si en el taller trabajan 10 operarios, calcular la probabilidad de que en un momento dado: a. Estén descansando la mitad de los operarios. Solución Se define la variable aleatoria: X = Número de operarios que descansan. n = número de operarios = 10 p = probabilidad de que un operario descanse = 0.1 Para este caso el valor de X = 5; n = 10, p = 0.1. Se reemplaza en la fórmula y se tiene lo siguiente: 10  5 P( X= 5= )   0.15 (0.9)= 0.001488 5   

Utilizando el Minitab se realiza de la siguiente manera: Ingresar a la opción Calc> Probability Distributions> Binomial…

Figura 3: Secuencia para calcular la probabilidad de una distribución binomial.

Aparece la siguiente ventana, marcar Probability, en el ítem Number of trials colocar el número 10; en el ítem Event probability colocar 0.1, marcar la opción Input constant y en el recuadro respectivo colocar el número 5 y luego dar clic en OK.

212

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Figura 4. Ingreso de datos de la distribución binomial.



El resultado que nos proporciona la salida del software es el siguiente: Probability Density Function Binomial with n = 10 and p = 0.1 x P(X = x) 5 0.0014880 b. Estén descansando menos de 4 operarios. Solución P( X < 4)= P( X ≤ 3)=

3  10  10 − x x ∑  0.1 (0.9) = 0.9872 x =0  x 

c. Estén descansando más de 4 operarios Solución P( X > 4) =

10  x 10 − x 0.001635 ∑ = 0.1 (0.9) x =5  x   10

d. ¿Cuál es el número de operarios descansando más probable? Solución X

P(X)

0

0.348678

1

0.387420

2

0.193710

3

0.057396

4

0.011160

5

0.001488

6

0.000138

7

0.000009

8

0.000000

9 10

0.000000 0.000000

El más probable es X = 1

Capítulo 4. Distribuciones de probabilidad

213

Ejemplo 3 Un estudiante se ha preparado para un examen de forma que tiene una probabilidad 0.7 de hacer bien cualquier problema. Si para aprobar el examen debe resolver correctamente al menos la mitad de los problemas, ¿qué tipo de examen le sería más favorable: uno de 4 problemas o uno de 6? Solución Se define la variable aleatoria: X: Número de problemas resueltos correctamente. Probabilidad de resolver correctamente un problema (p) = 0.7 Número de problemas del examen (n) = 4 problemas. P( X ≥ 2) =

4 4 4− x x 0.9163 ∑ =  0.7 (0.3) x=2  x 

Haciendo uso del software Minitab se procede de la siguiente manera: En el menú principal, hacer clic en Graph> Probability Distribution Plot> View Probability como se indica en la siguiente figura:

Figura 5. Secuencia de comandos.

Luego elegir Binomial en el ítem Distribution. - En la ventana Number of trials, digitar 4 y en la ventana de Event probability digitar 0.7> En la pestaña Shaded Area, dar clic en X Value> en la ventana de X Value digitar 2> OK.

Figura 6. Secuencia de comandos.

214

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Luego de dar clic en OK, se obtiene el siguiente gráfico con la probabilidad solicitada.

Figura 7. Resultado de la probabilidad en una distribución binomial con n = 4, p = 0.7.



Para el caso donde n = 6 P( X ≥ 3) =

6 6 6− x x 0.9295 ∑ =  0.7 (0.3) x x =3  

Conclusión: El examen más favorable es de 6 problemas, la probabilidad de aprobar es mayor.

2.3 Distribución hipergeométrica La distribución hipergeométrica es una distribución de probabilidad de una variable aleatoria discreta y es útil donde las extracciones se realizan sin reposición, en cuyo caso las pruebas no son independientes.

Características de una distribución hipergeométrica • El tamaño de la población es finito (N). • La población se divide en dos características mutuamente excluyentes. • Cada elemento pertenece a una de estas características. • Se obtiene una muestra aleatoria de tamaño n sin reemplazamiento.

Función de probabilidad hipergeométrica Una variable aleatoria hipergeométrica depende de tres parámetros: N: Tamaño de la población M: Número de elementos que pertenecen a la categoría de éxito en la población n: Tamaño de la muestra

Capítulo 4. Distribuciones de probabilidad

215

Su función de probabilidad es:

  M  N − M        x  n − x  = , x 0,1, 2,...min( M > 0, n)  )  = x= P( X N    n    0, otros casos 

Esperanza y varianza de una distribución hipergeométrica La esperanza viene dada por la siguiente expresión:

E( X ) =

nM N

La varianza viene dada por la siguiente expresión:

= V (X) n

M  M  N − n  1 −   N N  N − 1 

Gráfica de una distribución hipergeométrica:

Figura 8. Gráfica de la distribución hipergeométrica con N = 20; M = 8; n = 6.

Ejemplo 4 Un distribuidor mayorista recibe diariamente un lote de 20 refrigeradoras, de las cuales ocho son de color blanco y las restantes de color plata. Un comerciante minorista le solicita, también diariamente, seis refrigeradoras. Suponiendo que las refrigeradoras son seleccionadas al azar. a. ¿Cuál es la probabilidad de que, en un día cualquiera, el número de refrigeradoras seleccionadas de color blanco sea mayor a tres?

216

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

b. ¿Cuál es la probabilidad que, para los siguientes cinco días, como máximo en dos días, el minorista reciba exactamente tres refrigeradoras de color plata? Suponer independencia. Solución N = 20 refrigeradoras M = 8 refrigeradoras de color blanco N – M = 12 refrigeradoras de color plata n = 6 refrigeradoras seleccionadas como muestra a. X = número de refrigeradoras de color blanco seleccionadas aleatoriamente. X → H( 20, 8, 6) 6  8  12  ∑    6 − x  x = 4  x   P( X > 3) = = 0.1373  20    6 

b. X: número de refrigeradoras de color plata seleccionadas aleatoriamente. X → H( 20 , 12 , 6)





12  8     3  3    P( X= 3= ) = 0.3178  20    6  Y = número de días donde el minorista recibe exactamente tres refrigeradoras de color plata. Y → B(n = 5; p = 0.3178)

= P (Y ≤ 2)

2 5  y 0.3178)5− y 0.8126 ∑  0.317 (1 −= y =0  y 

Ejemplo 5 En un almacén de aparatos electrónicos se almacenan 10 tostadoras para su distribución, 4 de la marca A y el resto de marcas menos conocidas. Si un empleado selecciona al azar 5 tostadoras para llevarlas por encargo a una tienda para su comercialización, calcular la probabilidad de que en las 5 tostadoras seleccionadas: a. Haya exactamente 2 de la marca A. Solución N = Total de tostadoras = 10 M = Marca A = 4

Capítulo 4. Distribuciones de probabilidad

217

N – M = tostadoras de marcas menos conocidas =6 n = Tamaño de la muestra = 5 X = Número de tostadoras de la marca A  4  6     2  3    P( X= 2= ) = 0.4762 10    5  Usando el software Minitab se procede de la siguiente manera. En el menú principal: Calc> Probability Distributions> Hypergeometric…

Figura 9. Secuencia para calcular la probabilidad de una distribución hipergeométrica.

Activar la opción Probability e ingresar la siguiente información: N = 10; M = 4; n = 5; activar la opción Input constant e ingresar el valor de X = 2 como se muestra en la siguiente figura:

Figura 10. Ingreso de datos en una distribución hipergeométrica.

218

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Dar clic en OK, siendo el resultado del Minitab lo siguiente: Probability Density Function Hypergeometric with N = 10, M = 4, and n = 5 x P(X = x) 2 0.476190 b. A lo sumo haya una tostadora de las marcas menos conocidas. X: Número de tostadoras de marcas menos conocida N = 10 tostadoras en total M = 6 tostadoras de la marca menos conocida N – M = 4 tostadoras de marca A n = 5 tostadoras seleccionadas como muestra x =1  6  4

 ∑    5 − x  x = 0  x   P( X ≤ 1) = = 0.02381 10    5  Una de las formas para calcular las probabilidades usando el software Minitab es de la siguiente manera: En el menú principal: Graph> Probability Distribution Plot…, seleccionar la ventana de View Probability> OK.

Figura 11: Secuencia para calcular una probabilidad de una distribución hipergeométrica.

En la siguiente ventana, en la pestaña Distribution seleccionar Hipergeometric y digitar valores en los recuadros como se presenta en la siguiente figura:

Capítulo 4. Distribuciones de probabilidad

219

Figura 12. Ingreso de datos para calcular la probabilidad de una distribución hipergeométrica.



En el botón superior del cuadro, activar Shaded Area> X value>seleccionar Left Tail y en la caja de X value colocar el número 1 y dar OK de acuerdo a la siguiente gráfica:

Figura 13: Selección del área de probabilidad.



El resultado de Minitab se presenta a continuación:

220

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Figura 14. Resultado de la probabilidad en una distribución hipergeométrica con N = 10, M = 6, n = 5.



2.4 Distribución de Poisson Siméon Denis Poisson (Francia, 1781-1840) fue un matemático, astrónomo y físico. Perteneció a la Academia de Ciencias y fue presidente de la Agencia de longitudes, tiene más de 300 obras con aportaciones importantes en física (elasticidad, magnetismo, calor, mecánica celeste, etc.) y matemática (teoría de números, probabilidad, series de Fourier, etc.).

La distribución de Poisson es una distribución de probabilidad de una variable aleatoria discreta y hace referencia a una modelización en la que nos interesa la ocurrencia de un número de eventos finitos de eventos discretos en un intervalo de tiempo o de espacio. La distribución de Poisson se utiliza para describir procesos, como, por ejemplo: • El número de clientes que llegan a un supermercado en un tiempo de 10 minutos. • Número de faltas ortográficas cometidos en una página. • Número de accesos al servidor web de una empresa en un minuto.

Características de una distribución de Poisson • Los sucesos o eventos son independientes entre sí. • El promedio de ocurrencias de un evento en un intervalo de longitud t es la misma que en otro intervalo de la misma longitud y es proporcional a su longitud (λt ) . • La probabilidad de ocurrencia de un evento en un intervalo de tiempo depende de la longitud del intervalo.

Capítulo 4. Distribuciones de probabilidad

221

• El interés es analizar el número de ocurrencias en un intervalo. • La distribución de Poisson tiene un parámetro que se denota con λ y se define como el número promedio de ocurrencias en la unidad especificada.

Función de probabilidad de Poisson  e −λ λ x  , x = 0 , 1, 2 , ... )  x! = x= P( X  0, en otro caso 

Donde el valor de e = 2.71828 es conocido como el número de Euler o constante de Napier, y λ representa el promedio de ocurrencias en la unidad especificada.

Esperanza y varianza de una distribución de Poisson La esperanza viene dada por la siguiente expresión:

E( X ) = λ La varianza viene dada por la siguiente expresión:

V (X) = λ

Gráfica de una distribución de Poisson:

Figura 15. Gráfica de la distribución de Poisson con promedio

(λ) =3.

222

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Ejemplo 6 Suponga que en un establecimiento de comida rápida se atiende a 50 clientes por hora siguiendo una distribución de Poisson. a. ¿Cuál es la probabilidad que se tenga que atender a menos de ocho clientes entre las 5:00 p.m. y las 5:15 p. m.? Solución X: Número de clientes atendidos en una hora.

E( X ) = 50 clientes ⇒ X → Poisson (λ =50) por cada hora. Y: Número de clientes atendidos en un cuarto de hora (15 minutos). Y → Poisson (λ =12.5) por cada cuarto de hora. = P(Y < 8)

7 e −12.512.5 y ∑ = 0.06983 y! y =0

b. Hallar la probabilidad de que entre las 4:00 p.m. y 4:30 p.m. se atienda a más de 20 clientes. Solución W → Poisson (λ =25) por cada media hora.

= > 20) P(W

∞ e −25 25w ∑ = 0.8145 w! w = 21

Ejemplo 7 El promedio de ventas de televisores en las tiendas de Centro Plaza es de 6 cada dos horas. Si se supone que la venta de cada una de las tiendas es independiente una de otra. a. Si X representa el número de ventas cada 40 minutos, ¿cuál es la proba­ bilidad de que en un intervalo de 40 minutos no se realice venta alguna? Solución

Cada 2 horas (120 minutos) se venden en promedio 6 televisores, entonces, cada 40 minutos se venderán en promedio 2 televisores. X: Número de ventas de televisores cada 40 minutos. X → Poisson (λ =2) cada 40 minutos. P( X= 0= )

e −2 20 = 0.135335 0!

Haciendo uso del software Minitab se procede de la siguiente manera: En el menú principal, abrir la opción Calc> Probability Distributions> Poisson> OK> en la ventana Poisson distribution marcar Probability> en Mean=2 y en Input Constant=0> OK como se detalla en la figura 16. .

Capítulo 4. Distribuciones de probabilidad

223

Figura 16. Secuencias para determinar probabilidad de la distribución de Poisson.



Los resultados se presentan a continuación:



Probability Density Function

Poisson with mean = 2 x P(X = x) 1

0.135335

b. ¿Cuál es la probabilidad de que se realice al menos 4 ventas en el intervalo de 60 minutos? Solución

Cada 2 horas (120 minutos) se venden en promedio 6 televisores, entonces, cada 60 minutos se venderán en promedio 3 televisores. Y : Número de ventas de televisores cada 60 minutos. Y → Poisson (λ =3) cada 60 minutos. ≥ 4) P(Y=

∞ e −3 3y ∑ = 0.3528 y=4 y !

El procedimiento para calcular las probabilidades usando el software Minitab es de la siguiente manera: En el menú principal: Graph> Probability Distribution Plot. Seleccionar la ventana View Probability> OK. En la siguiente ventana en la pestaña: Distribution seleccionar Poisson y digitar en Mean=3>, en el botón superior activar Shaded Area> X value> Right Tail y en la ventana de X value digitar el número 4 y dar OK como se muestra en la siguiente figura:

224

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Figura 17. Secuencia para el cálculo de probabilidad de una distribución de Poisson.

3. Distribuciones de probabilidad de variables aleatorias continuas 3.1 Distribución uniforme continua La distribución uniforme continua es la más simple de las distribuciones continuas, cuya variable puede tomar valores comprendidos en el intervalo [a , b] .

Función de densidad de probabilidad uniforme Se dice que una variable aleatoria X tiene una distribución uniforme si su función de densidad de probabilidad está dada por:

 1 , a< x
Capítulo 4. Distribuciones de probabilidad

225

Características de la distribución uniforme • No tiene moda. • Se distribuye uniformemente en el intervalo donde está definida. • Las probabilidades son iguales en todo el rango de la variable. • También se le conoce como distribución rectangular.

Función de distribución acumulada

= F ( x)

0 ,  x − a ,  b − a 1 , 

x
si

si a ≤ x ≤ b x rel="nofollow">b

si

Esperanza y varianza de una distribución uniforme La esperanza viene dada por la siguiente expresión:

E( X ) =

a+b 2

La varianza viene dada por la siguiente expresión: V (X) =

(b − a)2 12

Gráfica de una distribución uniforme

Figura 18. Gráfica de una distribución uniforme.

1/ b − a

a

b

Ejemplo 8 Un servicio de llamadas telefónicas se ha diseñado de forma tal que el tiempo mínimo de espera de quien llame sea de 20 segundos y el máximo de 50 (tiempo de respuesta). Si los tiempos de respuesta se distribuyen uniformemente, encuentre la probabilidad de que, al llamar una persona, tenga un tiempo de respuesta.

226

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

a. Entre 25 y 45 segundos. Solución X = Tiempo de espera para que ingrese una llamada sigue una distribución Uniforme → U(20,50) 45 1 P( 25 ≤ X ≤= 45) ∫25 = dx 0.6667 30

b. Menor que 30 segundos o mayor que 40. Solución 30 P( X < 30) + P( X > 40)= ∫20

1 50 1 dx + ∫40 dx= 0.333 + 0.333= 0.666 50 50

Ejemplo 9 Un corredor de inmuebles cobra honorarios fijos de 50 dólares más una comisión del 6 % sobre el beneficio obtenido por el propietario. Si este beneficio es una variable aleatoria con distribución uniforme en el intervalo [0 , 12 000] dólares. a. ¿Cuánto espera obtener de utilidad (honorario fijo + comisión) el agente? Solución X: Beneficio → U [0,12000] ;= E( X ) Y: Utilidad = 50 + 0.06X

(a + b) = 6000 2

E(Y) = 50 + 0.06E(X) = 50 + 0.06 × 6000 = 410 b. ¿Cuál es la probabilidad de que su utilidad supere los US$ 600? Solución P(Y > 600) = P(50 + 0.06 × X > 600) = P( X > 9166.67) = 0.2361

Capítulo 4. Distribuciones de probabilidad

227

Figura 19. Secuencia para el cálculo de probabilidad de la distribución uniforme.

Figura 20. Resultado de probabilidad de la distribución uniforme.

c. ¿Qué utilidad máxima podrá obtener el agente con probabilidad 0,90?

P(Y= ≤ K ) 0.9;

k − 50 P(50 + 0.06X = ≤ k ) 0.9; P( X ≤ = ) 0.9 0.06

Figura 21. Resultado del valor de k de la distribución uniforme.

 k − 50  0.9 PX ≤ = 0.06  

k − 50 = 10800 , entonces, k = US$ 698 0.06

228

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

3.2 Distribución triangular Es una distribución de probabilidad de una variable aleatoria continua y se utiliza para describir una población de la cual se dispone pocos datos, por ejemplo, en la industria petrolera es costoso tomar datos y por lo tanto no es posible en la mayoría de las situaciones modelar la población.

Función de densidad de probabilidad triangular 0   2( x − a)  (b − a)(c − a) f (X)   2(b − x)  (b − a)(b − c )  0

,

x
,

a≤x≤c

,

c<x≤b

,

x≥b

Características Tiene tres parámetros. El valor mínimo (a) El valor máximo (b) El valor modal (c)

Función de distribución acumulada , 0   ( x − a) ,  (b − a)(c − a) F( x)= P( X ≤ x)=  1 − (b − x) ,  (b − a)(b − c )  , 1

xb

Esperanza y varianza de la distribución triangular E( X ) =

V (X) =

a+b+c 3

a2 + b2 + c 2 − bc − ac − ab 18

Capítulo 4. Distribuciones de probabilidad

229

Gráfica de una distribución triangular f(x)

Figura 22. Función de densidad de una distribución triangular.

2/b–a

0 a c

b

X

Ejemplo 10 Considere que el precio de un kilo de carne sigue una distribución triangular, donde el precio mínimo es de 10 dólares, el precio máximo 40 dólares y el precio más común es el de 20 dólares. Determine la probabilidad de que el precio de un kilo de carne sea a lo más de 25 dólares. Solución X: precio de un kilo de carne sigue una distribución triangular.

P( X < 25) = 0.625 Utilizando el software Minitab se procede de la siguiente manera:

Figura 23. Secuencia para el cálculo de probabilidad de una distribución triangular.

230

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Figura 24. Resultado de la probabilidad de una distribución triangular.

3.3 Distribución normal Abraham de Moivre (Francia, 1667-1754) fue elegido miembro de la Royal Society de Londres en 1697, siendo muy reconocido por su trabajo en el campo de la probabilidad y de la distribución normal. Johann Carl Friedrich Gauss (1777-1855), alrededor de 1820 desarrolló numerosas herramientas para el tratamiento de los datos observacionales, entre las cuales destaca la curva de distribución de errores que lleva su nombre, conocida también como la distribución normal y que constituye uno de los pilares de la estadística, ya que es considerada la más importante de las distribuciones por sus múltiples aplicaciones.

Características de la distribución normal • Tiene forma de una campana. • Es simétrica respecto a la media. • La media, mediana y moda coinciden. • Los puntos de inflexión de la curva se dan en x = µ − s; x = µ + s • En el intervalo [µ − s , µ + s] incluye el 68.26 % de las observaciones. • En el intervalo [µ − 2s , µ + 2s] , incluye el 95.45 % de las observaciones. • En el intervalo [µ − 3s , µ + 3s] , incluye el 99.73 % de las observaciones.

Función de densidad de probabilidad normal Una variable continua tiene una distribución normal, si su función de densidad de probabilidad es: = f ( x)

1 2ps

e



( x −µ )2 2 s2

− ∞ < x < ∞; −∞ < µ < ∞; s > 0

Capítulo 4. Distribuciones de probabilidad

231

Esperanza y varianza de una distribución normal La esperanza viene dada por la siguiente expresión:

E( X ) = µ La varianza viene dada por la siguiente expresión:

V ( X ) = s2

Grafica de una distribución normal

Figura 25. Gráfica de la distribución normal con promedio 14, desviación estándar de 1.5.

Distribución normal estándar Toda distribución normal puede ser estandarizada mediante la siguiente transformación:

z=

x−µ s

donde a la variable z se le llama normal estándar y tiene media 0 y varianza unitaria.

Función de densidad de probabilidad normal estándar La función de densidad de probabilidad de la variable aleatoria Z es = f (Z)

1 2p

e



Z2 2

−∞
Esperanza y varianza de una distribución normal estándar La esperanza viene dada por la siguiente expresión:

E(Z) = µ = 0

232

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

La varianza viene dada por la siguiente expresión:

V (Z) =s2 =1

Gráfica de una distribución normal estándar

Figura 26. Gráfica de la distribución normal estándar.

Ejemplo 11 Un constructor afirma que el tiempo necesario para completar un proyecto de construcción se puede representar mediante una variable aleatoria normal con una media de 60 semanas y desviación estándar de 8 semanas. a. Calcular la probabilidad de que el tiempo necesario para terminar un proyecto de construcción supere las 70 semanas. Solución

P( X > 70) = 0.1056 Haciendo uso del software Minitab se procede de la siguiente manera: en el menú principal clicar la opción Graph> Normal> View Probability> OK en Distribution elegir Normal> en Mean digitar 60 y en Standard Deviation digitar 8> en la ventana Shaded Area> marcar X value> ventana X value> seleccionar Right tail/ digitar en la ventana X value digitar 70> OK.

Capítulo 4. Distribuciones de probabilidad

233

Figura 27. Pasos para hallar una distribución normal.

En la siguiente gráfica se encuentra el valor de la probabilidad que es 0.1056

Figura 28. Resultado de probabilidad de una distribución normal.

234

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

b. Calcular la probabilidad de que la duración del proyecto sea inferior a 52 semanas. Solución De igual forma, se calcula la siguiente probabilidad P( X < 52) = 0.1587

Figura 29. Resultado de probabilidad de la distribución normal.

c. Calcular la probabilidad de que la duración del proyecto esté comprendida entre 56 y 64 semanas Solución

Haciendo uso del software Minitab y siguiendo las instrucciones del ejercicio anterior se obtiene lo siguiente: P(56 < X < 64) = 0.3829

Figura 30. Resultado de probabilidad de una distribución normal.

Capítulo 4. Distribuciones de probabilidad

235

Ejemplo 12 En una pizzería se ha determinado que el tiempo que se demora en entregar una pizza al cliente, desde que el cliente realiza el pedido hasta que lo recibe, se distribuye normalmente con una de media de 12.3 y una desviación estándar de 1.7 minutos. Para atraer clientes se ha diseñado una campaña publicitaria en la que la pizza será gratis si se demoran más de 15 minutos para su entrega. ¿Qué proporción de pizzas no se cobrarían por ese motivo? Solución X: Tiempo que se demora la pizzería en entregar la pizza solicitada. X → N( = µ 12.3= ; s 1.7)

P( X > 15) = 0.05612 Haciendo uso del software Minitab se procede como en el ejercicio anterior de la siguiente manera:

Figura 31. Secuencia de una distribución normal.

236

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Figura 32. Resultado de probabilidad de una distribución normal.

Ejemplo 13 Los paquetes grandes de café MÓNACO señalan en la etiqueta un contenido neto que debería ser de 4 kg. En el departamento de empaque saben que el contenido neto en peso es ligeramente variable y han estimado que la desviación estándar es de s =0.04 kg. Además, aseguran que sólo 2 % de los paquetes contiene menos de 4 kg. Si se supone una distribución normal. a. Determine el peso promedio y luego calcule el porcentaje de paquetes con un peso superior a 4.13 kg. Solución X : Peso de los paquetes de café MÓNACO

X → N (µ; s =0.04) Para calcular el promedio se hace uso de la normal estándar de la siguiente manera:

X −µ 4−µ  4−µ P( X < 4) =P  <  =P  Z <  =0.02 0.04  0.04   s  Utilizando el software Minitab de la siguiente manera: ingresar al menú principal, en la opción Graph> seleccionar View Probability> OK> en Distribution, seleccionar Normal> en Mean, digitar 0 y en Standard deviation, digitar 1> seleccionar Shaded Area>dar clic en Probability>seleccionar Left Tail>en la ventana de Probability digitar 0.02> OK

Capítulo 4. Distribuciones de probabilidad

237

El resultado del valor de Z 0 se presenta en la siguiente gráfica.

Z0 =

4−µ = −2.054; µ = 4.08 0.04

= (µ 4.08= ; s 0.04) Por lo tanto: X → N Para calcular el porcentaje de paquetes con un peso superior a 4.13 haciendo uso de la normal con los parámetros señalados.

P( X > 4.13) Haciendo uso del software Minitab y siguiendo el procedimiento del ejemplo 11 se obtiene lo siguiente:

238

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

P( X > 4.13) = 0.1056

b. De acuerdo con su peso, los paquetes se clasifican en 3 categorías, como sigue: Categoría A (los más livianos) son el 10 %, Categoría B (los de peso intermedio) son el 85 % y el 5 % restante (los más pesados) están en la categoría C. Calcule los valores límite del peso en cada categoría.

Capítulo 4. Distribuciones de probabilidad

239

Solución Haciendo uso del Minitab y siguiendo el procedimiento del ejemplo an­te­rior se obtiene lo siguiente:

Para la categoría A: Peso máximo es de 4.029 kg. Para la categoría B: Los pesos están entre 4.029 y 4.146 kg. Para la categoría C: Desde 4.146 kg a más.

3.4 Distribución exponencial Se utiliza en casos referentes a tiempo de funcionamiento, vida útil, duración del tiempo de trabajo sin fallas de un componente, etc.

Función de densidad de probabilidad exponencial Una variable aleatoria continua tiene una distribución exponencial si su función de densidad es:

1 −x  e b , x > 0, b > 0 f ( x) =  b  , en otro caso 0

Características de la distribución exponencial • Solo está definida para valores positivos. • Es asintótica al eje horizontal. • Es monótona decreciente.

Función de distribución acumulada  ,x < 0 0 F ( x) =  −( x / b ) ,x≥0  1 − e

Donde e = 2.71828

240

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Esperanza y varianza de una distribución exponencial La esperanza viene dada por la siguiente expresión:

E( X ) = b La varianza viene dada por la siguiente expresión:

V ( X ) = b2 Gráfica de una distribución exponencial

Figura 33. Gráficas de la distribución exponencial con = b 1 y= b 2.

Ejemplo 14 Suponga que un diseñador debe decidir entre dos procesos de manufactura para la fabricación de cierto componente. Empleando el proceso A, cuesta S/ 2.50 fabricar un componente. Empleando el proceso B, cuesta S/ 3.00 fabricar un componente. Los componentes tienen una distribución exponencial de tiempo transcurrido hasta la falla con medias de 200 y 350 horas, respectivamente, para los dos procesos. Debido a una cláusula de garantía, si un componente dura menos de 400 horas, el fabricante debe pagar una pena de S/ 1.20. ¿Cuál proceso debe adoptar el diseñador? Solución Si analizamos el problema vemos que el costo de producción del proceso A es menor, pero, por otro lado, si analizamos el tiempo de duración vemos que el tiempo de vida promedio del proceso B es mayor. Se tiene incertidumbre en la decisión, y debemos usar un procedimiento estadístico que involucre ambos factores, en este caso es el valor esperado Wi: Tiempo transcurrido hasta que se presente la falla en el componente producido con el proceso i. i = A, B

Capítulo 4. Distribuciones de probabilidad

241

Proceso

Costo

Costo adicional si Wi < 400 horas

A

2.5

1.2

B

3.0

1.2

Tabla de probabilidades: Proceso

P(Wi ≥ 400 h)

P(Wi < 400 h)

A

0.1353

0.8647

B

0.3189

0.6811

Sea: Xi: Costo por cada componente producido con el proceso i. E(X A): 2.5(0.1353) + (2.5 + 1.2)(0.8647) = S/ 3.53764 E(XB): 3.0(0.3189) + (3.0 + 1.2)(0.68117) = S/ 3.81732 Se debe adoptar el proceso A, ya que presenta el menor costo esperado de producción. Ejemplo 15 El tiempo de vida de un determinado producto es una variable que tiene una distribución exponencial, con una desviación estándar de 6 horas. Si el tiempo de vida es mayor que 6 horas, la utilidad por producto es el 20 % de su costo de fabricación C en soles; mientras que, si dura menos de 6 horas, se pierde el 10 % de su costo C. ¿Para qué valor de C se tiene una utilidad esperada mayor que 0? por producto? Solución X: tiempo de vida del producto.

X → Exponencial (b =6) U: utilidad asociada por cada producto. X → Exponencial (b =6) Tiempo de vida X

Probabilidad

X>6

P(X > 6) = 0.3679

0.2C

P(X ≤ 6) = 0.6321

–0.1C

X≤ 6

Utilidad U

Hallar C, tal que: E(U) > 0.1 E(U) = 0.2C(0.3679) + (–0.1C)(0.6321) > 0.1 E(U) = 0.07358C – 0.06321C = 0.01037C > 0.1 Entonces: C > S/ 9.6432

3.5 Distribución gamma La distribución gamma es una generalización del modelo exponencial, y se utiliza para modelar las variables asociadas al tiempo que transcurre hasta que se produce una determinada cantidad de veces un suceso de interés.

242

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Función de densidad de probabilidad gamma Una variable continua tiene una distribución gamma si su función de densidad es: x  −  1 xa−1e b , f ( x) =  Γ(a)ba  , 0 

x > 0, a > 0, b > 0 x≤0

Donde e = 2.71828

Características de la distribución gamma • Γ(a) es la función gamma y se define como: ∞

Γ(a) =∫ X a−1e − x dx , con las siguientes propiedades:



Para cualquier entero positivo: Γ(a) = (a − 1)!



Para cualquier a > 1; Γ(a) = (a ­ 1)! Γ(a ­ 1)



1 Γ   =p 2

a

• Si a =1, entonces, f ( x) es la función de densidad de la distribución exponencial con parámetro b. • Si a n/ = = 2 y b 2 , entonces, f ( x) es la llamada función de densidad de la distribución ji-cuadrado con n grados de libertad.

Gráfica de una distribución gamma

Capítulo 4. Distribuciones de probabilidad

243

Ejemplo 16 Supongamos que el tiempo que transcurre entre la entrada y la salida de un cliente a un supermercado sigue una distribución gamma con parámetros = a 4 y= b 1/ 2. Si un cliente cualquiera entró a las 11:00 horas, ¿cuál es la probabilidad de que salga del supermercado entre las 12:00 y las 13:00 horas? Solución X: tiempo que transcurre entre la entrada y la salida de un cliente a un supermercado. X → Gamma= (a 4 y= b 0.5)

P(1 ≤ X ≤ 2) = 0.423 Haciendo uso del software Minitab el procedimiento se presenta a continuación:

Figura 34. Gráficas de la distribución gamma con a= 1, b= 1 y a= 2, b= 1.

244

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Figura 35. Secuencia para calcular la probabilidad de una distribución gamma.

3.6 Relación entre las distribuciones de Poisson, exponencial y gamma 3.6.1 Relación de la distribución de Poisson con la distribución exponencial Una de las aplicaciones más importantes de la distribución exponencial es aquella en las que se encuentran asociadas al proceso de Poisson y su correspondiente distribución. Sea X una variable aleatoria de Poisson que representa el número de eventos que ocurren en un intervalo de tiempo con un parámetro λ , donde λ puede interpretarse como el número promedio de eventos por unidad de tiempo. Consideremos ahora la variable aleatoria Y como el tiempo que se requiere para que ocurra el primer evento, entonces se puede demostrar que Y es una variable 1 aleatoria con una distribución exponencial y con parámetro b = del intervalo λ de medición considerado. Ejemplo 17 El número promedio de robos que ocurre en una capital de un país es de 5 en 60 minutos. Suponiendo que el número de robos siga una distribución de Poisson. a. Determine la probabilidad de que en 1 hora ocurra exactamente 3 robos. Solución X: número de robos en 60 minutos. X → Poisson (λ =5) cada 60 minutos. P( X= 3= )

e −5 × 53 = 0.140374 5!

b. ¡Acaba de ocurrir un robo! Determine la probabilidad de que transcurra menos de 20 minutos para que ocurra el siguiente robo. Solución

b=

1 1 = = 0.2 de cada 60 minutos, es decir, b =12 minutos. λ 5

Capítulo 4. Distribuciones de probabilidad

245

Y : Tiempo transcurrido entre un robo y otro. Y → Exp( b =12 minutos) y

1 −12 P(Y <= 20) ∫ e= 0.811 0 12 20

3.6.2 Relación de la distribución de Poisson con la distribución gamma Sea una variable aleatoria X que se distribuye como una de Poisson, donde X representa el número de eventos en un determinado intervalo de tiempo. Esta variable aleatoria X se relaciona con la variable aleatoria Y, que representa el tiempo entre un evento hasta la presencia del siguiente evento, esta variable Y se distribuye como una exponencial. Se define la variable aleatoria W que representa el tiempo hasta que transcurra el k-ésimo evento, entonces W se distribuye 1 como una gamma con parámetro (a , b) donde a es entero y b = . λ Ejemplo 18 A un servidor web llegan en promedio 3 requerimientos cada 30 segundos. Calcule lo siguiente: a. Probabilidad de esperar más de un cuarto de hora para que lleguen 80 requerimientos. b. Probabilidad de esperar menos de 10 minutos para que lleguen 50 requerimientos. Solución X: Número de requerimientos que llegan al servidor cada 30 segundos. X → Poisson (λ =3) cada 30 segundos.

1 1  1  1  1 = = b = de cada 30 segundos (1/2 minuto), es decir, minuto   λ 3  3  2  6 a. Y: tiempo de espera, en minutos, hasta que lleguen 80 requerimientos b=

Y → Gamma = ( a 80, = b 1= / 6 0.16667)

P(Y > 15) = 0.1332 b. W: tiempo de espera, en minutos, hasta que lleguen 50 requerimientos W → Gamma = (a 50 , = b 0.16667) P(W < 10) = 0.9156

3.7 Distribución de Weibull La distribución de Weibull fue establecida por el físico suizo del mismo nombre quien demostró, con base a una evidencia empírica, que el esfuerzo al que se someten los materiales se puede modelar apropiadamente mediante el empleo

246

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

de esta distribución. En los últimos años, esta distribución se utiliza como modelo para situaciones del tipo tiempo-falla con el objetivo de evaluar una amplia variedad de componentes mecánicos y eléctricos.

Función de densidad de probabilidad de Weibull Una variable continua X tiene una distribución de Weibull si su función de densidad es: x  −( )a  a xa−1e b , x > 0 , a > 0 , b > 0 f ( x ) =  ba  , x≤0  0

Donde a es conocida como el parámetro de forma, y b como el parámetro de escala, además el valor de e = 2.71828.

Características de la distribución de Weibull • El parámetro a indica el comportamiento de la tasa de fallos con el transcurso del tiempo, tal que: – a < 1 indica que la tasa de fallos decrece con el tiempo – a =1, indica que la tasa de fallos es constante en el tiempo – a > 1, indica que la tasa de fallos crece con el tiempo. • Si a =1, entonces, f ( x) corresponde a una función de densidad de la distribución exponencial con parámetro b.

Función de distribución acumulada Sea x una variable aleatoria continua de Weibull con parámetros a y b , entonces su función de distribución es: 0 ,x < 0 F ( x) =  −( x / b)a ,x≥0 1 − e

Esperanza y varianza de una distribución de Weibull La esperanza viene dada por la siguiente expresión:

 1 E( X ) = bΓ 1 +   a

Capítulo 4. Distribuciones de probabilidad

247

La varianza viene dada por la siguiente expresión: 2   1   1     V (X) = b Γ  1 +  −  Γ  1 +    a    a      2

Gráfica de una distribución de Weibull

Figura 36. Gráficas de la distribución de Weibull con a= 2, b= 5 y a= 2 , b= 1.

Ejemplo 19 La duración X, en cientos de horas, de cierto tipo de tubo al vacío tiene una distribución de Weibull con parámetros = a 2 y= b 3. Calcule: a. El valor esperado y la desviación estándar de X. b. El porcentaje de tubos con duraciones inferiores a 600 horas. c. El porcentaje de tubos con duraciones entre 150 y 500 horas. Solución X: duración, en cientos de horas, del tubo al vacío. X Weibull(a = 2, b = 3)

 1 3Γ 1 +  3= (0.886227) 2.658681 a. E( X ) ==  2



  1    1  2    V ( X ) = 32 Γ 1 +  − Γ 1 +    = 9(0.886227 − 0.886227 2 ) = 0.907458 2 2        

0.981 b. P( X < 6) =

NOTA: 600 horas se representa como 6 cientos de horas Haciendo uso del software Minitab, el procedimiento se muestra a continuación:

248

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Figura 37. Secuencia para calcular la probabilidad de una distribución de Weibull.

Figura 38. Resultado de la probabilidad de una distribución de Weibull.

c. P(1.5 < X < 5) = 0.7166

Capítulo 4. Distribuciones de probabilidad

249

Ejemplo 20 El tiempo en horas para la falla de un material aislante sólido sometido a voltaje de corriente alterna tiene distribución de Weibull con a = 2.5 y b = 200 a. Calcule la probabilidad de que la duración de un material sea de a lo más 200 horas. b. ¿Qué valor es tal que exactamente 50 % de todos los especímenes tengan duraciones que excedan dicho valor? Solución

(a 2.5;= b 200) a. X: Tiempo de duración de material aislante → Weibull= 0.6321 P ( X ≤ 200) = b. P ( X > k= ) 0.5; = k 172.7

3.8 Distribución ji-cuadrado La distribución ji-cuadrado es muy importante en las aplicaciones de inferencia estadística como las pruebas de independencia y de bondad de ajuste, entre otras. Se dice que una variable aleatoria continua sigue una distribución ji-cuadrado ) con v grados de libertad si su función de densidad es:

( χ 2v

 v −1 − x 1  x 2 e 2 , si x > 0 , v > o  v f ( x) =  2 v / 2 Γ   2  0 , si x ≤ 0  Donde v es un parámetro cuyo nombre es “grados de libertad” y es el tamaño v de la muestra, y Γ   representa la función gamma evaluada en v/2. Además, 2 el valor de e = 2.71828.

Características: • Es una distribución asimétrica positiva • Las puntuaciones de la ji-cuadrado no pueden ser negativas. • Se aproxima a la distribución normal cuando el tamaño de la muestra es grande. • Si el valor de v = 2, la variable aleatoria ji-cuadrado es igual a una variable aleatoria exponencial con b =2 . • Si el valor de v =2, la variable aleatoria ji-cuadrado es igual a una variable = a v / 2= ; b 2. aleatoria gamma con

250

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

• La distribución ji-cuadrado posee la propiedad reproductiva es decir si:

X1, X2 , X3 ..., Xv son variables aleatorias mutuamente independientes con

distribución ji-cuadrado respectivamente, con v1 , v2 ,..., vn grados de libertad, entonces la variable aleatoria Y = X1 + X2 + ... + Xn tiene una distribución ji-cuadrado con v = v1 + v2 + ... + vn .

• La distribución ji-cuadrado está relacionada con la distribución normal, respecto a lo siguiente: al extraer una muestra aleatoria de una población N(µ; s2 ) , y estandarizar las variables se tiene lo siguiente: x1 − µ x2 − µ xv − µ , al elevar al cuadrado cada una de ellas y sumarlas ; ;... s s s 2

 x −µ 2 ∑ i  → χ v , este resultado es una variable aleatoria ji-cuadrado s  i =1  con v grados de libertad. v

Esperanza y varianza de una distribución ji-cuadrado E( x) = v V ( x) = 2v

Gráfica de una distribución ji-cuadrado

Figura 39. Gráfica de la distribución de probabilidad ji-cuadrado con diversos grados de libertad.

Ejemplo 21 Considere a X como una variable aleatoria con distribución ji-cuadrado con 18 grados de libertad. a. Determine la probabilidad de que X sea a lo más de 12. b. ¿Cuál es el valor de k, si X sobrepasa a este valor con una probabilidad de 0.95?

Capítulo 4. Distribuciones de probabilidad

251

Solución a. Haciendo uso de Minitab el procedimiento se presenta a continuación:

Figura 40. Uso del comando Chi-Square del software Minitab.

Resultado: P( X < 12) = 0.1528

252

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

b. P( X > K ) = 0.95

Haciendo uso del software Minitab, el procedimiento se presenta a continuación:

Figura 41. Uso del comando Chi-Square del software Minitab.



P( X > K ) = 0.95; el valor de k = 9.39

Ejemplo 22 Sea X una variable aleatoria con distribución Ji-cuadrado con 20 grados de libertad. a. Determine la probabilidad de que X sea por lo menos 15.35 b. Determine la esperanza y la varianza de X.

Capítulo 4. Distribuciones de probabilidad

253

Solución a. Para calcular P ( X > 15.35) = 0.7560 b. E( X ) 20 = = ; V (X) 4

3.9 Distribución t de Student La distribución t de Student fue creada por William Sealy Gosset, más conocido por su pseudónimo literario Student. Esta distribución de probabilidad es muy importante cuando se desea realizar una inferencia para la media poblacional y no se conoce la desviación estándar poblacional con la condición de que la distribución original es aproximadamente normal. Se dice que una variable aleatoria continua sigue una distribución t con v grados de libertad si su función de densidad es:

Función de densidad de probabilidad t de Student   v +1  Γ 2  1  = , f ( x)   v +1  Γ  v  vp  2  2 x   2  1 +  v  

− ∞ < x < ∞; v > 0

Donde v son los grados de libertad

Γ( ) = es la función gamma

Características • Es una distribución simétrica. • La distribución t es parecida a una distribución normal estándar. • En una distribución t las colas son más “pesadas” que una distribución norma estándar (Z), es decir, que en la distribución t es más probable encontrar valores alejados de la media, en comparación a la distribución Z. • La distribución t está relacionada con la distribución normal y la ji-cuadrado de la siguiente manera: = T

Z Y v

→ t( v )

Z → N (0,1); Y → χv2

254

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Esperanza y varianza de una distribución t de Student E( X ) = 0 V (X) =

v , v−2

v>2

Gráfica de una distribución t de Student

Figura 42. Gráfica de la distribución de probabilidad de la t de Student con 5 y 30 grados de libertad.

Ejemplo 23 Sea X → t(18) , determine las siguientes probabilidades: a. P( X > 2) b. P( x ≤ 2.5) Solución a. Haciendo uso del software Minitab se procede de la siguiente forma:

Capítulo 4. Distribuciones de probabilidad

255

P ( X > 2) = 0.03041 b. Haciendo uso del software Minitab se procede de la siguiente manera:



P ( x ≤ 2.5) = 0.9777

3.10 Distribución F de Fisher-Snedecor La distribución F es muy importante en las aplicaciones de inferencia estadística como en el análisis de varianzas, también se le conoce como la distribución F de Fisher-Snedecor.

256

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Función de densidad de probabilidad F (Fisher) Se dice que una variable aleatoria continua sigue una distribución F con m y n grados de libertad si su función de densidad es:  m+n m  Γ  2 2   m       f ( x) =  Γ  m  Γ  n   n    2  2  0 

m−2 x 2 m+n  2

x > 0, m > 0, n > 0

,

si

,

si x ≤ 0

 m 1 +   x   n 

Donde m representa los grados de libertad del numerador, y n a los grados de libertad del denominador, y Γ( ) es la función gamma.

Características • Notación: X tiene una distribución F con m y n grados de libertad se denota como F( m ,n) • Es una distribución asimétrica a la derecha. • La distribución F es muy parecida a la distribución ji-cuadrado, pero se encuentra centrada respecto a uno. • La distribución F es el resultado de dividir 2 variables aleatorias del tipo ji-cuadrado divididas entre sus grados de libertad mediante el siguiente X esquema: nX 2 2 m tiene una distri Sean X → χ( m) y Y → χ( n) , la variable W = = Y mY n bución F con m y n grados de libertad.

Esperanza y varianza de una distribución F E( X ) =

V (X) =

n n−2

2n2 ( m + n − 2) m(n − 2)2 (n − 4)

con n > 4

Capítulo 4. Distribuciones de probabilidad

257

Gráfica de una distribución F

Figura 43. Gráfica de la distribución F con diversos grados de libertad.

Ejemplo 24 Sea X una distribución F con 16 y 20 grados de libertad, calcular las siguientes probabilidades: a. P(X< 2.4) b. P(1.2< X <2.2) Solución a.

Haciendo uso del software Minitab se procede de la siguiente manera:

Figura 44. Secuencia del comando F.

258

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Figura 45. Resultado de la probabilidad.

P( X < 2.4) = 0.9670

b. Haciendo uso del software Minitab se procede de la siguiente manera:

Figura 46. Secuencia del comando F.



P(1.2 < X < 2.2) = 0.2969

Capítulo 4. Distribuciones de probabilidad

259

4. Problemas resueltos 1. Un informe del diario Gestión indica que el 58 % de los trabajadores de Lima tienen sueldos superiores al mínimo vital. Si usted entrevista a 50 trabajadores elegidos al azar, hallar la probabilidad de que: a. Más de 36 de ellos tengan sueldos superiores al mínimo vital. Solución X: número de trabajadores son sueldos superiores al mínimo vital X → B (n = 50; p = 0.58)

( X > 36=)

36  50  1 – P( X ≤ 36 ) 1 − ∑  0.58x (0.42)50− x = 1 – 0.9858 = 0.0142 =  x =0  x 

Usando el software Minitab se obtiene lo siguiente:

b. Se observe que a lo más 20 de ellos tengan sueldos inferiores al mínimo vital. Solución X → B(n = 50; p = 0.42) 20  50  50 − x x P( X ≤ 20) = = 0.4461 ∑  0.42 (0.58) 0 x 

c. Más de 30 pero menos de 40 tengan sueldos superiores al mínimo vital Solución X → B(n = 50; p = 0.58)

260

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios



P(30 < X < 40)= P(31 ≤ X ≤ 39)= P( X ≤ 39) – P( X ≤ 30)=



0.9991 − 0.6638 = 0.3353

2. Un comerciante ha comprado en un remate de aduanas un lote de 10 televisores full HD de 42’’ y pagó USD 3500 por todo el lote. Cada televisor en buenas condiciones lo puede vender a USD 600, pero si el televisor necesita alguna reparación lo vende a USD 250. En remates similares se sabe que el 80 % de los televisores adquiridos están en buenas condiciones. a. ¿Cuál es la probabilidad de que más de la mitad de televisores comprados estén en buenas condiciones Solución X: número de televisores buenos RX = 0, 1, 2, …, n X → b(n = 10; p = 0.80) 10  10  P( X > 5)= P ( X ≥ 6 )= ∑  0.8x (0.2)10− x = 0.9672  6  x 

b. ¿Cuál es la ganancia neta esperada del comerciante por la compra de los 10 televisores? Solución Y: ganancia neta con los 10 televisores. Y= 600X + 250(10 – X ) – 3500 = 350X – 1000

E(Y ) =× 350 8 – 1000 = USD 1800 c. ¿Cuál es la probabilidad de que su ganancia neta sea inferior a USD 750? P(Y < 750) = P(350X – 1000 < 750) = P( X < 5) = P( X ≤ 4) = 0.00637

3. Los impulsos provenientes de una fuente emisora tienen una intensidad (en kg.m2/s) que es considerada una variable aleatoria X cuya función de distribución es: 0 ,  4 x = , F ( x)   81 1 , 

x≤0 0<x<3 x≥3

Si se observan 10 de estos impulsos cuyas intensidades se consideran independientes, ¿cuál es la probabilidad de que a lo más 3 de ellos tengan una intensidad superior a 2?

Capítulo 4. Distribuciones de probabilidad

261

Solución Y: número de impulsos con intensidad X > 2 n = 10; p = P(X > 2) = 1 – 16/81 = 0.1975 Y → B(n = 10; p = 0.1975) 3  10  P(Y ≤ 3) = ∑  0.1975x (0.8025)10− x = 0.8835  0  x 

4. Ciertas piezas deben estar pintadas y para que estén aptas para la venta deben tener la pintura en buenas condiciones. El 4 % de dichas piezas tiene poca pintura y el 5 % tienen en exceso. El 99 % de las que tienen exceso no están aptas para la venta, lo mismo ocurre con el 90 % de las que tienen poca pintura. Calcular: a. La probabilidad de que una pieza esté apta para la venta. b. Si de una producción de 200 piezas se eligen, al azar y sin reposición, 12, ¿cuál es la probabilidad de que a lo más una de ellas esté mal pintada? Solución P: poca pintura, E: exceso de pintura, N: pintura normal A: pieza apta para la venta A

A

Total

P

0.0040

0.0360

0.04

N

0.9100

0.0000

0.91

E

0.0005

0.0495

0.05

Total

0.9145

0.0855

1.00

a. P(A) = 0.9145 b. N = 200, M = (0.04 + 0.05)(200) = 18, n = 12 Y: número de piezas mal pintadas Y → H(N = 200; M = 18; n = 12) 1  18  182  ∑     y = 0  y  12 − y   0.7054 P(Y ≤ 1) = =  200    12 

262

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

5. Un mayorista que vende focos de 30 vatios aceptará un lote de 120 piezas a un fabricante si no encuentra más de 4 focos defectuosos en una muestra de 20. a. ¿Cuál es la probabilidad de encontrar 3 defectuosos en una muestra de 20, si se sabe que en el lote hay 4 defectuosos? b. ¿Cuál es la probabilidad de aceptar el lote si se sabe que en el lote hay 6 defectuosos? Solución a. X: número de focos defectuosos seleccionados.

X → H ( N =120; M =4; n =20 )



 4 116      3 17    = 0.0138778 P( X= 3= ) 120     20   



Usando el software Minitab se obtiene lo siguiente: Probability Density Function Hypergeometric with N = 120, M = 4, and n = 20 x

P(X = x)

2

0.0138778

b. Y: número de focos defectuosos seleccionados.

Y → H (N = 120; M = 6; n =20)  4  6  114  ∑   y = 0  y  20 − y     0.9996 P(Y ≤ 4) = = 120     20   

6. Un lote contiene 80 artículos del proveedor A y 100 del proveedor B. Se elige una muestra aleatoria de tamaño 5 sin reemplazo. a. Determine la probabilidad de que en la muestra se elija 2 artículos sean del proveedor A y 3 del proveedor B. b. Cuál es la probabilidad de que en la muestra no haya ninguno del proveedor A.

Capítulo 4. Distribuciones de probabilidad

263

Solución a. Determine la probabilidad de que en la muestra se elija 2 artículos sean del proveedor A y 3 del proveedor B. X: número de artículos del proveedor A.

X → H (N = 180; M = 80; n = 5)  80 100      2  3     0.3432 = P( X= 2= ) 180    5   

b. ¿Cuál es la probabilidad de que en la muestra no haya ninguno del proveedor A?  80 100      0  5     0.0505676 = P( X= 0= ) 180    5   

7. A una garita de peaje, en promedio, llegan 240 autos por hora. El administrador de la garita ordena atender inicialmente solamente una caseta, pero si en el lapso de 2 minutos llegan por lo menos 10 autos, entonces ordena atender en una caseta más hasta que se produzca el descongestionamiento. ¿Cuál es la probabilidad de que el administrador tenga que ordenar atender en otra caseta? Solución

X = Número de autos que llegan a la garita de peaje en 2 minutos.

X ~ P ( λ =8 ) cada 2 minutos e -8 8x P[X= x= ] x!

P[X ≥ 10] =− 1 P[X < 10] =− 1 P[X ≤ 9] =− 1 0.716624 = 0.283376

8. Los accidentes laborales diarios de una empresa siguen una distribución de Poisson con promedio de 0.4. Calcular lo siguiente: a. La probabilidad de que en un día se produzcan por lo menos dos accidentes. b. La probabilidad de que se produzcan 4 accidentes en 6 días. c. La probabilidad de que haya un accidente hoy y ninguno mañana.

264

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Solución a. La probabilidad de que en un día se produzcan por lo menos dos accidentes X: número de accidentes diarios. X → Poisson (λ = 0.4) cada día ∞ e −0.4 × 0.4 x = P ( X ≥ 2) ∑ = 0.06155 X! 2

Usando el software Minitab: Graph> Probability Distribution Plot> View Probability> OK> Distribution> Poisson> Mean=0.4> Shaded Area> X value> Right Tail> X value=2> OK, y se obtiene el siguiente valor:

b. La probabilidad de que se produzcan 4 accidentes en 6 días. Como en promedio ocurren 0.4 accidentes cada día, entonces, cada semana de 6 días ocurrirán 0.4(6) = 2.4 accidentes. Y → Poisson (λ = 2.4) cada semana

P(Y= 4)=

e −2.4 × 2.44 = 0.125408 4!

Haciendo uso del software Minitab mediante la opción: Calc> Probability Distribution > Poisson >Probability > Mean=2.4 > Input constante=4, se obtiene: Probability Density Function Poisson with mean = 2.4 x P(X = x) 4 0.125408

Capítulo 4. Distribuciones de probabilidad

265

c. La probabilidad de que haya un accidente hoy y ninguno mañana. X: número de accidentes diarios. X → Poisson (λ = 0.4) cada día

 e −0.4 × 0.4  e −0.4 × 0.40  = P ( X= 1) P ( X= 0)=    0.9384  1! 0!   

9. Para la fabricación de hojalata mediante el método Bessemer se producen 0.3 imperfecciones por minuto. a. Determinar la probabilidad de no encontrar imperfecciones en un minuto. b. Determinar la probabilidad de encontrar a lo más dos imperfecciones en dos minutos. c. El jefe de planta indica que, si encontraran por lo menos 2 imperfecciones en dos minutos, se tomaría la decisión de cambiar el método. ¿El jefe de planta cambiaría de método? Solución X: número de imperfecciones que se presentan cada minuto. X → Poisson (λ = 0.3) cada minuto.

a. Determinar la probabilidad de no encontrar imperfecciones en un minuto.

P ( X= 0) =

e −0.3 × 0.30 = 0.740818 0!

b. Determinar la probabilidad de encontrar a lo más dos imperfecciones en dos minutos. Y: Número de imperfecciones que se presentan cada 2 minutos. Y → Poisson (λ = 0.6) cada 2 minutos.

= P (Y ≤ 2)

2 e −0.6 × 0.6 y ∑ = 0.9769 y! y =0

c. El jefe de planta indica que, si encontraran por lo menos 2 imperfecciones en dos minutos, se tomaría la decisión de cambiar el método. ¿El jefe de planta cambiaría de método? Y → Poisson (λ = 0.6) cada 2 minutos.

= P (Y ≥ 2)

266

∞ e −0.6 × 0.6 y ∑ = 0.1219 y! y =2

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

10. Por la venta de un producto, una empresa obtiene ingresos diarios que se pueden representar mediante una variable aleatoria X con distribución uniforme. Si se sabe que el ingreso mínimo es de 180 soles y que en 1 de cada 10 días los ingresos superen los 378 soles, calcule el coeficiente de variación de X. Solución X: ingreso diario. X → U= (a

180= , b ?)

P( X > 378= )

1 b − 378 ⇒ = 0.1; b= 400 10 b − 180

180 + 400 (400 − 180) 2 = 290; = V (X ) = 4 033.33 2 12 s =63.51 63.51 C.V .( X )= × 100= 21.89% 290

= F(X )

11. En una determinada zona de la ciudad existen dos bancos comerciales: A y B. A cuenta con el 70 % de los clientes y B con el resto. Los depósitos bancarios semanales, en dólares, en A tienen distribución uniforme entre 3500 y 18 500 dólares inclusive y los depósitos bancarios semanales en B tienen distribución normal con un promedio 10 000 dólares y una desviación estándar de 2500 dólares. a. En el banco A; si se elige al azar un depósito, ¿cuál es la probabilidad de que el valor de dicho depósito sea mayor a 15 500 dólares? Solución En el banco A; si se elige al azar un depósito, ¿cuál es la probabilidad de que el valor de dicho depósito sea mayor a 15 500 dólares? X: Depósitos bancarios semanales en el banco comercial A → U[3500; 18500] P( X > 15 500) = 0.2

Usando el software Minitab, se procede de la siguiente manera:

Capítulo 4. Distribuciones de probabilidad

267

b. La semana pasada se realizaron 60 depósitos en el banco A. Si se eligen al azar y sin reposición 10 de dichos depósitos, ¿cuál es la probabilidad de que por lo menos tres de ellos tengan un valor no mayor a US$ 5000? Solución X: Depósitos bancarios → U(3500; 18 500) P( X < 5000) = 0.1

268

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Y: Número de depósitos → H(N = 60; M = 6; n = 10) M = 0.1(60) = 6 P(Y ≥ 3) = 0.05237

c. Si se elige al azar un depósito entre todos los depósitos de los dos bancos, halle la probabilidad de que dicho depósito sea mayor a US$ 14 000. Solución P( X A > 14 000) = 0.3 P( XB > 14 000) = 0.05480 A: Depósito mayor a 14 000 B1: Clientes del banco comercial A B2: Clientes del banco comercial B P(A) = 0.7 × 0.3 + 0.3 × 0.0548 = 0.22644

12. Se cree que el tiempo X (en minutos) para que un profesor universitario prepare una práctica dirigida para el curso de Estadística, tiene una distribución uniforme. En promedio se demora una hora, y como mínimo emplea 55 minutos para la preparación de la práctica. a. ¿Cuál es la probabilidad de que el tiempo de preparación exceda a 58 minutos? b. Determine el tiempo máximo de preparación, tal que sólo el 10 % de las prácticas excedan este tiempo máximo. Solución a. ¿Cuál es la probabilidad de que el tiempo de preparación exceda a 58 minutos? 55 + b = 60; = b 65 2 X → U(55; 65) E( X= )

P( X > 58) = 0.7

b. Determine el tiempo máximo de preparación, tal que sólo el 10 % de las prácticas exceda este tiempo máximo. P( X < K= ) 0.1; = k 56

13. Sea X una variable aleatoria con distribución triangular, su valor mínimo es 1, el valor máximo es 6 y el valor modal es 3. a. Determine la función de densidad. b. Determine la función de distribución acumulada.

Capítulo 4. Distribuciones de probabilidad

269

Solución a. La función de densidad es: x −1 , 1≤ x ≤ 3  5   2(6 − x) = , 3< x≤6 f (x)   15 0 , en otro caso   b. La distribución de probabilidad acumulada es:



, 0   x −1 ,  10 Fx ( x) =  1 − (6 − x) ,  15  , 1

x <1 1≤ x ≤ 3 3< x≤6 x>6

14. Los sueldos de los trabajadores de una determinada fabrica sigue una distribución triangular con mínimo de 800 soles, el sueldo máximo es de 2200 y la gran mayoría tiene sueldos de 1000 soles. Determine la probabilidad que, al elegir un trabajador, el sueldo sea menor a 1300 soles. Solución Haciendo uso del software Minitab, el procedimiento se presenta a continuación:

270

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios



P( X < 1300) = 0.5179

15. Una máquina que despacha café está programada de forma que descarga una media de 250 cm3 por vaso. Si la cantidad de líquido despachada está distribuida normalmente y se sabe que en el 4.78 % de los vasos la cantidad de líquido descargada es inferior a 225 cm3 a. Halle la desviación estándar y luego calcule el mínimo de líquido despachado en el 15 % de los vasos más llenos. b. Si se utilizan 12 vasos de 270 cm3 cada uno, ¿cuál es la probabilidad de que se derrame líquido en exactamente dos de ellos? Solución

= µ 250; s) X: Contenido de café → N( P( X < 225) = 0.0478

a. Halle la desviación estándar y luego calcule el mínimo de líquido despachado en el 15 % de los vasos más llenos.

Capítulo 4. Distribuciones de probabilidad

271

P(Z <

225 − 250 225 − 250 )= 0.0478; = −1.667; s = 14.99; s = 15 s s

P(Z >

k − 250 k − 250 ) =0.15; =1.036; k =265.54 15 15

Los resultados previos, obtenidos haciendo uso del software Minitab, son: Graph> Probability> Distribution Plot> view Probability> OK> Distribution Normal> Mean=0> Sdev=1> Shaded Area> X value> Left Tail =-1.667> OK

b. Si usamos 12 vasos de 270 cm3 cada uno, ¿cuál es la probabilidad de que se derrame líquido en exactamente dos de ellos? P( X > 270) = 0.09121 Haciendo uso del software Minitab, el procedimiento es el siguiente: Graph> Probability> Distribution Plot> view Probability> OK> Distribution Normal> Mean=250> Sdev=15> Shaded Area> X value> Right Tail=270> OK

272

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

X: Número de vasos que se derrame → B(n = 12; p = 0.09121) 12  P( X= 2= )   0.091212 (0.90879)10= 0.210991 2   

16. Los sueldos de los empleados de una empresa se consideran una variable aleatoria X que sigue una distribución normal con media igual a 2400 soles. El 97.72 % de empleados tiene sueldos inferiores a 3360 soles. De acuerdo con los sueldos hay tres categorías: alta, intermedia y baja. Se sabe que los porcentajes de empleados en las categorías alta y baja son iguales y que el 82 % del personal pertenece a la categoría intermedia. a. Hallar el sueldo mínimo y el sueldo máximo de los empleados de la categoría intermedia b. ¿Qué porcentaje de empleados tienen sueldos que se diferencian del promedio en a lo más 250 soles? Solución a. Hallar el sueldo mínimo y el sueldo máximo de los empleados de la categoría intermedia. X: sueldos del personal (soles) X → N= (µ

2400 = ; s ?)

P( X < 3360) = 0.9772 Empleando la distribución normal estándar se tiene que:

= 2.00

3360 − 2400 = ⇒ s 480 s

Los porcentajes de empleados en las categorías alta y baja son iguales y deben de sumar 18 %, ya que complementan al 82 % del personal pertenece a la categoría intermedia. Como son porcentajes iguales, entonces cada categoría corresponde al 9 %. Se hallan los límites de sueldos en la categoría intermedia como sigue: Límite inferior: P( X < x1 ) = 0.09 , de donde resulta que: x1 = 1756.44 Límite superior: P( X < x2 ) = 0.91 , de donde resulta que: x2 = 3043.56 b. ¿Qué porcentaje de empleados tienen sueldos que se diferencian del promedio en a lo más 250 soles?

250) P( 2150 ≤ X ≤ = 2650) 0.698758 − 0.301241 Se pide: P( X − µ ≤= Por lo tanto, la probabilidad solicitada es: 0.397517

17. Una máquina produce rodamientos con un diámetro que es una variable normal de media 3.00 pulgadas y desviación estándar 0.01 pulgadas. Los rodamientos con diámetros mayores que 3.02 pulgadas o menores que 2.98 pulgadas no satisfacen las especificaciones de calidad.

Capítulo 4. Distribuciones de probabilidad

273

a. En cierto momento, la máquina produjo 38 rodamientos que no cumplían con las especificaciones. Determine el total de rodamientos producidos. b. Si de 10 000 rodamientos producidos por la máquina se escogen al azar y sin reposición 25 de ellos, ¿cuál es la probabilidad de que sólo 2 de ellos no cumplan con las especificaciones? Solución a. En cierto momento, la máquina produjo 38 rodamientos que no cumplían con las especificaciones. Determine el total de rodamientos producidos X: diámetro de rodamiento (en pulgadas). X → N (µ=

3; s=

0.01)

Los diámetros que cumplen con las especificaciones presentan un diámetro comprendido entre 2.98 y 3.02 Haciendo uso del software Minitab, el procedimiento es el siguiente: Graph> Probability> Distribution Plot> view Probability> OK> Distribution Normal> Mean=250> Sdev=15> Shaded Area> X value> Middle=2.98, 3.02> OK P( 2.98 ≤ X ≤ 3.02) = 0.9545

Los que no cumplen se encuentran comprendidos en 1 – 0.9545 = 0.0455 y representan los 38 rodamientos; el total de rodamientos es de: 0.0455x = 38; x = 835.16, es decir, equivalente a 836. b. Si de 10 000 rodamientos producidos por la máquina se escogen al azar y sin reposición 25 de ellos, ¿cuál es la probabilidad de que solo 2 de ellos no cumplan con las especificaciones? La probabilidad de que no cumplan es de 0.0455

= ; M 455 = ; n 25) X. Número de rodamientos → H ( N = 10 000

274

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

 455  9545      2  23     0.213086 = P( X= 2= ) 10 000     25   

18. La vida útil de dos tipos de máquinas industriales M y N se distribuyen en forma exponencial con media 9 años y de forma normal con media 8 y desviación estándar 1, respectivamente. a. ¿Cuál de las dos máquinas tiene mayor probabilidad de durar menos de 10 años? Sustente su respuesta. b. Si se selecciona 5 máquinas de tipo M solamente. ¿cuál es la probabilidad de que la quinta máquina seleccionada sea la primera que tenga una duración superior a 10 años? Solución X: vida útil de las máquinas; X M → Exp(b= 9); XN → N (µ= 8; s2= 1) a. ¿Cuál de las dos máquinas tiene mayor probabilidad de durar menos de 10 años?

P= ( X M < 10) 0.6708; P= ( XN < 10) 0.9772 La máquina N tiene mayor probabilidad de durar menos de 10 años. b. Si se selecciona 5 máquinas de tipo M solamente, ¿cuál es la probabilidad de que la quinta máquina seleccionada sea la primera que tenga una duración superior a 10 años? F: Máquina funciona más de 10 años

P( F= ) P( X M > 10= ) 0.3292

P( F1  = F2  F3  F4  F5 ) (= 0.6708)4 (0.3292) 0.06665

19. Un sistema de producción opera con tres máquinas (A, B, C) que funcionan de manera independiente. El tiempo que tarda en fallar cada una de ellas es una variable aleatoria X con distribución exponencial con una media de 100 horas. a. ¿La mediana del tiempo de funcionamiento de la máquina A es superior a su promedio? b. ¿Cuál es la probabilidad de que falle al menos una de las tres máquinas en las primeras 120 horas de operación? Solución a. ¿La mediana del tiempo de funcionamiento de la máquina A es superior a su promedio? Sea X: tiempo para la falla (horas)

X → Exp(b = 100)

E( X ) = 100

Capítulo 4. Distribuciones de probabilidad

275

P( X ≤ me ) = 0.50, de donde: me = 69.3

FALSO: ME < E( X ), distribución asimétrica sesgada a la derecha. b. ¿Cuál es la probabilidad de que falle al menos una de las tres máquinas en las primeras 120 horas de operación? Hallamos: p = P(falla) = P( X < 120) = 0.699; P(no falla) = 0.301 = 1= – (0.301)3 0.9727 P(al menos una máquina falle) = 1 – P(ninguna)

20. El tiempo que transcurre antes que una persona sea atendida en una ventanilla de un banco es una variable aleatoria que tiene una distribución exponencial con media de 5 minutos. ¿cuál es la probabilidad de que una persona sea atendida a lo más en dos minutos? Solución P( X ≤ 2) = 0.3297

21. Dos variables aleatorias independientes X e Y tienen distribución gamma con parámetros:

X → Γ= (a 100,= b 2); Y → Γ= (a 400,= b 2)

¿Cuál de ellas es más

asimétrica? Solución E( X ) = 100 × 2 = 200

E(Y ) = 400 × 2 = 800

2 2 V ( X= ) 100 × 2= 400 ⇒ = s 20; V (Y= ) 400 × 2= 1600 ⇒ = s 40

Me( X ) = P( X ≤ x0 ) = 0.5 ⇒ Me( X ) =199.334 Me(Y ) = P(Y ≤ y0 ) = 0.5 ⇒ Me(Y ) = 799.333

= C.A.( X )

3( 200 − 199.334) 3(800 − 799.333) = 0= .0999 C.A.(Y ) = 0.05 20 40

La distribución de X es más asimétrica que la de Y

22. El tiempo semanal X (en horas) durante el cual cierta máquina industrial no funciona tiene una distribución gamma con a =3 y b =2. a. Si una máquina no ha estado funcionando más de 5 horas, hallar la probabilidad de que su tiempo de no funcionamiento sea de a lo más 9 horas. Solución Si una máquina no ha estado funcionando más de 5 horas, hallar la probabilidad de que su tiempo de no funcionamiento sea de a lo más 9 horas.

276

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

X: tiempo que la máquina no funciona (está parada). X → Γ(a= 3; b= 2) P(5 < X ≤ 9) 0.370 P( X ≤ 9 / X > 5) = = = 0.680147 P( X > 5) 0.544

b. La pérdida, en dólares, para la operación industrial debido al no funcionamiento de la máquina, está dada por:= L 30X + 2X 2 . Calcule el valor esperado de L. Solución Paso previo:

E( X )= 6, V ( X )= 3 × 22 = 12 , luego: E( X 2= ) 12 + 62 = 48 De ahí que:

276 dólares = E( L) E(30X + 2X 2 ) = 30 × E( X ) + 2 × E( X 2 ) =30 × 6 + 2 × 48 =

23. Considere que el tiempo de supervivencia de un animal expuesto a una droga sigue una distribución gamma con a= 5 : b= 10 (horas). Determine la probabilidad de que el animal sobreviva a lo más 20 horas: Solución

P ( X ≤ 20) = 0.05265

24. Suponga que la vida útil de cierto producto es una variable aleatoria que tiene distribución de Weibull con = a 0.6 = y b 4 (cientos de horas): a. La vida media útil de ese artículo. Solución La vida media útil de ese producto:  1 E( X ) = b Γ 1 +  = 4Γ( 2.67) = 4 × 1.50851 = 6.03 a 

b. La variación de la vida útil. Solución 2   2    1     V ( X ) =b2 Γ 1 +  −  Γ 1 +    =16[Γ( 4.33) − (Γ( 2.67))2 ] =16 × 6.94347 =111.095 a    a     

c. La probabilidad de que el elemento dure más de 500 horas. Solución P( X > 500) = 0.3188

Haciendo uso del software Minitab, el procedimiento es el siguiente: Graph> Probability> Distribution Plot> view Probability> OK> Distribution Weibull> Shape=0.6> Scale=4> Shaded Area> X value> Right Tail=5> OK

Capítulo 4. Distribuciones de probabilidad

277

25. La duración de un radio eléctrico tiene una distribución de Weibull con a =2 y b =4 (miles de horas).

a. ¿Cuál es la probabilidad de que un radio dure más 9000 horas? b. ¿Cuál es la probabilidad de que un radio dure menos de 4500 horas? c. ¿Cuál es la probabilidad de que un radio dure entre 3500 y 8000 horas? Solución a. ¿Cuál es la probabilidad de que un radio dure más 9000 horas? P( X > 9) = 0.006330 b. ¿Cuál es la probabilidad de que un radio dure menos de 4500 horas? P( X < 4.5) = 0.7179 c. ¿Cuál es la probabilidad de que un radio dure entre 3500 y 8000 horas? P(3.5 < X < 8.) = 0.4467

26. El tiempo de falla de un producto electrónico sigue una distribución de Weibull con= a 0.6;= b 5 (en miles de horas). Determine la probabilidad de que el tiempo de falla del producto electrónico sea como mínimo de 3000 horas. Solución P( X ≥ 3) = 0.4790

27. Si las variables X e Y son independientes con distribuciones ji-cuadrado de 12 y 8 grados de libertad respectivamente, se pide: a. Hallar el valor de k tal que: P[18.5 < ( X + Y ) < k ] = 0.355 Solución Por propiedad, se tiene que: ( X + Y ) → χ(220) ; luego:

P[18.5 < χ(220) < k ] =0.355

278

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

Haciendo uso del software Minitab, el procedimiento es el siguiente: Graph> Probability Distribution Plot> view Probability> OK> Distribution> Chi-cuadrada> Degrees of freedom=20> Shaded Area> Left Right => X value=18.5> OK

0.4455 + 0.355 = 0.8. Hay que calcular P(χ 220 > K ) = 0.2

K= χ(220;8) = 25.0 Y  b. Calcular: P  < 0.8 X  Y   Y /8  12Y 12  P  < 0.8= P  < 0.8 = P  < (0.8)  = P  F(8 ;12) < 1.2 = 0.626   X X / 12 8 X 8      

28. Las variables aleatorias X, Y y Z son independientes con distribuciones: X → χ(230) , Y → χ(220) , Z → N (0 ,1) . Calcular lo siguiente:

a. Los límites del 90 % central de la distribución de X

Capítulo 4. Distribuciones de probabilidad

279

Solución Haciendo uso del software Minitab, el procedimiento es el siguiente: Graph> Probability> Distribution Plot> view Probability> OK> Distribution Chi-cuadrada> Degrees of freedom =30> Shaded Area> Middle > Probability 1 =0.05> Probability 2=0.05> OK

P( a < X < b) = 0.9; a = límite inferior; b = límite superior; a = 18.49; b = 43.77

b. El valor de k tal que P(| Z | > k ) = 0.08 Solución Haciendo uso del software Minitab, el procedimiento es el siguiente: Graph> Probability> Distribution Plot> view Probability> OK> Distribution Normal> Media=0> Desv Est =1> Shaded Area> Both Tail> Probability=0.08> OK El valor de K es 1.751

280

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

 Y / 20  < 2.1 c. P  0.45 < X / 30   Solución Haciendo uso del software Minitab, el procedimiento es el siguiente: Graph> Probability> Distribution Plot> view Probability> OK> Distribution F> Numerator df=20> Denominator df=30> Shaded Area> Middle> X value 1=0.45> X value 2= 2.1> OK. La probabilidad es de 0.9348

d. El valor de c tal que: P(c < X + Y < 65) = 0.8715 Solución Haciendo uso del software Minitab, el procedimiento es el siguiente: Graph> Probability> Distribution Plot> view Probability> OK> Distribution Chi-cuadrada> Degrees df=50> Shaded Area> Right Tail> X value=65> OK

0.07536 + 0.8715 = 0.94686 P( X + Y > C ) = 0.94686

Capítulo 4. Distribuciones de probabilidad

281

Para calcular el valor de C se utiliza el software Minitab con el siguiente procedimiento: Graph> Probability> Distribution Plot> view Probability> OK> Distribution Chi-cuadrada> Degrees df =50> Shaded Area> Right Tail> Probability=0.94686> OK

El valor de c = 35

5. Problemas propuestos 1. Para cierto negocio por correo electrónico, la proporción de los pedidos procesados por día tiene la siguiente función de densidad de probabilidad.

2(1 − x) , 0 ≤ x ≤ 1 f ( x) =  c.c.  0 , ¿Cuál es la probabilidad de observar, en una semana de seis días laborables, más de dos días en los que la proporción de pedidos procesados sea menor al 80 %? Asumir independencia de ser necesario.

2

282

La empresa National Oil Company se dedica a operaciones de perforación exploratoria en el sureste de los Estados Unidos. Para financiar su funcionamiento, los inversionistas forman sociedades que proporcionan financiamiento para perforar una cantidad fija de pozos petroleros. La experiencia en este tipo de exploraciones indica que el 15 % de los pozos perforados fueron productivos. Una sociedad recién formada proporciona el financiamiento para realizar perforaciones exploratorias en 12 lugares. Para hacer rentable la sociedad, por lo menos tres de los pozos de exploración deben ser productivos. ¿Cuál es la probabilidad que el negocio sea rentable?

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

3. La función de distribución acumulativa de una variable aleatoria X está dada por: 0 ,  3 1  x F( x= ) P( X ≤ x= )  + ,  128 2 , 1 

x<− 4 −4 < x < 4 x>4

Si se realizan 6 observaciones independientes de la variable X, hallar la probabilidad de que en sólo una de ellas X tome valores negativos.

4. La producción de artículos de una empresa, presenta las siguientes carac­ terísticas: • El 85 % de los artículos son buenos. • El 10 % de los artículos son para reprocesar. • El 5 % de los artículos son para desechar. La empresa realiza el control de calidad de la producción en forma periódica, seleccionando un grupo de artículos cada vez. a. ¿Cuál es la probabilidad de encontrar 3 artículos para desechar cuando se inspeccionan 5 artículos en forma independiente? b. ¿Cuál es la probabilidad de encontrar menos de 2 artículos calificados como no buenos cuando se inspeccionan 10 artículos de manera independiente? c. El costo de producción de cada artículo bueno es de 1.5 soles y de cada artículo no bueno es de 2.10 soles. Determine el costo esperado si la producción es de 3000 artículos.

5. Una compañía alquila equipos de sonido. Un equipo de este tipo se puede descomponer durante un mes independientemente de otros meses y con probabilidad 0.2. La compañía alquilará un equipo para ser usado durante 20 meses. Cada mes le generará una utilidad de 1000 soles (así se descomponga el equipo); además, cada mes en donde se descomponga el equipo le significará un gasto de 500 soles por reparación. a. Identifique el modelo probabilístico que describe a la variable, X, definida como el número de meses (entre los 20) en los que el equipo se descompondrá. Incluya los valores de los parámetros. b. Calcule la probabilidad de que el equipo se descomponga en más de dos, pero menos de 6 meses. c. Determine la utilidad esperada de la compañía. d. La compañía desea ganar, por lo menos, 18 500 soles. ¿Cuál es la probabilidad de que esto ocurra?

Capítulo 4. Distribuciones de probabilidad

283

6. El gerente de Recursos Humanos de Perú Data S. A afirma que la planilla del área de sistemas la constituyen 200 trabajadores de los cuales el 60 % son titulados y el resto son bachilleres. De los titulados, el 65 % es especialista en software y de los bachilleres, el 25 % es especialista en hardware. Software (S)

Hardware (H)

Total

Titulado (T)

78

42

120

Bachiller (B)

60

20

80

Total

138

62

200

Si el jefe del área decide elegir al azar cinco personas del total de trabajadores para encargarles una tarea dada la complejidad de esta, y define la variable aleatoria X “número de trabajadores titulados en la muestra”, ¿cuál es la probabilidad de que por lo menos 3 sean titulados?

7.

Un profesor ha elaborado 30 exámenes, de los cuales 8 tienen preguntas “difíciles”, 12 tienen preguntas “moderadas” y 10 tienen preguntas “fáciles”. Los exámenes se mezclan y el profesor elige al azar 4 de ellos y los toma en 4 secciones de un curso que está enseñando. a. Hallar la probabilidad de que ninguna sección reciba un examen difícil. b. ¿Cuál es la probabilidad de que exactamente una sección reciba un examen fácil? c. Sea X el número de secciones que no reciben un examen difícil, calcule E(X)

8. Una persona que viaja de Bolivia a EE UU con la finalidad de llevar droga y para que en la aduana no lo descubran, considera llevar bolsitas de té. Ha colocado en 8 de ellas la droga de un total de 50 sobres. El oficial de la aduana selecciona 3 sobres de té aleatoriamente para analizarlas. a. ¿Cuál es la probabilidad de que el viajero sea arrestado por posesión de narcóticos? b. ¿Cuál es la probabilidad de que no sea arrestado?

9. Un hostal alberga personas con distintas nacionalidades: 5 de Japón, 8 de EE UU, 6 de Reino Unido y 2 de Alemania. Al elegir a 3 turistas sin reemplazo determine la probabilidad de que: a. Un turista sea de Alemania. b. Por lo menos un turista sea de Japón. c. A lo más uno de ellos sea de EE UU.

10. De un grupo de obreros, 15 se clasifican con conocimientos excelentes, 10 con conocimientos regulares y 35 con conocimientos básicos. Se elige una muestra de 4 obreros.

284

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

a. Determine la probabilidad de que a lo más 2 de ellos tengan conocimientos básicos. b. Cuál es la probabilidad que por lo menos uno de ellos tenga conocimientos excelentes.

11. En un salón de clase de ingeniería se tienen 20 hombres y 13 mujeres. Se elige al azar y sin reposición una muestra de 4 alumnos para que formen una comisión. Determine la probabilidad de que ocurra lo siguiente. a. En la comisión se incluya 2 hombres. b. En la comisión se incluya por lo menos 2 mujeres.

12. En una clínica atienden en promedio a 6 personas en treinta minutos. a. Hallar la probabilidad de que en 10 minutos atiendan a 4 personas. b. Hallar la probabilidad de que en un cuarto de hora atiendan a más de 2 personas, pero no menos de 4 personas.

13. En una caja rápida de un supermercado llegan 3 personas en 30 segundos para ser atendidas. a. En un minuto dado, ¿cuál es la probabilidad de que lleguen exactamente 5 personas? b. Determine la probabilidad de que por lo menos lleguen 10 personas en un minuto.

14. Uno de los procesos de las lunas de los lentes de medida es el pulido. Una óptica indica que, si encontrara más de 3 defectos por cm2, los considera defectuosos y rechazará la entrega. Además, se sabe que el promedio del número defectos es de un defecto por cm2. Hallar la probabilidad de que un lente de 3 cm2 que ha sido revisado no se catalogue como defectuoso.

15. La tasa de muertes por accidente de tránsito es de 3.6 por cada 10 000 personas. Suponga que la distribución de muertes sigue una distribución de Poisson. a. Determine la probabilidad de que ocurran dos accidentes en 12 000 personas. b. Determine la probabilidad de que ocurran a lo más 3 accidentes en una población de 10 000 personas.

16. Una institución financiera está realizando una investigación acerca del número de cheques sin fondos. Se sabe que diariamente se presentan 5 cheques sin fondos.

Capítulo 4. Distribuciones de probabilidad

285

a. Determinar la probabilidad de que se reciba 4 cheques sin fondos en un día. b. Determinar la probabilidad de que a lo más se reciba 3 cheques sin fondos en un día.

17. El número de defectos superficiales en paneles de plástico utilizados en el interior de automóviles se considera una variable aleatoria con distribución de Poisson con un promedio de 0.5 defectos por pie cuadrado. Suponga que el interior de un automóvil tiene 8 pies cuadrados de este material. a. Hallar la probabilidad de que no haya defectos en el interior de un automóvil. b. Si en un automóvil se ha encontrado más de dos defectos, ¿cuál es la probabilidad de que se haya encontrado exactamente 4 defectos?

18. Una planta produce tornillos cuyo diámetro se distribuye uniformemente con media de 0.498 cm y desviación estándar de 0.002 cm. Se consideran aceptables los tornillos con diámetros en el intervalo 0.498 cm ± 0.003 cm. a. ¿Qué porcentaje de la producción resulta inaceptable? b. Considerando independientemente la calidad de cada tornillo, hallar la pro­babilidad de que el quinto tornillo producido sea el primero inaceptable.

19. Una empresa tiene 2 tiendas en diferentes zonas de Lima. En la tienda 1, las ventas diarias siguen una distribución uniforme siendo el monto mínimo 300 soles y el máximo 900 soles; en la tienda 2, las ventas se distribuyen en forma normal de valor medio 620 soles y en el 97.72 % de los días las ventas no superan los 980 soles. a. En la tienda 1, hallar el monto mínimo observado en el 25 % de los días considerados los de mayor venta. b. En la tienda 2, ¿cuál es la probabilidad de que el monto de la venta de un día se diferencie del promedio en a lo más 80 soles? c. ¿En cuál de las dos tiendas las ventas diarias presentan mayor homo­ geneidad?

20. La venta promedio de carne de res en un supermercado es de 300 soles y la venta mínima es de 200. a. Determine la venta máxima. b. Halle el porcentaje de días en los que las ventas exceden los 250 soles.

21. Suponga que la cantidad de líquido que expenden las máquinas de café en vasitos sigue una distribución uniforme en el intervalo de [125, b ].

286

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

a. Obtener el valor de b si se sabe P( X ≤ 129 = 0.1) b. ¿Cuál es el promedio de líquido que despacha la maquina por vasito (mm)? c. ¿Cuál es la probabilidad de que la máquina despache más de 140 (mm) si se sabe que hay más de 135 (mm) de café?

22. En un centro de investigación sobre el tiempo, considere que las mediciones se distribuyen en forma uniforme en el siguiente intervalo [1, 5 ] a. Determine la probabilidad de que la medición se encuentre 1.5 ≤ X ≤ 3. b. Determine la varianza de X. c. Un investigador del centro ha realizado 7 mediciones independientes, determine la probabilidad de que a lo más 2 de ellas estén entre 2.5 y 3.5.

23. Una empresa cuenta con una máquina y se define como X la variable aleatoria consistente en el número de horas que la máquina esta parada debido a una avería. X sigue una distribución triangular, y por experiencias se sabe que el mínimo es de 1 hora, el máximo es de 4 horas y en la mayoría de casos es de hora y media: a. Determine la función de densidad. b. Determine la función de probabilidad acumulada.

24. Se sabe que la duración de los proyectos en una empresa sigue una distribución triangular con una duración optimista de 24 horas, una duración pesimista de 120 horas y una habitual de 32 horas. a. Determine la probabilidad de que un nuevo proyecto dure por lo menos 35 horas. b. Calcule la esperanza de finalizar de un proyecto.

25. Un informe de una compañía de mantenimiento de equipos de aire acondicionado señala que el tiempo de duración de un servicio sigue una distribución normal con media 60 minutos y el 10.6 % de los servicios tiene una duración superior a 75 minutos. a. Hallar la desviación estándar y luego calcular la probabilidad de que la duración de un servicio se diferencie de la media en más de 20 minutos. b. Un operario de la compañía está programado para atender tres servicios en una mañana. Se supone que los tiempos incurridos en cada uno de estos servicios son independientes. Calcular la probabilidad de que al menos uno de ellos dure más de 70 minutos.

26. La duración de un proceso textil de fabricación de prendas es una variable aleatoria con distribución normal. El jefe de planta indica que en el 56.6 %

Capítulo 4. Distribuciones de probabilidad

287

de las veces, la duración es menor a 50 minutos y el 74.8 % de las veces dura más de 40 minutos. a. Halle la duración promedio y su desviación estándar. b. Si en un proceso alterno la duración es una variable con distribución uniforme de valor mínimo 40 minutos y promedio 55 minutos, ¿cuál de los dos procesos es más homogéneo en su duración?

27. En una tienda comercial las ventas diarias de dispositivos externos para computadores tienen una distribución normal con una media de 190 miles de soles y una desviación estándar de 20 miles de soles. Si se eligen al azar 10 días, halle la probabilidad que en exactamente cinco de ellos se registre una venta que sea inferior a 210 mil soles.

28. Los puntajes obtenidos por los empleadores de una empresa en una prueba de aptitudes tienen una distribución normal con media de 75 y desviación estándar de 10, respectivamente. Se desea hacer una modificación de modo que los nuevos puntajes (Y ) se expresan mediante Y= A + BX. Hallar A y B de modo que, con la modificación, la media y desviación estándar sean 80 y 8, respectivamente.

29. Los pesos de bolsas de detergente producidos por una fábrica se distribuyen en forma normal con media de 500 gramos y solo el 15.87 % de bolsas tienen pesos superiores a 525 gramos. a. Si se desechan un 4 % de bolsas (las de menor peso), ¿cuál es el peso mínimo de una bolsa no desechable? b. Una bolsa de detergente se considera aceptada si su peso se diferencia de la media en a lo más 30 gramos. Si un paquete de 6 bolsas contiene por lo menos 4 bolsas aceptables, se vende con una utilidad de 30 soles; si no contiene bolsas aceptables, entonces se pierde 8 soles y en otros casos la utilidad es de 25 soles. Calcule la utilidad esperada por paquete.

30. El precio de venta, en soles, de un producto en la zona A es una variable aleatoria con distribución normal con media 30 y la probabilidad de que sea inferior a 25 soles es 0.1056. En la zona B, el precio de venta tiene distribución uniforme siendo el valor mínimo 20 soles y el máximo 40 soles. a. ¿En cuál de las dos zonas los precios son más homogéneos? b. ¿Cuál es la probabilidad de que sólo en una de las dos zonas el precio se diferencie de su promedio en a lo más 5 soles? Considerar independencia entre zonas.

31. El tiempo que necesita una persona que está en ventanilla de un banco para atender a un cliente tiene una distribución exponencial con promedio de 50 segundos.

288

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

a. ¿Cuál es la probabilidad de que el tiempo necesario para atender un cliente dado sea mayor que un minuto? b. ¿Cuál es la probabilidad de que el tiempo necesario para atender a un cliente esté comprendido entre 1 y 3 minutos?

32. En una institución financiera, el tiempo de espera de sus clientes para ser atendido sigue una distribución exponencial y que en promedio es de 12 minutos. Calcular la probabilidad de que el tiempo de espera sea: a. A lo más 8 minutos. b. Entre 6 y 9 minutos.

33. El componente de un aparato de televisión dura en promedio 1200 horas. Si la duración de la vida del componente sigue una distribución exponencial. a. Determine la probabilidad de que su vida sea superior a 800 horas. b. Determine la probabilidad a lo más de 1000 horas. c. ¿Cuál es la desviación estándar de su vida útil?

34. Se sabe que el número de vehículos que entran en una autopista es registrado por un contador electrónico y sigue una distribución de Poisson de promedio de 10 vehículos cada 5 minutos. a. ¿Cuál es la probabilidad de que en una hora entren a la autopista entre 100 y 120 vehículos, ambos inclusive? b. ¿Cuál es la probabilidad de que transcurran más de 25 segundos entre 2 llegadas sucesivas de vehículos a la autopista? c. En una autopista hay una garita de peaje y cada vehículo debe pagar 4 soles. Un empleado de la garita empezó su turno a las 9 am ¿a qué hora (cómo máximo) habrá recolectado 200 soles con probabilidad de 0.99?

35. La central telefónica de un hotel recibe un promedio de 8 llamadas en 5 minutos. Si el número de llamadas sigue una distribución de Poisson, responda: a. La dirección del hotel desea modernizar su central. Para que sea rentable, el gerente considera que la probabilidad de recibir al menos 100 llamadas en una hora debe ser superior a 0.25. ¿Deberá el gerente ordenar la modernización de la central? Justifique. b. Si el hotel acaba de recibir una llamada, hallar la probabilidad de que transcurran menos de 2 minutos para recibir la siguiente.

36. Si se sabe que el tiempo de sobrevivencias de las palomas que ingieren un tóxico es una variable aleatoria G(a= 4; b= 10 horas) ¿Cuál es la probabilidad de que una paloma no sobreviva más de 11 horas?

Capítulo 4. Distribuciones de probabilidad

289

37. Considere que cierta pieza se romperá después de sufrir dos ciclos de esfuerzo. Si estos ciclos ocurren de manera independiente a una frecuencia promedio de tres por cada 150 horas, obtenga la probabilidad de que el tiempo sea a lo más 120 horas que ocurre el segundo ciclo.

38. Considere que el tiempo de supervivencia, en años, de pacientes con diabetes y que son sometidos a una determinada intervención quirúrgica sigue una distribución gamma con parámetros a =0 , 85 y b =6, calcúlese: a. El tiempo promedio de supervivencia. b. Cuántos años sobrevivirá a partir de los cuales la probabilidad de supervivencia es mayor que 0.20.

39. Un componente digital falla 1 vez cada 6 horas. a. ¿Cuál es el tiempo medio que transcurre para que fallen dos componentes? b. ¿Cuál es la probabilidad de que transcurra por lo menos 5 horas antes que fallen los dos componentes?

40. Considere el tiempo de supervivencia de pacientes que son sometidos a quimioterapia (años) sigue una distribución gamma con parámetros = a 0.9 = y b 7.5 a. Determine el tiempo promedio de supervivencia de un paciente con quimioterapia. b. Determine la cantidad de años a partir de los cuales la probabilidad de supervivencia sea menor a 0.08

41. El tiempo (en horas) que una máquina trabaja sin fallas es una variable a 2 y= b 400. aleatoria con distribución de Weibull de parámetros=

a. ¿Cuál es el tiempo máximo de trabajo sin fallas de la máquina observado con una probabilidad de 0.975? b. ¿Cuál es la probabilidad de que el tiempo de trabajo sin fallas de la máquina supere a su valor medio?

42. Un componente electrónico tiene un tiempo de vida (en horas) que se puede representar con una distribución de Weibull con a =1. Además, se conoce que el 10 % de los componentes producidos tiene una duración superior a 230.26 horas. ¿Cuál es la duración mínima del 5 % de componentes considerados los de mayor duración?

43. Las variables X, Y, V, W son independientes con distribuciones: X → N (= µ 25; = s 8); Y → χ(220) ; V → t(12) , W → χ(210) Hallar:

290

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

a. El valor de k, tal que: P(18.5 < W + Y < K ) = 0.85  W / 10  b. P  0.85 < < 3.10  Y / 20  

 X − 25    8 c. P  ≤ 1.90   Y / 20 

d. Los valores de a y b tal que: e. a y b son limites centrados

Miscelánea de problemas

44. En una computadora con arquitectura en paralelo, los mensajes que llegan a un nodo son almacenados en un buffer antes de ser transmitidos por red, hasta que se dispone de un paquete de cinco. Supongamos que los mensajes llegan al nodo de acuerdo con un proceso de Poisson de media 25 mensajes por segundo. a. Hallar la probabilidad de que en 0.5 segundos lleguen menos de 12 mensajes. b. Calcular la probabilidad de formar un paquete en menos de 0.1 segundos. c. ¿En cuántos segundos como máximo se formará un paquete con una probabilidad de 0.96? d. Calcular el tiempo medio para formar un paquete.

45. En un banco entran 90 clientes por hora, se supone que el número de clientes que llega al banco sigue una distribución de Poisson. a. ¿Cuál es la probabilidad de que en un intervalo de dos minutos lleguen al banco por lo menos 2 clientes? b. Hallar la probabilidad de que en diez minutos determinado lleguen menos de 18 clientes. c. ¿Cuántos minutos transcurrirán como máximo para observar la llegada de 25 clientes con una probabilidad de 0.90?

46. Se ha encontrado que los préstamos para vivienda otorgados por un Banco a través de sus diferentes sucursales el año pasado tienen una distribución aproximadamente normal con media 43 000 dólares y sólo un 2.28 % son superiores a 60 000 dólares. Si las condiciones de préstamo continúan para el siguiente año:

Capítulo 4. Distribuciones de probabilidad

291

a. Hallar la desviación estándar b. Si 4 de cada 5 préstamos son por montos no mayores a un valor k, halle el valor de k. c. ¿Qué porcentaje de préstamos se espera que estén entre 30 000 dólares y 45 000 dólares? d. Si de la base de datos del banco se eligen al azar y de manera independiente los préstamos para vivienda de 20 clientes, hallar la probabilidad de que no más de 7 de ellos sean superiores a 50 000 dólares.

47. En un laboratorio de pruebas, el error al medir la temperatura (en ºC) es una variable aleatoria X con función de densidad de probabilidad:

f= ( x) k x 2 ,

− 1< x ≤ 2

a. Halle el valor de k y construya la función de distribución acumulada de X. Calcule P( X > 1.0) b. Si se hacen 50 mediciones independientes de la temperatura, ¿en cuántas de ellas se espera un error de medición no mayor a 1.25?

48. Si las variables aleatorias X, Y, Z y W, son independientes y se dis­tribuyen como:

X → χ(15) Y → χ(210) ; W → t(10) 2

Z → N (0 ,1)

Hallar:

0.9, donde U= X + Y a. K, si P [ U > k ] = b. P[(W > 1.372)  (Z < 0.6745)] c. P(0.3515 <

Y / 10 < k) = 0.80 X / 15

49. El número medio de accesos al Aula Virtual de la universidad es de uno cada 15 segundos. a. Determine el intervalo de tiempo necesario para que la probabilidad de que no haya acceso alguno al Aula Virtual en ese lapso sea de 0.5. b. Si se observan dos intervalos de tiempo, uno de 10:00 a 10:01 a. m. y el otro de 6:30 a 6:31 p. m., ¿cuál es la probabilidad de que en solo uno de dichos intervalos el número de accesos al Aula Virtual sea no menor a 6? c. Si un acceso al Aula Virtual fue a las 11:00 a. m., ¿cuál es la probabilidad de que transcurra más 10 segundos para que ocurra el siguiente acceso? d. ¿Cuál es la probabilidad de que transcurran más de dos minutos hasta que ocurra el quinto acceso al Aula Virtual?

292

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

50. Suponga que la compra mensual de un dispositivo para la reparación de computadoras en la empresa A se distribuye normalmente. En el 84.13 % de los meses se compró por un valor menor o igual a treinta mil soles y en el 97.72 % de los meses se compró por una cantidad mayor o igual a quince mil soles. a. Halle la media, desviación estándar y coeficiente de variación de la distribución de compras mensuales. b. Suponga que en la empresa B la compra mensual por el mismo concepto tiene distribución uniforme con media igual a 25 mil soles y sólo en el 10 % de los meses las compras superaron los 33 mil soles. ¿Cuál de las dos empresas es más homogénea en sus compras?

51. La cantidad de horas semanales que los operadores de una empresa informática dedican a cargar ciertos datos se distribuye normalmente con media 4 y la probabilidad de que necesiten a lo más 4.75 horas es de 0.9332. a. Hallar la desviación estándar y calcular la probabilidad de que la cantidad de horas semanales dedicadas a cargar dichos datos esté comprendida entre 3 y 4.5 horas. b. ¿Cuál es la cantidad de horas semanales mínima que dedican el 30 % de los operadores que más horas semanales dedican a cargar datos? c. Si se observan los tiempos de 6 operadores elegidos al azar, ¿cuál es la probabilidad de que a lo más uno de ellos haya empleado menos de 3.5 horas en esta tarea?

52. Las variables aleatorias X, Y y Z son independientes con distribuciones X →χ(230) , Y →χ(220) , Z → N (0 ,1) . Calcular lo siguiente: a. Los límites del 90% central de la distribución de X

0.08 b. El valor de k tal que P ( Z > k ) =

c. El valor de c tal que: P(c < X + Y < 65) = 0.8715

53. En base a los registros obtenidos por los atletas pertenecientes a la federación de atletismo de un país A, se ha establecido que los tiempos que emplean para los 100 metros planos siguen una distribución normal con una media de 12.0 segundos y una desviación estándar de 1.5 segundos. a. Hallar la probabilidad de que un atleta emplee un tiempo que se diferencie de la media en no más de 0.5 segundos. b. Si se establece como criterio que, para clasificar al campeonato internacional, el atleta debe realizar la prueba 4 veces y en por lo menos 3 de ellas debe registrar como máximo un tiempo de 11.5 segundos, calcule la probabilidad que un atleta cualquiera lo logre.

Capítulo 4. Distribuciones de probabilidad

293

c. En un país B, el tiempo que sus atletas emplean para los 100 metros planos también tiene distribución normal con desviación estándar 1.5 segundos y se sabe que el 34.46 % de atletas cumplió con el tiempo máximo de 11.5 segundos. En promedio, ¿en cuál de los dos países los atletas son más rápidos al correr los 100 metros planos? Justifique numéricamente.

54. Cercano el mes de diciembre, las tiendas por departamento se encuentran en plena campaña navideña. ROPÓN S. A. se ha relanzado al mercado limeño después de 25 años y pretende competir con otras dos grandes tiendas por departamentos. En tal sentido ROPÓN S. A. pretende impulsar los beneficios de su tarjeta de crédito OHHROPON. Su división de crédito ha conseguido una base de datos de clientes solicitantes de crédito para los cuales su principal preocupación es su capacidad crediticia en función del monto solicitado como compras al crédito. La función de distribución acumulada es la siguiente: 0 , x<0  = F( x) 0.2 x , 0 ≤ x < 5 1 , x≥5 

Donde x viene expresada en miles de soles. a. De entre las distribuciones especiales estudiadas en clase, indique el nombre de la distribución de probabilidad de X con su o sus parámetros. b. El gerente decide confiar en su equipo de expertos y le solicita un informe conteniendo lo siguiente: Si a los clientes que solicitan préstamos entre 500 y 3500 soles se les dará como obsequio una entrada al cine con acompañante, ¿qué porcentaje de clientes resultará beneficiado? c. ¿Cuánto se espera recibir (en promedio) como solicitud de crédito por cliente? d. La atención en ROPÓN S. A. se congestiona grandemente y se considera que por hora se atienden, en promedio, 100 solicitudes de crédito. Determine la probabilidad de que en un tiempo máximo de 9.5 horas se atiendan 1000 solicitudes.

55. Beta Gas es una empresa repartidora a domicilio de gas propano, que recibe los pedidos por teléfono. En este marco responda las siguientes preguntas: a. En un lote de 36 balones recibidos de la empresa distribuidora, 4 de ellos tienen un defecto no apreciable a simple vista en la válvula de salida, pero que se evidencia al cabo de un periodo corto de funcionamiento. De éste lote se han entregado 10 balones elegidos al azar. La política de Beta Gas establece el inmediato cambio de balón por otro bueno, esta última operación le cuesta 6 soles. Calcular la probabilidad de que, tras la entrega de los 10 balones, la empresa tenga que gastar por lo menos 12 soles.

294

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

b. Se ha podido establecer que en promedio se reciben 2 pedidos cada 7 minutos b.1 Calcular la probabilidad de que en los próximos 35 minutos se reciban cuando menos 15 pedidos. b.2 Se acaba de recibir un pedido, hallar la probabilidad de que transcurra más de 4 minutos para recibir para recibir otro pedido. b.3 ¿Cuál es la probabilidad de que se reciban 4 pedidos en menos de 16 minutos? Escenario c. El contenido de gas en los balones de 10 kg es una variable aleatoria que se distribuye normalmente con media 10 kg y desviación estándar 0.2 kg. Si se eligen al azar 8 de estos balones, halle la probabilidad de que 4 de ellos contengan más de 9.9 kg.

56. Resuelva lo que se pide: a. Las variables aleatorias X, Y y Z son independientes con distribuciones:

X → χ(220) ; Y → χ(216) ; Z → N (0,1). Hallar: a.1) P ( Z >1.6445 ) a.2) k, tal que: P( k ≤ X + Y ≤ 48.5) = 0.4029  20Y  a.3) P 0.355 < < 2.666  16X  

0.4254 a.4) b tal que: P [ 0.245 < Z 2 < b ] =

57. El número de ventas que puede hacer un agente en un día al visitar a n potenciales clientes es una variable aleatoria con distribución binomial con media 8 y varianza 4.8. Si por cada venta el agente obtiene una ganancia de 35 soles, ¿cuál es la probabilidad de que su ganancia de un día sea de por lo menos 420 soles?

58. El número de departamentos para vivienda vendidos por una inmobiliaria diariamente en una zona de Lima tiene una distribución de Poisson de media igual a 3. a. Hallar la probabilidad de que el número de departamentos vendidos en un día cualquiera en esa zona sea superior a 4. b. El horario de atención diaria en la empresa es de 12 horas, se acaba de vender un departamento, hallar la probabilidad de que transcurran más de 5 horas para que se pueda vender otro. c. ¿Cuántas horas, como mínimo, se tendrá que esperar para que se puedan vender 5 departamentos con una probabilidad de 0.15?

Capítulo 4. Distribuciones de probabilidad

295

59. El peso de los melones que comercializa una tienda de frutas sigue una distribución normal de media de 2 kg y desviación estándar de 500 g. Los melones inferiores a 1,9 kg no se comercializan y se envían a la fábrica de conservas. Si los melones vienen en cajas de 10: a. Hallar la probabilidad de que un melón elegido al azar no sea enviado a la fábrica de conservas. b. Calcular la probabilidad de que la caja entera vaya a la fábrica de conservas. c. Hallar la probabilidad de que el cuarto melón revisado sea el primero enviado a la fábrica de conservas d. Si por melón correcto se recibe 4.50 soles y por cada uno que se envía a la conservera se recibe sólo 1.5 soles, calcular la cantidad que se espera recibir por cada caja.

60. Las especificaciones de un proceso de producción de rodamientos señalan que estos deben tener un centímetro de radio, con tolerancia de ± 0.05 centímetros. El fabricante gana 0.10 dólares por cada rodamiento aceptado. Si el radio es menor de lo permitido, el rodamiento se debe refundir, produciendo una pérdida de 0.05 dólares; por otra parte, si el radio es mayor de lo permitido se debe rebajar el rodamiento, con una pérdida de 0.03 dólares. Supongamos que el radio de los rodamientos tiene una distribución normal con medía 1.01 centímetros y una varianza de 0.0009 centímetros cuadrados. a. Si se fabrican 10 000 rodamientos, ¿cuántos de ellos se espera que cumplan las especificaciones? b. ¿Cuál es la ganancia esperada por rodamiento? c. ¿A cuánto se debería modificar la ganancia por cada rodamiento aceptado si se espera ganar 0,07 dólares por cada rodamiento? d. Si de un lote de 500 rodamientos se eligen al azar y sin reposición 12, ¿cuál es la probabilidad de que más de la mitad de los rodamientos elegidos cumplan con las especificaciones?

61. Los clientes de un banco que deben recibir un tratamiento especial llegan de acuerdo con un proceso de Poisson con un promedio de un cliente cada 20 minutos. a. ¿Cuál es la probabilidad de que en un período de media hora lleguen más de 2 clientes que deben recibir un tratamiento especial en el banco? b. A todo cliente que debe recibir un tratamiento especial se le entrega un premio; pero al empezar la jornada de trabajo el administrador se da cuenta que solo dispone de cinco de estos premios. En las primeras dos horas de atención, ¿esperaría el administrador agotar los premios?; ¿por qué?

296

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

c. ¿Cuál es la probabilidad de que transcurran más de 15 minutos para que llegue un cliente de tratamiento especial? d. ¿Cuál es la probabilidad de que pase más de una hora hasta la llegada del tercer cliente que deba recibir un tratamiento especial en el banco?

62. En cada uno de los siguientes enunciados no realice cálculos, solo indique la variable aleatoria, la distribución pertinente y los valores de los parámetros que corresponden. a. Una compañía de seguros atiende, en promedio, a un asegurado que ha sufrido un accidente automovilístico cada 30 minutos. Se desea conocer la probabilidad de que se atiendan una cierta cantidad de asegurados con accidentes automovilísticos en 2 horas. b. Un embarque de 100 artículos contiene 5 unidades defectuosas. Para inspección, se elegirá al azar y sin reemplazo 10 unidades. Si se encuentra una cierta cantidad de unidades defectuosas, se rechazará todo el embarque. Se desea conocer la probabilidad de rechazar el embarque.

63. Las variables; X, Y, V y W son independientes con distribuciones: X →χ(230) ; Y → t( 20) ; V → N (µ= 0 ; s2= 4) ; W →χ(215) . Hallar: a. Los valores de c y k tal que: P(c < X < k ) = 0.90, si P( X > k ) = 0.02  30W  b. P  0.4 ≤ ≤1.4  15X  



2  V  0.7298  +W ≤ b  = 2 

c. El valor de b tal que: P 7.962 ≤ 



1 − P( −2.5 ≤ t( 20) ≤ 2.5) = 0.0212 d. P(|Y |> 2.5) =

64. Los pedidos por delivery llegan a cierto supermercado (que atiende las 24 horas del día) según un proceso de Poisson. a. Si la probabilidad de que en una hora llegue por lo menos un pedido es 0.9817, ¿cuántos pedidos se espera que lleguen en 2 horas? b. Si en promedio llegan 4 pedidos por hora, halle la probabilidad de que el primer pedido demore en llegar más de 10 pero menos de 25 minutos. Debe definir una variable e identificar su modelo.

Capítulo 4. Distribuciones de probabilidad

297

Respuestas a los problemas propuestos

Capítulo 1. Estadística descriptiva 1.

Población / muestra / unidad de análisis / características / cualitativa ordinal / datos / cualitativa nominales / estadístico / parámetro / moda / cuartil 1.

2.

Presentación teatral / 180 presentaciones teatrales / 48 presentaciones teatrales.

3.

-

4.

a. 20

5.

a. 11.46 %

6.

a. - - -

7.

---

8.

a. 12 jóvenes b. 72.5 % c. 80 %

9.

a. S/ 600

b. 38.33 % b. 16.67 % c. 80 %

d. 35 %

b. [4500; 5100]

c. 5 familias d. 181 familias 10. a. 8 b.

- - -

c. 72 %

11. S/ 3849.08 12. Miraflores 13. –0.326 14. a. -----

b. 1.136 horas - -

15. a. Máquina B (151g)

b. No

c. –0.148 c. 3.0968 g

16. a. 96.5 kg b. Sí presenta (C.V. % = 10.89 %)

17. 115.21 segundos 18. a. No (coeficiente de variación ha disminuido) b. k = S/ 100 19. ii 20. a. i. De 30 a 40 años

ii. Q3 = 6 juegos/atracciones iii. 4.85 juegos/atracciones

b. i.

4 participantes



ii. US$ 6.53



iii. 1ra vez

c.

S/ 94.85

d.

i. Rango: De 30 a 40 años y bigote inferior:



S/ 78, bigote superior: S/ 153.

ii. De 18 a 30 años y de 40 años a más

Respuestas a los problemas propuestos

301

Capítulo 2. Probabilidad 1.

72 placas

2. a. 180

b. 105

c. 105

3.

a. 40320

b. 9216

c. 576

4.

a. 55

b. 165

5.

103 488

6. a. 9009

b. 8151

7. a. 125 b. 60 c. 60 d. 6 8. 0.5185 9.

a. 50 %

b. 0.4286 c. No

10. 0.9755 11. 0.00061035 12. a. 0.8

b. No

13. a. 0.40

b. 0.55

c. 0.40

14. a. 0.48

b. 0.41667

c. 0.19231

15. a. 0.34

b. 0.33

16. a. 0.06

b. 0.94

= P( A) 1= / 3, P( B) 1= / 2, P(C ) 1 / 2 17. 18. a. 0.1352

b. el método 2 (0.852)

19. a. 0.967

b. 0.2927

c. 0.98

20. a. 0.63375 b. fallas eléctricas (0.5461) 21. a. 0.7333

b. 0.5539

Capítulo 3. Variable aleatoria 1.

a. Discreta

b. Continua



d. Continua

e. Continua.



b. RX = {1, 2, 3, 3, 4, …}. En efecto:

c. Continua

2. a. Ω = {C, C C, C C C, C C C C, ... , }

= X (C ) 1;= X ( C C ) 2; = X ( C C C ) 3; X (C ) 1;= X ( C C ) 2; = X ( C C C ) 3; X= ( C C C C ) 4; ....;

Sea X = número de artículos buenos escogidos, entonces: X = {0 ,1, 2 , 3, 4 , 5} La función de probabilidad de X es:

3.

302

X= ( C C C C ) 4; ....;

x

0

P(X = x)

6/15504

1

2

210/15 504 1820/15 504

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

3

4

5

Total

5460/15 504

6006/15 504

2002/15 504

1

4. Sea, X = número de artículos de la marca A escogidos, entonces: X = {1, 2, 3}

La función de probabilidad de X es: X

1

2

3

Total

P(X = x)

0.2

0.5

0.3

1

5. Sea, X = número de hermanos elegidos para integar el proyecto, entonces, X = {0, 1, 2}

La función de probabilidad de X es: X

0

1

2

Total

P(X = x)

12/35

17/35

6/35

1

6. Sea, X= número de pruebas necesarias hasta encontrar el segundo defectuoso, entonces: X = {2, 3, 4, 5}

La función de probabilidad de X es: x

2

3

4

5

Total

P(X = x)

0.1

0.2

0.3

0.4

1

7. Sea, X = número de pedidos que se envían a tiempo, X = {0, 1, 2 , 3}

La función de probabilidad de X es: x

0

1

2

3

Total

P(X = x)

0.001

0.027

0.243

0.729

1

P( X= 3= ) 0.729 a. P( X= 0= ) 0.001 b. P( X ≥ 2) = 0.972 c. 8.

9.

Definamos la variable X = ganancia de la compañía por una póliza Entonces, la distribución de probabilidad de la variable X es:

x

p(x)

x × p(x)

–148 500 1 500

0.008 0.992

–1 188 1 488

Total

1

300

Definamos la variable X = ganancia al invertir 10 000 soles Entonces, la distribución de probabilidad de la variable X es: x

p(x)

x × p(x)

–10 000

0.15

–1 500

–5 000

0.35

–1 750

10 000

0.40

4 000

20 000

0.10

2 000

Total

1

2 750

Respuestas a los problemas propuestos

303

10. Estrategia 1



Estrategia 2

x

p(x)

x × p(x)

x

p

x × p(x)

20 000

0.2

4 000

100 000

0.5

50 000

30 000

0.4

12 000

0

0.5

0

50 000

0.4

20 000

Total

1

36 000

50 000

La segunda estrategia.

11. Continua

No continua

x

p(x)

x × p(x)

x

p

x × p(x)

1 000 000

0.4

400 000

–400 000

0.4

–160 000

– 600 000 Total

0.6 1

–360 000 40 000

100 000

0.6

60 000 –100 000

Continuar. 12. Definamos la variable X = ganancia de una póliza P: prima a pagar Entonces, la distribución de probabilidad de la variable X es:



x

p(x)

x × p(x)

P – 80 000

0.004

0.004P – 320

P – 40 000

0.007

0.007P – 280

P – 20 000

0.01

0.01P – 200

P Total

0.979 1

0.979P P – 800

Entonces 200 = P – 800, entonces P = 1000 dólares.

13. Sea X: sale el número elegido



G: ganancia del jugador

Total

X

0

1

2

3

4

G(X)

–3

1

2

3

5

P (x)

0,48148

0,38611

0,11611

0,01552

0,00078

1.0

E(G(X)) = –0.77565, no le conviene jugar.

14. Sea C = costo del proyecto



304

X

27

28

29

30

31

32

Total

P (x)

0,05

0,15

0,25

0,40

0,10

0,05

1.0

C(X)

1400

1600

1800

2000

2300

2600

E(X) = 1920 E(X2) = 3 759 000, V(X) = 72 600, s =269.444

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

15. Sea X: número de caramelos de sabor fresa, G: ganancia del jugador, P: pago por el derecho a jugar.



X

0

1

2

3

Total

P(x)

0,216

0,432

0,288

0,064

1.0

G

9

11

13

15

------

E(X) = 11.4 = P, entonces P = 11.4

E[ X ] x ≤ 75) 1625 = / 5050 0.3218 b.= 16. a. P(50 ≤=

338 350 = 67 5050

17. a. P ( 2.2 ≤ x ≤ 4.8) = 0.5055 b. P= ( x ≤ a) 0.9;= ⇒ a 5.692 c. = P( x ≤ a) 0.5;= ⇒ a 4.2426 E( X ) = 4; E( X 2 ) = 18

V ( X ) =18 − 42 = 2



E(U) = 18

2.8284 sU =



CV(U) = 15.7135 %.



P(U > 20 ) = 0.30555.



d. d.1

d.2

18.

 0 ,  3  x = , F( x)  a. 3  25  1, 

V(U) = 8

x≤0 0 < x < 5

b. P(10 ≤ x ≤ 20) = 0.448

x≥5

E( X ) = 18.75; E( X 2 ) = 375 c.

= E( X ) 18= .75, V ( X ) 375 = – 18.752 23.4375 = CV ( X ) 25.8198 %. , x ≤ −1  0  3  x +1 = F( x)  , − 1 < x < 2 b. 19. a. P( x < 0)= F(0)= 0.111  9 x≥2  1 , 

= E( X ) 0= .25; E( X 2 ) 0.4 c.

E( X ) = 0.25, V ( X ) = 0.4 − 0.252 = 0.3375 CV ( X ) = 232.379 %.

20. a. k =

1 2 10

P ( x < 6= )

0.6= 0.77459

b. P ( X ≤ 7 X > 3) = 0.6388

= E( X ) 3= .3333; E( X 2 ) 20 c.

E(X) = 3.333 V(X) = 20 – 3.3332 = 8.8911 CV(X) = 89.463 %.

d. P( x > µ = ) p( x > 3.333 = ) 0.42294 ⇒ 42.294 % 1 b 1 (1) 21. a. ∫ ( a + bx 2 ) dx = 1; ⇒ a + = 3 0



1

2 ∫ x( a + bx ) dx =

0

a b 3 3 ⇒ + = ( 2) 5 2 4 5

Respuestas a los problemas propuestos

305



Solucionando encontramos: a = 0.6

b = 1.2

b. P( x > 0.6) = 0.08 22. a. = f ( x)

dF( x) = dx

 0 , otro caso   2 ( 1 − x) , 0 < x < 1

b. P(0.1< x < 0.2) = 0.17

c. E( X ) = 0.333 23. a. P ( x ≤= a) 0.75; ⇒= a 3.1744 b. P ( x ≤ 0) = 0.5 P(solo una) = 5 × 0.55 = 0.15625 0.57812558 24. a. c = 3 × 2003 P ( t < 400 / t > 300 ) = b. P(t > 300) = 0.296 P(solo uno) = 5 × 0.296 × 0.7044 = 0.36354      25. A. F( x) =      

,

0

x3 − 1 , 20 13x 2 17 , − 100 100 , 1

x ≤1

 1 < x < 2 B. P  x < 2   = 0.30667 x > 1 . 5   2 ≤x<3 x≥ 3

 0 , x≤0 26. a. F( x) =  − x /10 , x>0 1 − e

b. P(6 ≤ x ≤ 18) = 0.383513

61 P( x > 5)= e –0.5= 0.6065; por lo tanto se espera que: 100 × 0.6065 = c. tengan una duración superior a 5 años. 27. Definamos: k = Número de horas para que vuelva a revisar el telar



La variable aleatoria es C = costo que se incurre porque se llega antes de que el telar se pare o después de haberse parado; entonces se tiene:  9( k − x) , C( x) =   3( x − k ) ,

x≤k x>k

Donde X es el tiempo de funcionamiento del telar y tiene por función de densidad de probabilidad:

1  , f ( x) =  30 0 , 

90 ≤ x ≤ 120 otro caso



E(C ) = 0.2k 2 − 39k + 1935



k = 97.5

28. E(Y) = 1190 CV(Y) = 27.92 %

306

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

29. a. k = 1.25



 0 , x≤ 0  5  x   = F( x) 1.25  x −  , 0 < x ≤ 1  5     , x≥1 1

P(0.3 ≤ x ≤ 0= .6) F(0.6) − F(0= .3) 0.3562 b. c. E(X) = 0.4167

V(X) = 0.23809 – 0.41672 = 0.06448, sX =0.25394

30. a. P(T > 10) = 1 – F(10) = 0.75

c. 0.32

b. E(T) = 11.6667

d. E(C) = 5 + 0.5 × E(T 2) = 5 + 0.5 × 141.6667 = 75.8333

31. a. P(Y > 11 000)= P( X ≥ 7)= 0.20 b.

Y

6 000

11 000

26 000

51 000

Total

P(y)

0.6

0.2

0.15

0.05

1

E(Y) = 12 250

E(Y 2) = 277 250 000

V(Y ) = 127 187 500 sX = 11 277.743

t≤ 2

0 ,   1 3 32. a. = F (t )  (t −8) , 117 ,  1

2
b. P(C < 140) = P(T < 3) = F(3) = 0.1624 c. P(T ≥ 4) = 1– F(4) = 1 – 0.4786 = 0.5214.

d. E(T) = 3.90385.

Capítulo 4: Distribuciones de probabilidad 1. 0.9999 2. 0.2642 3. 0.09375 4.

a. 0.001128 b. 0.5443

c. 4770 soles

5.

a) X → b(n = 20; p = 0.2)

b. 0.5981 c. 18 000 soles

d. 0.4114

6. 0.684321 7.

a. 0.2669

b. 0.415982

8.

a. 0.4143

b. 0.585714

9.

a. 0.257143

b. 0.5789

10. a. 0.5571

b. 0.6945

a. 0.36217

b. 0.5194

11.

c. 2.93 c. 0.6842

12. a. 0.0902235 b. 0.8009

Respuestas a los problemas propuestos

307

13. a. 0.160623 b. 0.08392 14. 0.3528 15. a. 0.124104

b. 0.5152

16. a. 0.175467 b. 0.2650 17. a. 0.0183156 b. 0.256 18. a. 14.3 %

b. 0.077

19. a. 750 soles b. 0.3433 c. En la tienda 1 las ventas diarias son más homogéneas 20. a. 400

b. 75 %

21. a. 165 22. a. 0.375

b. 145

b. 1.33

 0 ,   2( x − 1) 23. a. f ( x)  , =  1.5  2( 4 − x) ,   7.5 24. a. 0.8552

c. 0.83 c. 0.7564

, 0   x −1 ,  si 1 ≤ x ≤ 1.5 b. Fx( x) =  1.5 1 − ( 4 − x) ,  7.5 si 1.5 < x ≤ 4  , 1

x <1

si x < 1 1 ≤ x ≤ 1.5 1.5 < x ≤ 4 si x > 4

b. 58.67

25. a. s = 26.92; 0.4575

b. p = 0.3551; 0.7318

26. a. = µ 48; = s 12 b. El proceso alterno es más homogéneo en su duración. 27. 0.01069 28. A = 20; B = 0.8 29. a. 456.2

b. 29.3

30. a. Zona A(C.V.=13.33 %) b. 0.5 31. a. 0.3012 b. 0.2739 32. a. 0.4866 b. 0.1342 33. a. 0.5134

b. 0.5654

34. a. 0.4964 b. 0.4346

c. 1200 c. 230.3 minutos

35. a. 0.3549 b. 0.9592 36. 0.02574 37. 0.6916 38. a. 5.1

b. 8.305

39. a. 6 horas b. 0.4346 40. a. 6.75

b. 0.4477

41. a. 768.3 b. 0.4559 42. 299.6 días 43. a. 40.26

b. 0.5749 c. 0.9281 d. a = -2.461, b = 2.461

44. a. 0.5190 b. 0.1088 c. 0.3804 d. 0.2

308

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

45. a. 0.8009 b. 0.7488 c. 21.06 46. a. 8 500

b. 50 154 c. 53 %

d. 0.9632

47. a. 0.7778 b. 16 48. a. 16.47 49. a. 10.4

b. 0.775

c. 1.787

b. 0.3374 c. 0.5134 d. 0.09963

50. a. = µ 25; = s 5 C.= V . 20 % 51. a. 0.8186

b. La empresa A

b. 4.262 horas c. 0.7558

52. a. 18.49 y 43.77

b. 1.751

c. 35.75

53. a. 0.2611 b. 0.1458 c. los atletas del país A, en promedio, son más rápidos que los del B 54. a. X → U(a = 0; = b 5)

b. 0.6

c. 2 500 soles

d. 0.05505

55. a. 0.05653 b.1. 0.08346 b.2. 0.3189 b.3. 0.6696 c. 0.144973 56. a.1. 0.1

a.2. 34.97

a.3. 0.96

a.4. 1.678

57. 0.05653 58. a. 0.1847

b. 0.2865

c. 29.07 horas

59. a. 0.5793 b. 0.0001737 c. 0.0817 60. a. 0.8860 61.

b. 0.0847 dólares

d. 32.38 soles

c. K = 0.0838 dólares d. 0.991

a. 0.1912 b. 6 clientes especiales c. 0.4724 d. 0.4232

62. a. X: número de asegurados atendidos X → P(λ =4) b. X: número de unidades defectuosas

X → H (n = 100, M = 5, n = 10), 0.4162

63. a. c = 19.87; k = 47.96 64. a. 8

b. 0.7579 c. 20 d. 0.0212

b. 0.3245

Respuestas a los problemas propuestos

309

Bibliografía

Anderson, D. R., Sweeney, D. J., Williams, Thomas A., Camm, Jeffrey D., y Cochran, James J. (2016). Estadística para negocios y economía. México: México D. F.: Cengage Learning. Carrascal, A. U. (2011). Estadística descriptiva con Microsoft Excel 2010. México: México D.F: Alfaomega. Chue J., Barreno E., Castillo C., Millones R., y Vásquez F. (2012). Estadística des­ criptiva y probabilidades. Perú, Lima: Fondo editorial Universidad de Lima. Córdova, M. (2005). Estadística descriptiva e inferencial. Perú, Lima: Moshera. García, O. C. (2011). Estadística descriptiva y probabilidades para ingenieros. Lima, Perú, Lima: Empresa Editora Macro E.I.R.L. Levine, D. M., Krehbiel, T. C., y Berenson, M. L. (2006). Estadística para administra­ ción. México, México D. F.: Pearson Educación. Lind, D. A., Mason, R. D., Marchal, W. G., y Hano, R. M. C. (2004). Estadística para administración y economía. México, México D. F.: Alfaomega. Mendenhall, W., Beaver, R. J., Beaver, B. M., y Velázquez, A. J. A. (2015). Introduc­ ción a la probabilidad y estadística. México, México D. F.: Cengage Learning. Mitacc, M. (2011). Tópicos de estadística descriptiva y probabilidad. Perú, Lima: Thales. Montgomery, D. C., y Runger, G. C. (2004). Probabilidad y estadística aplicadas a la ingeniería. México, México D. F.: Limusa-Wiley. Romero, M. S. J., y Ordóñez, C. X. G. (2014). Estadística descriptiva e inferencial. España, Madrid: CEF. Spiegel, M. R., Schiller, J. J., Srinivasan, R. A., y Vargas, E. M. A. (2013). Probabili­ dad y estadística. México, México D.F.: McGraw-Hill/Interamericana. Webster, A. L. (2005). Estadística aplicada a los negocios y a la economía. México D. F.: McGraw-Hill.

Bibliografía

311

Anexos

Anexo 1 Resumen de fórmulas de estadística descriptiva

Estadígrafo

Datos originales

Media aritmética

Mediana

Moda

X=

Datos agrupados

n ∑ xi

i =1

Y=

n

 X n +1 , n impar  ( 2 )   Me =   X n + X n+ 2 ( )  ( 2) 2   2

k

n

variación

d2 f Mo − f Mo − 1 =

= Pk LI P

Percentiles

Coeficiente de

n

SX =

2 2 ∑ Xi − n x

i =1

n −1

 n n! = C kn =  k k !( n − k )!  

f Mo − f Mo + 1

 kn − FP − 1  k + c  100 fP  k 

k

     k

2 2 2 ∑ yi fi − n Y ∑ fi ( yi − Y ) =i 1=i 1 = SY = n −1 n −1

S C.V ( X ) = X (100) X

= Coeficiente de asimetría de Pearson: C.A

    

 d1  Mo LI Mo + c  =   d1 + d2  = d1

estándar

i =1

n  − FMe − 1 = Me LI Me + c  2 f Me  

Valor de la variable más frecuente.

Desviación

k ∑ yi fi

S C.V (Y ) = Y (100) Y

3 ( X − Me ) X − Mo = C. A S S

Pkn =

n! (n − k )!

Anexos

315

Anexo 2 Resumen de fórmulas de probabilidad P( E ∪ F ) = P( E) + P( F )

si E ∩ F = Φ

P( E ∪= F ) P( E) + P( F ) − P( E ∩ F )

Probabilidad condicional = P( E / F )

P( E ') =− 1 P( E)

si E ∩ F ≠ Φ P( E ∩ F ) P( F )

P( F ) ≠ 0

k

Probabilidad total P( A) = ∑ P( Ei ) P( A / Ei ) i =1

Probabilidad de Bayes

P( Ei / A) =

P( Ei ) P( A / Ei )

k

∑ P( Ei ) P( A / Ei )

i =1

Función de distribución (V. A. continua) F( x) = P( X ≤ x) =

Valor esperado Varianza

E( X ) = µ = ∑ x p( x)

V ( X ) =s2 =E( X 2 ) − [ E( X )]2

E( X 2 ) = ∑ x 2 p( x)

316



E( X 2 ) = ∫ x 2 f ( x) dx −∞

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

x

∫ f ( x) dx

−∞



E( X ) =µ = ∫ x f ( x) dx −∞

Anexo 3 Distribuciones notables de probabilidad Distribución

Función de probabilidad

V(X)

np

npq

 n n− x P( X = x= )   px q  x  

Binomial

x = 0, 1, 2, . . . , n

Hipergeométrica

Poisson

E(X)

q=1–p

 M  N − M      x  n− x  N   n

= x= ) P( X

M n  N

e −λ λ x x!

P( X= x=)

 M  M   N − n  n  1 −     N  N   N −1 

λ

λ

x = 0, 1, 2, . . . λ > 0 Uniforme

Normal

= f ( x)

f ( x) =

f ( x) Exponencial =

Gamma

Weibull

f ( x) =

f ( x) =

1 b−a

1 2ps2

1 x - µ  −   e 2 s 

1 −( x / b ) e b 1 ba Γ(a)

a ba

x

a −1

a+b 2

a ≤ x ≤b

x

a −1

e

x −  a e b

−x

E( X ) = µ V (X) = s2

2

x>0

b

(b − a)2 12

−∞ < x < ∞

Z=

x−µ s

b

b2

ab

ab2

 1 bΓ 1 +  a  

2   2    1     b 2 Γ  1 +  −  Γ  1 +    a    a     

Anexos

317

Distribución

Ji-cuadrado

Función de probabilidad  v −1 − x 1  x 2 e 2 , si x > 0, v > o  v/ 2  v  f ( x) =  2 Γ   2  0 , si x ≤ 0 

  v +1  Γ 2   = f ( x)   T de Student  Γ  v  vp   2 

F (Fisher)

318

1 v +1 2  2 x

− ∞ < x < ∞; v > 0

,

 1 +  v  

m  m+n 2  Γ    2  m    f ( x) = Γ  m  Γ  n   n    2  2  0 

x

m−2 2 m+n  2

, si x > 0, m > 0, n > 0

 m 1 +   x   n 

Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios

, si x ≤ 0

E(X)

V(X)

v

2v

0

v , v−2

v>2

2n2 ( m + n − 2) n n−2

m(n − 2)2 (n − 4)

con n > 4

Este libro se terminó de imprimir en abril del 2018, en Tarea Asociación Gráfica Educativa Psje. María Auxiliadora 156-164, Breña, Lima, Perú Teléfonos: 424-8104 / 332-3229 [email protected]

Related Documents


More Documents from ""