Guia Utpl Etadistica

  • Uploaded by: Imirvlad GI
  • 0
  • 0
  • 2 weeks ago
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Guia Utpl Etadistica as PDF for free.

More details

  • Words: 28,451
  • Pages: 112
Loading documents preview...
Departamento de Economía Sección Métodos Cuantitativos

Estadística l

Guía didáctica 4 créditos

Titulaciones

Ciclo

� Ingeniero en Administración de Empresas Turísticas y Hoteleras

II

� Ingeniero en Contabilidad y Auditoría � Ingeniero en Administración en Banca y Finanzas � Ingeniero en Administración en Gestión Pública

III

� Economista � Ingeniero en Administración de Empresas

IV

� Licenciado en Psicología

VI

Autor:

Mg. Carlos Correa Granda Estimado estudiante recuerde que la presente guía didáctica está disponible en el EVA en formato PDF interactivo, lo que le permitirá acceder en línea a todos los recursos educativos.

Asesoría virtual:

www.utpl.edu.ec

ESTADÍSTICA I

Guía didáctica Carlos Correa Granda UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA

CC Ecuador 3.0 By NC ND Diagramación, diseño e impresión: Ediloja Cía. Ltda. Telefax: 593-7-2611418 San Cayetano Alto s/n www.ediloja.com.ec [email protected] Loja-Ecuador Quinta edición Primera reimpresión ISBN-978-9942-08-531-3

Esta versión digital ha sido acreditada bajo la licencia Creative Commons Ecuador 3.0 de reconocimiento -no comercial- sin obras derivadas; la cual permite copiar, distribuir y comunicar públicamente la obra, mientras se reconozca la autoría original, no se utilice con fines comerciales ni se realicen obras derivadas. http://www.creativecommons.org/licences/by-nc-nd/3.0/ec/ Octubre, 2014

2. Índice 2. Índice................................................................................................................................................ 3 3. Introducción.................................................................................................................................. 5 4. Bibliografía.................................................................................................................................... 7 4.1. Básica............................................................................................................................... 7 4.2. Complementaria............................................................................................................ 7

5. Orientaciones generales para el estudio....................................................................... 9 5.1. Generales........................................................................................................................ 9 5.2. Específicas....................................................................................................................... 9

6. Proceso de enseñanza-aprendizaje para el logro de competencias................ 11 PRIMER BIMESTRE 6.1. Competencias genéricas............................................................................................... 11 6.2. Planificación para el trabajo del alumno.................................................................. 11 6.3. Sistema de evaluación del componente educativo (primero y segundo bimestre)......................................................................................................................... 14 6.4. Orientaciones específicas para el aprendizaje por competencias......................... 15

UNIDAD 1: ¿QUÉ ES LA ESTADÍSTICA?....................................................................................... 15 1.1. Introducción................................................................................................................... 15 1.2. ¿Qué se entiende por estadística?.............................................................................. 15 1.3. ¿Por qué hay que estudiar estadística?...................................................................... 15 1.4. Tipos de estadística....................................................................................................... 16 1.5. Tipos de variables.......................................................................................................... 17 1.6. Fuentes de datos estadísticos...................................................................................... 18 1.7. Niveles de medición...................................................................................................... 19 Autoevaluación 1...................................................................................................................... 20

UNIDAD 2: DISTRIBUCIONES DE FRECUENCIA Y REPRESENTACIONES GRÁFICAS................. 21 2.1. Introducción................................................................................................................... 21 2.2. Elaboración de una distribución de frecuencias....................................................... 23 2.3. Distribuciones de frecuencia relativa......................................................................... 28 2.4. Representación gráfica de una distribución de frecuencias................................... 29 2.5. Distribuciones de frecuencia acumuladas................................................................. 32 2.6. Representación gráfica de las frecuencias acumuladas.......................................... 33 2.7. Otros tipos de gráficos comúnmente utilizados....................................................... 34 Autoevaluación 2...................................................................................................................... 36

UNIDAD 3: MEDIDAS DESCRIPTIVAS: MEDIDAS DE TENDENCIA CENTRAL............................. 37 3.1. Introducción................................................................................................................... 37 3.2. Medidas de tendencia central..................................................................................... 37 Autoevaluación 3...................................................................................................................... 52

SEGUNDO BIMESTRE 6.5. Competencias genéricas............................................................................................... 55 6.6. Planificación para el trabajo del alumno.................................................................. 55 6.7. Orientaciones específicas para el aprendizaje por competencias......................... 59

UNIDAD 4: MEDIDAS DESCRIPTIVAS: MEDIDAS DE DISPERSIÓN........................................... 59 4.1. Introducción................................................................................................................... 59 4.2. Medidas de dispersión.................................................................................................. 59 Autoevaluación 4...................................................................................................................... 73

UNIDAD 5: INTRODUCCIÓN AL ESTUDIO DE LA PROBABILIDAD............................................. 75 5.1. Introducción................................................................................................................... 75 5.2. Definición de probabilidad.......................................................................................... 75 5.3. Enfoques de probabilidad............................................................................................ 76 5.4. Reglas de probabilidad................................................................................................. 76 5.5. Diagramas de árbol....................................................................................................... 78 5.6. Análisis combinatorio................................................................................................... 78 Autoevaluación 5...................................................................................................................... 82

UNIDAD 6: DISTRIBUCIONES DE PROBABILIDAD DISCRETA................................................... 84 6.1. Introducción................................................................................................................... 84 6.2. Definición de una distribución de probabilidad....................................................... 84 6.3. Medidas descriptivas de una distribución de probabilidad................................... 84 6.4. Distribución de probabilidad binomial...................................................................... 85 6.5. Distribución hipergeométrica..................................................................................... 86 6.6. Distribución de Poisson................................................................................................ 87 Autoevaluación 6...................................................................................................................... 93

UNIDAD 7: DISTRIBUCIÓN DE PROBABILIDAD CONTINUA...................................................... 95 7.1. Distribución de probabilidad normal......................................................................... 95 7.2. Aproximación normal a la binomial........................................................................... 96 Autoevaluación 7...................................................................................................................... 104

7. Solucionario.................................................................................................................................. 106

Guía didáctica: Estadística I

3. Introducción Estadística I o Estadística Descriptiva es un componente educativo de carácter genérico que se desarrolla de manera conjunta para las diferentes titulaciones que conforman el Área Administrativa (Administración de Empresas Turísticas y Hoteleras, Administración de Empresas, Administración en Banca y Finanzas, Administración en Gestión Pública, Contabilidad y Auditoría y Economía), así como también se dirige a la titulación de Psicología del Área Sociohumanística. En cada uno de los planes de estudio se encuentra en diferente posición de acuerdo a las estructuras curriculares, y contempla un total de 4 créditos. El estudio de la estadística, como componente educativo, reviste gran importancia si nos remontamos en primer lugar a su origen, pues desde tiempos inmemoriales se vienen utilizando las distintas herramientas que han servido para llegar a recoger información, organizarla, clasificarla para posteriormente llegar a describirla y tomar decisiones futuras. Esto generalmente se podía observar cuando se tomaban decisiones para la administración de un Estado o nación, por ello su nombre se deriva del Estado. Luego habremos de analizar que en nuestra vida diaria estamos empleando herramientas estadísticas, lo que implica por tanto que en todos los campos de la actividad humana tenga vigencia su aplicación, identificando de esta manera la importancia que tiene su estudio y la aplicabilidad en los diferentes campos de actividad humana. Solo por citar unos ejemplos, la encontramos en la medicina, en el deporte, en la cocina, en los negocios, etc. En esta ocasión desarrollaremos la primera parte de la estadística, esto es la estadística descriptiva, como base para continuar con el estudio de la estadística inductiva o inferencial que se realizará en el siguiente semestre. Es así que nos dedicaremos a conocer la forma de recoger información, organizarla, clasificarla para llegar a describirla con sus características puntuales, de igual manera será la oportunidad para conocer que la descripción de las características de un conjunto de datos, implica el cálculo de indicadores, de manera que podamos obtener valores representativos de todo el conjunto. Tendremos la oportunidad de iniciar el análisis de la estadística inductiva, a través del tratamiento de las probabilidades, desde sus definiciones básicas hasta llegar a comprender el uso y la aplicabilidad de las distribuciones de probabilidad. Estructuralmente podemos decir que durante el primer bimestre se abordarán los temas referentes al ámbito introductorio hasta el tratamiento de las medidas de tendencia central, luego para el segundo bimestre continuaremos con las medidas descriptivas analizando las medidas de dispersión. Posteriormente nos insertaremos en el tratamiento de las probabilidades llegando hasta las distribuciones de probabilidad. Le invito a iniciar este estudio que no reviste mayor dificultad, pues, aunque se requiera tener una base matemática, se podría decir que es lo elemental, lo importante es que llevemos un estudio sistemático de manera que todos los conocimientos tengan un encadenamiento. Por este motivo le sugiero que antes de revisar el tema siguiente se debe analizar lo conocido del anterior, para ello es importante el

5

Guía didáctica: Estadística I

desarrollo de las autoevaluaciones, de esta forma se podrá dar cuenta de qué es lo que conoce y qué es aquello que le falta por revisar. Siempre estamos dispuestos a prestarle la ayuda que requiera despejando las dudas que tenga sobre cualquiera de los temas que vamos abordando, recuerde siempre que lo importante es preguntar aquello que no sabemos o que a lo mejor nos está dando mayor dificultad. En el caso de este componente educativo, tanto el autor de la guía como los profesores asesores de las correspondientes titulaciones estamos listos para prestarle la asesoría necesaria. Finalmente, le recuerdo que si bien no se puede constituir en un requisito legal, con este componente educativo habrá adquirido las competencias necesarias para tomar el componente educativo Estadística II. Le auguro el mejor de los éxitos.

6

Guía didáctica: Estadística I

4. Bibliografía 4.1. Básica ¾¾

Lind, D., Marchal, W. y Wathen, S. (2012). Estadística aplicada a los negocios y la economía. México, D.F.: Editorial McGraw–Hill S.A.

Es un texto que cubre los métodos básicos de estadística descriptiva e inferencial, así como todos los procesos de decisión y análisis de resultados. Su presentación de forma clara y didáctica permite que el estudiante vaya desarrollando su proceso de aprendizaje de manera adecuada, resulta de gran utilidad cuando el aprendizaje se realiza con autonomía. Las diferentes secciones se encuentran claramente diferenciadas por colores de manera que el estudiante puede considerar los aspectos que son importantes en cada uno de los temas, de igual manera al finalizar las secciones se realiza una revisión de los temas abordados en los diferentes capítulos, así mismo encuentra actividades de autoevaluación que le permitirán al lector ir realizando un análisis de los conocimientos adquiridos en cada temática desarrollada. ¾¾

Correa Granda, Carlos (2013). Guía Didáctica Estadística I. Loja–Ecuador: Ediloja

Este documento se convierte en el sustituto de la presencia del profesor, de manera que en su desarrollo se ha priorizado el diálogo didáctico entre el profesor y el estudiante. Contiene varias explicaciones adicionales que el texto básico posiblemente no las tiene o en su defecto pueden resultar un poco complicadas para el estudiante. De igual manera se encuentran actividades recomendadas para confirmar en mayor medida la aplicabilidad de cada uno de los temas planteados; así como también, preguntas de autoevaluación que le permitirán de alguna manera ir midiendo el nivel de comprensión de las unidades temáticas desarrolladas.

4.2. Complementaria •

Anderson, D., Sweeney, D., y Williams, T. (2008). Estadística para administración y economía. México D.F.: Cengage Learning Editores S.A.

Los contenidos del texto se encuentran desarrollados clara y didácticamente, de tal manera que le ayudarán mucho en la comprensión de los temas. Al finalizar cada unidad va a encontrar algunos ejercicios de autoexamen que le sirven para identificar el avance en la comprensión de los temas. •

Berenson, M., Levine, D., y Krenbhiel, T. (2001). Estadística para administración. México D.F.: Editorial Pearson Educación.

Sus contenidos se encuentran sistemáticamente organizados y mantiene una gran cantidad de ejercicios resueltos de manera que el lector puede ir comprendiendo la forma de resolver, los métodos que se han

7

Guía didáctica: Estadística I

empleado y sobre todo el uso y aplicación de los elementos recogidos en una investigación, de modo que se encuentra en capacidad de analizar los resultados obtenidos. •

Kazmier, Leonard (2006). Estadística aplicada a la Administración y a la Economía. México D.F.: Editorial McGraw–Hill S.A.

En este texto se podrán revisar especialmente los temas referentes a las probabilidades, en él encontrará una serie de ejercicios propuestos así como ejercicios resueltos explicados paso a paso. •

Webster, Allen (2000). Estadística aplicada a los negocios y a la economía. Santa Fe de Bogotá: Editorial McGraw–Hill S.A.

Es un texto que contiene gran cantidad de ejercicios resueltos y propuestos, además en los segmentos finales de cada capítulo proporciona sitios Web que el lector puede consultar para encontrar datos e información que puede utilizar para complementar su estudio.

8

Guía didáctica: Estadística I

5. Orientaciones generales para el estudio En esta ocasión, me permito hacerle algunas sugerencias que contribuirán para el éxito en los estudios de este componente educativo, las cuales se resumen de la siguiente manera:

5.1. Generales •

El aprendizaje de la estadística exige una clara comprensión de las definiciones, propiedades, relaciones, a tal punto que sus esfuerzos deben orientarse en primer lugar a la aprehensión de los fundamentos teóricos, puesto que, estos son los que le permitirán la aplicación a través de ejercicios y problemas.



Si no conoce la teoría correspondiente, mal podrá intentar resolver ejercicios o problemas, lo primero que debe hacer es entender todos los elementos conceptuales de los temas propuestos para que luego los vaya a aplicar. El texto escogido tiene la ventaja de utilizar un lenguaje sencillo además de encontrarse estructurado didácticamente lo que le permitirá comprender con mayor facilidad cada uno de los temas.



Siga paso a paso las sugerencias que se realizan en el texto básico y en esta guía didáctica para que vaya tomando experiencia, a veces pueden parecer procedimientos muy sencillos pero son necesarios hasta lograr la experiencia suficiente para que en lo posterior se puedan obviar dichos procesos.



Recuerde que es necesario trabajar de manera sistemática, de modo que no pase a otro tema sin haber conocido el anterior, como le había manifestado en la introducción, es importante desarrollar las autoevaluaciones que constan al final de cada unidad, pues, éste es un estudio ordenado, sistemático y progresivo.



Otro aspecto que debemos considerar es la presentación de los trabajos a distancia, una buena presentación y la puntualidad en la entrega, habla muy claramente del proceso de aprendizaje que va llevando un estudiante. Cuidemos estos dos aspectos que son muy importantes.

5.2. Específicas •

Para el aprendizaje de este componente educativo, es necesario que usted dedique diariamente por lo menos una hora a la revisión del texto básico y la guía didáctica, de manera que se puedan abordar los temas en forma secuencial.



Le recomiendo contar con material adicional como es un cuaderno de apuntes, con la finalidad de que vaya realizando cuadros resumen de los temas y en cada uno de ellos se realicen actividades adicionales como son los ejercicios resueltos y propuestos que constan en el texto básico.



Cualquier inquietud que se le presente en la revisión de los temas, anótelas para que luego las transfiera al profesor sea en forma telefónica o a través del EVA enviando correos electrónicos. Si alguna respuesta no está lo suficientemente clara, vuelva a insistir a fin de que usted resuelva sus inquietudes.

9

Guía didáctica: Estadística I



Tome en cuenta las sugerencias sobre las técnicas de estudio que usted aprendió en el componente educativo de Metodología de Estudio, para que pueda llevar en forma adecuada los estudios no solo de este componente sino de todos los demás en los que se encuentra matriculado.



Recuerde que el estudio de la estadística requiere un ambiente adecuado de trabajo y no dejar pasar ningún tema sin antes haberlo comprendido de manera suficiente puesto que todos los temas van avanzado en forma progresiva.



Mientras más ejercicios realice, usted estará asegurándose la comprensión del tema en estudio y estará preparado para continuar con el siguiente.



Recuerde que en el sistema de estudios a distancia, el estudiante es el constructor de su propio aprendizaje, está bajo su responsabilidad tanto el ritmo de estudio que mantenga como el éxito en el curso.



Revise siempre los textos adicionales recomendados en la bibliografía complementaria para ampliar los conocimientos de cada tema.



Le recomiendo también que revise la planificación de la componente educativo, con la finalidad de que vaya observando las actividades de aprendizaje establecidas.

En esta parte, finalmente lo que me resta decirle es que la estadística en sí no es difícil, es un componente educativo que usted lo vive a diario y que puede ir relacionando todos los elementos y herramientas con su actividad, esto le permite comprender que el uso de ella no es exclusivo de los negocios, sino que es aplicable a todos los campos del quehacer humano.

Nota importante:

Por su participación en ciertas actividades del EVA en cada bimestre, usted podrá obtener un punto que complementará la nota obtenida en la evaluación a distancia; esto quiere decir que si obtiene menos de 6 puntos, podrá incrementar su nota (hasta 6 puntos) por medio de la participación y los ejercicios que su tutor(a) le propondrá en el EVA.

10

Desarrolla el pensamiento matemático y estadístico para la aplicación y análisis de aspectos económicos

Competencias específicas de titulación

Utiliza los elementos conceptuales y procedimentales de la estadística descriptiva.

Reconoce la importancia de la estadística como eje transversal para la organización, sistematización, inferencia y validación en las diferentes disciplinas del conocimiento científico.





Competencias específicas del componente educativo

Desarrollo de los ejercicios de revisión que constan al finalizar la explicación del capítulo.

¾¾

1.7. Niveles de medición

1.6. Fuentes de datos estadísticos

1.5. Tipos de variables

1.4. Tipos de estadística

1.3. ¿Por qué hay que estudiar estadística?

1.2. ¿Qué se entiende por estadística?

Inicio del desarrollo de la evaluación a distancia.

Lectura comprensiva del capítulo 1 del texto básico.

¾¾

¾¾

Revisión de la guía didáctica.

¾¾

UNIDAD 1: ¿Qué es la estadística? 1.1. Introducción

Actividades de aprendizaje

Contenidos Unidades

Vivencia de los valores universales del humanismo de Cristo Comunicación oral y escrita Orientación a la innovación y a la investigación Pensamiento crítico y reflexivo Trabajo en equipo Comunicación en inglés Compromiso e implicación social Comportamiento ético Organización y planificación del tiempo

6.2. Planificación para el trabajo del alumno

¾¾ ¾¾ ¾¾ ¾¾ ¾¾ ¾¾ ¾¾ ¾¾ ¾¾

PRIMER BIMESTRE

Proceso de enseñanza-aprendizaje para el logro de competencias

6.1. Competencias genéricas

6.

™™

Comprende y argumenta las nociones y conceptos fundamentales de la estadística.

Indicadores de aprendizaje

Ocho horas de interacción

Ocho horas de autoestudio

Semanas 1 y 2

Tiempo de dedicación

Guía didáctica: Estadística I

11

Competencias específicas de titulación

12







Contenidos Unidades

2.7. Otros tipos de gráficos comúnmente utilizados

2.6. Representación gráfica de las distribuciones de frecuencia acumuladas

2.5. Distribuciones de frecuencia acumuladas

Sugiere la toma de 2.3. Distribuciones de frecuencia decisiones con criterio relativas técnico científico en base a la información existente. 2.4. Representación gráfica de una distribución de frecuencias ¾¾

UNIDAD 2: Distribuciones de frecuencia ¾¾ y representaciones gráficas Aplica los conceptos estadísticos básicos 2.1. Introducción ¾¾ correctamente en el desarrollo de ejercicios 2.2. Elaboración de una distribución de referentes a la realidad en frecuencias la que se desenvuelve. ¾¾ 2.2.1. Elementos que intervienen en Organiza, analiza e las distribuciones de frecuencia interpreta información 2.2.2 . Sugerencias para elaborar una recogida en un problema tabla de distribución de a investigar. frecuencias

Competencias específicas del componente educativo

™™

Continúa con el desarrollo de la evaluación a distancia.

Desarrollo de las ™™ autoevaluaciones que constan en el texto básico por cada tema planteado desde el numeral 2.1 al 2.6.

Lectura comprensiva del capítulo 2 en el texto básico.

Revisión de la guía didáctica.

Actividades de aprendizaje

Elabora, analiza e interpreta los gráficos estadísticos.

Organiza información y la presenta mediante cuadros de distribución de frecuencias.

Indicadores de aprendizaje

Ocho horas de interacción

Ocho horas de autoestudio

Semanas 3 y 4

Tiempo de dedicación

Guía didáctica: Estadística I

Competencias específicas de titulación

Competencias específicas del componente educativo

3.2.6.1. Definición 3.2.6.2. Características 3.2.6.3. Formas de cálculo

3.2.6. Media geométrica

3.2.5. Relación entre la media aritmética, mediana y moda

3.2.4.1. Definición 3.2.4.2. Características 3.2.4.3. Formas de cálculo

3.2.4. Moda

3.2.3.1. Definición 3.2.3.2. Características 3.2.3.3. Formas de cálculo

3.2.3. Mediana

3.2.2. Media aritmética ponderada

3.2.1.1. Definición 3.2.1.2. Características 3.2.1.3. Formas de cálculo

3.2.1. Media aritmética

3.2. Medidas de tendencia central

3.1. Introducción

Preparación para la primera evaluación presencial parcial .

¾¾

Ingreso de la evaluación a distancia al EVA.

¾¾

Revisión de todos los temas desarrollados en el bimestre.

Desarrollo de la evaluación a distancia.

¾¾

¾¾

Desarrollo de las autoevaluaciones que constan al finalizar cada tema.

Lectura comprensiva del capítulo 3 del texto básico.

¾¾

¾¾

Revisión de la guía didáctica.

UNIDAD 3: Medidas descriptivas: Medidas de tendencia central ¾¾

Actividades de aprendizaje

Contenidos Unidades

™™

™™

Tiempo de dedicación

Ocho horas de interacción

Ocho horas de autoestudio

Semanas 7 y 8

Calcula, representa e Semanas 5 y 6 interpreta Ocho horas de gráficamente cada una de las medidas autoestudio de tendencia central. Ocho horas de Analiza y explica las interacción características, usos, ventajas y desventajas de cada una de las medidas de tendencia central.

Indicadores de aprendizaje

Guía didáctica: Estadística I

13

Guía didáctica: Estadística I

6.3. Sistema de evaluación del componente educativo (primero y segundo bimestre) Formas de evaluación

Parte de ensayo

Interacción en el EVA

Prueba objetiva

x

x

x

x

Cumplimiento, puntualidad, responsabilidad

x

x

x

x

x

Esfuerzo e interés en los trabajos

x

x

x

x

x

x x

x

Contribución en el trabajo colaborativo y de equipo

x x

x

Emite juicios de valor argumentadamente

x

x

x

x

x

x

x

Aporta con criterios y soluciones

x

x

Análisis y profundidad en el desarrollo de temas

x

x

PORCENTAJE

Puntaje

10% 20% 30%

2

4

TOTAL

6

Máximo 1 punto (completa la evaluación a distancia)***

Investigación (cita fuentes de consulta)

x

70%

14

20 puntos

Actividades presenciales y en el EVA

Presentación, orden y ortografía

Estrategia de aprendizaje

Habilidades

Creatividad e iniciativa

Dominio del contenido

3. Coevaluación

Parte objetiva

x

Respeto a las personas y a las normas de comunicación

Conocimientos

Evaluación presencial

Comportamiento ético

Competencia: criterio

Actitudes

Evaluación a distancia **

1.

Autoevaluación *

2. Heteroevaluación

Para aprobar la asignatura se requiere obtener un puntaje mínimo de 28/40 puntos, que equivale al 70%. * Son estrategias de aprendizaje, no tienen calificación; pero debe responderlas con el fin de autocomprobar su proceso de aprendizaje. ** Recuerde que la evaluación a distancia consta de dos partes: una objetiva y otra de ensayo, debe desarrollarla y entregarla en su respectivo centro universitario. *** Su tutor(a) le planteará una o más actividades en el EVA que serán calificadas por un punto en total. Este solo computará para complementar la nota del trabajo a distancia, es decir, si Ud. logra menos de seis puntos en el mismo podrá aumentar dicha nota (hasta completar los 6 puntos) con esas actividades en el EVA.

Señor estudiante: Tenga presente que la finalidad de la valoración cualitativa es principalmente formativa.

14

Guía didáctica: Estadística I

6.4. Orientaciones específicas para el aprendizaje por competencias

UNIDAD 1: ¿QUÉ ES LA ESTADÍSTICA? Para el desarrollo de esta unidad, revise conjuntamente con esta guía el capítulo 1 del texto básico.

1.1. Introducción Como habrá podido comprender en este momento introductorio, el autor nos lleva a deliberar sobre la importancia que tiene el estudio de la Estadística y nos acerca a la reflexión sobre los ámbitos de aplicación, allí hemos podido observar que este componente educativo nos permite contar con herramientas suficientes para tomar decisiones sobre diferentes tópicos. Comprender los fundamentos de la estadística como ciencia, nos permitirá mantener bases suficientes para llegar a trabajar con las distintas herramientas e instrumentos que luego nos facilitarán la comprensión, descripción y caracterización de un conjunto de datos investigados.

1.2. ¿Qué se entiende por estadística? Al revisar el texto básico, vemos que esta parte se encuentra desarrollada posteriormente a las razones por las que se debe estudiar estadística, aquí lo hacemos primero, para iniciar entendiendo su significado. Realice la lectura de este acápite e identifique las ideas principales al respecto. Le sugiero que subraye las ideas principales que encuentre. ¿Está de acuerdo en que la idea central se relaciona con el tratamiento de información numérica? Lo invito ahora a que enuncie su propia definición sobre la estadística. ¿Le parece a usted que podríamos definir a la estadística como la ciencia que nos proporciona los elementos de juicio necesarios para llegar a tomar decisiones adecuadas?, si está de acuerdo, reflexione sobre las razones que le llevan a estarlo; si no lo está también reflexione sobre la definición adecuada y regrese al texto para constatarlo. De las diferentes formas de enunciar lo que significa la estadística, realice ahora un cuadro sinóptico en el que se resuman las ideas claves que se observan en cualquiera de las definiciones encontradas. Para ello lea detenidamente este acápite que se encuentra en el texto básico y reflexione sobre los distintos ejemplos que se han planteado allí.

1.3. ¿Por qué hay que estudiar estadística? Ahora que ya hemos podido enunciar una definición sobre la estadística, veamos las razones que justifican el inicio de su estudio. Lea este apartado en el capítulo 1 del texto básico que se encuentra posterior a la introducción que se realiza por parte de los autores.

15

Guía didáctica: Estadística I

Después de leer cada uno de los ejemplos y explicaciones que se brindan, puede ahora resumir las 3 razones por las que se debe estudiar estadística, diciendo que: 1.

En todas las actividades humanas se encuentra información numérica y así la encontramos en publicaciones de negocios, deportivas, medicina, financieras, poblacionales, educativas, etc.

2.

Las técnicas estadísticas se emplean para tomar decisiones que afectan a la vida diaria

3.

El estudio de la estadística permite comprender las razones por las cuales se toman ciertas decisiones en los diferentes ámbitos y campos de aplicación.

Muy bien, usted conoce ahora por qué es necesario e importante realizar este estudio. Ahora que ya hemos definido y sabemos por qué vamos a estudiar, ampliemos un poco más hacia donde se dirige y cómo se subdivide la estadística.

1.4. Tipos de estadística Podemos identificar dos grandes áreas en las que se divide a las ciencias estadísticas, la estadística descriptiva y la estadística inferencial. Le invito a realizar una lectura sobre esta parte y a elaborar en su cuaderno de trabajo, un cuadro resumen de los tipos de estadística, conforme al que se presenta a continuación. E S T A D I S T I C A

DESCRIPTIVA

INFERENCIAL L

Significa que:

Significa que:

Nos permite conocer los métodos para recoger, organizar, resumir, presentar, analizar e interpretar un conjunto de datos

Considera al método inductivo, es decir a partir del análisis de una parte del objeto investigado se llega a conclusiones globales sobre todo el objeto, o también, a partir del análisis de una muestra inferimos hacia conclusiones sobre la población

Una vez identificadas las principales características de cada uno de los tipos de estadística, podemos afirmar que no reviste mayor complicación su estudio. Conviene también destacar que en el caso de la estadística inferencial se deben considerar dos conceptos fundamentales: la población y la muestra. Gráficamente podemos representar de esta manera a los conceptos, ahora usted puede describirlos, con la ayuda de su lectura en el texto básico y también le invito a que formulemos algunos ejemplos al respecto.

16

Guía didáctica: Estadística I

Población

Muestra

Parámetros: media aritmética, etc.

Estadísticos o estadígrafos: media aritmética, etc.

¿Cuándo es necesario extraer una muestra? Al revisar el texto básico, usted podrá extraer también sus conclusiones al respecto, sin embargo, podría decir que la respuesta a esta pregunta tiene diferentes análisis: a.

Si analizamos la factibilidad de trabajar, analizar a todos los elementos que componen la población objeto de estudio, podría volverse un asunto engorroso que puede llevar a confusiones y por tanto no llegar a conclusiones válidas.

b.

Por el tiempo disponible, el trabajar con todos los elementos de la población implica considerar una cantidad de tiempo mayor que quizá cuando se aborde a las conclusiones ya no tengan validez.

c.

Por el costo, también es un aspecto a meditar, cuando se trabaja con todos los elementos de la población, significa que se deba disponer de una gran cantidad de recursos y ello determina que el costo de la investigación sea demasiado alto y no exista el presupuesto suficiente para ello.

Aunque en los temas posteriores se hace una explicación de estos dos conceptos siguientes, aprovechando que ya hemos definido una muestra y una población, vamos a decir que cuando trabajamos con datos muestrales, las características que se extraen de ella se denominan estadísticos o estadígrafos, mientras que cuando se trabaja con datos poblacionales las características se denominan parámetros.

1.5. Tipos de variables Otros elementos que debemos recordar y saber diferenciar a la hora de trabajar con un conjunto de datos es la variable utilizada. Para comprender bien lo que significa una variable realice una lectura detenida en el texto básico, sobre este tema que es de mucha importancia, porque después de comprender el enunciado usted estará en capacidad de saber diferenciar cada una de las variables con las que se encuentra trabajando. Bien, después de la lectura estará en capacidad de contestar a la siguiente pregunta: ¿Qué es una variable? Correcto, ya ha definido lo que es una variable, pues como su nombre lo indica será todo aquello que cambia de un momento a otro o de un lugar a otro.

17

Guía didáctica: Estadística I

Pero, también cuando hablamos de variables debemos diferenciar los tipos de variables existentes. Aquí identificamos dos grandes grupos de variables: cuantitativas y cualitativas. En el texto básico, el gráfico 1.2 nos presenta un resumen de los tipos de variables y nos entrega además ejemplos de cada una de ellas. Puede hacer usted un cuadro sinóptico en donde además se observen las características de cada uno de los tipos y ejemplificar cada uno de ellos. Muy bien, con esto hemos clarificado el tipo de variable y la podemos inmediatamente identificar. Ahora, hemos hablado de las variables pero ¿cómo es que podemos llegar a obtener esta información cuando se está investigando? Esta parte no se encuentra desarrollada en el texto básico por eso me permito desarrollarla a continuación, para lo cual, le sugiero que vaya subrayando las ideas principales, y recuerde cuando usted ha sido parte de la construcción de información sobre un determinado tema.

1.6. Fuentes de datos estadísticos Como hemos afirmado anteriormente, una de las razones por las cuales se estudia la estadística, es precisamente porque en toda actividad se genera información, sea de tipo cualitativo o de tipo cuantitativo, como hemos además visto al referirnos a las variables. Ahora bien, ¿de dónde se genera y cómo se obtiene la información? Reconocemos que existen dos caminos, una el levantarla directamente del objeto que se está investigando y la otra, es el recoger información que previamente ha sido ya trabajada y que ya consta en otras publicaciones, por ello la distinguimos de acuerdo a su procedencia en: primaria y secundaria. Fuentes primarias: son aquellas que nos proporcionan información directamente desde el objeto de estudio, para obtenerla, se pueden utilizar: • • • •

Encuestas Entrevistas Datos recogidos de laboratorio Censos

Por ejemplo, si se realiza una encuesta a los consumidores de un producto que está siendo investigado, los datos que se recogen se constituyen en datos primarios puesto que se ha recurrido a la fuente que directamente nos otorga los datos. Estos datos se encuentran, si cabe el término, en “bruto”, a partir de lo cual se inicia el proceso de clasificación, organización, presentación, sea en tablas o en gráficas. Fuentes secundarias: son aquellas que nos proporcionan información que ha sido previamente elaborada por otras personas y se encuentran generalmente en: • • •

Informes escritos Revistas Periódicos

18

Guía didáctica: Estadística I

• •

Diferentes publicaciones Boletines, etc.

Por ejemplo, si se toma un boletín estadístico del Banco Central, allí podremos encontrar información que ya ha sido procesada y podemos trabajar con esos datos para establecer promedios o características adicionales sobre el tema que nos interesa analizar. En una investigación se puede utilizar tanto fuentes primarias como fuentes secundarias, si nos interesa no solo describir información sino además relacionar con datos previamente trabajados por otras organizaciones o personas.

1.7. Niveles de medición Retomemos la lectura del texto básico para hablar de las variables y la forma en la que se encuentran expresadas. Lea detenidamente el acápite sobre los niveles de medición que se encuentra en el texto básico. Una vez que ha identificado las características de los niveles de medición de las variables, realice un análisis del gráfico 1.3 en donde se presenta en forma resumida lo concerniente a los niveles de medición y enuncie alguna otra característica que no conste en el mismo cuadro. Amplíe el gráfico ubicando los ejemplos sobre variables con cada uno de los niveles de medición. Ejercicios Al concluir este tema (1.6 del texto), encontrará ejercicios que le propongo los realice para afirmar los conocimientos de los temas analizados (ejercicios del 1 al 4).

Actividades recomendadas

El estudio de la estadística requiere poner en práctica cada uno de los temas y conceptos definidos, y como hemos dicho la estadística es una ciencia que no tiene ningún campo de acción específico o propio, por ello en cada actividad humana encontramos información numérica. •

Revise un texto en el periódico y observe los datos que se presentan.



Ubique allí cuál es la variable, su tipo, el nivel de medición.



¿Cuál ha sido la fuente de origen de los datos?



Supóngase que usted requiere conocer cómo ha cambiado el nivel de precios de un producto en determinado tiempo, piense de qué manera debería recoger información, ¿a qué tipo de fuente de información va a recurrir?, ¿cómo se la va a presentar?, ¿cuál es su nivel de medición?



Cuando usted se encuentre en cualquier lugar, escriba el tipo de datos o información que ha observado.

Hemos concluido con el estudio de la primera unidad, es hora de constatar nuestros avances a través del desarrollo de la siguiente autoevaluación.

19

Guía didáctica: Estadística I

Autoevaluación 1

A.

Conteste dentro del paréntesis con V o F si considera que las siguientes afirmaciones son verdaderas o falsas respectivamente.

1.  (    )

La estadística es aplicable a todas las actividades del quehacer humano.

2.  (    )

Una de las razones para estudiar estadística es que permite comprender la razón de las decisiones que se toman y proporciona un entendimiento mayor de la forma como estas afectan.

3.  (    )

La estadística descriptiva se refiere a aquellos métodos que permiten extraer conclusiones sobre una población a partir del análisis de una muestra.

4.  (    )

Una muestra es aquella parte de la población que reúne todas las características representativas de la población.

5.  (    )

Las variables continuas son aquellas que se originan en la enumeración o el conteo y, por lo tanto, no pueden tomar valores intermedios.

6.  (    )

Un ejemplo de variable discreta es el número de estudiantes en una clase.

7.  (    )

Una de las propiedades del nivel de medición nominal indica que las categorías de datos se encuentran representadas por etiquetas o nombres.

8.  (    )

En los datos de nivel de intervalo, el punto cero representa la ausencia de características y la razón entre dos números es significativa.

9.  (    )

Cuando se distinguen a los automóviles por la marca, hemos medido los datos en forma nominal.

10.  (    )

Un ejemplo del nivel medición de intervalo es la temperatura.

Importante: puede revisar la solución a esta evaluación al final de esta guía. Asegúrese de haber contestado bien a cada una de las preguntas. Si no ha sido así, entonces vuelva a revisar la guía y el texto básico. Para recordar: Hasta aquí hemos analizado y conocemos los fundamentos y las razones por las cuales es importante el estudio de la estadística. También hemos llegado a comprender cómo se define y de qué manera se ha clasificado, llegando a un concepto clave de lo que es una VARIABLE. El punto de partida en el tratamiento de una investigación es la identificación de la variable con la que se está trabajando y el tipo de variable. Una vez que hemos recogido la información, pasemos a la siguiente unidad a organizarla y presentarla.

20

Guía didáctica: Estadística I

UNIDAD 2: DISTRIBUCIONES DE FRECUENCIA Y REPRESENTACIONES GRÁFICAS Para el desarrollo de esta unidad, revise conjuntamente con esta guía el capítulo 2 del texto básico.

2.1. Introducción Una vez que hemos llegado a comprender los elementos iniciales del estudio de la estadística, vamos a iniciar el tratamiento de las herramientas que nos permiten llegar a cumplir con su objetivo. Conforme habíamos indicado, la estadística nos permite llegar a recoger, organizar, clasificar y presentar los datos. Cuando tenemos pocos datos, su análisis es sencillo, de manera que no reviste mayor dificultad y no es necesario establecer ningún proceso adicional para presentarlos. De igual manera si existen datos con pocos valores de la variable los podemos presentar a través de una SERIE ORDENADA, por ejemplo, si en un grupo de 30 alumnos las calificaciones obtenidas en un determinado examen son las siguientes: 15, 12, 16, 18, 14, 15, 12 , 19, 20 , 14, 16, 18, 15, 18, 19, 20, 17, 13, 16, 14, 14, 17, 16, 15, 12, 15, 16, 18, 19, 18 Procedemos primero a ordenar los datos, generalmente lo hacemos en orden ascendente. Rellene usted, los cuadros con cada uno de los valores:

Una vez ordenados podemos identificar los valores máximo y mínimo: Xmáx = 20 y Xmin. = 12 Con ello podemos determinar que la variable recorre 9 puestos incluidos los valores máximo y mínimo. Si contamos los puestos o hacemos la diferencia y sumamos 1, esto se denomina amplitud de variación, rango o recorrido: AV = 20 – 12 + 1 = 9 Si el rango o recorrido es menor que 15, se puede trabajar con una serie ordenada de frecuencias, por lo que los datos quedarían de la siguiente manera:

21

Guía didáctica: Estadística I

Tabla 1 Calificación

Tabla de conteo

Frecuencia

12

///

3

13

/

1

14

////

4

15

/////

5

16

/////

5

17

//

2

18

/////

5

19

///

3

20

//

2

total

30

Esta columna es auxiliar. Cuando tengamos experiencia se la puede descartar.

Como vemos, este caso no reviste mayor dificultad, pues lo importante es llegar a determinar la posibilidad de presentar los datos de esta manera, considerando que se lo puede hacer solamente cuando el rango o recorrido no es mayor a 15. De igual manera podemos proceder cuando tenemos un conjunto de datos cuya variable es cualitativa, en donde a cada una de las categorías le corresponderá una frecuencia. Por ejemplo, si queremos presentar un informe que nos diga que en una concesionaria de vehículos en el mes de septiembre del año 2012 se han registrado las siguientes ventas por cada marca: Mazda 15, Chevrolet 21, Toyota 18 y Nissan 35. Para apreciar mejor la información detallada, la podemos presentar a través del siguiente cuadro: Tabla 2: Volumen de ventas durante el mes de septiembre de 2012 Marca

Vehículos vendidos

Mazda

15

Chevrolet

21

Toyota

18

Nissan

35

Total

89

Cuando tenemos una mayor cantidad de información y la variable recorre un mayor número de posiciones desde el valor menor hasta el mayor, es necesario llegar a presentarla de manera resumida, por lo que recurrimos a la construcción de tablas de frecuencia, que permiten llegar a identificar las características del conjunto de datos. Para ello es necesario acudir a varios pasos que los detallo en el siguiente apartado.

22

Guía didáctica: Estadística I

2.2. Elaboración de una distribución de frecuencias Para trabajar esta parte realice una lectura comprensiva del tema que se encuentra desarrollado en el texto básico y trate de enunciar una definición propia sobre lo que significa una distribución de frecuencias. ¿Encontró usted que para definir tuvo que referirse a los siguientes elementos?: • • •

Herramienta útil para resumir información Establece niveles que son mutuamente excluyentes A cada nivel le corresponde un número de observaciones

De acuerdo. Si usted lo ha considerado, entonces está en lo correcto. 2.2.1. Elementos que intervienen en las distribuciones de frecuencias

Elementos de una distribución de frecuencias

Esta parte se encuentra desarrollada en el texto básico en lo referente a la construcción de distribuciones de frecuencias, de manera que esquemáticamente podemos señalar los siguientes elementos:

Rango, recorrido o amplitud de variación Intervalos de clase o categorías Límites de clase Límites reales de clase Número de clases o intervalos Tamaño o anchura de clases Frecuencia Marcas de clase Fuente: texto básico Elaboración: el autor

Veamos cada uno de ellos, con mayor detalle y con su procedimiento correspondiente, ya que en el texto se encuentran explicados de manera muy general: a.

Rango, recorrido o amplitud de variación: identifica el número de puestos que recorre la variable desde el valor mínimo hasta el valor máximo. En este momento consideremos dos casos:

Si trabajamos con variables continuas, llegamos a obtenerla directamente a través de la diferencia simple, pero si se trata de una variable discreta, entonces a la diferencia entre estos valores le agregamos la unidad porque se consideran los dos valores extremos:

AV = H – L

Variable continua

23

Guía didáctica: Estadística I

AV= H – L + 1

Variable discreta

Donde: H = Xmáx = valor máximo de la variable L = Xmin = valor mínimo de la variable b.

Intervalos de clase o categorías: corresponde a cada uno de los niveles, clases o categorías en los que se distribuye la variable.

c.

Límites de clase: son los límites de los intervalos y por ello vamos a tener el límite inferior y el límite superior. Cuando la variable es continua el límite superior es igual al límite inferior de la siguiente clase o intervalo, en cambio cuando se trata de una variable discreta, el límite superior de una clase es diferente al límite inferior de la siguiente.

Especialmente cuando se está trabajando con una variable discreta, y se requiere volverla continua a la distribución, se identifican los límites reales de clase, que se los obtiene restando la media unidad al límite inferior y sumando la media unidad de la variable al límite superior. De esta manera observaremos que los límites superior e inferior de la clase inmediata son iguales. Otra manera de establecer los límites reales es a través de la semisuma entre los límites superior de una clase e inferior de la siguiente, por ejemplo: Si tenemos los siguientes intervalos, podemos llegar a establecer los límites reales: Tabla 3 Intervalos de clase (con límites nominales)

Intervalos de clase (con límites reales)

100–109

99.5-109.5

110–119

109.5–119.5

120–129

119.5–129.5

109.5 = (109 + 110)/2

En el ejemplo anterior como la variable cambia en la unidad, entonces se va sumando y restando 0,5. Si la variable tuviera una separación de 0,1 entonces se debería sumar y restar 0,05 y así hay que considerar la variable con la que se encuentre trabajando. d.

Número de clases: las clases o intervalos corresponden a cada uno de los niveles en los que se va a presentar a todo el conjunto de observaciones, vienen a constituirse en cada una de las categorías en las que se distribuyen los datos recogidos en la investigación.

No existe una norma para definir exactamente cuántas clases se deberían construir, puesto que esto depende de la información que se haya recogido. Sin embargo, como el objetivo de toda distribución de frecuencias consiste en presentar de forma resumida una información, se aconseja que no sean menos de 5 ni más de 20, esto ¿por qué razón?: si hacemos una distribución con menos de 5 intervalos se pueden perder rasgos o características del conjunto investigado, y luego si se realiza una distribución de frecuencias con más de 20 intervalos, perdería su función básica, cual es la de resumir la información y presentarla de forma que pueda analizar e interpretar.

24

Guía didáctica: Estadística I

Al número de clases se lo representa por “k” y se puede adoptar la siguiente regla para determinar el número de clases a desarrollarse:

2k ≥ n donde:

n es el número total de observaciones

k, es un número entero positivo que representa el número de clases o intervalos de clase en los que se va a distribuir la variable Por ejemplo, si en una investigación hemos recogido 50 valores que ha tomado la variable, entonces procedemos a sustituir las letras por los números, con lo que tendremos: 2k ≥ 50 Buscamos ahora el valor de k, que cumpla la condición, de manera que por ejemplo, si elevamos a la quinta, nos quedaría: 25 = 32, esto no cumple con la condición, seguimos con el siguiente valor, entonces: 26 = 64, aquí ya se cumple con la condición. Por simple inspección, se ha establecido el número de intervalos, puesto que: 26 ≥ 50 64 ≥ 50 En este caso se deberían distribuir en 6 clases a las 50 observaciones. Para considerar: En el ejemplo desarrollado en el texto básico, solamente se menciona 2K > n; sin embargo, nosotros tomaremos en cuenta que el término es: “mayor o igual a n”, es decir 2k ≥ n

Si fuera dado el tamaño de clase o anchura de clase, al número de intervalos lo encontraremos aplicando la siguiente fórmula:

e.

Tamaño o anchura de clase, o intervalo de clase, se refiere al número de puestos que recorre la variable en cada uno de los intervalos desde el límite inferior hasta el límite superior.

Si ya tenemos la distribución, al tamaño lo podemos establecer a través de la diferencia entre los límites superior e inferior siempre que la distribución sea continua, en caso contrario, la distribución es de carácter discreta (cuando existe separación entre los intervalos) y a la diferencia anterior se le suma la unidad en la que se encuentra identificada la variable. Por ejemplo, en la tabla 3, el tamaño es 10, con los límites 109 – 100 +1 =10 o si utilizamos los límites reales, el tamaño será: 109,5 -99,5 = 10 En el caso de que vayamos a construir la distribución de frecuencias, se procede a aplicar la fórmula en la que consideramos el rango o recorrido y el número de intervalos o clases:

25

Guía didáctica: Estadística I

f.

Frecuencia (ni): constituye el número de datos u observaciones que se encuentran dentro de cada uno de los niveles, categorías o intervalos de clase, esta se denomina frecuencia absoluta simple, observe la tabla 1, para la calificación 12, la frecuencia es 3, ahora usted determine las frecuencias para las calificaciones 14, 18 y 20.

Si usted afirma que son 4, 5 y 2 respectivamente, está en lo correcto. Para poder determinar esta frecuencia, se aconseja (hasta que se vaya teniendo práctica), realizar una tabla de conteo para llegar a totalizar la frecuencia de cada intervalo. Una forma de comprobar si se encuentran distribuidos todos los datos, es a través de la suma de la columna de frecuencias que siempre será igual al número de datos recogidos y organizados en la tabla. g.

Marcas de clase (Xi): una vez que ha realizado la tabla de frecuencias, se puede considerar como otro elemento a la marca de clase o también conocido como punto medio, ya que para su determinación se procede a sumar los límites inferior y superior de la misma clase y dividirlos entre dos. De otra manera podemos expresar que la marca de clase se constituye en la semisuma de los límites inferior y superior de cada uno de los intervalos de clase.

2.2.2. Sugerencias para elaborar una tabla de distribución de frecuencias Revise ahora en el texto básico el ejemplo desarrollado, en el que se elabora una tabla de frecuencias para mostrar el precio típico de venta en diversas concesionarias (tabla 2.4). Ahora realicemos un ejemplo para aplicar lo mencionado anteriormente: En 50 bancos comerciales y/o instituciones de préstamos, se registró el número de solicitudes de préstamos para casas otorgados durante un mes en particular. Los datos son los siguientes: 2

4

2

32

9

9

2

6

3

1

14

9

16

7

8

19

6

4

4

2

4

18

0

6

13

7

2

8

0

1

14

1

2

2

18

8

24

1

8

5

1

3

11

18

26

3

12

23

5

4

Se solicita presentar la información a través de una tabla de frecuencias. Bien, como en el pedido no nos indica ni tamaño ni número de clases en las que se debe presentar la distribución de frecuencias, procedemos a resolver este pedido de la siguiente manera: 1.

Identificamos los valores máximo y mínimo: busque usted los valores máximo y mínimo Xmáx. = H = 32 Xmin. = L = 0

26

Guía didáctica: Estadística I

2.

Establecemos el rango o recorrido de la variable, en este caso podemos identificar que se trata de una variable discreta porque hablamos de “número de solicitudes”, entonces tendremos: AV = H – L + 1 AV = 32 – 0 + 1 AV = 33

Significa entonces que la variable recorre 33 puestos desde el valor menor hasta el valor mayor. 3.

Número de clases o intervalos, como no se nos ha solicitado un número específico, procedemos a establecerlo: 2K ≥ n

Ahora reemplazamos los valores: 2k ≥ 50 Si decimos que K= 5, entonces tendremos que 25 = 32, lo que significa que no se cumple la condición, puesto que hay 50 datos y 32 es menor a 50. Luego, si K = 6, tendremos que 26 = 64, esto significa por tanto que la condición 26 > 50, es correcta porque 64 > 50. De esta manera llegamos a confirmar la distribución de los datos en 6 intervalos. 4.

Tamaño o anchura de clase, con los datos anteriormente definidos, encontramos el tamaño del intervalo de clase:

En este caso, como no resultó un valor exacto, aproximamos al inmediato superior que sería 6. 5.

Nuevo rango, debido al resultado anterior debemos encontrar un nuevo rango, si hubiéramos tenido un resultado exacto no hace falta realizar este paso. Nuevo rango=(tamaño de clase)*(número de clases) Nuevo rango=(6)*(6)=36

Si relacionamos con el rango original (33) vemos que nos van a sobrar 3 datos, los cuales se pueden distribuir entre los valores menores y mayores pero como en este caso el primer valor es 0 solamente podemos agregar los nuevos datos al valor mayor, lo que significaría que vamos a llegar hasta 36 en la distribución de frecuencias.

27

Guía didáctica: Estadística I

6.

Elaboración de la tabla de frecuencias (ni). Una vez que ya contamos con todos los elementos procedemos a elaborar la tabla de frecuencias, considerando los intervalos, el conteo y la frecuencia correspondiente:

Tabla 4: Número de solicitudes de préstamos para casas Número de solicitudes

Tabla de conteo

Frecuencia (ni)

0–6

///////////////////////////

27

6–12

///////////

11

12–18

///////

7

18–24

///

3

24–30

/

1

30–36

/

1

Escriba la frecuencia que le corresponde a cada clase

50

Total Esta columna solo es un elemento auxiliar

Consideremos que: Para ubicar los datos se puede tomar un solo criterio para toda la distribución. Por ejemplo: Si el valor del límite superior de una clase es igual al límite inferior de la siguiente clase, y el dato es exactamente igual a ese valor, se lo puede ubicar en el intervalo en donde coincide con el límite superior o ubicarlo en el intervalo en donde es igual al límite inferior, pero ese mismo criterio se debe aplicar a toda la distribución. En el ejercicio, el valor 6, se ubica en el primer intervalo y no en el segundo, lo mismo que el valor 18 o el 24, se consideran en el intervalo tercero y cuarto, respectivamente.

Con esto hemos logrado construir una tabla de frecuencias. Es hora de practicar lo aprendido, para lo cual le invito a desarrollar los ejercicios 12, 13 y 14, que se encuentran en el texto básico.

2.3. Distribuciones de frecuencia relativa Hasta ahora, hemos determinado las frecuencias absolutas simples, o solamente conocidas como frecuencias, sin embargo, también podemos determinar las frecuencias relativas que se definen como la proporción de datos que contiene cada intervalo del total. Para encontrarla, lo que hacemos es dividir cada frecuencia absoluta simple para el número total de observaciones y si queremos expresar en porcentaje a este resultado se lo multiplica por 100.

28

Guía didáctica: Estadística I

Tabla 5: Número y proporción de solicitudes de préstamos para casas Número de solicitudes

Frecuencia absoluta

Frecuencia relativa

Frecuencia relativa (en porcentaje)

0–6

27

0,54

54

6–12

11

0,22

22

12–18

7

0,14

14

18–24

3

0,06

6

24–30

1

0,02

2

30–36

1

0,02

2

Total

50

1

100

Se puede presentar en cualquiera de las dos formas

Como podemos observar la suma de las frecuencias relativas siempre nos tiene que resultar igual a 1, o si lo estamos presentando de manera porcentual a 100%, puesto que lo que hacemos es definir la proporción de datos que se encuentra en cada intervalo. Con lo que hemos revisado hasta ahora puede contestar a la siguiente interrogante: ¿Cuál es la diferencia entre frecuencia absoluta simple y frecuencia relativa simple? Bien, si usted indicó que la principal diferencia radica en que la primera se refiere a la cantidad de datos observados y que la segunda se refiere a la proporción de datos que se encuentra en cada intervalo o clase, está en lo correcto.

2.4. Representación gráfica de una distribución de frecuencias Ahora pasemos a presentar la misma información a través de un gráfico, para ello se utilizan el histograma y el polígono de frecuencias. Realice la lectura de este tema en el texto básico y luego elabore un cuadro resumen de las características de cada una.

HISTOGRAMA

_______________________________________ _______________________________________ _______________________________________ _______________________________________ _______________________________________

Siguiendo con el ejercicio anterior, vamos a representar gráficamente la distribución de frecuencias a través de un histograma, lo que nos permitirá por simple observación llegar a conclusiones sobre el conjunto de datos, de la siguiente manera:

29

Guía didáctica: Estadística I

HISTOGRAMA

Número de Bancos y/o Instituciones de préstamos

Solicitudes de préstamos para casas en Bancos y/o Instituciones 30 28 26 24 22 20 18 16 14 12 10 8 6 4 2 0

27

11 7 3

0–6

6 – 12

12 – 18

18 – 24

1

1

24 – 30

30 – 36

Número de solicitudes

Fuente: tabla 5 Elaboración: el autor

Es conveniente ahora, que usted, sin observar la tabla con los valores, y solamente observando el gráfico, enuncie las principales conclusiones a las que puede abordar: __________________________________________________________________ __________________________________________________________________ __________________________________________________________________ ___________________________________________________________________ __________________________________________________________________.

Revise ahora en el texto básico, lo referente al polígono de frecuencias y describa las características y todo aquello que se debería considerar

POLIGONO DE FRECUENCIAS

_____________________________________ _____________________________________ _____________________________________ _____________________________________ _____________________________________

Elaboremos ahora, el gráfico conociendo que previamente hay otros elementos que se debe preparar, como se muestra en la tabla 6.

30

Guía didáctica: Estadística I

Tabla 6 Número de solicitudes

Marcas de clase

Frecuencia absoluta

 

-3

0

0–6

3

27

6–12

9

11

12–18

15

7

18–24

21

3

24–30

27

1

30–36

33

1

 

36

0

Total

Marcas de clase supuestas

50

Para el ejercicio que venimos desarrollando el gráfico será el siguiente:

Número de Bancos y/o Instituciones de préstamos

POLÍGONO DE FRECUENCIAS

Solicitudes de préstamos para casas en Bancos y/o Instituciones 27

30 25 20 15

11 7

10 0 -6

-3

3

5 0

0

3

6

9

12

15

18

21

1 24

27

1 30

33

0 36

39

42

Número de solicitudes

Fuente: tabla 5 Elaboración: el autor

De igual manera, si usted solamente estuviera observando este gráfico sin conocer los datos, ¿qué conclusiones puede identificar? y ¿por qué es necesario establecer las “marcas de clase supuestas”? En cada uno de las representaciones gráficas, usted ha podido revisarlo y por simple observación ha llegado a establecer conclusiones sobre los valores observados, sin embargo, también ha observado que el gráfico tiene un título, que cada uno de los ejes de igual manera tiene un título en el que se identifica la información que se está presentando y también se debe hacer constar la fuente en la que se origina la información y quién lo elabora.

31

Guía didáctica: Estadística I

Adicionalmente los gráficos deberían ir numerados cuando hay algunos en un mismo documento, de manera que luego al presentar la investigación se elabore un índice de gráficos y de tablas. El título de todo gráfico, debe reflejar la información que se está presentando, de manera que el lector inmediatamente pueda identificarla a través de las representaciones. Por otro lado cuando hablamos del polígono de frecuencias es necesario establecer marcas de clase supuestas con la finalidad de cerrar el polígono. Como podemos observar en la tabla 6, las marcas de clase supuestas son (-3) y (39), una anterior a la primera y otra posterior a la última. Como la primera marca de clase es (3) entonces le restamos el tamaño de los intervalos que en este caso es (6) lo que nos daría como resultado una marca de clase de (-3), de igual manera procedemos con la última, como la marca de clase es (33) entonces le sumamos el tamaño de los intervalos (6) lo que nos da como resultado (39). En el caso de querer representar las frecuencias relativas, realizamos exactamente el mismo procedimiento con la diferencia que en el eje de las Y no ubicaremos una escala con las frecuencias absolutas, sino con las frecuencias relativas, en lo demás se siguen los mismos procedimientos.

2.5. Distribuciones de frecuencia acumuladas El análisis de la información a veces requiere considerar la cantidad de datos que van quedando después de unos o también analizar la proporción de datos que se encuentran antes o después de determinado valor, para ello se emplea el análisis de las frecuencias acumuladas. Remítase al texto para que establezca la función de las frecuencias acumuladas de manera que las pueda resumir en un cuadro sinóptico. En efecto, una frecuencia acumulada nos muestra la cantidad de datos u observaciones que se encuentran antes o después de un valor de interés y de igual forma podemos llegar a establecer las frecuencias acumuladas relativas, que siguen el mismo procedimiento. Adicionalmente a lo que nos presentan los autores del texto básico, podemos explicar lo correspondiente a las frecuencias acumuladas, de la siguiente manera: ™™

Para encontrar las frecuencias acumuladas, hay que partir de la necesidad de análisis, pues podemos realizar una distribución “menor que” o una distribución “mayor que”.

™™

La frecuencia acumulada “menor que”, nos muestra el número de datos que se encuentran por debajo de un determinado valor; para encontrarla lo que hacemos es ir sumando las frecuencias anteriores.

™™

La frecuencia acumulada “mayor que”, en cambio nos presenta el número de datos que se encuentra después de determinado valor, por lo que iniciamos con el total de observaciones y luego vamos restando las frecuencias absolutas simples de cada intervalo.

De igual forma trabajamos con las frecuencias relativas; de manera que podemos encontrar las frecuencias acumuladas mayor que o menor que. Continuando con los datos del ejercicio anterior, tendríamos lo siguiente:

32

Guía didáctica: Estadística I

Tabla 7 Número de solicitudes

Frecuencia absoluta simple

Frecuencia acumulada “Menor que”

cálculo

Frecuencia acumulada “Mayor que”

cálculo

0–6

27

27

27 + 0

50

50–0

6 – 12

11

38

27 + 11

23

50–27

12 – 18

7

45

38 + 7

12

23–11

18 – 24

3

48

45 + 3

5

12–7

24 – 30

1

49

48 + 1

2

5–3

30 – 36

1

50

49 + 1

1

2–1

Total

50

 

 

 

 

En el primer caso respondemos a la pregunta ¿cuántos datos menores que 6 hay? y la respuesta es 27, o si vemos en el siguiente caso ¿cuántos datos menores que 12 hay?, serán los que van quedando entonces serán los 27 del primer intervalo más los 11 del segundo, así sucesivamente llegamos hasta el último en donde tendremos la totalidad de los casos. Cuando trabajamos con la frecuencia acumulada “mayor que”, vamos a dar respuesta a la interrogante ¿cuántos datos mayores que 0 hay?, en este caso la respuesta será 50, o sea la totalidad de los datos, luego para el siguiente intervalo preguntamos ¿cuántos datos mayores que 6 hay? y la respuesta vendría dada por la diferencia entre los 50 y los que van quedando en el primer intervalo que son 27. De igual forma seguimos hasta llegar al último intervalo que será igual a la frecuencia absoluta simple. Puede ahora responder a las siguientes preguntas: ¿Cuántos datos menores a 24 existen? ¿Cuántos datos menores a 30 existen? ¿Cuántos datos mayores a 18 existen? ¿Cuántos datos mayores que 6 existen? De acuerdo. Para que verifique sus respuestas observe las columnas correspondientes a las frecuencias acumuladas.

2.6. Representación gráfica de las frecuencias acumuladas El gráfico que nos permite observar con mayor rapidez la forma en la que se encuentran los datos, se denomina OJIVA y al igual que las tablas tendremos entonces una ojiva menor que y una ojiva mayor que. Este es un gráfico lineal en donde el eje Y contiene las frecuencias acumuladas y en el eje X seguimos representando los límites de los intervalos. Presentamos cada uno de los gráficos resultantes:

33

Guía didáctica: Estadística I

De igual forma podemos proceder con las frecuencias relativas acumuladas en donde el eje Y tendría como escala del 0 al 100%. ¿Qué diferencias puede mencionar de los dos gráficos?

2.7. Otros tipos de gráficos comúnmente utilizados Revise unas páginas anteriores en el texto básico (representación gráfica de datos cualitativos) y usted podrá encontrar otros tipos de gráficos que le permiten representar la información que se recoge en las investigaciones que se realizan: Enuncie el uso que cada una de ellas tiene y preséntelo en un cuadro sinóptico: • • • • •

Barras verticales Barras horizontales Lineal Circular Otros que usted puede identificar

34

Guía didáctica: Estadística I

Ejercicios Realice los ejercicios 30, 33 y 36 que constan en el texto básico después del resumen del capítulo.

Actividades recomendadas

Vamos ahora a ejercitarnos con la presentación y el análisis de la información que se observa en distintos medios, para ello le sugiero que haga lo siguiente: ¾¾

Revise los periódicos y observe la información que se muestra en la sección financiera, ubique un gráfico y extraiga sus propias conclusiones, luego de ello lea la información completa.

¾¾

Realice una encuesta a varias personas y pregunte su edad, luego a esa información preséntela en una serie de frecuencias, (si es del caso, elabore una tabla de distribución de frecuencias), represéntela gráficamente.

Es hora de constatar lo que hemos avanzado en el estudio de esta unidad, para lo cual le invito a desarrollar la siguiente autoevaluación.

35

Guía didáctica: Estadística I

Autoevaluación 2

A.

Conteste dentro del paréntesis con V o F si considera que las siguientes afirmaciones son verdaderas o falsas respectivamente.

1.  (    )

Las encuestas se consideran como una fuente de información secundaria.

2.  (    )

Las variables cualitativas se subdividen en discretas y continuas.

3.  (    )

Las variables discretas se originan en la enumeración o el conteo.

4.  (    )

Una tabla de distribución de frecuencias nos permite presentar en forma resumida un conjunto de datos.

5.  (    )

La marca de clase es el punto medio de un intervalo de clase.

6.  (    )

La frecuencia relativa simple nos muestra la proporción de datos que se encuentran en cada uno de los intervalos de clase.

7.  (    )

Los límites de clase determinan los valores mínimo y máximo de cada uno de los intervalos de clase.

8.  (    )

Para realizar el polígono de frecuencia se utilizan las frecuencias acumuladas.

9.  (    )

El histograma se caracteriza por ser un gráfico de barras verticales continuas.

10.  (    )

Se denominan ojivas a las representaciones gráficas de las frecuencias acumuladas menor qué y/o mayor qué.

Recuerde que usted puede constatar sus respuestas en el solucionario que se encuentra al final de esta guía. ¿Cómo le fue? Bien, me alegra. Si no es así, le recomiendo volver a revisar los temas de manera que se encuentre listo para comprender la siguiente unidad. Para recordar: En esta unidad hemos conocido la forma de recoger la información y la hemos organizado y presentado de acuerdo a su origen, tipo y necesidad de información. Hemos conocido el procedimiento para construir una tabla de distribución de frecuencias con todos sus elementos y representaciones gráficas. Ahora nos corresponde seguir con el tratamiento de la información y para ello, nos adentramos a conocer las características que se pueden extraer del grupo de datos investigados, para llegar a obtener conclusiones válidas sobre el.

36

Guía didáctica: Estadística I

UNIDAD 3: MEDIDAS DESCRIPTIVAS: MEDIDAS DE TENDENCIA CENTRAL Para el desarrollo de esta unidad, revise conjuntamente con esta guía el capítulo 3 del texto básico denominado: Descripción de datos–medidas numéricas.

3.1. Introducción Una vez que conoce la forma de recoger información y de presentarla, sea través de tablas o con el procedimiento realizado para elaborar una tabla de distribución de frecuencias, ahora es conveniente seguir con las características que permiten describir a un conjunto de datos que se recogen de un problema a investigarse. Siempre se observan indicadores o elementos referenciales de los cuales se extraen conclusiones respecto al tema investigado. En esta ocasión iniciamos la búsqueda de esas características y para ello lo hacemos con el estudio de las medidas de tendencia central que no son más que la determinación de una característica puntual de acuerdo a la necesidad del investigador y al objeto en estudio. Vamos entonces a conocer cada una de estas herramientas. Para nuestro estudio tomaremos inicialmente en esta unidad una primera parte del capítulo que se encuentra desarrollado en el texto básico, por ello revisemos la guía para ir luego al texto.

3.2. Medidas de tendencia central También se conocen como medidas de ubicación. Para comprender estos conceptos remítase al texto básico en la parte introductoria del capítulo 3. 3.2.1. Media aritmética 3.2.1.1. Definición Lea en el texto básico la explicación sobre la media poblacional y la media muestral; allí se va a encontrar con dos conceptos previamente analizados en esta guía como son el parámetro y el estadístico, ya sabemos que son las características de la población y de la muestra respectivamente. Ahora, luego de la lectura realizada, usted puede enunciar una definición propia de lo que considera como media aritmética, independientemente si se trata de una población o de una muestra, entonces escríbala en su cuaderno de trabajo. 3.2.1.2. Características Remítase ahora al texto básico, donde encontrará desarrolladas las propiedades de la media aritmética, analice cada una de ellas y preséntelas en un cuadro resumen.

37

Guía didáctica: Estadística I

3.2.1.3. Formas de cálculo Para llegar a determinar el valor de la media aritmética podemos resumir la forma de hacerlo de acuerdo a las características de los datos, puesto que en el texto no se encuentran especificadas las variaciones que pudieran existir. Esto le ayudará a comprender mejor la aplicación. FORMA DE PRESENTACIÓN DE LOS DATOS

Datos no agrupados

Serie ordenada

Tabla de distribución de frecuencias

FORMAS DE CÁLCULO Muestra

Población

Xi= valor observado

Xi= valor observado

n = número de datos

N = número de datos

Xi= valor observado

Xi= valor observado

ni= frecuencia de cada valor

ni= frecuencia de cada valor

n = número de datos

N = número de datos

Xi= marca de clase

Xi= marca de clase

ni= frecuencia de cada clase

ni= frecuencia de cada clase

n = número de datos

N = número de datos

Para ampliar la comprensión de cada una de estas variantes, revise los ejercicios que se encuentran desarrollados en el texto básico. ¿Qué es lo importante aquí? Adicionalmente a determinar el valor, es también, saber intepretar el resultado, en este caso cualquiera sea el tipo de datos con el que contamos, el resultado obtenido nos indica que es un valor representativo del conjunto, por tanto, podemos hacer referencia a ese valor obtenido porque representa a todos los valores observados. Revise los ejercicios desarrollados en el texto básico, allí usted podrá observar el procedimiento a seguir para calcular el valor de la media aritmética. Ahora vamos a desarrollar un ejemplo de cálculo de la media aritmética para datos agrupados, en base al ejercicio que hemos venido trabajando anteriormente. Recuerde que llegamos a obtener la siguiente tabla de distribución de frecuencias:

38

Guía didáctica: Estadística I

Número de solicitudes

Frecuencia absoluta (ni)

0–6

27

6 – 12

11

12 – 18

7

18 – 24

3

24 – 30

1

30 – 36

1

Total

50

Para calcular la media aritmética, seguiremos los siguientes pasos: Número de solicitudes

Frecuencia absoluta (ni)

Marcas de clase (Xi)

Xini

0–6

27

3

81

6 – 12

11

9

99

12 – 18

7

15

105

18 – 24

3

21

63

24 – 30

1

27

27

30 – 36

1

33

33

Total

50

 

408

a. Establecer la marca de clase

b. Obtener el producto entre la marca de clase y la frecuencia absoluta

c. Sumar cada uno de los productos anteriores

d. Dividir esta suma para el número de datos analizados

¿Qué significado tiene entonces este resultado? En efecto, como se trata de una variable discreta se puede tomar el valor entero esto es 8, y se diría que en los 50 bancos se han tramitado 8 solicitudes de préstamos para casas durante un mes. 3.2.2. Media aritmética ponderada Podríamos decir que esta es una variante de la media aritmética, cuando los datos se presentan de otra manera distinta a las mencionadas anteriormente. Lea en el texto básico esta parte y defina entonces lo que usted considera que es una ponderación. Si en el enunciado que usted realiza, hace referencia a la presencia o asignación de algún peso, importancia o un valor relacionado con el valor que toma la variable, está en lo correcto.

39

Guía didáctica: Estadística I

En el texto usted encuentra que en el ejemplo inicial se hace referencia al precio de las bebidas de acuerdo a cada una de las presentaciones, entonces se determina el precio promedio. Como veremos allí es fácil determinar la variable, a través de la interrogante que ha sido: establecer el precio promedio; luego, la cantidad de bebidas en cada una de las presentaciones constituye la ponderación porque no se han vendido en iguales cantidades. ¿Cómo vamos a calcular? Seguimos el mismo procedimiento que para la media aritmética de una serie ordenada, en donde la diferencia sería que ni, será ahora la ponderación o peso asignado a cada valor (wi). La fórmula quedaría de la siguiente manera:

Ilustremos la aplicación, a través del siguiente ejercicio: Una librería especializada se concentra principalmente en libros usados. Los libros de pasta rústica cuestan 1.00 dólar cada uno, y los de pasta dura, 3.50 dólares. De los 50 libros vendidos el pasado martes por la mañana, 40 fueron de pasta rústica, y el resto de pasta dura. ¿Cuál fue el precio medio ponderado de un libro? De acuerdo a la interrogante planteada, se establece que la variable es el Precio y que la cantidad vendida correspondería al peso o la ponderación para cada uno de los tipos de libros, de esta manera tendremos el siguiente cuadro de datos: TIPO DE LIBRO Pasta rústica Pasta dura

PRECIO (Xi)

CANTIDAD (Wi)

(XiWi)

1

40

40

3,5

10

35

50

75

Esto significa que en promedio los 50 libros fueron vendidos a 1,5 dólares, podemos decir también que el precio típico de los libros es de 1,5 dólares. Analice ahora el ejemplo que se ha desarrollado sobre la aplicación de la media ponderada que consta en el texto básico.

40

Guía didáctica: Estadística I

3.2.3. Mediana 3.2.3.1. Definición Remítase al texto básico y en el acápite titulado como mediana, lea, analice y establezca su propia definición sobre este indicador. Con la lectura y reflexión, se ha podido dar cuenta que mientras la media aritmética utiliza todos los valores que se han recogido de una investigación, la mediana solamente establece el valor que se encuentra utilizando la posición central dentro del conjunto. 3.2.3.2. Características Siguiendo con la lectura, ahora puede establecer las características de este indicador, y luego las puede enunciar de manera resumida.

3.2.3.3. Formas de cálculo Al igual que en el cálculo de la media aritmética, también en la mediana debería identificarse el tipo de datos que se tiene para luego identificar el procedimiento. Esta parte no se encuentra desarrollada en el texto básico, por lo que lo voy a explicar aquí:

Mediana para datos no agrupados Los datos no agrupados son aquellos que no tienen una ordenación previa para presentarlos; por ello, se debe realizar lo siguiente: a. b. c.

Con los datos recogidos se procede a ordenarlos de manera ascendente o descendente Establecer el dato que ocupa la posición central. Identificar el valor del dato que ocupa la posición central que vendría a ser el valor mediano.

Para identificar el dato que se encuentra ocupando la posición central dentro de todo el conjunto de datos, aplicaremos la siguiente ecuación:

Con cuyo resultado contaremos la posición desde el valor menor y desde el valor mayor, por ejemplo, si tenemos los siguientes datos: 6, 9, 3, 7, 4, 8, 6, 9, 1, 2 Procedemos a ordenarlos: 1, 2, 3, 4, 6 , 6 , 7, 8, 9, 9, luego identificamos la posición que ocupa el valor central:

PosMe= 5,5

41

Guía didáctica: Estadística I

Como el número de datos es par, significa que deberemos tomar los datos que ocupan la posición 5 y la posición 6. Posteriormente establecemos el promedio entre los valores encontrados y con ello finalmente hemos determinado el valor mediano:

Me= 6 Este resultado significa que, 6 es el valor que se encuentra ocupando la posición central o que es el valor que divide en dos partes iguales al conjunto. Si el número de datos es impar, entonces encontramos la posición, siguiendo el mismo procedimiento:

Hagamos un ejemplo de aplicación, con los siguientes datos: 5, 8, 3, 9, 1, 5, 7, 3, 8, 6, 4. Procedemos a ordenar los datos: 1, 3, 3, 4, 5, 5, 6, 7, 8, 8, 9 Ahora establecemos el dato que ocupa la posición central:

PosMe= 6 Identificamos el sexto valor, aquí no hay problema empezar por el menor o por el mayor, puesto que será un solo valor: 1, 3, 3, 4, 5, 5 , 6, 7, 8, 8, 9. Por simple observación llegamos a determinar que el valor mediano es: Me = 5 Tenga presente que primero se encuentra la posición del dato mediano y luego el valor mediano.

Mediana para datos agrupados Para calcular la mediana de datos presentados en una tabla de distribución de frecuencias, vamos a desarrollar el siguiente procedimiento: a.

En la tabla de distribución de frecuencias, encontramos la frecuencia acumulada.

b.

Establecemos el dato que se encuentra ocupando la posición central. Para ello utilizamos la siguiente fórmula:

42

Guía didáctica: Estadística I

c.

Identificamos el intervalo mediano a través de la frecuencia acumulada y la posición encontrada.

d.

Aplicamos la fórmula de la mediana que es la siguiente:

donde: Li = límite real inferior del intervalo mediano n = número total de observaciones FA = frecuencia acumulada anterior al intervalo mediano ni = frecuencia absoluta simple del intervalo mediano i = tamaño o anchura del intervalo de clase mediano Ilustremos el procedimiento a través del cálculo del valor mediano, con el siguiente ejercicio: Un estudio de 241 autores famosos reveló los siguientes datos acerca de la distribución de las edades a las que fue publicado su mejor libro. Determine la edad que corresponde al 50% de los autores Número de autores (ni)

Frecuencia acumulada (FA)

20 a 30

20

20

30 a 40

73

93

40 a 50

80

173

50 a 60

44

217

60 a 70

22

239

70 a 80

2

241

Edad del autor

Total

Este es el intervalo mediano porque hasta allí existen 173 datos y a nosotros nos interesa el dato 120,5

241

PosMe = 120, 5 Una vez que hemos identificado el dato que contiene el valor mediano, y que con ello hemos determinado el intervalo mediano, continuamos con el procedimiento. Aplicamos la fórmula para encontrar el valor mediano:

Me = 43, 44

43

Guía didáctica: Estadística I

Con lo aprendido usted puede interpretar este resultado. Explique su significado. Si en su interpretación indica que es el valor que se encuentra ocupando la posición central y que es el que supera al 50% de los valores observados, entonces se encuentra en lo correcto. 3.2.4. Moda 3.2.4.1. Definición Volvamos a trabajar en el texto básico y revise lo que nos explican al respecto los autores. Con sus propias palabras, exprese una definición de la moda. Generalmente, este término lo utilizamos para referirnos a aquello que se encuentra con mayor frecuencia o que muchos utilizan, por ejemplo en el vestir. 3.2.4.2. Características Con la lectura realizada puede también extraer algunas características de la moda, para establecer las diferencias y sus aplicaciones con respecto a la media aritmética y a la mediana. 3.2.4.3. Formas de cálculo Aquí trabajaremos en forma más amplia, puesto que en el texto no existe mayor detalle de este indicador. Al igual que en las dos medidas anteriores vamos a diferenciar entre los tipos de datos que tenemos a disposición. Para datos no agrupados, por simple observación se puede determinar el valor o los valores de la moda, si es que existieran. Si tenemos los siguientes valores: 4, 5, 7, 5, 8, 1, 3, 5, 6, 8, 5 Procedemos a ordenarlos para facilitar la observación: 1, 3, 4, 5, 5, 5, 5, 6, 7, 8, 8. En este caso el valor modal es 5 porque es el que se repite el mayor número de veces en este grupo. Para el caso de datos agrupados en una serie ordenada de frecuencias, se considera únicamente la mayor frecuencia y el valor de la variable será el valor modal. Cuando trabajamos con datos agrupados en una tabla de distribución de frecuencias, deberemos observar los siguientes pasos: a. b. c. d.

44

Considerar el intervalo que mantiene la frecuencia absoluta simple más alta, lo que sería intervalo modal. Determinar la diferencia entre la frecuencia del intervalo modal y del premodal. Determinar la diferencia entre la frecuencia del intervalo modal y del postmodal. Aplicar la siguiente fórmula:

Guía didáctica: Estadística I

Donde: Li = límite real inferior de la clase modal Δ1= diferencia entre la frecuencia absoluta simple del intervalo modal y del premodal Δ2= diferencia entre la frecuencia absoluta simple del intervalo modal y del postmodal i= tamaño o anchura de la clase modal Calculemos ahora el valor modal del ejercicio anterior:

Frecuencia post modal

Número de autores (ni)

Edad del autor 20 a 30

20

30 a 40

73

40 a 50

80

50 a 60

44

60 a 70

22

70 a 80

2

Total

241

Intervalo modal, porque es el de mayor frecuencia

Frecuencia premodal

Mo = 41,63 Con este resultado usted puede extraer una conclusión que le permite describir a la variable en mención. 3.2.5. Relación entre la media aritmética, mediana y moda La relación de estas tres medidas de tendencia central o de ubicación nos permite identificar la forma en la que se encuentran distribuidos los valores, de manera que así se puede determinar el tipo de sesgo que contiene el conjunto de datos. En el texto básico, en el acápite titulado "Posiciones relativas de la media, la mediana y la moda", podrá leer sobre este tema. Recuerde usted que hemos trabajado las tres medidas de tendencia central de manera que en un mismo conjunto se pueden establecer estas tres medidas, salvo las excepciones para la media aritmética como es el caso de la presencia de valores extremos o cuando existen intervalos abiertos en una tabla de distribución de frecuencias.

45

Guía didáctica: Estadística I

A través de la relación entre estas medidas, podemos ver que existen tres casos que se pueden determinar en cuanto se refiere a la forma en la que se presentan los datos y que se resumen a continuación: SIMÉTRICA

SESGADA A LA DERECHA o SESGO POSITIVO SESGADA A LA IZQUIERDA o SESGO NEGATIVO

Con estas características, ya se puede identificar cada uno de los gráficos que se presentan y el tipo de sesgo que tienen.

SIMÉTRICA (cero sesgo)

SESGO POSITIVO

SESGO NEGATIVO

3.2.6. Media geométrica Adicionalmente a las medidas que hemos analizado hasta ahora, existe la media geométrica que nos permite también calcular promedios de acuerdo al tipo de variable e información con la que estamos trabajando. Su uso obedece también a la necesidad del investigador, revisemos ahora. 3.2.6.1. Definición Lea en el texto básico lo referente a esta herramienta y con sus propias palabras defina su significado. 3.2.6.2. Características De la lectura realizada para establecer la definición también puede llegar a identificar características propias por las cuales se la aplica en las diferentes investigaciones. Una de ellas, establece que el valor obtenido al calcular la media geométrica, nunca es mayor que la media aritmética. Esta medida también se la utiliza cuando queremos identificar el promedio al que cambia una variable durante un período de tiempo, el caso más ilustrativo del uso de esta medida es cuando se requiere conocer el promedio de crecimiento anual de la población de un país durante un período; la misma aplicación encontramos cuando se está trabajando con tasas (porcentuales) que serían a las que cambia la variable. En el texto básico, usted puede encontrar la ilustración de su uso a través de los ejemplos desarrollados. 3.2.6.3. Formas de cálculo Al revisar el texto básico, va a encontrar que existen dos formas de aplicar la media geométrica, de acuerdo a la necesidad y a la aplicación que se requiera:

46

Guía didáctica: Estadística I

1.

Utilizando la fórmula que considera la raíz n-ésima del producto de las variables.

2.

Utilizando la fórmula para establecer el promedio de los porcentajes o incrementos por cada período en donde se considera la cantidad final y la cantidad inicial.

Desarrollemos un ejercicio para ilustrar el segundo caso: La población del Ecuador en el año 2001 fue de 12´500.000 habitantes. De acuerdo a los datos registrados en el censo del año 2010, la población es de 14´483.499 habitantes. ¿Cuál es la tasa de incremento promedio anual de la población ecuatoriana?

MG=1,65% Esto significa entonces que cada año la población ha crecido en el 1,65% en promedio Revise los ejercicios resueltos para cada uno de los casos establecidos que se encuentran en el texto básico. En este momento vamos a desarrollar un ejercicio, en el que calculamos las tres medidas de tendencia central y luego procederemos a considerar una distribución en donde la variable se refiere a las calificaciones obtenidas en un examen, por lo que emplearemos el concepto de límites reales. Vaya repasando cada uno de los pasos en el cálculo de las medidas, así como también los elementos que se utilizan.

47

Guía didáctica: Estadística I

Ejercicio de aplicación En un examen de estadística rendido por 54 estudiantes, se obtuvieron las siguientes calificaciones (sobre 100 puntos): CALIFICACIONES

ESTUDIANTES (ni)

45–49

2

50–54

3

55–59

5

60–64

6

65–69

7

70–74

8

75–79

6

80–84

6

85–89

5

90–94

3

95–99

3

 

54

Se solicita calcular, la media aritmética, la mediana y la moda, e identificar el tipo de sesgo que tiene el conjunto de datos. Media aritmética CALIFICACIONES

ESTUDIANTES (ni)

Xi

(Xi*ni)

45–49

2

47

94

50–54

3

52

156

55–59

5

57

285

60–64

6

62

372

65–69

7

67

469

70–74

8

72

576

75–79

6

77

462

80–84

6

82

492

85–89

5

87

435

90–94

3

92

276

95–99

3

97

291

 

54

 

3908

µ = 72, 37

48

Guía didáctica: Estadística I

De acuerdo a este resultado, podemos afirmar que la calificación representativa del conjunto de 54 estudiantes es de 72,37. Si la variable queda expresada en puntaje exacto, la calificación representativa sería de 72 puntos. Mediana CALIFICACIONES

ESTUDIANTES (ni)

Límites reales

FA

45–49

2

44,5–49,5

2

50–54

3

49,5–54,5

5

55–59

5

54,5–59,5

10

60–64

6

59,5–64,5

16

65–69

7

64,5–69,5

23

70–74

8

69,5–74,5

31

75–79

6

74,5–79,5

37

80–84

6

79,5–84,5

43

85–89

5

84,5–89,5

48

90–94

3

89,5–94,5

51

95–99

3

94,5–99,5

54

 

54

 

 

Intervalo mediano

Me = 72 Según el resultado obtenido, quiere decir que el 50% de estudiantes ha obtenido una calificación de 72 puntos, por debajo de esa calificación se encuentra el 50% de estudiantes y sobre esa misma calificación se encuentra el 50% restante.

49

Guía didáctica: Estadística I

Moda CALIFICACIONES

ESTUDIANTES (ni)

Límites reales

45–49

2

44,5–49,5

50–54

3

49,5–54,5

55–59

5

54,5–59,5

60–64

6

59,5–64,5

65–69

7

64,5–69,5

70–74

8

69,5–74,5

75–79

6

74,5–79,5

80–84

6

79,5–84,5

85–89

5

84,5–89,5

90–94

3

89,5–94,5

95–99

3

94,5–99,5

 

54

 

Intervalo modal

Mo = 71, 17 El resultado de la moda nos explica que la calificación que se presenta con mayor frecuencia en el grupo de los 54 estudiantes es de 71 puntos. Sesgo Al comparar los resultados obtenidos con las tres medidas de tendencia central, tendremos que: μ = 72,37 Me = 72 Mo = 71,17 El valor de la media aritmética es mayor a los valores de la mediana y de la moda, por lo tanto, la distribución tiene sesgo levemente positivo, porque como observamos la diferencia entre los valores resultantes, no es mayor.

50

Guía didáctica: Estadística I

Actividades recomendadas

Para una mejor comprensión y desarrollo de las habilidades en la resolución de problemas que tienen que ver con la aplicación de estas herramientas, es necesario proceder a resolver ejercicios en donde se consideren distintas formas en las que se encuentran los datos recogidos y sobre todo las necesidades de investigación. Por ello le sugiero que realice los ejercicios que se encuentran en el texto básico al finalizar cada uno de los temas, así como también aquellos que se encuentran en la primera parte del resumen del capítulo 3 del texto, desde el ejercicio 63 hasta el 74. Adicionalmente, al encontrar la respuesta, se requiere comprenderla y analizarla en base a las características de la herramienta utilizada. Resulta necesario e importante medir el avance en la comprensión de los temas desarrollados, le vuelvo a insistir que todos los contenidos de este componente educativo se convierten en prerrequisito de los siguientes, por tanto, asegúrese de haber comprendido todos, para ello le propongo la siguiente autoevaluación.

51

Guía didáctica: Estadística I

Autoevaluación 3

A.

Conteste dentro del paréntesis con V o F si considera que las siguientes afirmaciones son verdaderas o falsas respectivamente:

1.  (    )

El cálculo de la media aritmética toma en cuenta todos los valores del conjunto de datos.

2.  (    )

En una tabla de distribución de frecuencias en la que existe un intervalo de clase abierto, no es posible calcular el valor de la media aritmética.

3.  (    )

La suma de las diferencias entre cada uno de los valores con respecto a la media aritmética, siempre debe ser igual al número de datos recogidos.

4.  (    )

La mediana es el valor que se encuentra repetido el mayor número de veces dentro del conjunto.

5.  (    )

El valor mediano ocupa la posición central dentro del conjunto de observaciones.

6.  (    )

Para calcular el valor mediano en una tabla de distribución de frecuencias, se requiere considerar la frecuencia acumulada.

7.  (    )

En un conjunto de datos puede existir uno o más valores modales.

8.  (    )

Cuando el valor de la media aritmética es igual a los valores de la mediana y la moda, se dice que la distribución de los datos es simétrica.

9.  (    )

La media geométrica es aquel valor que se encuentra ocupando la posición central dentro de un conjunto de valores.

10.  (    )

La media geométrica siempre es menor o igual (nunca mayor) que la media aritmética.

Importante: al final de esta guía didáctica, usted puede encontrar el solucionario a esta autoevaluación, esto le permitirá contrastar sus avances. Si en alguna de las preguntas ha fallado en su respuesta, vuelva a revisar el tema de manera que asegure su comprensión. No pase a la siguiente unidad hasta que se encuentre convencido de sus habilidades en estos temas.

52

Guía didáctica: Estadística I

Para recordar: Con los temas desarrollados en esta unidad, hemos podido determinar las principales características de un conjunto de datos, lo que nos ha permitido a su vez llegar a conclusiones sobre el tema investigado. Las medidas de tendencia central son fáciles de entender y nos determinan un valor en cada una, luego al relacionar los valores alcanzados se llega también a identificar el tipo de sesgo o la forma en la que se encuentran distribuidos los valores. Cada una de las medidas posee sus características y aplicaciones, por lo que se debe tener bien claro cuándo y para qué aplicarlas. Otra de las medidas de tendencia central es la media geométrica, que tiene su aplicabilidad de acuerdo a las necesidades del investigador y de acuerdo a las características de la información. También hemos abordado a la media ponderada, que viene a ser un caso especial de la media aritmética. En el segundo bimestre, tendremos la oportunidad de analizar las medidas de dispersión, que también nos permitirán caracterizar de mejor manera al conjunto de datos y valores observados.

Hemos concluido con el estudio de todas las unidades correspondientes al primer bimestre, ahora, estamos preparados para rendir nuestra primera evaluación presencial parcial, le auguro el mejor de los éxitos, y le invito a que con el mismo o mayor ánimo continúe con los temas a desarrollar en el segundo bimestre.

53

Utiliza los elementos conceptuales y procedimentales de la estadística descriptiva.

Reconoce la importancia de la estadística como eje transversal para la organización, sistematización, inferencia y validación en las diferentes disciplinas del conocimiento científico.



Competencias específicas del componente educativo

Desarrolla el pensamiento • matemático y estadístico para la aplicación y análisis de aspectos económicos.

Competencias específicas de titulación

Lectura comprensiva del capítulo 3 del texto básico (medidas de ™™ dispersión) y del capítulo 4 (otras medidas de posición).

¾¾

Desarrollo de los ejercicios de revisión que constan al finalizar la explicación del capítulo 3 y del capítulo 4.

Revisión de la guía didáctica.

¾¾

™™

Tiempo de dedicación Describe un conjunto Semana 1 de datos, identificando Cuatro horas de autoestudio la importancia de las medidas de dispersión. Cuatro horas de interacción Calcula, analiza e interpreta los resultados de la aplicación de las medidas de dispersión.

Actividades de aprendizaje Indicadores de aprendizaje

4.2.1. Amplitud de Variación 4.2.2. Desviación media absoluta ¾¾ 4.2.2.1. Definición 4.2.2.2. Características 4.2.2.3. Formas de cálculo

4.2. Medidas de dispersión

4.1. Introducción

UNIDAD 4: Medidas descriptivas: Medidas de dispersión

Contenidos Unidades

Vivencia de los valores universales del humanismo de Cristo Comunicación oral y escrita Orientación a la innovación y a la investigación Pensamiento crítico y reflexivo Trabajo en equipo Comunicación en inglés Compromiso e implicación social Comportamiento ético Organización y planificación del tiempo

6.6. Planificación para el trabajo del alumno

¾¾ ¾¾ ¾¾ ¾¾ ¾¾ ¾¾ ¾¾ ¾¾ ¾¾

6.5. Competencias genéricas

SEGUNDO BIMESTRE

Guía didáctica: Estadística I

55

Competencias específicas de titulación

56

Aplica los conceptos estadísticos básicos correctamente en el desarrollo de ejercicios referentes a la realidad en la que se desenvuelve.

Organiza, analiza e interpreta información recogida en un problema a investigar

Sugiere la toma de decisiones con criterio técnico científico en base a la información existente.







Competencias específicas del componente educativo ¾¾

5.6.1. Permutación 5.6.2. Combinaciones

5.6. Análisis combinatorio

5.5. Diagramas de árbol

5.4.1. Reglas de adición 5.4.2. Reglas de multiplicación

5.4. Reglas de probabilidad

5.3. Enfoques de probabilidad

5.2. Definición de probabilidad

5.1. Introducción

UNIDAD 5: Introducción al estudio de la probabilidad

4.2.6.1. Cuartiles 4.2.6.2. Deciles 4.2.6.3. Percentiles

4.2.4. Coeficiente de variación 4.2.5. Asimetría 4.2.6. Otras medidas de dispersión

Desarrollo de las actividades recomendadas que constan en la guía didáctica.

¾¾

Continúa con el desarrollo de la evaluación a distancia.

Desarrollo de las autoevaluaciones que constan en el texto básico por cada tema analizado.

¾¾

™™

Lectura comprensiva del capítulo 5 del texto ™™ básico.

Revisión de la guía didáctica.

¾¾

¾¾

¾¾

Desarrollo de las actividades recomendadas.

Inicia el desarrollo de la evaluación a distancia correspondiente al segundo bimestre.

Ocho horas de autoestudio

Semanas 2 y 3

Tiempo de dedicación

Ocho horas de interacción Identifica y desarrolla ejercicios aplicando las reglas de probabilidad.

Define e identifica los elementos de las probabilidades.

Actividades de aprendizaje Indicadores de aprendizaje

4.2.3.1. Definición 4.2.3.2. Características 4.2.3.3. Formas de ¾¾ cálculo

4.2.3. Varianza y desviación estándar

Contenidos Unidades

Guía didáctica: Estadística I

Competencias específicas de titulación

Competencias específicas del componente educativo

6.6.1. Características y usos 6.6.2. Formas de cálculo 6.6.3. Uso de las tablas de probabilidad

6.6. Distribución de Poisson

6.5.1. Características y usos 6.5.2. Formas de cálculo

6.5. Distribución hipergeométrica

6.4.1. Características y usos 6.4.2. Formas de cálculo 6.4.3. Uso de las tablas de probabilidad

6.4. Distribución de probabilidad binomial

Resuelve ejercicios de distribuciones de probabilidad discreta.

™™

Continúa desarrollando las evaluaciones a distancia.

Determina la distribución de probabilidad aplicable de acuerdo a la información del problema investigado.

Identifica los elementos de un problema.

Reconoce las características de las distribuciones de probabilidad discreta.

™™

¾¾

6.3.1. Media 6.3.2. Varianza y desviación típica o estándar

6.3. Medidas descriptivas de una distribución de probabilidad

Desarrollo de las autoevaluaciones que constan al finalizar cada tema.

¾¾

6.2. Definición de una distribución de probabilidad

™™

Lectura comprensiva del capítulo 6 del texto básico. ™™

Revisión de la guía didáctica.

¾¾

¾¾

Actividades de aprendizaje Indicadores de aprendizaje

6.1. Introducción

UNIDAD 6: Distribuciones de probabilidad discreta

Contenidos Unidades

Ocho horas de interacción

Ocho horas de autoestudio

Semanas 4 y 5

Tiempo de dedicación

Guía didáctica: Estadística I

57

Competencias específicas de titulación

Competencias específicas del componente educativo

58 7.2.1. Características y usos 7.2.2. Aplicación del factor de corrección por continuidad 7.2.3. Formas de cálculo

7.2. Aproximación normal a la binomial

7.1.1. Características y usos 7.1.2. Formas de cálculo 7.1.3. Uso de las tablas de probabilidad

7.1. Distribución de probabilidad normal

UNIDAD 7: Distribuciones de probabilidad continua

Contenidos Unidades

Desarrollo de las actividades recomendadas en la guía didáctica. Continúa desarrollando las evaluaciones a distancia. Revisión de todos los temas desarrollados en el bimestre. Preparación para la segunda evaluación presencial parcial.

¾¾

¾¾

¾¾

¾¾

™™

Desarrollo de las autoevaluaciones que constan al finalizar cada tema.

¾¾

™™

Lectura comprensiva del capítulo 7 del texto básico. ™™

Revisión de la guía didáctica.

¾¾

¾¾

Resuelve ejercicios de distribuciones de probabilidad normal.

Identifica los elementos de un problema investigado.

Reconoce los elementos que caracterizan a la probabilidad normal.

Actividades de aprendizaje Indicadores de aprendizaje

Ocho horas de interacción

Ocho horas de autoestudio

Semanas 7 y 8

Cuatro horas de interacción

Cuatro horas de autoestudio

Semana 6

Tiempo de dedicación

Guía didáctica: Estadística I

Guía didáctica: Estadística I

6.7. Orientaciones específicas para el aprendizaje por competencias

UNIDAD 4: MEDIDAS DESCRIPTIVAS: MEDIDAS DE DISPERSIÓN

Para el desarrollo de esta unidad, revise conjuntamente con esta guía el capítulo 3 del texto básico (Medidas de dispersión) y capítulo 4 (Otras medidas de dispersión).

4.1. Introducción Una vez que se han analizado las medidas que permiten determinar características puntuales sobre un conjunto de datos y dependiendo de las necesidades del investigador, es preciso también abordar el estudio de otras medidas que nos permiten llegar a mayores conclusiones al respecto. Estas medidas se denominan medidas de dispersión, ya que podemos identificar la variación o la distancia existente entre cada valor con respecto a aquel que nos sirve como referencia. Las medidas de variación son de gran utilidad porque a través de ellas se puede además llegar a tomar decisiones adecuadas, pues, si bien las medidas de tendencia central nos permiten tener un valor referencial, a través de las medidas de dispersión podemos llegar a conocer la variabilidad del conjunto de datos. Veamos entonces cuáles son estas medidas y en qué consiste cada una de ellas.

4.2. Medidas de dispersión ¿Qué entiende por dispersión?, a través de la lectura en el texto básico, vamos a comprender el significado de la dispersión entre los valores, así como también podemos determinar la importancia de este tipo de medidas en el análisis de la información recolectada dentro de una investigación. Ahora puede usted, expresar una definición propia de lo que entiende por dispersión. Según la necesidad de la investigación, encontramos varios tipos de medidas que tienen su aplicabilidad específica, las cuales, entre las de mayor uso, se pueden resumir de la siguiente manera:

59

Guía didáctica: Estadística I

Amplitud de variación o rango Desviación media absoluta Medidas de dispersión

Varianza Desviación típica o estándar Cuartiles, deciles y percentiles

Analicemos ahora cada una de estas medidas. 4.2.1. Amplitud de variación Este es un concepto que ya se lo abordó cuando trabajamos las distribuciones de frecuencia, recordemos que el rango o también conocido como recorrido o amplitud de variación, nos ayuda a conocer el número de puestos o lugares que recorre la variable desde el valor menor hasta el mayor. Después de la lectura del texto básico sobre el tema, usted puede expresar su propia definición. Al rango lo determinamos a través de la diferencia entre el valor máximo y el valor mínimo: Rango = Valor máximo - Valor mínimo Como queda dicho, su resultado nos explica el número de puestos que recorre la variable desde el valor menor hasta el valor mayor. 4.2.2. Desviación media absoluta 4.2.2.1. Definición Después de la lectura en el texto básico, usted puede enunciar su propia definición diciendo que la desviación media absoluta, es: _____________________________________________________________________________________ _____________________________________________________________________________________. 4.2.2.2. Características La desviación media absoluta, posee ciertas características que la diferencian de las demás. Estas características las podemos escribir en las siguientes líneas, pues, como toda medida tiene sus ventajas y tiene también sus limitaciones. Citemos ahora las ventajas e inconvenientes que hemos podido detectar después de haber leído los temas:

60

Guía didáctica: Estadística I

1.

Es fácil de calcular, porque es el valor medio (promedio) de las diferencias entre cada uno de los valores con respecto a la media aritmética.

2.

Considera todos los valores del conjunto a diferencia del rango que solamente toma los dos valores extremos.

3.

Toma en cuenta los valores absolutos de las diferencias entre cada uno de los valores registrados y la media aritmética.

4.

Al tomar en cuenta los valores absolutos, no identifica la posición real de cada valor con respecto al valor referencial (media aritmética).

4.2.2.3. Formas de cálculo El cálculo de esta medida no reviste mayor dificultad, pues no es más que determinar el promedio de las diferencias entre cada valor con respecto a la media aritmética, pero cada una de estas diferencias se encuentra expresada en términos o valores absolutos1. Si se trata de valores no agrupados o simples:

Ejemplo: Si tenemos los siguientes datos: 4, 6, 3, 6, 7, 4, 5, 8, 4, 5 Determinamos primero la media aritmética, usted puede calcularla y obtendrá que la misma es: 5,2 Luego identificamos las diferencias en términos absolutos entre cada valor con respecto a la media de la siguiente manera: |4 – 5,2|= 1,2

|4 – 5,2| = 1,2

|6 – 5,2| = 0,8

|5 – 5,2| = 0,2

|3 – 5,2| = 2,2

|8 – 5,2| = 2,8

|6 – 5,2| = 0,8

|4 – 5,2| = 1,2

|7–5,2|= 1,8

|5 – 5,2| = 0,2

Finalmente, aplicamos la fórmula correspondiente y tenemos el valor:

DM = 1,24 Este resultado significa entonces que, en promedio, la distancia entre cada uno de los valores con respecto a la media aritmética es de 1,24. 1

Un valor absoluto es aquel que no considera el signo de la operación matemático y se lo denota entre ||, por ejemplo el -3 en valor absoluto será |-3|= 3.

61

Guía didáctica: Estadística I

Tratándose de datos agrupados presentados a través de una tabla de distribución de frecuencias, debemos considerar las frecuencias que afectan a cada una de las marcas de clase, por lo que la fórmula quedaría definida de la siguiente manera:

Desarrollemos un ejemplo: Vamos a tomar los datos del ejercicio que hemos venido trabajando anteriormente: Número de solicitudes

Frecuencia absoluta (ni)

Marcas de clase (Xi)

0–6

27

3

5,16

139,32

6 – 12

11

9

0,84

9,24

12 – 18

7

15

6,84

47,88

18 – 24

3

21

12,84

38,52

24 – 30

1

27

18,84

18,84

30 – 36

1

33

24,84

24,84

Total

50

Diferencia entre la marca de clase y la media aritmética que, como sabemos, es 8,16

278,64

DM = 5,57 ¿Qué significado tiene para usted, este resultado? Para interpretar este resultado, le aconsejo que recuerde la definición desarrollada anteriormente y las características de la medida. ¿Estaría de acuerdo si decimos que en promedio los valores analizados de la variable, se encuentran distantes en 5,57 unidades con respecto a la media aritmética? Puede revisar adicionalmente el ejemplo resuelto que se encuentra en el texto básico. 4.2.3. Varianza y desviación estándar 4.2.3.1. Definición Continuando con el análisis de las medidas de dispersión, volvamos al texto básico, allí puede encontrar las definiciones de estas dos medidas de dispersión que son complementarias, pues partimos de la varianza y luego llegamos a la desviación típica o estándar. Con la lectura realizada, ahora establezca su propia definición respecto a la varianza y a la desviación típica.

62

Guía didáctica: Estadística I

4.2.3.2. Características Después de haber definido estas medidas, también se pueden establecer las características de cada una de ellas y comparar con la desviación media. ¿Puede enumerar estas características? Inténtelo luego de la lectura. Usted, coincidirá conmigo que, a diferencia de la desviación media absoluta, en donde se toman en cuenta las diferencias expresadas en valores absolutos entre cada valor con respecto a la media aritmética, en la desviación típica o estándar no hace falta tomar los valores absolutos sino que se parte de la determinación de la varianza para llegar a la desviación típica. También coincidiremos si usted indica que una de las dificultades para la interpretación del valor obtenido como varianza es que las unidades de medida de la variable vienen expresadas en forma cuadrática, y que por ello llegamos a calcular la desviación típica o estándar, para analizar la dispersión del conjunto de datos observados. Pasemos ahora a determinar las formas de cálculo de estas medidas. 4.2.3.3. Formas de cálculo Revise en el texto básico este acápite, allí va a encontrar que hacemos una diferenciación en el cálculo cuando se trata de trabajar una muestra y una población. También consideraremos el caso de trabajar con datos no agrupados y datos agrupados. En cualquiera de los casos antes mencionados, el procedimiento a seguirse para llegar a determinar el valor de la varianza, se resume en los siguientes pasos: 1. 2. 3. 4. 5.

Determine la media aritmética del conjunto de valores. Calcule la diferencia entre la media y cada valor observado. Eleve al cuadrado la diferencia mencionada anteriormente. Sume los resultados obtenidos en el numeral anterior. Finalmente, divida la suma de las diferencias para el número de datos.

Existe una diferencia cuando se tratan datos poblacionales y datos muestrales. Como denominador en un caso se utiliza el total N y en el otro caso se utiliza el denominador (n – 1); el porqué de esta diferenciación lo podrá encontrar con la lectura en el texto básico. Para que vaya tomando experiencia en el cálculo de estos indicadores, conviene que se remita al texto y repase los ejercicios desarrollados en cada uno de estos temas, de manera que allí podrá habituarse con el procedimiento seguido. También le sugiero que desarrolle los ejercicios planteados en el texto básico, así podrá desarrollar las destrezas necesarias para el tratamiento de estos temas. 4.2.4. Coeficiente de variación Este tema no se encuentra desarrollado específicamente en el texto básico, por lo que vamos a abordarlo aquí.

63

Guía didáctica: Estadística I

Cuando se requiere hacer comparaciones entre dos o más conjuntos de datos, es útil hacerlo a través del coeficiente de variación ya que no interesa aquí la unidad de medida, pues es adimensional. Para su cálculo se debe utilizar la desviación típica o estándar y la media aritmética de cada uno de los conjuntos de datos y lo expresamos en forma porcentual. Trabajando con la muestra o la población tendremos las siguientes fórmulas a aplicar: Coeficiente de variación de la muestra





Coeficiente de variación de la población

Para comprender mejor su aplicación, desarrollemos el siguiente ejemplo: Un estudio sobre el monto de bonos pagados y los años de servicio de varios empleados, dio como resultado los siguientes datos estadísticos: la media de los bonos pagados fue de $200 y la desviación estándar fue de $40. La media del número de años de servicio fue 20 años y la desviación estándar 2 años. Compare las dispersiones relativas de las dos distribuciones empleando el coeficiente de variación. Como observamos, tenemos dos grupos de datos: los primeros expresados en dólares y los segundos expresados en años. Necesitamos comparar estos dos grupos, entonces procedemos a aplicar el coeficiente de variación. Para los bonos

Para los años de servicio

CV = 20%

CV = 10%

En este caso podemos observar que existe mayor dispersión relativa con respecto a la media aritmética en los bonos pagados en comparación con el conjunto de datos de los años de servicio. Esto significa entonces, que existe mayor variabilidad en los valores observados sobre el pago de los bonos que en el conjunto de valores investigados sobre los años de servicio. 4.2.5. Asimetría Otra de las medidas que permiten caracterizar un conjunto de datos es la determinación del tipo de asimetría o sesgo que tiene el conjunto de datos, de modo que con ello podemos determinar si la

64

Guía didáctica: Estadística I

tendencia es a distribuirse de manera similar o de pronto la mayoría de los datos se ubican en los valores mayores o menores. Este tema se encuentra desarrollado en el texto básico con el título SESGO, en el capítulo 4. Allí encuentra los tipos de sesgo y la forma de calcularlo. Bajo esta consideración, vamos a encontrar tres tipos de conjuntos de valores, que se clasifican según el sesgo: •

Simétricos, aquellos que como su nombre lo indica se encuentran distribuidos simétricamente, es decir, existe igual número de datos a partir de un valor central. Si comparamos los valores de la media, mediana y moda, veremos que es el mismo.



Sesgados positivamente, o denominados también sesgados a la derecha: son aquellos que se encuentran más acumulados hacia los valores menores, pero existe una cantidad pequeña de valores mayores, por ello me menciona además que la cola se encuentra a la derecha. Al relacionar las medidas de tendencia central, la media aritmética es mayor a la mediana y a la moda.



Sesgados negativamente, o sesgados a la izquierda: son aquellos que se encuentran acumulados en mayor cantidad hacia los valores mayores, aunque existe una cantidad de valores menores que es pequeña, la cola de la curva al representarlos gráficamente se va a ubicar en los valores menores. En este caso al comparar la media es menor a la mediana y menor a la moda.

Para determinar la magnitud de la simetría en un conjunto de datos, se lo puede hacer a través del cálculo de: ™™ ™™

Coeficiente de sesgo de Pearson Coeficiente de sesgo calculado con software

Para conocer las fórmulas que se deben aplicar, remítase al texto básico en su capítulo 4, (acápite 4.5) y podrá determinar cuáles son las características y aplicaciones que se realiza a cada uno de ellos. En el caso del coeficiente de sesgo de Pearson, sus resultados van a estar entre -3 y 3, de manera que con ello podemos llegar a identificar el tipo de sesgo que tiene el conjunto de datos. Para reafirmar el uso de estas medidas examine el ejemplo resuelto que se encuentra en el texto al finalizar este tema. 4.2.6. Otras medidas de dispersión Existen otras medidas que nos permiten también identificar la posición de determinados valores, entre ellas encontramos a los cuartiles, los deciles y los percentiles. Volvamos al texto básico donde encontrará el desarrollo de estas medidas en el apartado 4.4. 4.2.6.1. Cuartiles Los cuartiles, por definición, serían aquellas medidas que dividen en cuatro partes iguales al conjunto de datos y por ello encontraremos 3 cuartiles. Gráficamente se puede representar de la siguiente manera esta definición:

65

Guía didáctica: Estadística I

Xmin

Q1

Q2

Q3

Xmáx

El cálculo de estas medidas lleva el mismo procedimiento que el cálculo de la mediana, tanto para datos agrupados como para datos no agrupados, la única diferencia es que en lugar de dividir el conjunto de datos para 2, ahora lo dividimos para 4; por lo demás el procedimiento es exactamente igual. ¿Cómo vamos a interpretar los valores obtenidos? Vamos a decir que: Q1, nos indica que el 25% de datos se encuentran por debajo de ese valor y que el 75% supera dicho valor. Q2, al igual que el valor de la mediana, es el valor que se encuentra ocupando la posición central y que por tanto por debajo y sobre él se encuentra el 50% de datos. Q3, significa que este valor supera al 75% de datos analizados y es superado por el 25% restante. Revisemos ahora, lo concerniente a los deciles. 4.2.6.2. Deciles Llevando el mismo sentido que la medida anteriormente analizada, los deciles son aquellos que dividen al conjunto de datos en 10 partes iguales y que por tanto tendremos 9 deciles. Cada uno de los deciles, corresponde a la décima parte. Su cálculo será similar a los cuartiles, con la diferencia que al dividir al conjunto de datos para determinar la posición del valor ya no dividimos para 2 ni para 4 sino que ahora lo hacemos para 10. Si tenemos, por ejemplo, el decil 1 (D1), significa que es el valor que supera a la décima parte de los datos y es superado por las nueve décimas partes del conjunto de datos. Si calculamos el decil 7 (D7), significará que es aquel valor que supera las siete décimas (7/10) partes del conjunto de datos y es superado por las restantes tres décimas (3/10) partes de dicho conjunto. Pasemos a revisar ahora los percentiles, que algunos autores también los denominan como centiles. 4.2.6.3. Percentiles Seguimos con los mismos procedimientos anteriores y ahora dividimos el conjunto en 100 partes iguales de manera que tendremos 99 percentiles. Este tipo de medida nos permite, llegar a identificar el valor que se encuentra ocupando una posición que sea de nuestro interés como investigadores. Generalmente cuando se realizan análisis en el ámbito económico sobre la distribución del ingreso, se utilizan estas medidas. Para calcular y ejercitar sobre estas medidas le recomiendo primero revisar el ejercicio resuelto y también desarrollar los otros ejercicios que se encuentran propuestos, en el texto básico.

66

Guía didáctica: Estadística I

Concluyendo con este tema, como usted ha observado, llevamos el mismo procedimiento para calcular estas medidas conjuntamente con el cálculo de la mediana, de ahí que podemos establecer algunas relaciones entre estas medidas, por ejemplo: D1 = P10 D2 = P20 D3 = P30 Q1 = P25 D4 = P40 D5 = P50 = Q2 = Me ¿Puede seguir estableciendo las demás relaciones? D6, D7, D8, D9, Q3 Muy bien, ahora que ha cumplido con estas relaciones, usted puede comprender que es indistinto si queremos calcular el D9 y el P90, será el mismo valor. O, si debemos calcular el P70, sabemos que será igual al D7, y así sucesivamente. En el texto se encuentran desarrollados otros temas que puede usted revisarlos aunque no se encuentran contemplados en nuestro plan de estudio, sin embargo, le van a aportar conocimientos que le pueden ser de utilidad posterior. Vamos a desarrollar el mismo ejercicio planteado anteriormente y con los datos obtenidos aplicaremos algunos de los conceptos estudiados en esta unidad. Ejercicio de aplicación En un examen de estadística rendido por 54 estudiantes, se obtuvieron las siguientes calificaciones (sobre 100 puntos): CALIFICACIONES

ESTUDIANTES (ni)

45–49

2

50–54

3

55–59

5

60–64

6

65–69

7

70–74

8

75–79

6

80–84

6

85–89

5

90–94

3

95–99

3

 

54

Se solicita calcular, la desviación media absoluta, la varianza y desviación típica, el coeficiente de asimetría de Pearson, el cuartil 2, decil 2 y percentil 25.

67

Guía didáctica: Estadística I

Desviación media absoluta Media aritmética: μ = 72,37 CALIFICACIONES

ESTUDIANTES (ni)

Xi

45–49

2

47

25,37

50,74

50–54

3

52

20,37

61,11

55–59

5

57

15,37

76,85

60–64

6

62

10,37

62,22

65–69

7

67

5,37

37,59

70–74

8

72

0,37

2,96

75–79

6

77

4,63

27,78

80–84

6

82

9,63

57,78

85–89

5

87

14,63

73,15

90–94

3

92

19,63

58,89

95–99

3

97

24,63

73,89

 

54

 

 

582,96

DM = 10,80 Este resultado significa que en promedio los valores se encuentran separados en 10,80 con respecto a la media aritmética, es decir, para el ejemplo las calificaciones se encuentran separadas en ese valor con respecto al valor medio de las calificaciones. Varianza y desviación típica o estándar Media aritmética: μ = 72,37

68

CALIFICACIONES

ESTUDIANTES (ni)

Xi

45–49

2

47

-25,37

643,6369

1287,2738

50–54

3

52

-20,37

414,9369

1244,8107

55–59

5

57

-15,37

236,2369

1181,1845

60–64

6

62

-10,37

107,5369

645,2214

65–69

7

67

-5,37

28,8369

201,8583

70–74

8

72

-0,37

0,1369

1,0952

75–79

6

77

4,63

21,4369

128,6214

80–84

6

82

9,63

92,7369

556,4214

85–89

5

87

14,63

214,0369

1070,1845

90–94

3

92

19,63

385,3369

1156,0107

95–99

3

97

24,63

606,6369

1819,9107

 

54

 

 

 

9292,5926

Guía didáctica: Estadística I

--

Varianza:

Este sería el valor de la varianza, pero estaría expresado en la unidad de medida de la variable al cuadrado, en este caso serían puntos al cuadrado, lo que no nos permite tener una mayor claridad, por ello calculamos la desviación estándar --

Desviación típica o estándar:

Con este resultado, ya podemos decir, que típicamente las calificaciones de los 54 estudiantes se encuentran separadas con respecto a la media aritmética de las calificaciones en 13,12 puntos. Coeficiente de asimetría de Pearson

Para calcular este coeficiente se requieren los valores de la media aritmética, la mediana y la desviación típica o estándar. Como ya los hemos calculado anteriormente, procedemos a calcular este coeficiente: Media aritmética: μ = 72,37 Mediana: Me = 72 Desviación Típica o estándar: σ = 13,12

sk = 0, 085 El resultado obtenido, nos indica que la distribución de los valores tiene sesgo positivo, pero que la distribución se encuentra muy ligeramente sesgada. Esto confirma el resultado obtenido anteriormente, al comparar las tres medidas de tendencia central.

69

Guía didáctica: Estadística I

Cuartil dos CALIFICACIONES

ESTUDIANTES (ni)

Límites reales

FA

45–49

2

44,5–49,5

2

50–54

3

49,5–54,5

5

55–59

5

54,5–59,5

10

60–64

6

59,5–64,5

16

65–69

7

64,5–69,5

23

70–74

8

69,5–74,5

31

75–79

6

74,5–79,5

37

80–84

6

79,5–84,5

43

85–89

5

84,5–89,5

48

90–94

3

89,5–94,5

51

95–99

3

94,5–99,5

54

 

54

 

 

Q2 = 69,5 + 2,5 Q2 = 72

70

Intervalo decílico y percentílico Intervalo cuartílico

Guía didáctica: Estadística I

Decil dos Utilizamos la misma tabla, puesto que se sigue el mismo procedimiento:

D2 = 59,5 + 0,66 D2 = 60,16 Percentil 25 En esta ocasión, también desarrollamos el procedimiento similar al anterior:

P25 = 59,5 + 2,92 P25 = 62,42

71

Guía didáctica: Estadística I

Actividades recomendadas

Como lo he venido mencionando en las unidades anteriores, es necesario que todos aquellos contenidos que los vamos abordando teóricamente, los llevemos a la práctica por ello le recomiendo que: 1.

Identifique una variable que desee estudiar de un conjunto de personas, por ejemplo puede preguntar sobre los niveles de ingreso o sobre los niveles de gasto.

2.

Presente los datos, decida usted si los va a presentar a través de una distribución de frecuencia (sería recomendable).

3.

Calcule las medidas de tendencia central que le permiten describir el conjunto de datos.

4.

Establezca las medidas de dispersión que se pueden calcular con sus datos y vaya interpretando cada una de estas medidas.

5.

Calcule las medidas de dispersión, observe si los resultados obtenidos como desviación media son similares con la desviación estándar, explique por qué lo son o no.

6.

Determine qué valor se encuentra en la posición del P75 y cómo interpreta este resultado.

72

Guía didáctica: Estadística I

Autoevaluación 4

Al concluir con el análisis de esta unidad, debemos revisar el avance que hemos logrado en la comprensión de cada uno de los temas. Recuerde que al final de la guía se encuentra la solución a este cuestionario, si alguna de sus respuestas no le es favorable vuelva a revisar el tema. A.

Conteste dentro del paréntesis, con V o F si considera que las siguientes afirmaciones son verdaderas o falsas respectivamente:

1.  (    )

Las medidas de dispersión nos permiten conocer el nivel de concentración de un conjunto de datos alrededor de un valor de referencia.

2.  (    )

Para calcular la desviación media, es necesario considerar los valores absolutos de las diferencias entre cada valor con respecto a la media aritmética.

3.  (    )

La varianza se puede encontrar extrayendo la raíz cuadrada de la desviación típica o estándar.

4.  (    )

La desviación típica puede considerarse como una medida de mayor precisión que la desviación media.

5.  (    )

El coeficiente de variación permite comparar la dispersión relativa existente entre grupos de datos diferentes, inclusive en su unidad de medida.

6.  (    )

Un conjunto de datos simétrico es aquel cuya media aritmética es menor que la mediana y que la moda.

7.  (    )

El coeficiente de Pearson, puede tomar valores entre -3 y 3.

8.  (    )

Los cuartiles, deciles y percentiles, son medidas que nos permiten establecer la posición de un determinado valor.

9.  (    )

El cuartil 2 es igual al valor de la mediana, al decil 5 y al percentil 50.

10.  (    )

Para calcular los valores de cuartiles, deciles o percentiles, primero se debe localizar la posición del dato que contiene el valor de la medida a encontrarse.

Importante: no pase a la siguiente unidad hasta que se encuentre seguro de sus habilidades en estos temas.

73

Guía didáctica: Estadística I

Para recordar: En esta unidad se han desarrollado los contenidos referentes a las medidas de dispersión, hemos analizado cada una de estas medidas, con sus características, la forma de cálculo y su aplicabilidad. Debemos considerar las características de cada una de las medidas para poder diferenciarlas, por ejemplo, no es lo mismo hablar de la desviación media absoluta y de la desviación típica o estándar, cada una de ellas tiene sus características que la hacen diferente y por tanto su aplicabilidad. Hemos confirmado además que se puede llegar a identificar la forma en la que se encuentra distribuidos los valores, y se puede calcular el grado de asimetría de todo el conjunto de datos observados, esto a través del coeficiente de sesgo o de asimetría de Pearson. Hasta aquí podemos decir que se ha llegado a describir a un conjunto de valores que se están investigando, a partir de la siguiente unidad, empezamos a trabajar los temas relacionados con la inferencia estadística, principalmente con lo referente a la teoría de las probabilidades, para que posteriormente se puedan insertar en el análisis de los muestreos y pruebas de hipótesis.

74

Guía didáctica: Estadística I

UNIDAD 5: INTRODUCCIÓN AL ESTUDIO DE LA PROBABILIDAD Para el desarrollo de esta unidad, vaya revisando conjuntamente con esta guía el capítulo 5 del texto básico.

5.1. Introducción Hasta ahora hemos avanzado en nuestro estudio con las medidas que nos han permitido describir un conjunto de datos, estableciendo las medidas descriptivas para conclusiones sobre las principales características de dicho conjunto. Al definir a la estadística, habíamos dicho que podemos identificar dos grandes campos de aplicación, la estadística descriptiva y la estadística inferencial. Con este tema de las probabilidades vamos a insertarnos ya en la inferencia estadística, pues se trata de que podamos establecer inferencias sobre determinados eventos que se puedan presentar o vivir. ¿Cuántas veces hemos utilizado la expresión “qué tan probable será esto o aquello”? Posiblemente hemos contestado y lo hemos realizado en base a alguna información o algún conocimiento que tenemos del evento, pero no lo hemos cuantificado. Esta es la oportunidad para comprender de mejor manera este tema.

5.2. Definición de probabilidad Vamos a leer el texto básico y reflexionemos acerca de lo que hemos venido entendiendo sobre lo que significa hablar de probabilidades. Puede ahora expresar una definición relativa a esta. Si en su definición usted ha considerado que es la cuantificación de la posibilidad de que un evento ocurra, estamos en el mismo camino. Existen algunos conceptos que es necesario precisar, de manera que se pueda luego diferenciar la información que se mantiene; así debemos precisar lo que es un experimento, resultado y evento. Como se observa, podríamos decir que estos conceptos vienen a complementarse, de manera que el concepto más general es el experimento, luego el resultado que es lo que se obtiene al ejecutar el experimento y el evento que son el conjunto de uno o más resultados del experimento. Algo importante a tomarse en cuenta es que primero debemos definir con el experimento, el o los resultados posibles y los eventos que se pueden obtener. Revise el cuadro que consta en el texto básico, allí usted puede observar claramente la diferencia entre estos conceptos a través de los siguientes ejemplos: • •

Lanzamiento de un dado Listado de los miembros de una junta directiva

75

Guía didáctica: Estadística I

Otro aspecto a considerar es que los resultados van a variar entre 0 y 1, considerando al 0 como la seguridad de no ocurrencia del evento y el 1 como la certeza de que el resultado se va a presentar. De manera general para calcular la probabilidad de ocurrencia de un evento se consideran los resultados favorables y los resultados posibles, a través de la siguiente fórmula:

5.3. Enfoques de probabilidad Ahora bien, una vez que ya hemos definido el término de probabilidad, también es importante reconocer su enfoque, desde el punto de vista objetivo y subjetivo. Lea en el texto básico estos enfoques y la clasificación de la probabilidad, luego interprete el siguiente cuadro:

PROBABILIDAD

OBJETIVO

CLÁSICA

SUBJETIVO

EMPÍRICA

Al hablar de la probabilidad CLÁSICA, se deben distinguir dos tipos de eventos: •

Mutuamente excluyentes, que son aquellos eventos que se caracterizan porque la presencia de uno impide que otro se presente, por ejemplo, en el lanzamiento de una moneda, la presencia del evento cara, impide que el evento sello se presente al mismo tiempo.



Colectivamente exhaustivos, implica que por lo menos uno de los eventos se debe presentar. En el mismo ejemplo, se presenta cara o se presenta sello.

Para ampliar más sobre estos temas, le recomiendo que realice los ejercicios que se encuentran propuestos en el texto básico, en la página 146.

5.4. Reglas de probabilidad Cuando existen dos o más eventos que se pueden presentar, es necesario trabajar con las reglas de adición o multiplicación, según sea el caso.

76

Guía didáctica: Estadística I

5.4.1. Reglas de adición Como usted lo habrá revisado en el texto básico, existen dos tipos de reglas que se aplican para la adición: •

La regla especial: P (A o B) = P(A) + P(B) y,



La regla general: P(A o B) = P(A) + P(B) – P(A y B)

La regla especial se utiliza cuando existen eventos mutuamente excluyentes, en cambio la regla general de adición se emplea cuando los eventos son inclusivos, esto es, que se pueden presentar solos o también se pueden presentar al mismo tiempo. Por ejemplo, si al lanzar un dado queremos encontrar la probabilidad de que el número extraído sea un 2 o un número par, se pueden presentar al mismo tiempo los dos eventos porque el 2 es un número par. 5.4.2. Reglas de multiplicación De igual manera, las reglas de multiplicación se utilizan cuando existen dos o más eventos sobre los cuales se debe calcular la probabilidad. En este caso, como observará en el texto básico, los eventos se caracterizan por su dependencia e independencia. Hablamos de que un evento es independiente, cuando no depende de lo que haya sucedido antes, es decir, no recibe ninguna influencia de otro evento. También encontramos las reglas: •

especial: P(A y B) = P(A)P(B); y,



general: P(A y B) = P(A) P(B|A)

En el primer caso, la fórmula nos presenta la independencia de los eventos, puesto que encontramos la probabilidad conjunta de A y B a través del producto entre las dos probabilidades. En el segundo caso, la fórmula nos indica que los eventos son dependientes, y por ello observamos que el segundo evento (B) depende de lo que ha sucedido antes, esto es, la presencia del evento A. El término P(B|A), se lee: “probabilidad de que se presente B, dado que se ha presentado A”, aquí hay que tener presente que no es un cociente (como a veces se confunde). En algunas ocasiones no se distingue, cuándo utilizar la regla de adición o cuándo aplicar la regla de multiplicación. Una forma de hacerlo es conociendo bien lo solicitado: •

Cuando se solicita establecer la probabilidad de que se presente, por ejemplo, el evento A o el evento B, la letra o nos está significando SUMA o ADICIÓN.

77

Guía didáctica: Estadística I

Cuando se solicita establecer la probabilidad de que se presente, por ejemplo, el evento A y el evento B, la letra y nos está significando MULTIPLICACIÓN.



Realice los ejercicios que se encuentran propuestos al finalizar cada uno de los temas explicados. Una vez que hemos comprendido estos temas, pasemos ahora a analizar la utilidad de los diagramas de árbol.

5.5. Diagramas de árbol Cuando un experimento implica varias etapas, es conveniente realizar una representación gráfica, en donde, como a manera de un árbol, se van considerando las diferentes ramas que se desprenden del primer evento o la primera etapa. Vaya al texto básico y revise los pasos que se deben seguir para su construcción. Conviene que repase estos pasos. El diagrama de árbol le permite tener una mejor visualización de las probabilidades individuales en los eventos que se puedan presentar de manera conjunta. Recordaremos además que la suma de todas las probabilidades de todos los eventos que se presentaren debe darnos igual a 1.

5.6. Análisis combinatorio Cuando el número de posibles resultados resulta ser grande y no es posible establecerlo por simple observación o a través de un diagrama de árbol, es necesario recurrir al análisis de las permutaciones y combinaciones. 5.6.1. Permutación Cuando se requiere identificar el número de resultados en donde es importante el orden en el que se pueden presentar los objetos, se utiliza las permutaciones. Revise en el texto básico estos temas, allí verá que utilizamos el factorial de los números. Para calcular el número de permutaciones o las diferentes maneras en las que se pueden presentar los objetos, se debe utilizar la siguiente fórmula:

Por ejemplo, si tenemos el conjunto de letras: a, b, c, d, e y queremos conocer de cuántas maneras distintas podemos presentar de tres en tres estas letras, podríamos tener las siguientes formas:

78

Guía didáctica: Estadística I

Significa entonces que se pueden presentar de 60 maneras distintas estas cinco letras tomadas de 3 en 3; así pues, si tomamos el conjunto a,b,c, no será lo mismo al conjunto a,c,b o al conjunto c, a, b, etc. 5.6.2. Combinaciones A diferencia de las permutaciones, en las combinaciones no interesa el orden de los objetos, lo que interesa es que los objetos se presenten independientemente del orden. Para calcular el número de combinaciones, se utiliza la siguiente fórmula:

Si continuamos con el ejemplo anterior, el número de combinaciones que se pueden realizar con las cinco letras tomadas de tres en tres, será:

79

Guía didáctica: Estadística I

Significa entonces que podremos encontrar 10 formas de presentar las cinco letras tomadas de 3 en 3; así pues a, b, c es lo mismo si presentamos a, c, b, porque se presentan las mismas letras, o que c, a, b o que c, b, a. Algo importante a recordar es que por definición el factorial de 0, siempre es igual a 1. Para ejercitar estos temas y familiarizarse con el uso de las permutaciones y combinaciones, le sugiero que realice los ejercicios que constan al finalizar estos temas en el texto básico (ejercicios 39 a 46). Una vez que hemos concluido el análisis de los temas previstos para esta unidad, pasemos a establecer actividades que nos pueden ser de utilidad. Ejercicios de aplicación Suponga que se va a elegir de manera aleatoria un individuo entre una población de 130 personas. En esa población hay 40 niños menores de 12 años, 60 adolescentes y 30 adultos. ¿Cuál es la probabilidad de que el individuo elegido sea un adolescente o un adulto? --

En primer lugar debemos identificar los datos que nos proporcionan: • •

Tenemos en total 130 personas. La población está constituida por 3 segmentos distintos, cada uno con sus características propias.

--

Luego identificamos lo solicitado: en este caso es elegir un individuo que puede ser adolescente o adulto.

--

Significa entonces que los eventos son mutuamente excluyentes, porque si se escoge un adolescente, ya no será adulto, ni será niño.

--

Como la condición es que el escogido sea adolescente o adulto, significa que deberemos utilizar la regla especial de adición, ya que son mutuamente excluyentes. P (A o B) = P(A) + P(B)

Si representamos al evento A como el individuo adolescente y al evento B como el individuo adulto, procedemos a reemplazar la información:

P (A o B) = 0,6923 P (A o B) = 69,23% Esto significa entonces que: la probabilidad de que el individuo escogido del grupo de las 130 personas sea un adolescente o un adulto es del 69,23%.

80

Guía didáctica: Estadística I

Suponga que se extrae al azar dos frutas, una a la vez, de una bolsa que contiene cuatro manzanas, seis naranjas y cinco duraznos. Las extracciones se realizan sin reemplazamiento. ¿Cuál es la probabilidad de obtener una naranja y una manzana, en ese orden? --

Identificamos los datos: 4 manzanas, 6 naranjas, 5 duraznos, en total la bolsa contiene 15 frutas.

--

Se extrae una fruta y no se devuelve a la bolsa, por eso se llama sin reemplazamiento.

--

Los eventos son dependientes, porque la segunda extracción depende de lo primero, esto significa que debemos emplear la regla general de la multiplicación. P(A y B) = P(A) P(B|A)

--

Vamos a conocer como evento A la extracción de una naranja y como B la extracción de una manzana.

P(A y B) = 0,1143 P(A y B) = 11,43% Significa, por tanto, que existe el 11,43% de probabilidades que las frutas extraídas sean una naranja y una manzana, en ese orden.

Actividades recomendadas

Para la mejor comprensión de los temas sobre las probabilidades le sugiero realice las siguientes actividades que le ayudarán a poner en práctica cada uno de los conceptos hasta aquí aprendidos. 1.

Identifique los casos en los que se ha referido a la probabilidad, para que recuerde en qué temas siempre está invocando a esta palabra, haga un listado de aquellas ocasiones, por ejemplo, cuántas veces usted se ha preguntado ¿qué tan probable es que en este día llueva?

2.

Establezca ejemplos en los que pueda determinar las diferencias entre las probabilidades objetiva y subjetiva, haga un listado y exprese por qué las determina así.

3.

En base a sus ejemplos anteriores lleve a cabo ejercicios en donde pueda diferenciar los resultados posibles y los resultados favorables, por ejemplo, al lanzar una moneda una sola vez cuántos resultados posibles tiene y cuántos resultados favorables tiene a su evento.

4.

Ahora identifique experimentos en donde se presenten dos o más eventos, para que determine las probabilidades conjuntas, sea utilizando las reglas de adición y/o las reglas de multiplicación.

5.

Identifique casos en los que deba utilizar el análisis combinatorio, tanto permutaciones como combinaciones, y resuélvalos.

81

Guía didáctica: Estadística I

Autoevaluación 5

Revisemos ahora la comprensión que hemos logrado en los temas trabajados en esta unidad. Le recuerdo que es importante trabajar estas preguntas de autoevaluación que le ayudan a determinar aquellos temas que no están lo suficientemente claros para que se los vuelva a estudiar. Al final de esta guía se encuentra el solucionario de las preguntas para que constate su nivel de logro. A.

Conteste dentro del paréntesis con V o F si considera que las siguientes afirmaciones son verdaderas o falsas respectivamente:

1.  (    )

El concepto de probabilidad hace referencia a la cuantificación de un evento que pudiera presentarse o no.

2.  (    )

La certeza de que un evento pudiera tener un resultado exitoso es igual a cero, mientras que la probabilidad de certeza de que un evento tenga un resultado desfavorable es igual a uno.

3.  (    )

La probabilidad se puede calcular a través del cociente entre los resultados posibles para los resultados favorables a un evento.

4.  (    )

Se dice que dos o más eventos resultan ser mutuamente excluyentes cuando la presencia de uno impide que otro se presente al mismo tiempo.

5.  (    )

La probabilidad empírica también se conoce como probabilidad relativa ya que representa la fracción de eventos similares que sucedieron en el pasado.

6.  (    )

La regla especial de adición se utiliza cuando los eventos son mutuamente excluyentes.

7.  (    )

La regla general de la multiplicación se aplica cuando dos o más eventos son independientes.

8.  (    )

El diagrama de árbol nos ayuda a calcular las probabilidades cuando estos implican la existencia de varias etapas.

9.  (    )

Las combinaciones son útiles cuando al determinar el número de casos que se pueden presentar interesa mucho el orden en el que se muestren los objetos seleccionados.

10.  (    )

En las permutaciones no interesa el orden en el que se presentan los objetos sino que se tienen que presentar una sola vez.

82

Guía didáctica: Estadística I

Importante: No pase a la siguiente unidad hasta que se encuentre seguro de sus habilidades en estos temas. Para recordar: Con esta unidad hemos iniciado el estudio de los elementos básicos de la estadística inductiva o inferencial, lo hacemos con el tratamiento de la teoría de la probabilidad, desde entender lo que significan las probabilidades, con sus concepciones y enfoques hasta llegar a identificar las reglas de adición y multiplicación de las probabilidades con sus correspondientes variantes, puesto que la probabilidad no es un evento único sino que se puede presentar de manera conjunta con otros eventos. También hemos considerado el análisis factorial para adentrarnos a dos conceptos importantes y que nos van a servir para los siguientes momentos, como son las permutaciones y las combinaciones. En la siguiente unidad, vamos a trabajar las distribuciones de probabilidad y empezamos revisando las distribuciones discretas, cada una con sus características y aplicaciones.

83

Guía didáctica: Estadística I

UNIDAD 6: DISTRIBUCIONES DE PROBABILIDAD DISCRETA Para el desarrollo de esta unidad, revise conjuntamente con esta guía el capítulo 6 del texto básico.

6.1. Introducción Como hemos visto en la unidad anterior, existen experimentos en los cuales se pueden presentar varios eventos, cada uno con su correspondiente probabilidad. Por ello, trabajar de manera única no es posible, en ese caso se debe llegar a la organización y clasificación de los datos a emplearse. Una de las maneras de trabajar en estos casos, es utilizando el concepto de las distribuciones de frecuencias. Recordará además que allí dijimos que para trabajar con los datos precisábamos previamente determinar el tipo de variable, si era discreta o continua. De esta manera, resulta exactamente igual trabajar con distribuciones de probabilidades, porque también vamos a diferenciar entre distribuciones discretas y distribuciones continuas, dependiendo del tipo de variable analizada. En esta unidad, desarrollamos el estudio del primer tipo, es decir, las distribuciones discretas.

6.2. Definición de una distribución de probabilidad Le invito a leer su texto básico y a revisar lo que significa una distribución de probabilidad. Lea esta definición y encontrará que seguimos con la misma definición que para las distribuciones de datos, es decir, un conjunto organizado de los posibles resultados que se pueden alcanzar en un experimento. Con la lectura de este tema en el texto básico, puede identificar las características de las distribuciones.

6.3. Medidas descriptivas de una distribución de probabilidad Lea en el texto básico este apartado en donde se explica el uso de las medidas descriptivas cuando se trabaja con las probabilidades. Al igual que cuando hablamos de los datos presentados en una tabla de frecuencias y posteriormente hemos llegado a determinar las medidas que describen al conjunto de datos, así mismo, llegamos a trabajar cuando se trata de las probabilidades en un conjunto de información. Por otro lado, podemos decir que cuando se trabaja con las distribuciones de probabilidad, es que estamos empleando el concepto de la frecuencia relativa simple, porque el número total de observaciones, vendrían a constituirse en el conjunto total de posibles resultados y cada una de las frecuencias relativas simples, vendrían a constituirse en las probabilidades de éxito en cada uno de los intervalos, clases o eventos. Por ello decimos que el tratamiento de la información es exactamente igual al de la información presentada a través de una tabla de distribución de frecuencias, de manera que podemos determinar sus características como son la media, la varianza y la desviación típica o estándar como las más utilizadas para el efecto.

84

Guía didáctica: Estadística I

6.3.1. Media La media aritmética será así mismo el valor representativo del conjunto de valores probables, o se conoce también como el valor esperado. Utilizamos la siguiente fórmula:

De esta manera lo que estamos haciendo, es multiplicar cada valor por la probabilidad asociada al mismo y luego sumamos todos los valores obtenidos con este producto. 6.3.2. Varianza y desviación típica o estándar Sabemos ya lo que significa cada una de estas dos medidas, por lo que es conveniente ahora revisar nuestro texto básico para determinar cuáles son las características y procedimientos a seguir para su cálculo. Recordemos que la varianza viene expresada en forma cuadrática y que la desviación típica se la obtiene extrayendo la raíz cuadrada a la varianza. La fórmula para calcular esta medida se expresa de la siguiente manera:

De acuerdo a la fórmula, usted puede ir aplicando con cada uno de los elementos considerados. Repase el ejemplo que consta en el texto básico para que amplíe su comprensión sobre el uso de estas medidas en una distribución de probabilidad.

6.4. Distribución de probabilidad binomial Es necesario comprender que una distribución de probabilidad binomial se caracteriza porque se refiere a variables discretas. Un experimento para considerarse como binomial, debe cumplir con algunas características, las cuales se pueden resumir de la siguiente manera: --

Solamente hay dos resultados posibles (éxito o fracaso).

--

Los resultados son mutuamente excluyentes.

--

La variable aleatoria es el resultado de conteo, es decir, se cuenta el número total de éxitos en el número total de ensayos.

--

La probabilidad de éxito es constante, es decir, la misma probabilidad de éxito se mantiene en cada uno de los ensayos.

--

Cada ensayo es independiente uno del otro, es decir, el resultado obtenido en un ensayo no influye en el resultado de los demás ensayos.

85

Guía didáctica: Estadística I

Para calcular una probabilidad binomial se lo hace utilizando el análisis combinatorio a través de la siguiente fórmula:

P(X) = nCX πX(1 – π)n–X Cada uno de estos elementos tiene su significado específico:

n = número de ensayos X = número de éxitos de la variable analizada π = probabilidad de éxito en cada ensayo Usted puede, y es aconsejable que aplique la fórmula hasta que vaya tomando mayor criterio sobre este tipo de probabilidades, luego puede también encontrarla en las tablas que ya los autores han diseñado y que siguen este mismo procedimiento. En el apéndice B9 del texto básico, encuentra las tablas de probabilidad binomial. Para cada n tiene un bloque de probabilidades en cuya fila superior se encuentran las probabilidades de éxito desde 0,05 hasta 0,95 y en la primera columna los valores de X. Revise el ejemplo resuelto en el texto para que se familiarice con el uso de la tabla de probabilidades. Adicionalmente a través de este ejemplo puede observar la forma de llegar a determinar la media o el valor esperado y la desviación típica o estándar. Luego dentro de este tema también podrá determinar que es posible considerar la probabilidad acumulada, porque en muchos casos no se requiere una probabilidad puntual sino una probabilidad dentro de un intervalo. Le invito a que revise en su texto básico, este aspecto junto con las aplicaciones desarrolladas.

6.5. Distribución hipergeométrica De la lectura que viene realizando del texto básico, podrá observar que la distribución binomial no es la única distribución para cuando trabajamos con variables discretas, sino que podemos encontrar otras aplicaciones dependiendo de las características del conjunto de datos a analizarse. En este sentido, la aplicación de la distribución hipergeométrica, se lleva a cabo cuando el conjunto de datos analizados reúne ciertas características, las cuales señalamos a continuación: --

Los resultados se clasifican en dos categorías: éxito o fracaso.

--

Los resultados son mutuamente excluyentes, es decir, si se presenta éxito no puede presentarse al mismo tiempo el fracaso.

--

La variable aleatoria es el número de éxitos en un número fijo de ensayos.

--

Los ensayos son dependientes, es decir, el resultado de un ensayo influye en los demás.

--

Los muestreos se realizan con una población finita sin reemplazo y n/N > 0.05. Por lo tanto, la probabilidad de éxito cambia en cada ensayo.

86

Guía didáctica: Estadística I

--

También podría diferenciar en qué casos utilizar la distribución binomial y en qué casos utilizar la distribución hipergeométrica, ¿puede explicar los casos?:

Para esta distribución de probabilidad, y en razón de que la probabilidad de éxito no permanece constante para cada evento, no se puede establecer una tabla predefinida, para su cálculo podemos utilizar la fórmula correspondiente que consta en el texto (fórmula 6.6). Ahora puede revisar también el ejemplo resuelto en el texto básico, en donde se hace referencia al número de empleados en una compañía, por lo que estamos hablando de una variable discreta, luego hay una condición de que un empleado solo puede ser elegido una vez por lo que el muestreo es sin reemplazo, eso hace que la probabilidad de éxito para cada empleado sea diferente. Considere además que la aplicación de la fórmula para obtener un resultado, igual emplea el análisis combinatorio. Ejercite su comprensión del tema a través del desarrollo de la autoevaluación planteada en el texto básico.

6.6. Distribución de Poisson Esta es otra de las distribuciones de probabilidad para variables discretas que, al igual que las anteriores, lleva sus características que le permiten una aplicación a casos específicos. Se caracteriza porque se trabaja en intervalos definidos, sean de tiempo, espacio, área, etc., se utiliza por ello, cuando se trata de realizar control de calidad en la producción, ya que allí se trabaja por lotes de producción. ¿Cuáles son estas características? Posee tres características que son: ----

La variable es el número de veces que ocurre un evento en un intervalo determinado. La probabilidad de que ocurra un evento es proporcional al tamaño del intervalo. Los intervalos no se superponen y son independientes.

Para calcular esta probabilidad se precisa el uso de la fórmula (6.7) que consta en el texto básico.

Donde:

µ =

media de la cantidad de veces (éxitos) que se presenta un evento en un intervalo particular.

e = X = P(X) =

es la constante 2.718281… número de veces que se presenta un evento. es la probabilidad de un valor específico de X.

87

Guía didáctica: Estadística I

De igual forma podemos determinar la media de la distribución que a su vez es igual a la varianza a través de la siguiente fórmula:

µ=nπ Ya sabemos que n es el número de casos y π, es la probabilidad de éxito. Con la lectura que ha realizado sobre los tipos de distribuciones de frecuencia discretas, usted podrá establecer las diferencias entre estas distribuciones y también con las características de cada uno de los eventos, puede determinar la distribución de probabilidad que debe aplicar en cada caso. En el apéndice B5 del texto básico, puede encontrar las tablas ya construidas sobre la distribución de probabilidad de Poisson. Para su uso requiere conocer el valor de µ que se encuentra en la fila superior y en la primera columna se encuentran los valores de X que es la probabilidad a encontrarse, por ejemplo, si queremos hallar la probabilidad de que X= 4 cuando la media µ es 5, podemos ver que la tabla nos da como resultado 0,1755. Con la ayuda de la tabla, al igual que en el caso de la binomial, podemos ir encontrando las probabilidades acumuladas. Antes de utilizar la tabla de probabilidades, es conveniente que se habitúe en el cálculo a través de la fórmula, por ello le sugiero realizar algunos de los ejercicios que constan al finalizar este tema. Ejercicios de aplicación Una estudiante presenta un examen de opción múltiple con 15 preguntas. Cada pregunta propone cinco opciones. Si la estudiante adivina la respuesta en cada pregunta, ¿cuál es la probabilidad de que apruebe el examen? La mínima calificación aprobatoria requiere que 60% de las preguntas sean contestadas en forma correcta. Suponga que todas las opciones de cada pregunta son igualmente probables. Para resolver el ejercicio, primero debemos identificar la información que se nos ha proporcionado: n = 15 preguntas X = adivinar la respuesta π = 0,20 (porque existen 5 opciones de respuesta y solo 1 es correcta de manera que 1/5) Aprobar = significa que debe cumplir con el 60% o más de las 15 preguntas, entonces el 60% de las 15 son 9 preguntas, quiere decir que la probabilidad de aprobar vendría dada por la suma de las probabilidades de 9, 10, 11, 12, 13, 14, o 15. Con todas estas características, sabemos que el experimento es binomial, entonces procedemos a plantearlo: P(aprobar) = P(X=9) + P(X=10) + P(X=11) +P(X=12) + P(X=13) + P(X=14) + P(X=15)

88

Guía didáctica: Estadística I

Debemos calcular cada una de las probabilidades aplicando la fórmula de la probabilidad binomial, aquí voy a calcular la primera y luego se ubicarán los resultados de todas las demás. Le recuerdo que también las puede obtener de la tabla en el apéndice B del texto. P(X) = nCx(πX)(1- π)n-X P(X=9) = P(X=9) = P(X=9) = 5005*(0,000000512)(0,262144) P(X=9) = 0,00067, es decir 0,0007 Si recurrimos a la tabla vamos a encontrar los siguientes valores: P(X = 10) = 0.0001 P(X = 11) = 0.0000 P(X = 12) = 0.0000 P(X = 13) = 0.0000 P(X = 14) = 0.0000 P(X = 15) = 0.0000 En este caso estamos trabajando con 4 decimales, pero realmente las tablas se presentan con 3 decimales, como se puede observar las probabilidades prácticamente son cero, ahora, para determinar la probabilidad solicitada procedemos a sumar todas las probabilidades: P (aprobar) = P(X=9) + P(X=10) + P(X=11) +P(X=12) + P(X=13) + P(X=14) + P(X=15) P(aprobar) = 0.0007 +0.0001 + 0.0000 + 0.0000 + 0.0000 + 0.0000 + 0.0000 P(aprobar) = 0.0008 Diremos entonces que las probabilidades de aprobar el examen por parte de la estudiante son muy bajas, prácticamente son nulas porque se encuentran cercanas a cero. Veamos ahora otro ejercicio: Imagine que el 15% de la población es zurda y el resto utiliza la mano derecha (no hay ambidiestros). Si usted pregunta a las siguientes cinco personas que encuentre. ¿Cuál es la probabilidad de que: a. b. c. d.

Todas esas personas sean zurdas? Todas esas personas sean diestras? Exactamente dos de ellas sean zurdas? Por lo menos una de ellas sea zurda?

89

Guía didáctica: Estadística I

Datos: n = 5 personas X = la persona elegida sea zurda π = 0,15 (probabilidad de que una persona sea zurda) a.

Todas esas personas sean zurdas

P(X) = nCx(πX)(1- π)n-X P(X = 5) = 5C5(0,155)(1- 0,15)5-5 P(X = 5) = P(X = 5) = 1*(0,0000759)(1) P(X = 5) = 0,0000759 La probabilidad de que todas las 5 personas sean zurdas, es prácticamente cero. b.

Todas esas personas sean diestras

Esto significa también que estamos buscando la probabilidad de que ninguna sea zurda P(X)= nCx(πX)(1- π)n-X P(X=0)= 5C0(0,150)(1-0,15)5-0 P(X=0)= P(X=0)= 1*(1)(0,4437) P(X=0)= 0,4437 o también se puede expresar como 44,37% El resultado obtenido nos indica que existe el 44,37% de probabilidades de que todas las cinco personas consultadas sean diestras. c.

Exactamente dos de ellas sean zurdas

P(X)= nCx(πX)(1- π)n-X P(X=2)= 5C2(0,152)(1-0,15)5-2 P(X=2)= P(X=2)= 10*(0,0225)(0,614125) P(X=2)= 0,13817

90

Guía didáctica: Estadística I

Quiere decir que existe el 13,82% de probabilidades de que en el grupo de las cinco personas, exactamente dos de ellas sean zurdas. d.

Por lo menos una de ellas sea zurda

Cuando se debe establecer la probabilidad en este tipo de eventos, tenemos dos caminos: ---

Sumar las probabilidades de 1, 2, 3, 4, y 5 Restar de 1 la probabilidad de cero, que para este ejercicio ya fue calculada anteriormente.

Vamos a tomar la segunda opción: P(X=por lo menos 1 sea zurda)= 1-P(X=0) P(X=por lo menos 1 sea zurda)= 1-0,4437 P(X=por lo menos 1 sea zurda)= 0,5563 Es decir, existe el 55,63% de probabilidades de que por lo menos 1 persona de entre las cinco, sea zurda. Si un banco recibe en promedio 6 cheques sin fondos por día. ¿Cuáles son las probabilidades de que reciba: a. b.

Cuatro cheques sin fondo en un día dado? 10 cheques sin fondos en cualquiera de dos días consecutivos?

Para resolver este ejercicio, primero debemos identificar las características del ejercicio en cuanto a la información otorgada, de lo cual se desprende que corresponde a un experimento que se considera en un intervalo de tiempo, que la probabilidad de éxito es proporcional al intervalo, los intervalos son independientes, n es grande y π es pequeña por lo que se establecería que se debe utilizar la distribución de Poisson. Ahora sí podemos iniciar a resolverlo: a.

Cuatro cheques sin fondo en un día dado

X = número de cheques sin fondo en un día cualquiera µ = 6 cheques sin fondo por día

P(X=4)= 0,1339 Este resultado nos permite concluir que existe el 13,39% de probabilidades que en un día cualquiera se reciban cuatro cheques sin fondo en el banco.

91

Guía didáctica: Estadística I

b.

10 cheques sin fondos en cualquiera de dos días consecutivos

X = número de cheques sin fondo en dos días consecutivos µ = 6 x 2 días = 12 promedio de cheques sin fondo que llegan en dos días consecutivos

P(X=10)= 0,1048 El resultado del ejercicio nos indica que existe el 10,48% de probabilidades de que en dos días consecutivos se reciban 10 cheques sin fondo en el banco.

Actividades recomendadas

Como hemos venido trabajando hasta ahora, es recomendable desarrollar algunas actividades que permitan determinar la comprensión de cada uno de los temas analizados, para ello le propongo que: 1.

Realice un listado con algunas variables y clasifíquelas como variables discretas y variables continuas.

2.

Reflexione sobre algunas conversaciones o experiencias vivenciales en donde ha identificado el uso de las probabilidades y considere la posibilidad de cuantificarlas, definiendo para ello si se caracterizan como objetivas o subjetivas. A partir de allí considere los resultados posibles y los resultados favorables al evento analizado, para llegar a obtener la respuesta.

3.

Para emplear el análisis combinatorio, desarrolle ejercicios en donde determine el número de permutaciones y de combinaciones que se pueden extraer.

4.

Realice un cuadro sinóptico en donde resuma las características de cada una de las distribuciones de probabilidad discreta, de manera que pueda tener un elemento de ayuda para identificar cada uno de estos tipos y pueda aplicar su correspondiente fórmula.

5.

Es conveniente que realice algunos ejercicios sobre estas distribuciones de probabilidad. Para ello tome los ejercicios que se encuentran como resumen del capítulo de manera que usted comprenda los casos que pudiera encontrar en la vida práctica, por ejemplo, en su campo de labor diaria.

92

Guía didáctica: Estadística I

Autoevaluación 6

De igual forma pasemos a revisar ciertos aspectos básicos para determinar el avance que vamos teniendo en la comprensión de los temas planteados en esta unidad. No está por demás recordarle que si en alguno de ellos ha tenido alguna dificultad, debe volver a revisar ese tema de manera que vaya teniendo seguridad y refuerce los conocimientos en este. No pase a la siguiente unidad hasta que se asegure de haber comprendido todo. A.

Conteste dentro del paréntesis con V o F si considera que las siguientes afirmaciones son verdaderas o falsas respectivamente:

1.  (    )

Las distribuciones de probabilidad llevan el mismo concepto y características de las distribuciones de datos.

2.  (    )

Una distribución de probabilidad binomial se caracteriza porque los resultados son eventos mutuamente excluyentes.

3.  (    )

La media de una distribución de probabilidad, también se conoce como el valor esperado y es igual a la sumatoria del producto de la variable por la probabilidad de ella.

4.  (    )

En el caso de las distribuciones de probabilidad no es necesario identificar la desviación típica o estándar, ya que la varianza no viene expresada en unidades cuadráticas.

5.  (    )

En las distribuciones de probabilidad binomial existen solamente dos resultados posibles para cada evento, éxito o fracaso.

6.  (    )

En las distribuciones de probabilidad binomial, la probabilidad de éxito para cada uno de los eventos, no permanece constante debido a que los eventos se realizan sin reemplazamiento.

7.  (    )

Otra de las características de la probabilidad binomial consiste en que si el valor de n va creciendo mientras que el valor de π, permanece constante, la forma de la distribución va siendo más simétrica.

8.  (    )

Cuando el tamaño de la población es finito se debe preferir el uso de la probabilidad binomial ya que la probabilidad hipergeométrica es utilizada más bien cuando la población es infinita.

9.  (    )

La distribución de probabilidad de Poisson se caracteriza porque en ella los intervalos se superponen y son dependientes.

10.  (    )

La distribución de probabilidad de Poisson, siempre tiene sesgo positivo.

93

Guía didáctica: Estadística I

Importante: aunque los resultados a estas preguntas usted las puede encontrar al final de esta guía, le recomiendo no llegar hasta allá sino cuando usted haya completado el cuestionario. Para recordar: En esta unidad se han analizado las distribuciones de probabilidad discreta, desarrollando las características de cada una y su forma de aplicar. Hemos analizado que este tipo de distribuciones de probabilidad se utilizan cuando la variable que se está analizando es discreta. De igual manera se han podido caracterizar estas distribuciones para establecer indicadores de la distribución de probabilidad. La siguiente y última unidad, consiste en revisar la distribución continua de probabilidad, básicamente aquí hablaremos de la distribución de probabilidad normal.

94

Guía didáctica: Estadística I

UNIDAD 7: DISTRIBUCIÓN DE PROBABILIDAD CONTINUA

Para el desarrollo de esta unidad, revise conjuntamente con esta guía el capítulo 7 del texto básico.

7.1. Distribución de probabilidad normal En la unidad anterior hemos trabajado con las variables discretas y encontramos que se pueden identificar tres tipos de distribuciones, binomial, hipergeométrica y de Poisson, cada una con sus características propias que determinan su aplicabilidad en los diferentes casos. Ahora, cuando trabajamos con una variable continua, lo hacemos básicamente con una que es la probabilidad normal. Antes de definir lo que significa esta distribución, haga una revisión de lo que nos dicen los autores del texto respecto a este tipo de distribuciones de probabilidad, de manera que puede encontrar allí las características de una familia de distribuciones de probabilidad uniforme. Como verá, estas distribuciones se caracterizan por ser simétricas y su representación gráfica tiene la forma de una campana. Al igual que en las distribuciones anteriores, existe una manera de calcular, conforme lo puede establecer en la fórmula 7.4 del texto básico. Sin embargo, puede resultar un tanto compleja la aplicación de esta fórmula, de modo que para encontrar una probabilidad se acude al uso de las tablas de áreas bajo la curva normal (Apéndice B1, del texto básico). Pero, ¿cómo podemos llegar a determinar una probabilidad de este tipo?, antes de identificar su procedimiento, conviene que definamos a la probabilidad normal, esto lo puede hacer con la lectura en el texto básico, a partir de lo cual puede emitir su propia definición. Si en su definición ha considerado aspectos tales como: variable continua, forma simétrica o acampanada, que es simétrica con respecto a la media aritmética, entonces podemos decir que estamos en lo correcto. Ahora sí, podemos detallar los pasos que se requieren para determinar una probabilidad. 1.

La probabilidad normal, se denomina también distribución de probabilidad normal estándar, y por ello se requiere transformar los valores de X en términos de Z, a través de la siguiente fórmula:

2.

El resultado de Z, puede ser negativo y positivo, este signo nos indica la posición del dato con respecto a la media, cabe indicar que en términos de Z la media es igual a cero.

3.

Para determinar el área bajo la curva normal a encontrarse es aconsejable realizar un gráfico como el siguiente:

95

Guía didáctica: Estadística I

4.

Con los valores de Z, pasamos a leer en la tabla de áreas bajo la curva normal el valor correspondiente, usted puede observar esta tabla en el apéndice B1 del texto básico.

Para observar el uso de estas tablas, remítase a los ejemplos desarrollados en el texto, allí podrá identificar la forma en la que se puede llegar a conocer los valores de las probabilidades requeridas. En el texto básico encontramos un apartado denominado REGLA EMPÍRICA, a través de ella usted descubrirá que existen casos que se pueden deducir directamente como los siguientes: 1.

Alrededor del 68% del área bajo la curva normal se encuentra a una desviación estándar con respecto a la media aritmética: µ ± 1σ.

2.

Aproximadamente el 95% de las observaciones se encuentran distantes a dos desviaciones estándar con respecto a la media aritmética: µ ± 2σ.

3.

Prácticamente toda (99,7%) el área bajo la curva normal se encuentra distante a tres desviaciones estándar con respecto a la media aritmética: µ ± 3σ.

En los apartados correspondientes a las aplicaciones de la distribución normal estándar y en la determinación de áreas bajo la curva normal, así como en los ejercicios desarrollados, se encuentra explicado al detalle la forma en la que se determinan las probabilidades normales. Realice también las autoevaluaciones previstas de manera que vaya adquiriendo las competencias referidas al cálculo de la probabilidad normal. Estudiemos ahora el caso especial en donde se utiliza la distribución normal cuando la variable es discreta, se trata de la aproximación normal a la binomial.

7.2. Aproximación normal a la binomial En algunas ocasiones, aunque la variable es discreta, los cálculos de las probabilidades pueden resultar demasiado extensos por el número de observaciones, de allí que otra forma de trabajar este tipo de casos, es utilizando la aproximación de la distribución normal a la binomial. Puede leer este acápite en el texto, pues, allí está explicada la forma en la que se debe trabajar en estos casos. Quizá conviene relievar en este momento, ¿cuándo se debe utilizar la aproximación normal a la binomial? En primer lugar para saber si es buena la aproximación de la normal a la binomial, se debería considerar que nπ y n(1 – π), son 5 por lo menos.

96

Guía didáctica: Estadística I

Ahora bien, dado que se va a trabajar con el procedimiento de la distribución de probabilidad normal (que corresponde a variables continuas) una distribución de probabilidad discreta (binomial), implica que previamente se debe realizar un tratamiento a los valores de la variable, el cual se denomina corrección de continuidad. Recordemos que en las distribuciones de probabilidad binomial estamos trabajando con variables discretas que son aquellas que no toman valores intermedios entre uno y otro valor, en cambio la distribución normal trabaja para variables continuas que sí pueden tomar infinidad de valores entre uno y otro. La aplicación del factor de corrección de continuidad establece cuatro casos que se pueden presentar: 1.

Cuando la probabilidad a encontrarse dice que por lo menos ocurra X, se utiliza el área por encima de (X - 0,5)

2.

Cuando la probabilidad a encontrarse dice que ocurra más que X, se utiliza el área por encima de (X + 0,5)

3.

Cuando vamos a encontrar la probabilidad de que ocurra X o menos, se utiliza el área por debajo de (X + 0,5)

4.

Cuando vamos a encontrar la probabilidad de que ocurra menos que X, se utiliza el área debajo de (X - 0,5)

Una vez que hemos aplicado la corrección por continuidad, se sigue los pasos que se contemplan para encontrar una probabilidad normal. Revise este apartado en el texto básico, allí se encuentran explicados los pasos que se deben seguir para trabajar en estos casos. Ejercicios de aplicación Una persona con una buena historia crediticia tiene una deuda promedio de $15.015. Suponga que la desviación estándar es de $3.540 y que los montos de las deudas están distribuidos normalmente. a.

¿Cuál es la probabilidad de que la deuda de una persona con una buena historia crediticia sea mayor a $18.000?

b.

¿De que la deuda de una persona con una buena historia crediticia sea de menos de $10.000?

c.

¿De que la deuda de una persona con una buena historia crediticia esté entre $12.000 y $18.000?

Desarrollo: En primer lugar por los datos conocemos que se trata de una distribución normal con la siguiente información:

97

Guía didáctica: Estadística I

X = deuda de las personas µ = 15.015 σ = 3.540 Luego de identificados estos elementos informativos, procedemos a trabajar con cada una de las interrogantes. a.

¿Cuál es la probabilidad de que la deuda de una persona con una buena historia crediticia sea mayor a $18.000?

--

Probabilidad solicitada es que la deuda de la persona sea mayor a $18.000 = P(X > 18.000)

--

Transformamos los valores de X a referencias tipificadas en términos de Z

--

Con este valor obtenido vamos a leer en la tabla de áreas bajo la curva normal que se encuentra en el apéndice B.1 del texto básico, pero previamente planteamos el ejercicio, y es conveniente, hacerlo de manera gráfica para poder establecer el área a encontrarse:

µ

x

P(X>18000) = 0,5 - (Area para Z = 0,84) P(X>18000) = 0,5 - 0,2995 P(X>18000) = 0,2005 Significa, por tanto, que existe el 20,05% de probabilidades de que la deuda de una persona con una buena historia crediticia sea mayor a $18.000.

98

Guía didáctica: Estadística I

b.

¿De que la deuda de una persona con una buena historia crediticia sea de menos de $10.000?

--

Probabilidad solicitada es que la deuda de la persona sea menor a $10.000 = P(X < 10.000).

--

Al igual que en el literal anterior, procedemos a calcular la probabilidad solicitada, empecemos con el planteamiento de la probabilidad:

x

µ

P(X<10000)=0,5-(Area para Z=1,42) P(X<10000)=0,5-0,4222 P(X<10000)=0,0778 El resultado significa que existe el 7,78%de probabilidades de que la deuda de una persona con una buena historia crediticia sea menor a $ 10.000. c.

¿De que la deuda de una persona con una buena historia crediticia esté entre $12.000 y $18.000?

--

Ahora la probabilidad solicitada, es de que la deuda de una persona con un buen historial crediticio, tenga una deuda entre 12000 y 18000, esto es: P(12000 < X < 18000)

X1

µ

X2

X1 = 12000 X2 =18000

99

Guía didáctica: Estadística I

Z2= 0,84 P(12000<X<18000) = (Area para Z1=-0,85)+(Area para Z2=0,84) P(12000<X<18000) = 0,3023+0,2995 P(12000<X<18000) = 0,6018 El resultado nos explica que existe el 60,18% de probabilidades de que la deuda de un cliente con un buen historial crediticio, se encuentre entre 12000 y 18000 dólares. Le propongo desarrollar ahora otro ejercicio, en donde la variable es discreta, pero por el tamaño de la población investigada, se debe aplicar la aproximación normal a la binomial. Un hotel de cierta ciudad tiene 120 habitaciones. En los meses de primavera, su ocupación es de 75%. a.

¿Cuál es la probabilidad de que por lo menos la mitad de las habitaciones estén ocupadas en un día dado?

b.

¿Cuál es la probabilidad de que 100 o más de las habitaciones estén ocupadas en un día dado?

De acuerdo a la información del ejercicio, podemos confirmar que se trata de una variable discreta, puesto que se habla de habitaciones. Luego para poder trabajar con el número de habitaciones que corresponden a la población en estudio, no es posible hacerlo a través de la distribución de probabilidad binomial, de allí que se hace necesario trabajar con la aproximación normal a la binomial, ahora veamos si sería una buena aproximación. La condición para conocer si es una buena aproximación nos dice que nπ y n(1 – π), son 5 por lo menos, revisemos si se cumple: n = 120 π = 0,75 nπ=(120)(0,75) nπ=90 n(1- π)=(120)(1-0,75) n(1- π)=(120)(0,25) n(1- π)=30

100

Guía didáctica: Estadística I

Se cumple la condición, por tanto, se puede considerar como una buena aproximación. Con esto procedemos a calcular las probabilidades solicitadas. a.

¿Cuál es la probabilidad de que por lo menos la mitad de las habitaciones estén ocupadas en un día dado?

P(X mayor o igual a 60), esto porque nos pide identificar la probabilidad de que por lo menos la mitad estén ocupadas, quiere decir que pueden ser 60 o más habitaciones. Recordemos que al trabajar con una variable discreta, debemos proceder a establecer la corrección por continuidad, entonces según el caso, debemos expresar que: Cuando la probabilidad a encontrarse dice que por lo menos ocurra X, se utiliza el área por encima de (X 0,5): (X-0,5)=(60-0,5) (X-0,5)=(59,5)

X

µ

Z= - 6,43 P(X≥60)=0,5+(Area para Z=-6,43) P(X≥60)=0,5+0,5 P(X≥60)=1 El resultado nos indica que existe absoluta certeza (100%) de que por lo menos la mitad de las habitaciones se encuentren ocupadas en un día dado. Quizá en este caso cabe una aclaración, como el valor de Z es mayor a 3, y si recordamos la regla empírica, prácticamente a partir de 3 desviaciones típicas con respecto a la media aritmética, se encuentran todas las observaciones, por ello en la tabla de áreas bajo la curva normal usted encontrará solamente hasta el valor de Z = 3,09 con el área de 0,4990, por ello a partir de este valor de Z se considera como el área 0,5. b.

¿Cuál es la probabilidad de que 100 o más de las habitaciones estén ocupadas en un día dado?

Con los resultados anteriores, procedemos a identificar la probabilidad solicitada. Como nos están solicitando calcular la probabilidad de 100 o más, aplicamos la corrección por continuidad y tendremos:

101

Guía didáctica: Estadística I

(X-0,5)=(100-0,5) (X-0,5)=99,5

µ

X

Z= 2 P(X≥100)=0,5-(Area para Z=2) P(X≥100)=0,5-0,4772 P(X≥100)=0,0228 La respuesta a la inquietud presentada se establece diciendo que existe el 2,28% de probabilidades de que 100 o más habitaciones se encuentren ocupadas en un día cualquiera. Como podrá analizar, hemos llegado a concluir los temas previstos para este componente educativo, espero que le sean de utilidad en su formación profesional, por ello le invito a desarrollar las siguientes actividades con la finalidad de que vaya adquiriendo las destrezas y habilidades que le permitan analizar los casos que se presenten. Luego le propongo una autoevaluación para que confirme su nivel de logro o establezca las acciones correctivas para mejorar sus resultados.

102

Guía didáctica: Estadística I

Actividades recomendadas

Como he venido insistiendo al finalizar cada unidad temática, es preciso llevar a cabo algunas actividades que le permitan afianzar los contenidos estudiados, por ello le recomiendo realizar las siguientes actividades: 1.

Realice un cuadro sinóptico con cada una de las características definitorias de una distribución normal.

2.

Repase el procedimiento a seguirse para llegar a resolver un problema de probabilidades con una distribución normal.

3.

Obtenga datos que le permitan llegar a calcular la o las probabilidades con una distribución normal.

4.

Revise los datos para las distribuciones binomiales y trabaje con la aproximación de la normal a la binomial para que luego llegue a determinar las probabilidades correspondientes.

Ahora es necesario también hacer una revisión de la comprensión de los contenidos desarrollados en la unidad, para ello le propongo responder al siguiente cuestionario. Al final de esta guía se encuentran las soluciones para que pueda medir el logro obtenido.

103

Guía didáctica: Estadística I

Autoevaluación 7

A.

Conteste dentro del paréntesis con V o F si considera que las siguientes afirmaciones son verdaderas o falsas respectivamente:

1.  (    )

Una variable continua se caracteriza porque puede existir una gran cantidad de valores intermedios entre dos valores consecutivos.

2.  (    )

Dentro de las distribuciones de probabilidad continua se pueden identificar las distribuciones de probabilidad uniforme.

3.  (    )

La distribución de probabilidad normal se caracteriza por ser asimétrica positiva, ya que siempre la media aritmética es mayor que cualquier otro valor.

4.  (    )

Una distribución de probabilidad normal se caracteriza porque se distribuye con media igual a 0 y varianza igual a 1, en términos de referencia tipificada o valores de Z.

5.  (    )

Las probabilidades normales se calculan primero transformando los valores de X a valores de Z o valores tipificados.

6.  (    )

Por regla general se puede afirmar que el 68% de las observaciones se encuentran entre la media (µ) ± 2σ.

7.  (    )

Una probabilidad normal es considerada como una buena aproximación a la distribución binomial cuando los productos nπ y n(1 – π), son por lo menos igual a 10.

8.  (    )

Para aproximar una probabilidad normal a una distribución de probabilidad binomial, primero se debe realizar la corrección de continuidad de la variable.

9.  (    )

Si se trata de calcular la probabilidad de “por lo menos ocurra X”, entonces a la variable se le debe sumar 0,5.

10.  (    )

En la aproximación normal a la binomial, también se deben satisfacer las cuatro características básicas de la probabilidad binomial, en donde una de ellas dice que la probabilidad de éxito se mantiene para cada una de las pruebas.

Importante: al final de esta guía didáctica puede encontrar las soluciones, pero no pase a esta parte mientras no haya terminado de contestarla, luego puede definir sus logros y si hay algún tema que no ha quedado claro, vuelva a revisarlo hasta que se encuentre seguro de su conocimiento.

104

Guía didáctica: Estadística I

Para recordar: Hemos analizado la distribución de probabilidad normal, que se aplica a una variable de carácter continuo, como hemos observado, aquí debemos trabajar con la tabla de áreas bajo la curva normal. Es recomendable que para desarrollar los ejercicios, primero se plantee el problema y se lo realice gráficamente a fin de que se asegure cuál es el área que debe encontrar. También hemos visto un caso especial que se presenta en el tema de las probabilidades cuando nos referimos a variables discretas que por la cantidad de casos investigados no se facilitaría trabajar como una distribución de probabilidad binomial, en cuyo caso es aconsejable trabajar la variable como si fuera continua y aplicar la distribución de probabilidad normal.

105

Guía didáctica: Estadística I

7. Solucionario

PRIMER BIMESTRE Unidad 1

106

1

V

2

V

3

F

4

V

5

F

6

V

7

V

8

F

9

V

10

V

Guía didáctica: Estadística I

Unidad 2 1

F

2

F

3

V

4

V

5

V

6

V

7

V

8

F

9

V

10

V

107

Guía didáctica: Estadística I

Unidad 3

108

1

V

2

V

3

F

4

F

5

V

6

V

7

V

8

V

9

F

10

V

Guía didáctica: Estadística I

SEGUNDO BIMESTRE Unidad 4 1

V

2

V

3

F

4

V

5

V

6

F

7

V

8

V

9

V

10

V

109

Guía didáctica: Estadística I

Unidad 5

110

1

V

2

F

3

F

4

V

5

V

6

V

7

F

8

V

9

F

10

F

Guía didáctica: Estadística I

Unidad 6 1

V

2

V

3

V

4

F

5

V

6

F

7

V

8

F

9

F

10

V

111

Guía didáctica: Estadística I

Unidad 7 1

V

2

V

3

F

4

V

5

V

6

F

7

F

8

V

9

F

10

V

Felicitaciones por haber superado con éxito el estudio de este componente educativo

CCG/vtc/2013-07-16/112 vjg/2013-11-04 2014-09-22

112

Related Documents

Guia
February 2021 3
Guia
February 2021 4
Guia Definitiva
February 2021 1
Guia Ferulas
February 2021 1
Guia Ceneval.pdf
February 2021 1
Guia Practica
February 2021 1

More Documents from "Eduardo Solorzano"

March 2021 0
January 2021 0
March 2021 0
Human Design
January 2021 1
Traders Dong.pdf
March 2021 0