Cap-3-est

  • Uploaded by: Nestor Paul
  • 0
  • 0
  • February 2021
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Cap-3-est as PDF for free.

More details

  • Words: 20,225
  • Pages: 58
Loading documents preview...
capítulo ~.1

r

,..0.:

• •••.



. ~· - ~~~; d. ;' ,.n.~t. · a· , :n·1 'd· ~.; \e~·~ . t -o-; -· .S _a. . ~ · · t b .u" mer~.. · c-.-~ 1e.·~· ;:n,. a·. :-· ·;~··:- I · \y· - ·- · . . . . .. o ~ - · . . . . _

····p

·

....

--=·

d

- ...

:.

(.~~·

• o o ••••••••••••••

J1 ~·,_·

..•.. '·~·

~. ··-···-..=-~-~.

''<;;: ..

~ ª. ~s-

1.

.•· 1··.~g·.il'ta-

···,~···: ·:D

·• ·,~.~~;...

'.:m·,: ·:~ .~ -,~

· o •••••••••

OBJETIVO DEL CAPÍTULO

•••••••••••••••••••••••••••••• Mostrar cómo organizar y presentar de manera más eficaz datos numéricos reunidos en tablas y diagramas.

-

181

Introducción

En el capítulo anterior aprendimos cómo recolectar datos mediante una investigación de. encuestas. Como se señaló en la sección 2.5, puesto que el muestreo abona tiempo, dinero y mano de obra, generalmente tratamos~'?n ínforrnacíón de muestras 'antes que con datos de toda una población. No obstante, sínímportar si tratamos C()Il.1Jna muestra o con una población, como regla general, cuando una serie de datos que hemos reunido contiene aproximadamente 20 o más observaciones, la mejor forma de examinar tales datos masivos es presentarlos en forma de resumen construyendo tablas y díagramas apropiados. Entonces podemos extraer las característicasimportantesde los datos de estas tablas y diagramas. Por lo tanto, este capítulo trata sobre la presentación de .datos. En particular, mostraremos cómo grandes series de datos numéricos pueden organizarse y presentarse de manera más eficaz en forma de tablas y diagramas con el fin de intensificar el análisis e interpretación de datos, aspectos clave del proceso de toma de decisiones. Para motivar nuestro análisis sobre la presentación tabular y de diagrama de los datos numéricos, podemos ver en el diagrama de resumen del capítulo de la página 94 que las observaciones en nuestra serie de datos .son de dos típos, de orden de tiempo o independientes. Las observaciones de orden de tiempo pueden controlarse sobre una gráfica digipunto, mientras que las observaciones independientes pueden organizarse en una clasificación ordenada o diagrama de tallo y hojas y luego presentarse en forma tabular como una distribución de frecuencia o en forma gráfica como un histograma, polígono u ojiva. Después de terminar este capítulo, debe poder: l. Organizar una serie de datos numéricos en una clasificación ordenada o diagrama de tallo y hojas. 2. Comprender cómo y cuándo construir y usar distribuciones de frecuencia y distribuciones de porcentaje. 3. Saber cómo y cuándo construir y usar distribuciones acumulativas. 4. Comprendercómo y cuándo construir y usar distribuciones acumulativas. S. Saber cómo y cuándo construiry usar ojivas (es decir, polígonos de

frecuencia acumulativa y polígonos de frecuencia relativa acumulativa). 6. Saber cómo y cuándo construir y usar la gráfica digipunto. 7. Apreciar el valor de usar paquetesestadísticos o de hoja de trabajo para presentar datos numéricos en la forma de tablas y diagramas. 8. Comprender cómo distinguir entre una presentación buena y otra mala de datos numéricos y las cuestiones éticas involucradas.

l!j

Organización

de

datos

numéricos: la clasificación ordenada y el diagrama de tallo y hojas Con el fin de Introducir las ideas relevantes para los capítulos 3 y 4, supongamos que una compañía que brinda servicios de asesoría universitaria a estudiantes por todo Estados Unidos ha contratado a un analista investigador para comparar las colegiaturas cobradas a residentes de fuera del estado por colegios y universidades en distintas regiones del país. La tabla 3.1 muestra las colegiaturas cobradas a residentes de fuera del estado por cada uno de !os 60 colegios y universidades del estado de Texas (véase en particular el Conjunto de datos especiales del apéndice D, páginas Dl-D2). Cuando se recolecta una serie de datos como ésta, 54

Capitule 3

Presentación de datos numéricos en tablas y diagramas

1

j

j

l

generalmente se hace en forma sin procesar; es decir, las observaciones numéricas no se disponen en ningún orden o secuencia particular. Corno se deduce de la tabla 3.1, al crecer el. número de observaciones, se hace más dificil centrarse en las principales características de un conjunto de datos y se necesitan métodos para ayudamos a organizar las observaciones de tal manera que entendamos mejor la información que transmite la serie de datos. Dos métodos comúnmente usados para lograr esto son la clasificación ordenada y el diagrama de tallo y hojas: ·¡ ¡ · ~ . -·- -··. -· :

·-------------

Tabla 3.1

Datos sin procesar referentes a colegiaturas (en $000) para residentes fuera del estado en 60 colegios y universidades de Texas.

7.2

4.9 4.7 2.4 4.9 4.9 3.5

4.8

3.6 11.0 7.9 8.0

10.7 8.3 8.5 3.9 5.8 4.9

10.4 3.8 8.8 4.9 3.9 5.8.

6.4

4.8

7.7

4.9

4.8

8.3

4.9 10.3 3.9

4.4

11.6 4.1

4.7 6.4 8.6 4.9 3.4 3.5

4.6 6.6 12.0 8.0 3.9 4.8

6.0 4.5

4.9 3.6

s.o

5.9

5.4 8.. 0 7.0 7.4 3.9 3.6

Fuente: Véase Conjunto de datos especiales l, apéndice D, páginas Dl-D2, tomadolle "Amerlca's Best Colleges, 1994 College Guíde", U.S. News& WorldReport, resumido de College Counsel 1993 de Natick, Mm. Relmpresíón con permiso especial, U.S. News & World Report; © 1993.por U.S. News & WorlclReport y por College Counsel.

a.z,

l

La clasificación ordenada

Si ordenamos los datos sin procesar de la observación más pequeña a la más grande, la secuencia ordenada obtenida se denomina clasificación ordenada. Cuando los datos se disponen en una clasificación ordenada, como en la tabla 3,2, se facilita nuestra evaluación de sus principales características. Se hace más fácil seleccionar los extremos, los valores típicos y las concentraciones de valores. Tabla 3.:2 2.4 3.9

3.4 3.9

4.9 6.6 8.3

4.9 7.0 8.5

4.8

Clasiiicación ordenada sidades de Texas. 3.S 3.9 4.8 5.0

4.8

7.2

8.6

3.5. 4.1 4.9 S.4 7.4 8.8

de colegiaturas 3.6 4.4 4.9

S.8 7.7

10.3

3.6 4.S 4.9 5.8

7.9

10.4

(en $000) de 60 colegios y univer3.6 4.6 4.9

3.8

3.9

4.9 6.0

4.9

8.0 10.7

8.0

5.9

4.7

11.0

4.7

6.4

8.0

11.6 .

3.9 4.8 4.9 6.4 8.3 12.0

Fuente: Tabla 3.1.

Aun cuando resulta útil colocar los datos sin procesar en una clasificación ordenada antes de desarrollar tablas de resumen o de calcular mediciones de resumen descriptivas (véase el capítulo 4), mientras mayor sea el número de observaciones presentes en una serie de datos, más pesado es formar la clasificación ordenada. En tales situaciones se hace particularmente útil organizar la serie de datos en un diagrama de tallo y hojas con el fin de estudiar sus características (referencias 1, 13 y 14).

3 .2.2

El diagrama de tallo y hojas

Un diagrama de tallo y hojas separaIas ..e.n:trq
Organización de datos numéricos; la claslíicación ordenada y el dlagrarna de callo y hojas

sería el dígito rastrero. Por lo tanto, una entrada de 7.2 (correspondiente a $7,200) tiene un dígito guía de 7 y un dígito rastrero de Z. La figura 3.1 describe el diagrama de tallo y hojas de las colegiaturas de los 60 colegios y universidades de Texas, La columna de números a la izquierda de la linea vertical se denomina el "tallo". Estos números corresponden a los dígitos guía de los datos. En cada fila las "hojas" se bifurcan a la derecha de la línea vertical, y estas entradas corresponden a dígitos rastreros .

. ·:.::.?:

.. . . 11 .06 ; : .

Figura 3.1

Diagrama de tallo y hojas de colegiaturas de residentes fuera del estado en 6Ó colegios y universldades de Texas.

. ......

·. ·.:/.~ :-,.: : : ··.:.::··;~:·.:·;:"::./.

· ~~::. .:;:. · ;;.:.:~·-(~_::;.;:·;~t~~-z;~t;;.'.,. >.rk~~!~ti_:

Fuente: Tabla 3.1.

e Construcción del diagrama de tallo y hojas Usando los datos de la tabla 3.1, se construye fácilmente el diagrama de tallo y hojas. Observe que la primera institución, la Universidad Abílene Christian, tiene una colegiatura de 7,200 dólares. Por lo tanto, el dígito rastrero de 2 se enumera como el primer valor.de hoja junto al valor de tallo de 7 (el dígito guía). La segunda institución, la Universidad Angelo State, tiene una colegiatura de 4,900 dólares. Aquí el dígito rastrero de 9 se enumera corno el primer valor· de hoja junto al valor de tallo de 4. Continuando, la tercera institución, el Austin College, tiene una colegiatura de 10,700 dólares, por lo que el dígito rastrero de 7 se enumera como el primer valor de hoja junto al valor de-tallo de 10. La cuarta institución, la Universidad Baylor, tiene una colegiatura de 10 400 dólares, por lo que el dígito rastrero de 4 se enumera como el segundo valor de hoja junto al valor de tallo de 10. En este punto de su construcción, nuestro diagrama de tallo y hojas tiene la siguiente forma: · ·

.:::. ~ ~·~·::.

...

.\

. ·. :

.~'.!_·'; , . >r'f J

......

s .:

·t :f.·':;:·: ::.;: . ·.6 .

.

.

.

. 9' ' :]: '6 ;· ·74 .:;:.;:·· -.

n

1i · .:. 56

Capítulo 3

Presentación de datos numéricos en tablas y diagramas

Observe que dos de las cuatro escuelas tienen el mismo tallo. Al incluirse más y

más escuelas, se observarán aquéllas que tienen los mismos tallos y, tal vez, incluso las mismas hojas pertenecientes a los tallos (es decir, las mismas colegiaturas). Tales valores de hojas se registrarán adyacentes a las hojas previamente registradas, opuestas al tallo apropiado, dando como resultado la figura 3.1. Para ayudamos a· seguir examinando los· datos, ·tal vez deseemos volver a arreglar las hojas de cada uno de los tallos, colocando los dígitos en orden ascendente, fila por fila. El diagrama de tallo y hojas revisado se presenta en la figura 3.2.

Figura 3.l

Diagrama de tallo y ho;as revisado de ecleglaturas de resldenees fuera del estado en 60 colegios y universidades de Texas.

También es útil otro tipo de nuevo arreglo. Si deseamos alterar el tamaño del diagrama de tallo y hojas, éste es lo bastante flexible para tal ajuste. Suponga, por ejemplo, que deseamos incrementar el número de tallos para que podamos obtener una menor concentración de hojas en los tallos restantes. Esto se hace en el diagrama de tallo y hojas presentado en la figura 3.3. 2L 4

·iH ·..' ·3~ 4

·

.· ·:::.·

.

.3H 55~º6~99999 ·~L. 14 . ~.'tJ. ~~??88.88999999,~~,9 .

:sL:. 04 ·· : : ' .

.sa

'889 .' · ·

·:6a

6

6i. ó4~{'

.

.::

.

!;.

.. ... '"~· .:;;,;.,:>

:. .. · ·

·:r;;; ·.~~~:'.:::\;d>_. ,. ,. ).<:>:.~: / 3;. ¡};r};;:;.;/: 8L 00033 ~H 568

·gt

..9fi

·101

.. ·...,

.i'o'tt>1

liH 6 .1'2L 'o ~.-. •!•



:,.., : .

Figura

34 .·

.\1L· Ei':-: -'~·.·)=·:

...

·:.

.Ór

. '

-:· · ··:·:··:~:e:~--,::·.:···:',.·:·:=

...:.:.. .:

3.3

Diagrama de tallo y hojas revisado de colegiaturas de residentes fuera del estado en 60 colegios y universidades de Texas usando más tallos. Fuente: Figura 3.2.

Organlzaclón de datos numéricos: la clasificación ordenada y el diagrama de tallo y hojas

5

Observe que cada tallo de la: fig. 3.2 ha sido dividido en dos nuevos tallos: uno para los dígitos O, 1, 2, 3 6 4..de la unidad inferior, y otro para los dígitos 5, 6, 7, 8 ó 9 de la unidad superior. Éstos.están representados por L y JI respectivamente, .como se indica en las listas de tallos de la fig. 3.3. Sin embargo, algunos investigadores han argumentado que los datos mostra- dos en la figura 3.3 no están resumidos. Esto es; no logramos captar la forma en que los datos se aglutinan realmente dentro de varios agrupamientos. Así pues, en vez de ampliar el diagrama, como en la figura 3.3, tal vez deseemos condensar los datos, como en la figura 3.4.

·;.:f;

i

·:!·:

~~

;~

1~

* ·Í~ ·:~::~ ~f

::~·.:. · .t~·

:·.•"

:~f.~· ;-)~

s:

.: ~~ .~

· ~f I

r

Figura 3.4

Diagr.ima de tallo y hojas revisado de colegiaturas de residentes fuera del estado en 60 colegios y universidades de Texas después de condensar tallos, Fuente: Figura 3.2.

:·?;. -~:

·..:.. '. .~~

·.t;·

.:1:'4. ·:.~:·

.:j

í '~

i

Observe que las parejas consecutivas de tallos de la figura 3.2 forman el con- junto reducido de tallos de la figura 3.4 y las bojas correspondientes al miembro superior dé cada pareja están en negritas. El diagrama de tallo y hojas (revisado) es, tal vez, Ja técnica más versátil de la estadística descriptiva. Organiza simultáneamente los datos para posteriores análi- sis descríptívos (como veremos en el capítulo 4) y prepara los datos tanto para forma tabular como de diagrama.

Problemas

de

la

sección

Dado el siguiente diagrama de talloy9 714 10 82230 11

561776735 12 394282 13

20

3.2

·: ¡

,] •/

·.~

3.2

" O 3.1 hoias:

~; · ;~

(a) Vuelva a arreglar las hojas y forme el diagrama de tallo y hojas revisado. (b) Disponga los datos en una clasificación ordenada. . (e) ¿Cuál de estos dos mecanismos parece dar más información? Analice. · Después de examinar los registros de facturación mensuales de una compañía de libros por correo, el auditor toma una muestra de 20 de sus cuentas pagadas. Las cantidades adeudadas a la compañía fueron $4,

$18,

$11,

$7,

$7,

$10,

$5,

$33,

$9,

S12

$3,

$11,

$10,

$6;

$26,

$37,

$15,

$18,

$10,

$21

no:

'i

~1

1

3.3

sa

Cap~ulo

3

(a} Desarrolle la clasíñcacíón ordenada. (b) Forme el diagrama de tallo y hojas. Los siguientes datos representan la tasa de flujo máxima (en galones por minuto) de una muestra aleatoria de 34 regaderas probadas a 80 libras por pulgada cuadrada de presión:

Presentación de datos numéricos en cabras y diagramas

-r:

Marca y modelo

~. I .'

, <

1 i' 1

t!!;"¡.~



:~l

·1

'Iasade flujo máxímo

·'. · ~~· .

(en 80lb/pulg2) 2.9 2.8 2.0

Sears Energy-SavingShower Head 20170 Thermo Saver DynaJet CFOl Resources Conservatíon The Incredíble Head ES-181 Zín-Plas Brass Showerhead 14-9601-F Zin-PlasWater Plncher.14-9550 Whedon Saver Shower SS2C Great Víbratíons Water Saver Massage·B28400 · ·-American Standard Shower Head Chrome 10509.QOZOA TeledyneWater Pik Shower Massage 5 SM-2U. Chatham Solid Brass Shower Head 44-3S. · TeledyneWater Pik Shower Massage 8 SM-4 Melard Wa,tei-saving Adjustable 3610 Pollenex Dial Massage DMlSO Nova B6402 Speakman Anystream _52253-J\F Kohler City Club Z-7351 NY-Del 550-11 Ondíne Water Saver'28446· Kohler Trend 11740 Alsons Somerset 673 Speakman CosmopolitanS2270-AF Poílenex Dial Massage DM109· Alsons Alspray Massagé Action 690C · Moen Pulsation 3935 Sears Personal Hand Shower 20173 Teledyne Water Pik Shower Massage 5 SM-3U Alsons Hand Shower 462PB Alsons Massage Action Pulsatíng 4SC Moen Pulsation 3981 : Teledyne Water Plk Super Saver SS-3 Pollenex Dial Massage DM209 Pollenex Dial Massage/Steamy Mist DM230 Pryde Splash 2461 TeledyneWater Pik Shówer Massage 8 SM-5

3.6 2.7 2.5 ·2.6 2.9

2.7

2.8 2.5 2.8 2.2 2.5 2.5

2.8

1.8 2.7 2.7

4.7 2.8 Z.7 3.1 2.9

3.4

2.6 2.6

2.7

2.4 2.5 5.4 4.9

2.8 2.5

Fuente: Copyrtght 1990 por Consumers unten of Unlted States, Inc., Yonkers, N. Y.

1070¡\. Adaptado fon permiso de Cansumer Rtpolts, julio 1990, pp. 472-473.

3.4

(a) Desarrolle la dasificaci6n ordenada. (b) Forme el diagrama de tallo y hojas. Los siguientes datos representan el precio al menudeo de una muestra de 39 diferentesmarcas de accesoriosde baño:

so

79 65 25

so

50 20 22

50

22 14 60

28 20 25 30

65

35

Z4

12

40 24 48 30

50 25 15 10

zz

120 10

12

32 35

17 20

30

35

so

Fuente: Copyright 1993 por Consumera Unlon of Unlted State.s, Inc., Yonke.rs, N. Y. 10703-. Adaptado con permiso de Consuma Reports, enero 1993, pp. 3.4-35.

:~~:: ·.·. •:t~ .. ·.·.

~

l.. .

(a) Desarrolle la clasificación ordenada. (b) Forme el diagrama de tallo y hojas.

Organización de datos numéricos: la clasificación .ordenada y el diagrama de tallo y hojas



3.5

Los siguientes datos son los valores en libros (el capital contable dividido entre el número de acciones pendientes) de una muestra aleatoria de so acciones de la bolsa 'de valores .de Nueva York: . . .. ':: ·· . . . . .. . . , 7

8 10 10 7

3.6

9 5

6 8 8

8

14

16 8 15

6 8 5

10

2.3

12 7

10

18

13

6 6

10

8

10

12

9

9

lS

7

8. 10.

8

11 9

9 11

15

16 4 7

9

13

7

10

(a) Desarrolle Ja clasificación ordenada, (b)° Forme el diagrama de tallo y bojas: Un médico entrevistado en un programa de televisión nocturno conjetura que "el cáncer parece ser más frecuente en estados con grandes poblaciones urbanas y en estados ele la parte este de Estados Unidos". Los siguientes datos representan la tasa de incidencia de cáncer (incidencia reportada para una población de 100 000) en los 50 estados durante un afio reciente: ·

Incidencia de cáncer en una población de 100,000

Estado

433 442

Alabarna Alas ka Atizona Arkansas California Colorado Connecticut Delaware florida

360

383 366 28'2 434 500

367 406 371 307 402 438 377

Georgia

Hawali Idaho Illinols Indiana lowa

Kansas

345

Kentucky

Louísíana Maine Maryland Massachusetts Michigari Minnesota Misslssíppí Missourí

414 422. 391 491 443· 454

366 438 390

Estado

Incldéncía de cáncer en una población de 100,000

Montana Nebraska Nevada New Harnpshíre NewJersey New Mexlco NewYork North Carolina North Dakota Ohío Oklahoma Oregon Pennsylvanía Rhode Island South Carolina South Dakota

3n. 336 422 403

Texas Utah Vermont Virginia Washington West Virginia Wisconsln Wyoming

313

Tennessee

464

375 329 355·

408 463

326

396 442

445 418 348 408 229

376

440

364 409 398

2.38

Fuents: National Cancer !nstitute.

3.7

60.

3

C.apitutc

(a) Desarrolle Ja clasificación ordenada. {b) Forme el diagrama de tallo y hojas. Los siguientes datos representan el tipo (cremosa frente a espesa), calificación (O"" mala, 100 =excelente), costo (en centavos) y cantidad de sodio (en mg) de una muestra de 37 marcas de mantequilla de cacahuate:

Presentación de datos numéricos en tablas y diagramas

¡ Producto Jlf

Smucker's Natural Deaf Smith Arrowhead Mills Adams 100% Natural Adarns Skippy Laura Scudder's Ali Natural

Kroger

Country Pure Brand (Safeway) NuMade (Safeway) Peter Pan Peter Pan A&l'

1

1

.ff·

Hollywood Natural FoodClub Pathmark Lady Lee (Lucky Stores) Albertsons Shur Fine (Shurfíne Central Corp.) Smucker's Natural Jif Skippy Adams 100% Natural Deaf Smi.th AtrowheadMilis Country Pure Brand (Safeway) Laura Scudder's All Natural Smucker's Natural FoodClub Kroger A&P Peter Pan NuMade (Safeway) Health Valley 100% Natural Lady Lee (Lucky Stores) Albertsons Pathmark Shur Fine (Shurfine Central Corp.)

Costo (e)

Sodio (mg)

68

22

220

65 62 56 56 56

27 32

Tipo

Calificación

Cremosa .Crernosa Cremosa Cremosa Cremosa Cremosa Cremosa Cremosa· Cremosa Cremosa Cremosa Cremosa Cremosa Cremosa Cremosa

53

so

168 225 165 240 225

21 20 21 22

45

44 41 40

187

225 3 225 15 225 255 225 225 225 15 162 211

12

40 39 36 30 30 22 80 75 75 62 62

Cremosa

oo

26 26 19 26 .. 14

so

Cremosa Cremosa Cremosa Espesa Espesa Espesa Espesa Espesa Espesa Espesa Espesa Espesa Espesa Espesa Espesa Espesa Espesa Espesa Espesa Espesa Espesa

lS

32 17 9

16 17 16 27 23 21

o

26

32

62

º·

195 165 188 195 255 225 180 208 ·3 225 225 210 195

21

24

56 53 52 50 47

26

17

14 11

47

22 21

42

42

34 16 17 9 16

40 36 34

34

Fuente: Copyright 1990 por Consumers Un!on of Unlted States, Inc., Yonkers, N.Y. 10703. Adaptado con permísode ConsumerReports, Septiembre de 1990. p. 590. Para cada una de las tres variables (calificación, costo y sodio) (a) Desarrolle la clasificación ordenada. (b) Forme el dlagrama de tallo y hojas. 3.8 Los siguientes datos representan la cantidad de tiempo {en segundos) para · llegar de O a 60 mph durante una prueba de caminos para una muestra de 22 modelos de automóviles alemanes y una muestra de 30 modelos de automóviles japoneses:

Automóviles japoneses

Automóviles alemanes 10.0 6.4 8.5

s.s

s.i 10.9

7.9 6.9

6.4

6.0 4.9 8.9

7.1

8.7 7.5 S.4 8.5

S.6 S.3 6.7 6.9 8.8

9.4 8.9

6.7 7.2

8.5 9.,S

7.7 9.3 9.1 6.8 7.1 10.S

5.7 8.3 9.5 8.0 6.5 12.5

8.2 9.7 11.7 6.3 12.0 6.2

9.3

8.6 10.0 8.8 9.2 6.6

/:ue11te: Datos extraídos de Road Q¡ Track, octubre de 1990, vol. 42, núrn. 2, pág. 4i.

Organización de dalos numéricos: la dasiñcación

ordenada

y el diagrama de tallo y. hojas

3.9

(a) Desarrolle la clasificación ordenada. (b) Forme el diagrama de tallo y hojas. Los siguientes datos corresponden al costo por onza (en centavos) de muestras aleatorias de 31 champús convencionales etiquetados para cabello "normal" y 29 champús convencionales etiquetados para cabello "delgado":

Cabello fino

Cabello normal

79 49

23 13

28 47 9

63

20 14 16 18

so

19 16 239 32 8

9

ss

87 20 81

13

37 69 44 64

85 21

69

9 32

19 85 23 14

63 44

12

so

20

23

12

49 87

65 28

22

18. 37 17 Sl 8

8

74 SS

11

35

Fuente; Copyright 1992 por Consumen Union of United States, !ne., Yonkers, N. Y. 10703. Adaptado con permiso de Consumet Reports, junio de 1992, pp. 400·401. (a) Desarrolle la clasificación ordenada para cada serie de datos. (b) Forme el diagrama de tallo y hojas para cada serie de datos.

Dj

Tabulación de datos numéricos: La distribución de frecuencia

Usando ya sea los datos sin procesar, la clasificación ordenada o el diagrama de tallo y hojas revisado de las colegiaturas de residentes fuera del estado de 60 cole- ~ gios y universidades de Texas (véanse Las tablas 3.1 y 3.2 de la página SS y de la figura 3.1 de la página 56), el analista ínvestígador desea construir las tablas y diagramas apropiados que amplíen el informe que está preparando para el gerente de mercadotecnia de la compañía de servicios de asesoría colegial. Sin importar si se selecciona una clasificación ordenada o un diagrama de tallo y hojas para organizar los datos, al crecer el número de observaciones se hace necesario condensar aún más los datos en tablas de resumen apropiadas. Así pues, tal vez deseemos acomodar los datos en agrupamientos de clase (por ejemplo, categorías) de acuerdo con divisiones establecidas convenientemente del alcance de las observaciones. Tal acomodo de los datos en forma tabular se denomina una distribución de frecuencia. Una distribución de frecuencia es una tabla de resumen en la que los datos se disponen en agrupamientos o categorías convenientemente establecidas de clases ordenadas numéricamente. Cuando las observaciones se agrupan o condensan en tablas de distribución de frecuencia, el proceso del análisis e interpretación de los datos se hace mucho más manejable y significativo. En esta forma resumida las características más importantes de los datos se aproximan muy fácilmente, compensando ast el hecho de que cuando los datos se agrupan de ese modo, la información inicial referente a las observaciones individuales de que antes se disponía se pierde a través del proceso de agrupamiento o condensación.

62

Capítulo 3

Presentación de datos numéricos en tablas y diagramas

Al construir la tabla debe ponerse atención . a . . . . . . . de frecuencía-dístríbucíón, . ~ l. Seleccionar el número apropiado de agrupamientos de clase para la

tabla.

2. Obtener un intervalo o ancho de clase de cada agrupamiento de clase. · · 3. Establecer los límites de cada agrupamiento de clase para evitar los traslapes.

3. 3. •

Selección del número de clases

El número de agrupamientos de clase por utili~ar depende princlpalmente del número de observaciones en los datos. Estoes, un núniero mayor de observaciones requiere un número mayor de grupos· 'de clase. En. general, sin embargo, la dístribución de frecuencia debe tener al menos cinco agrupamientos de clase, pero no más de 15. Si no hay suficientes agrupamientos de clase o si hay demasiados, se obtendrá poca información. Como ejemplo, una distribución de frecuencia que sólo tiene un agrupamiento de clase que abarca todo el alcance de colegiaturas se podría formar de la siguiente manera: . . Colegiaturas (en $000)

Número de escuelas

2.0-13.0 Total

60. 60

Sin embargo, de esta tabla de resumen no se obtiene información adicional que no se conociera ya al examinados datos sin procesar o la clasificación ordenada. Una tabla con demasiada concentración de datos .no es significativa. Lo mismo seria cierto en el otro extremo, si una tabla tuviera demasiados agrupamientos de clase, habría una subconcentración de datos! ~se sabría muy poco.

3. 3.2. Obtención de los intervalos de clase Al desarrollar la tabla de distribucíón de frecuencia es deseable que el ancho de cada agrupamiento de clase sea igual. Para determinar el ancho de cada clase, el alcance de los datos se divide entre el número de agrupamientos de clase deseado:

L.:'.•.· .

t

.

....

Puesto que sólo hay 60 observaciones en nuestros datos de colegiaturas, decidimos que seis agrupamientos de clase serán suficientes. De la Clasificación orde-

r· :

J....

nada de la tabla 3.2 (página 55), el alcance se calcula como 12.0- 2.4 = 9.6 miles de dólares y, usando la ecuación (3.1), el ancho del intervalo de clase se aproxima mediante

~ ·.

t.=·•.

~:.: :,: .

Ancho de intervalo

::

9·6 6

= 1.6 miles

de dólares

Por conveniencia y facilidad de lectura, el intervalo seleccionado o ancho de cada

agrupamiento de clase se redondea a 2.0 miles de dólares .

.

:.-:·..

·64

Capitulo 3

Tabolación de datos numéricos: la distribución de frecuencia Presentación de datos numéricos en tablas y diagramas

3. 3. 3 Establecimiento de los límites de las clases Para construir la tabla de distribución de frecuencia, es necesario establecer claramente límites de clase definidos para cada agrupamiento de clase de manera que las observaciones, ya sea en formasin procesar o en una clasificación ordenada, se registren apropiadamente. Debe evitarse el traslape de clases. Puesto que el ancho de cada intervalo de clase para los datos de colegiatura se estableció en 2.0 dólares, los límites de los diversos agrupamíentos de clase deben establecerse de manera que incluyan todo el alcance de observaciones. Siempre que sea posible, estos límites deben elegirse para que faciliten la lectura e interpretación de los datos. De esta forma, el primer intervalo de clase establece desde 2.0 hasta abajo de 4.0, el segundo de 4.0 a abajo de 6.0, etc. Los datos sin procesar (tabla 3.1) o de la clasificación ordenada (tabla 3.2) se registran entonces encada clase según se muestra:

se

Colegiaturas (en $000) 6.0 pero menor que 8.0 que 10.0 8.0 pero

menor

Registros

2.0 pero menor que 4.0 pero menor que

4.0 6.0

10.0 pero menor que 12.0 12.0 pero menor que 14.0 Total ·

Frecuencia

HH#ff/11 l+I+ H+f. ¡..¡..¡.¡. ¡.¡.¡.¡. /111 HHl/11

#1+1!1

13 24 9

8

s

l+I+ /

1

60

Estableciendo los límites de cada clase de esta manera, las 60 observaciones se han registrado en seis clases; cada una con un ancho de intervalo de 2.0 miles de dólares, sin traslape. De esta "hoja de trabajo" La distribución de frecuencia se presenta en la tabla 3.3. Tabla

3.3

Distribución de frecuencia de colegiaturas. de 60 escuelas de Texas.

·Número de escuelas

Colegiaturas (en $000) 2.0 pero menor 4.0 pero menor 6:0 pero menor 8.0 pero menor 10.0 pero menor 12.0 pero menor Total

que que que que que que

4.0 6.0 8.0 10.0 12.0 14.0

13

24 9 8 5 1

60

Fuente: Los datos fueron tomados de la tabla 3.1 de! la página 55.

La principal ventaja de usar una de estas tablas de resumen es que las principales características de los datos se hacen evidentes inmediatamente para el lector. Por ejemplo, de la tabla 3.3 vemos que el alcance aproximado de las 60 colegiaturas va de 2.0 a 14.0 miles de dólares, en la enseñanza fuera del estado, en la mayoría de las escuelas de Texas tendiendo a agruparse entre 4.0 y 6.0 miles de dólares.

Otras mediciones descriptivas que se obtienen de los datos agrupados se presentarán en la sección 4.9. Por otra parte, la principal desventaja de tal tabla de resumen es que no podemos saber cómo se distribuyen los valores individuales dentro de un intervalo de.clase particular sin tener acceso a los datos originales. Por lo tanto, para las cinco escuelas con colegiaturas para residentes fuera del estado de entre 10.0 y 12.0 miles de dólares, no resülta claro de la tabla 3.3 si los valores se distribuyen a lo largo de todo el intervalo, si están cerca los 10.0 miles de miles de dólares o si están cerca de los 12.0 mil dólares. El punto medio de la clase, sin embargo, es el valor usado para representar todos los datos resumidos en intervalo particular. El punto medio de una clase (o marca de clase} es el punto a la mitad de los limites de cada clase y es representativo de los datos de esa clase.

de

un

El punto medio de la clase para el intervalo "2.0 pero menor que 4:0" es 3.0 miles de dólares. (Los otros punto medios son, respectivamente, 5.0, 7.0, 9.0, 11.0 y 13.0 miles de dólares). ·

3.3.4

Subjetividad en la selección de límites de clase

La selección de límites de clase para tablas de distribución de frecuencia es altamente subjetiva. De esta forma, para series de datos que no contienen muchas observaciones, la opción de un conjunto particular-de límites de ciase sobre otro puede producir una imagen completamente distinta para el lector. Por ejemplo, para los datos de colegiaturas, si se usa un ancho de intervalo de clase de 2.5 miles de dólares en vez de 2.0 (como se usó en la tabla 3.3) se pueden ocasionar cambios en la forma en que se distribuyen las observaciones entre las clases. Esto es particularmente cierto si el número de observaciones en la serie no es muy grande . .Sin embargo, tales cambios en la concentración de datos no ocurren sólo porque el ancho del intervalo de clase se altere. Podemos mantener el ancho del intervalo en 2.0 miles de dólares pero elegir distintos límites de clase inferiores y superiores. Tal manipulación también puede ocasionar cambios en la forma en que los datos se distribuyen, especialmente si el tamaño de la. serie no es muy grande. Afortunadamente, al incrementarse el número de observaciones en una serie, las alteraciones en la selección de los límites de clase afectan la concentración de los datos cada vez menos.

Problemas de la sección 3.3 3.10

3.11

Una muestra aleatoria de SO vicepresidentes ejecutivos se seleccionó de entre las diversas compañías de relaciones públicas de Estados Unidos, y se obtuvieron los sueldos anuales de los funcionarios de estas compañías. Los sueldos variarán de $52,000 a $137,000. Establezca los límites de clase para una distribución de frecuencia (a) si se desean 5 intervalos de clase. (b) si se desean 6 intervalos de clase. (e} si se desean 7 intervalos de clase. (d) si se desean 8 intervalos de clase. Si el precio inicial de apartamentos en cooperativa y en condominio de una recámara en Queens, un barrio de Nueva York, varía entre $103,000 y $295,000 {a) indique los límites de clase de 10 clases en las que estos valores pueden agruparse. (b) ¿Qué ancho de intervalo de clase elígíó? (e) ¿Cuáles son los 10 puntos medios de clase?

Tabulación

Capítulo 3

de datos numéricos; La distribución

Presentación de datos numéricos en tablas '/ diagramas

de frecuencia

e

3.12

Los datos sin procesar mostrados a continuación son los cobros por electricidad y gas.durante el mes de julio de 1993 para una muestra aleatoria de 50 apartamentos de tres recámaras en Manbattan: . ....

Datos sin-procesa¡ de cobros de servidos püoücos ($) 96

157 141

171

202·.

119

90 206 150 183

185 149 163

95 108

178 116 175 154 151

147 172 123 130 114

153 . .. 197

102

148 144

.111

128

187 ·191

143

135

213 168 166

127 130 109 139

•.' ·'137

129.

·.

82 165 167

149

158

(a) Forme una distribución de frecuencia (1) con 5 intervalos de clase. (2} con 6 Intervalos de clase. (3) con 7 intervalos de clase. [Sugerendq: Como ayuda para decidir cómo establecer mejor los límites de clase, primero debe disponer los datos sin procesar en un diagrama de tallo y hojas (haciendo que las hojas sean los dígitos rastreros) o en una clasificación ordenada.] (b) Forme una distribución de frecuencia con siete Intervalos de clase con los siguientes limites de ciase: $80 pero menos de SlOO, $100 pero menos de Sl20, etcétera. 3.13

e

3.14

Construya una distribución de frecuencia de los datos de las regaderas del problema 3.3 de las páginas 58-59. Construya una distribución de frecuencia de los datos de valores en libros del problema 3.5 de la página 60.

3.15

cáncer Construya del problema una distribución 3.6 de la depágína frecuencia 60. de los datos· de la incidencia de

3.16

Construya distribuciones de frecuencia separadas para cada una de las tres variables numéricas (caliñcacíón, costo y sodio) de los datos de la mantequilla de cacahuate del problema 3.7 de las páginas 60-61. Construya d.lstribuciones de frecuencia separadas para los tiempos de aceleración de los automóviles alemanes frente a los japoneses del problema 3.8 de la página 61. Dadas las clasificaciones ordenadas de la síguíente tabla que tiene que ver con la duración (en horas) de una muestra de cuarenta focos de 100 watts producidos por el fabricante A y una muestra de cuarenta focos de 100 watts elaborados por el fabricante B:

3.17

3.18

Clasificac.iones ordenadas de la. duración de dos marcas de focos de lOO·wa:tts (e1:1 horas) Fabricante A

684 831

720

773

848 868

852

852

859

697 835 860

870

893

899

905

909

876 911

922

924 943

926

926

938

946

971

972

977

984

954 1005

1016

1041

1052

1080

939

.821

1014 1093

"

. 819 907

952

836 912 959 1004

888 918

B 897

942 ..

962

986

1018

1005 1020

1007 1022

1038

1072

1077

1077

1096

1100 1154

1113

1113 1188

994 1016

1153

1174

903 943 992 1015 1034 108~ 1116 1230

(a) Forme Ja distribución de frecuencia para cada marca. (Sugerencia: para propósitos de comparación, elija anchos de intervalos de clase de SlOO para cada distribuclón.) (b) Con el fin de responder los problemas 3.2.5, 3.32 y 3.40, forme la distribución de frecuencia para cada marca de acuerdo con el siguiente esquema [si no lo ha hecho ya en la parte (a) de este problema): Fabricante A: 650 pero menos que 750, 750 pero menos que 850, etcétera · Fabricante B: 750 pero menos que ~SO, 850 pero menos que 950, etcétera.



i

Fabricante

..

\

1·11 /:

..

Tabulación de datos numéricos: la distribución de frecuencia relativa distribución del porcentaje

y

La distribución de frecuencia es una tabla de resumen en la que los datos originales se condensan o agrupan para facilitar el análisis de datos. Sin embargo, para ampliar el análisis, casi siempre es deseable formar la distribución de frecuencia relativa o la distribución de porcentaje, dependiendo de si preferimos proporciones o porcentajes. Estas dos dístríbucíones equivalentes se muestran en las tabla 3.4 y 3.5, respectivamente,

Tabla 3.4

Distribución de frecuencia relativa de colegiaturas a residentes fuera de! estado en 60 escuelas de Texas.

Colegiaturas (en $000) 2.0 pero menos 4.0 pero menos 6.0 pero menos 8.0 pero menos lü.üpero menos 12.0 pero menos Total

que 4.0 que 6.0 que 8.0 que 10.0 que 12.0 que 14.0

Proporción de escuelas .217 .400 .150 .133 .083

.017 1.000

Fuente: Los datos fueron tomados de la.tabla 3.3 de la página 64.

Tabu!adón dt:
Capítulo 3

Presentación de datos numéricos en tablas y diagramas

Tabla 3.5

Distribución de porcentaje de colegiaturas a residentes fuera del estado en 60 escuelas de Texas.

Colegiaturas (en $000) 2.0 pero menor 4.0 pero menor 6.0 pero menor 8.0 pero menor 10.0 peromenor 12.0 pero menor

Total

que que que que que que

Porcentaje de

escuelas

4.0 6.0· 8.0

10.0 12.0 14.0

21.7 40.0 15.0 13.3 8.3 1.7

100.0

Fuente: Losdatos fueron tomados ele la tabla 3.3 de la páglna 64.

La distl'ibución .de frecuencia relativa descrita en la tabla 3.4 de la página 67 se forma dividiendo las frecuencias de cada clase de distribución de frecuencia (tabla 3.3 en la página 64) entre el número total de observaciones. Entonces puede formarse una distribución de porcentaje (tabla 3.5) multiplicando cada frecuenda relativa o proporción entre 100.0. Por lo tanto, de la tabla 3.4 resulta claro que la proporción de escuelas en Texas con colegiaturas de residentes fuera del estado de 12.0 pero menos que 14.0 miles de dólares es .017, mientras que en la tabla 3.5 se ve que 1.7% de las escuelas tiene tales colegiaturas. Generalmente es más significativo trabajar con una base de 1 para. proporciones o de 100.0 para porcentajes que usar las frecuencias mismas. De hecho, el uso de la distribución de frecuencia relativa o de la distribución de porcentaje Sf vuelve esencial siempre que una serie de datos se compara con otras series de datos, especíalmente si difiere el número de observaciones en cada serie de datos. Como ejemplo, supongamos que un psicólogo industrial deseaba comparar el ausentismo diario entre los empleados de oficina de dos tiendas departamentales. Si, en un día dado, seis empleados de SO de la tienda A se ausentan y tres empleados de 10 de la tienda B se ausentan, ¿qué conclusiones podemos sacar? Es inapropiado decir que ocurrió mcís ausentismo en la tienda A. Aunque hemos observado que en la tienda A hubo el doble de ausencias.que en la tienda B, también había cinco veces más empleados que en Ja tienda A. Por lo tanto, en estos tipos de comparaciones, debemos formular nuestras conclusiones a partir de los cocientes relativos de ausentísmo, no de los conteos reales. Así pues, puede establecerse que el cociente de ausentísmo es dos veces y media mayor en la tienda B (30.0%) que en la tienda A (12.00A>). . Ahora suponga, al desarrollar su informe para el gerente de mercadeo de la compañía de servicios de consultoría colegial, que el analista investigador deseaba comparar las colegiaturas de residentes fuera del estado de· las 60 escuelas de Texas con las reportadas de 45 instituciones de educación superior del estado de Carolina del Norte. La tabla 3.6 muestra ínformacíón sobre la colegiatura de residentes fuera del estado por cada uno de los 45 colegios y universidades de Carolina del Norte (véase el Conjunto de datos especiales l del apéndice P de la página D3). Para comparar las colegiaturas de las 60 Instituciones de Texas con las de las 4.5 escuelas de Carolina del Norte, desarrollamos una distribución de porcentaje para este último grupo. Esta nueva tabla se comparará entonces con la tabla 3.5.

Tabla 3.6 6.S 6.4 9.7 7.9 7.9

Datos sin procesar referentes a colegiaturas (en $000) para residentes fuera del estado en 45 colegios y universidades de Carolina del Norte. 7.1 8.S 7.0 8.2 7.4

4.0

s.o 4.4 6.0 6.4

8.3 5.7 6.3 10.4 7.0

S.4 7.7 8.3 9.9

13.o·

7.6 7.2 6.9 3.9 8;7

9.0 12.4 5.7 9.8 6.4

15.7 7.1 7.6

8.2 6.7

16.7 5.5 7.9 5.6 7.4

Fuer.iu: Véase Conjunto de datos especiales 1, apéndice D, página D3, tomado de "Ameríca's Best Colleges, 1994 CollegeGuíde", U.S. News & World Report, resumido de College Counse\ 1993 de Natlck, Mass. Reimpresión con permiso especial, U.S. News & W.orld Repo.rt, O 1993 por U.S. News & World R~rt

y poi; College Counsel.

La tabla 3.7 describe tanto la distribución de frecuencia como la distribución de porcentaje de las colegiaturas cobradas a residentes fuera del estado por las 45 escuelas de Carolina del Norte. Esta tabla se ha construido en lugar de Ias dos tablas separadas para ahorrar espacio. Observe que los agrupamientos de clase seleccionados en la tabla 3. 7 concuerdan, donde es posible, con aquellos seleccionados en la tabla 3.3 para las escuelas de Texas. Los límites de las clases deberían concordar o ser múltiplos entre sí con el fin de facilitar las comparaciones. Tabla 3.1

Distribución de frecuencia y distribución de porcentaje de las colegiaturas para residentes fuera del estado en 45 escuelas de Carolina del Norte.

Colegiaturas

Número de

escuelas

(en $000)

2.0 pero menor 4.0 pero menor 6.0 pero menor 8.0 pero menor 10.0 pero menor 12.0 pero menor 14.0 pero menor 16.0 pero menor Total

que que que que que que que que

4:0

6.0 8.0 10.0 12.0 14.0 16.0 18.0

1

8 21 10 1 2

1 1 45

Porcentaje de escuelas 2.2 17.8 46.7 22.Z .2.2 4.4 2.2 2.2 99.9*

• Error debido a redondeo. Fuente: Losdatos fueron tomados de la tabla 3.6.

Usando las distribuciones de porcentaje de las tablas 3.5 y 3.7, ahora resulta stgníñcatívo comparar las escuelas de los dos estados en térmínos de las colegiaturas cobradas a residentes fuera del estado. De las dos tablas resulta evidente que las colegiaturas generalmente son menores en Texas. que en Carolina del Norte. Por ejemplo, en Texas las colegiaturas por lo general se agrupan entre 4.0 y 6.0 miles de dólares (es decir, 40.0% de las escuelas), mientras que en Carolína del Norte las colegiaturas por lo general se agrupan entre 6.0 y 8.0 miles de dólares (es decir, 46.7% de las escuelas). Además, podemos observar que los alcances en las colegiaturas pueden aproximarse fácilmente a partir de las tablas. En Carolina del Norte, el alcance en las colegiaturas es aproximadamente 16.0 miles de dólares (es decir, la diferencia entre 18.0, él limite superior de la última clase, y 2.0, el límite inferior de la primera clase), mientras que en Texas el alcance es aproximadamente 12.0 miles de dólares (es decir, 14.0 - 2.0). En el capítulo 4 se analizarán otras mediciones de resumen que ampliaránun análisis comparativo de las colegiaturas entre los dos estados.

Tabulación de datos numéricos: la distribución de frecuencia relativa y distribución del porcentaje 70

Capitulo

3

Presentación da datos numéricos en tablas y díagramas

Problemasde la sección .3.4 o

3.19

3.20

e

3.2! 3.22.

3.23

3.24 3.25

ID

Forme la distribución de porcentaje desarrollada en el problema 3.12(b) servicios públicos. Forme la distribución de porcentaje desarrollada en el problema 3.13 de

de la distribución de frecuencia de la página ó6 respecto a los cobros de de la distribución de frecuencia la página 66 respecto a las regaderas.

Pormela dístrfbucíón de porcentaje de la distribución-de frecuencia desarrollada eh el problema 3.14 de la página 66 respecto a los valores en libros de compañías enumeradas en el NYSE.. Forme la distribución de porcentaje de la distribución de frecuencia desarrollada en el problema 3.15 de la página 66 respecto a la Incídencía de cáncer. Forme las dtstrtbudones de porcentaje correspondiente a las distribuciones de frecuencia para cada una de las tres variables numéricas (calificación, costo y sodio) desarrolladas en el problema 3.16 de la página 66 respecto a las características de Ja mantequilla de cacahuate. Forme las distribuciones de porcentaje de las distribuciones de frecuencia desarrolladas en el problema 3.17 de la página 66 respecto a los tiempos de aceleración de los automóviles alemanes y japoneses. Forme las distribuciones de porcentaje de las distribuciones de frecuencia desarrolladas en el problema 3.18 de la página 66 respecto a la duración de los focos fabricados por las dos compañías competidoras A y B.

Graficación

de datos numéricos:

el histograma

y

e·1 polígono ·

A menudo se dice que "una imagen vale más que mil palabras". De hecho, les estadísticos han empleado las técnicas gráficas para describir de manera más vívida series de datos. En particular, los histogramas y los polígonos se usan para describir datos numéricos que han sido agrupados en distribuciones de frecuencia, de frecuencia relativa o . de porcentaje.

3.5.1

Histogramas

Los histogramas son diagramas de barras verticales en los que se construyen barras rectangulares en los límites de cada clase. Al graficar histogramas, la variable aleatoria o fenómeno de interés se despliega a lo largo del eje horizontal; el' eje vertical representa el número, proporción o porcentaje de observaciones por intervalo de clase; dependiendo de si el histograma particular es, respectivamente, un histograma de frecuencia, un histograma de frecuencia relativa o un histograma de porcentaje. · ·

-E-->

Tipo de diagrama

Número de observaciones Porporcíón de observaciones

<

Porcentaje
~>

Histograma o polígono de frecuencia Histograma o polígono de frecuencia relativa Histograma o polígono de porcentaje

Etiqueta del eje vertical

<

;;..

~

Figura 3.5

Histograma de porcentaje de colegiaturas de residentes fuera del estado en 60 escuelas de Texas. Fuente: Los datos fueron tomados de la tabla 3.5.

,

,

( . .

f. tf.f. ~:

Un histograma de frecuencia se describe

en la figura 3.5 para las colede

glaturas a residentes fuera del estado en los 60 colegios y universidades Texas.

Es.ínteresante observar la estrecha relación visual retratada por el diagrama de tallo y hojas y el histograma. Observe la figura 3.4 de la página 58 y nuestro histograma de la figura 3.5. Si tuviéramos que rotar el diagrama de tallo y hojas 90º (es decir, sostener nuestro libro de costado) se descríbíría un histograma de frecuencia de manera tal que sus agrupamientos de clase estarían representados por los tallos y sus barras verticales estarían representadas por las hojas individuales de cada tallo. Al comparar dos o más series de datos, ni los diagramas de tallo y hojas ni los histogramas puede construirse en la misma gráfica. Con respecto a estos últimos, la sobreposición de las barras verticales de uno en el otro ocasionaría dificultades de interpretación. En tales casos es necesario construir polígonos de frecuencia relativa o de porcentaje.

3.5.2

Polígonos

Al ígualque.con

los histogramas, al grañcar polígonos el fenómenode interés se despliega a lo largo del eje horizontal y el eje vertical representa el número, proporción o porcentaje de observaciones por intervalo de clase. El polígono
Debido a que los puntos medios consecutivos son conectados por una serie de

lineas rectas, el polígono algunas veces está dentado en apariencia. Sin embargo,

al ..tr.atar con una serie de datos muy grande, si tuviéramos que crear los límites de las clases en su distribución de frecuencia más juntos {incrementando así el _:>;(une:o de clases en esa distribución), las líneas dentadas del polígono se .§uavr.zarían".

Graflcación de datos numéricos: el histograma y el pollgono

::-::· .

... · ....

"!·; .. ··

·~

.

:¡ . ··.· .. i.:: Figura 3.6

Polígono de porcentaje de colaglaturas de residentes fuera del estado en 6~ escuelas de Texas, Puente: Los datos fueron tomados de la tabla 3.5.

9: ·.:·/:·;· .

o . ·o

Q.:.··:: .· ~ .. ... ·~:

:4 . ;·.t.

6 •:'. :. 8 :-. :. 10 ..:::· 12,.: . ;.· ... : .. : ·:· ··.· .. :· . ~.. · .. ·:··

· ·. :·' Colegl?turás (e.~·$000} ·: · · •

·.·

14 ~.: 16 . ··:··(_. ··~ - . . ·. · ..... ·

··:·

Figura 3.7

Polígonos de porcentaje de colegiaturas de residentes fuera del estado en 60 escuelas de Texas y 45 escuelas de Carolina del Norte. Fuente: Los datos fueron tomados de las tablas 3.5 y 3:7.

La figura 3.6 muestra el polígono de porcentaje para. las colegiaturas a residentes fuera del estado de las 60 escuelas de Texasy la figura 3.7 compara los polígonos de porcentaje para las colegiaturas de las 60 escuelas de Texas con las 45 escuelas de Carolina del Norte. Las diferencias en la estructura de las dos dístríbu-

Graflcación de datos numéricos: el histograma y el polígono

72

CapítuJo 3

Presentación de datos numéricos en tablas y diagramas

cíonés, anteriormente mente aquí.

analizada al comparar las fablas 3.S y 3.7, seíndícan clara": :'. .. · · ·, .-.: · ..

;

• Construcción del polígono Observe que el· .Polígono es una representación de la forma de la dístríbuclón partícular, Puestoque eJ área _b¡¡jo la dístnbucíón de porcentaje . (curva entera). debe ser ) 00%, ;, es necesario conectar el primero y el último puntos. con el eje horízontalpara rodearel área de la dístríbución observada. En la figura· 3 .6 esto se hace conectando' el' primer puntó méqío observado con el punto medio de una clase "precedente ficticia" (esto es, 1.0 in.Hes de dólares) teniendo 0.0% observaciones y conectandoel último punto medio observado con el punto medio de una clase "sucesora ficticia" (esto es, 15.0 miles dólares) teniendo o.0% .observacíones. . . <. . . . . . · : :·. · Observe también que cuando se construyen los polígonos (figura 3.6) olos hístogramas (figura 3.5), el eje vertical debe mostrar el verdaderocero u "origen" para no distorsionar o malinterpretar el carácterde los datos. Sin embargo, el eje horizontal no necesita especificar el punto cero para el fenómeno de interés. Por razones estéticas, el alcance de la variable aleatoria debe constituir la principal por-: ción del diagrama y, cuando no se incluye el cero, son apropiadas las "rupturas" en el eje.

de

-v:

Problemas de la .secciÓ!J .3.5 3.26

3.27

3.28

3.29

3.30

3.31

3.32

De la dístríbucíón.de porcentaje desarrollada en el problema 3.19 de la página 70 respecto a los cobros de servicios públtcos {a) grañque el hístograrna de porcentaje: (b) grañque el polígono de porcentaje. De la distribución de porcentaje desarroiláda en el problema 3.20 de la página 70 respecto a las regaderas (a) grañque el histograma de porcentaje. (b) grafique el polígono de porcentaje. De Ja distribución de porcentaje desarrollada en el problema 3.21 de la página 70 respecto a los valores en libros de compañías enumeradas en el NYSE (a) grafique el histograma de porcentaje, {b) grañque el polígono de porcentaje. De la distribución de porcentaje desarrollada en el problema 3.22 de Ja página 70 respecto a la incidencia de cáncer (a) grañque el histograma de porcentaje respectivo. (b) grafique el polígono de porcentaje respectivo. De las distribuciones de potcentaje_desa'rrolladas'en el problema 3.23 de la página 70 para cada una· de las tr_es variables numéricas (calíñcacíón, costo y sodio) respecto a las características de la mantequilla de cacahuate (a) grañque el histograma de porcentaje respectivo. · (b) grafique el polígono de porcentaje respectivo. De las distribuciones de porcentaje desarrolladas en el problema 3.24 de la página 70 para cada una de las tres variables numéricas (calificación, costo y sodio) respecto a los tiempos de aceleración de los automóviles alemanes y japoneses (a) grañque los histogramas de porcentaje en gráficas separadas. {b) grañque los polfgonos de porcentaje en una gráfica. De las dlstribucíones de porcentaje desarrolladas en el problema 3.25 de la página 70 respecto a la duración
11.1

Distribuciones acumulativas y polígonos acumulativos

Los otros dos métodos útiles de representación de datos que facílítan el análisis y la interpretación son las tablas ~e distribución acumulativa y los diagramas de poligonos acumulativos. Éstos 'pueden desarrollarse a partir de la tabla de distribución de frecuencia, de. la. tabla de distribución de frecuencia relativa y de la. tabla de distri~ución de porcentaje. ·

3 .6. 1

la distribución de porcentaje acumulativa

Dependiendo de nuestra preferencia individual por proporciones o porcentajes, al comparar dos o más series de datos de distinto tamaño, seleccionamos ya sea la distribución de frecuencia relativa o la distribución de porcentaje. Puesto que ya tenemos las distribuciones de porcentaje de las colegiaturas a residentes fuera del estado de las 60 escuelas de Texas y de las 45 de Carolina del Norte en las tablas 3.5 y 3.7 (páginas 68 y 69), podemos usar estas tablas para construir las distribuciones de porcentaje acumulativas respectivas. Véanse las tablas 3.8 y 3.9.

Tabla 3.8

Distribución de porcentaje acumulativo de las colegiaturas para residentes fuera del estado en 60 escuelas de Texas.

Colegiaturas (en $000)

Porcentaje de escuelas "menor que" valor indicado

o.o

2.0 4.0 6.0 8.0 10.0 12.0 14.0

21.7 61.7 76.7 90.0 98.3 100.0

Fuente: Los datos fueron tomados de la tabla 3.S.

Tabla 3.9

Distribución de porcentaje acumulativo . de Ias coleglaturas para residentes fuera del estado er\ 45 escuelas de Carolina del Norte.

Colegiaturas (en $000)

Porcentaje de. escuelas "menor que" valor índícado

2.0 4.0. 6.0 8.0 10.0 12.0 14.0 16.0 18.0

o.o

2.2

zo.o

66.7 88.9 91.l 95.6 97.8 100.0

Fuente: Los daros fueron tomados de Ja tabla 3.7.

74

Capítulo 3

Presentación de datos numéricos en tablas y diagramas

"

Una tabla de distribución de porcentaje acumulativo se construye registrando primero los límites inferiores· de cada clase a partir de la .dístríbución de porcentaje y luego insertando un límite extra al final. Calculamos los porcentajes acumulativos en la colurnna'vmenor que" determinando el porcentaje de observaciones menores que de cada uno de los valores de los límites establecidos. Así, en la tabla 3 ..5 vemos que 0.0% de las colegiaturas a residentes fuera .del estado de las instituciones de Texas son inferiores a 2.0 miles de dólares: 2i'7% de las colegiaturas son inferiores a 4.0 miles de dólares. 61.7% de las colegiaturas. son inferiores a 6.0 miles de dólares, y así sucesivamente basta que todas (100.0%) las colegiaturas son inferiores a 14.0 miles de dólares. Este proceso acumulativo se observa fácilmente en la tabla 3.10. · Tabla 3.1 O

Formadón de la distribución de porcentaje acumulativo.

De la tabla 3.5

De la tabla 3.8 Porcentaje de escuelas en intervalo de clase

Colegiaturas (en $000)



2.0 pero menor 4.0 pero menor 6.0 pero menor 8.0 pero menor 10.0 pero menor menor 14.0 pero 12.0 pero menor

.

1

3 .6.2.

¡¡\':

1

~.

,¡;. ~~~· .. rfif.

f\,~f~:. .

~i.· ..

).'.t ~~ :...

f~'.a :· . < .

\'i'¡. .:

~~'..

21.7 40.0 15.0 13.3 o.o 8.3 1.7

Polígono de porcentaje

o.o

21.7 61.7 = 21.7 + 40.0 76] = 21.? + 40.0 + 15.0 90.0"' 40.0 + 15.0 + 13.3 13-3+ 8.3 + 1.7 100.0 = 21.7 21.7 + + 40.0 + 15.0+ 983 = 21.7 + 40.0+15.0+13.3 + 8.3

acumulativo

La figura las colegiaturas a residentes fuera del estado de las 60 escuelas de Texas. La. principal ventaja de la ojiva sobre otros diagramas es la facilidad con que podemos interpolar entre los puntos grañcados.

~s~~· .

a if<":t:

4.0 6.0 8.0 10.0 12.0 16.0 14.0

Para construir un polígono de porcentaje acumulativo (también conocido como ojiva), observamos que el fenómeno de Interés, las colegiaturas, nuevamente se grañca en el eje horizontal, mientras que los porcentajes acumulativos (de la columna "menor que") se grañcan en el eje vertica1.'En cada lírníte inferior, grañcamos el valor de porcentaje (acumulativo) correspondiente del listado de la distribución de porcentaje acumulativo. Entonces conectamos estos puntos con una serie de segmentos de líneas rectas. 3.8 de la página 76 ilustra el polígono de porcentaje acumulativo de

s.:

.

que que que que que que que

Porcentaje de escuelas de limite· ínferíortmenor que" de intervalo de clase

.

e Apro:ximadón de porcentajes Como un ejemplo, el analista investigador de la compañía de servicios de asesoría colegial podría desear aproximar el porcentaje de colegios y universidades que cobran una colegiatura por debajo' de una cantidad especificada, digamos 7 .O miles de dólares. Para hacer esto, se proyecta una línea vertical hacia arriba en 7 .O hasta que interseca la curva "menor que". El porcentaje deseado se aproxima entonces leyendo horizontalmente desde el punto de intersección hasta el porcentaje indicado en el eje vertical. En este caso, aproxírnadamente 69.2% de las escuelas de Texas tienen colegiaturas por debajo de 7.0 miles de dólares. (Esto, claro está, implica que aprcxímadamente 30.8% de las escuelas tienen colegiaturas de al menos 7 .O .rnlles de dólares.) · e Aproximación de valores Aún más importante, al preparar su informe para el gerente de mercadeo de la compañía de servicios de asesoría colegial, el Dlstrtbucicnes acumularívas y polígonos acumulativos

.:::.::.:~>.':··J·.:.-·

..

:.~~: .. ·"·:·.·.~· ••

,,....;:

• : ._~·.:. ...: -, ~4' ':

. .1 .

·I

..

·.·>· .

~·.;::: .,,::,'.·.;·:

:

;s: * -r~r:::.S-;. áj.'.,~~'.+.· . ·. · ,.:~_,,~·.fa€~#;l~5ii,fa._;Ú ~:i."?E ·.··\··;:··

~

· ·;,,'.\?6: ...

Figura 3,8

·. :.~. ~.~·>::-~:;:·!:·

:, -: ·~ j ....: ' \.·

·:·

':•: :.· ·:·· .-::"·····:·

.

.

Polígono de porcentaje acumulativo de colegiaturas d!! residentes fuera del estado en óO escuelas de Texas, Fuente: Los datos fue.ron tomados de Ja tabla 3.8

analista investigador tal. vez desee también aproximar diversas colegiaturas que correspondan a porcentajes acumulativos particulares. Por ejemplo, ¿25% de todas. las escuelas de Texas. tienen colegiaturas por debajo de esa cantidad? Par! determinar esto, se dibuja una línea horizontal desde el punto de porcentaje acumulativo especificado (25.0) hasta que ínterseca la curva "menor que,". La colegiatura deseada se aproxima entonces bajando una perpendicular (una línea. vertical) en el punto de intersección hacia el eje horizontal. De. la figura 3.8, observamos que esta colegiatura es aproximadamente 4.2 miles de dólares. Otros puntos de porcentaje comúrunente considerados para tal análisis (véase el capítulo 4) son el valor de 50.0% y el de 75.0%.

• Comparación de dos o más distribuciones acumulativas Aproximaciones como éstas son extremadamente útiles al comparar dos más· series de datos. La figura 3.9 de la página 77 describe los polígonos de porcentaje acumulativo de las colegiaturas a residentes fuera del estado tanto para las 6.0 escuelas de Texas como para las 1:5 de Carolína del Norte . . De la figura 3.9 observamos que en general la· ojiva de Texas se traza a la izquierda de la ojiva de Carolina del Norte .. Por ejemplo, en Texas 25% de todas las colegiaturas son inferiores a 4.3 miles de dólares, mientras que en Carolina del Norte vemos que 25% de todas las colegiaturas son inferiores a 6.1 miles de dólares. Además, en Texas 50% de todas las colegiaturas son inferiores a 5.4 miles de dólares, mientras que en Carolina del Norte SO% de todas las colegiaturas son inferiores a 7.2 miles de dólares. Adicionalmente, en Texas 75% de todas las colegiaturas son inferiores a 7.7 miles de dólares, mientras que en Carolina del Norte vemos que 75% de todas las colegiaturas son inferiores a 8.7 miles de dólares. Estas comparaciones nos permiten confirman nuestra anterior impresión de que las colegiaturas son menores en Texas que en Carolina del Norte.

o

70

Capítulo 3

Presentación de datos numéricos en tablas y diagramas

i

.f

f:

: 20 10

...

0'----.-41.,.._.,~

·.o

...... ,......_.

~--'.

. · :·::·. :.'. ··f:\';•,;

-'-_,.'----."--'--~-'-....._--'_,... _,._,..._~

4 :·s . .:·a·::, ··10· -, :i2 · ·•14:. ·'.:'.' ·::.~'.~~-'' ·'.·' . ··;;:.co18§1áít1t~~:~ri':ib&> ·,''··'·=·

-: ···

1e .: : .: ié · :·~,.

,



·to

Flgur3 3.9 Polígonos de porcentaje acumulativo de colegiatura.S de residentes (uera del estado en 60 escuelas de Texas y 45 escuelas de Carolina del Norte. Fuente. Los datos fueron tomados de las tablas 3.~ y.3.7.

Problemcs de lo sección 3.6 3.33

~.

3.34

).

.e 3.S

1e a
3.35

Examine la figura 3.9. (a) ¿10.0% de las colegiaturas a residentes fuera del estado en cada estado están por debajo de qué cantidades? · (b) ¿40.0% de las colegiaturas a residentes fuera del estado en cada estado están por debajo de qué cantidades? (c) ¿60.0% de las colegiaturas a residentes fuera del estado en cada· estado están por debajo de qué cantidades? (d) ¿90.0% de las colegiaturas a residentes fuera del estado en cada estado están por debajo de qué cantidades? · (e) ¿Qué porcentaje de las colegiaturas a resídentes fuera del estado en cada estado están por debajo de 5.0 dólares? (f) ¿Qué porcentaje de las colegiaturas a residentes fuera del estado en cada estado están por debajo de 11.0 dólares? (g) Discuta sus hallazgos. . . (h) ¿Cómo podría ser 'de utilidad su información para el analista investigador de la compañía de servicios de asesoría colegial? Analice. De la distribución de frecuencia desarrollada en ~l problema 3. lZ{b) de la · página 66 referente a los cobros de servicios públicos (a) Forme la distribución de frecuencia acumulativa . (b) Forme Ja distribución de porcentaje acumulativo. (c) Grafique la ojiva (polígono de porcentaje acumulativo). De la distribución de frecuencia desarrollada en el problema 3.13 de la página 66 referente a las regaderas (a) forme Ja distribución de frecuencia acumulativa. (b) Forme la distribución de porcentaje acumulativo. (c) Grañque la ojiva (polígono de porcentaje acumulativo).

Distribuciones acumulativas y polígonos acumulatívos

O

3.36

3.37

3.38

3.39

3.40

De la distribución de frecuencia desarrollada en el problema 3.14 de la página 66 referente a los valores en libros de compañías enumeradas en el NYSE (a) Forme la distribución de frecuencia acumulativa. (b) Forme la distribución de porcentaje acumulativo. (e) Graflque la ojiva (polígono de porcentaje acumulativo). De la distribución de frecuencia desarrollada en el problema 3.15 de la pagina 66 referente a la incidencia de cáncer -. (a) Forme la distribución de frecuencia acumulativa. (b) Forme la distribución de porcentaje acumulativo. (e) Grañque la ojiva (polígono de porcentaje acumulativo). De las distribuciones de frecuencia desarrolladas en el problema 3.16 de la página 66 para cada una de las tres variables numéricas (calificación, costo y sodio) referente a las características de la mantequilla de cacahuate (a) Forme las distribuciones de frecuencia acumulativa respectivas. (b) Forme las distribuciones de porcentaje acumulativo respectivas. (c) Grafíque las ojivas (polígonos de porcentaje acumulativo). De las distribuciones de frecuencia desarrolladas en el problema 3.17 de la página 66 referente a a los tiempos de aceleración de los automóviles alemanes y japoneses (a) Forme las distribuciones de frecuencia acumulativa. (b) Forme las distribuciones de porcentaje acumulativo. (e) Grafique las ojivas (polígonos de porcentaje acumulativo) en una gráfica. De las distribuciones de frecuencia desarrolladas en el problema 3.17 de la página 66 referentes a la duración de focos de dos fabricantes (a) Forme las distribuciones de frecuencia acumulativa. (b) Forme las distribuciones de porcentaje acumulativo. (e) Grafíque las ojivas (polígonos de porcentaje acumulativo) en una gráfica.

Graficación de datos en secuencia: la gráfica digipunto . Hasta ahora en este capítulo, en nuestro análisis de los métodos gráficos, no hemos tomado en cuenta de ninguna manera el orden secuencial en que se han recolectado los datos. En muchas situaciones, particularmente en contabilidad, economía y finanzas, nos interesa estudiar un conjunto de datos recolectados regularmente, diario, semanal, mensual, trimestral.o anual, de manera tal que resultaría natural grañcar los resultados (sean éstos, índices de precios de acciones, ingresos por ventas industriales, ganancias corporativas, etc.) en una gráfica en la que el eje X (horizontal) representa un periodo dado. Esta materia de análisis de series de tiempo se presenta en el capítulo 19. En otras circunstancias, particularmente en la administración del proceso y la calidad de los productos, también estamos interesados en estudiar los resultados en un conjunto de datos recolectados en orden secuencial (sean el número de clientes por minuto que llegan a una sucursal de un banco de Manhattan durante el periodo de la comida de mediodía a la 1 PM, el porcentaje de baterías defectuosas en muestras consecutivas de 50, la cantidad de llenado en botellas de jugo de manzana de un lltro, etc.). El tema del control estadístico del proceso y la calidad de productos se analiza en el capítulo 16 y se presenta una diversidad ele diagramas de control. En esta sección, como introducción a estos importantes temas, usamos el tiempo de procesamiento (en minutos) ocupado por un pagador que maneja 24 clientes consecutivos en un banco de Manhattan durante el periodo de almuerzo de mediodía a la 1 PM (figura 3.10). Ilustraremos que grañcar los datos en orden secuencial puede ampliar un análisis.

78

Capítulc 3

Presentación da datos nUméricos en tablas y diagramas

Figura 3.10 Datos sin procesar referentes al tiempo de procesamiento clientes consecutivos en un banco de Manhattan.

1

....

del pagador (en minutos) para 24

Los datos enumerados en la figura 3.10 aparecen en forma sin procesar. Aun s datos fueron registrados cronol6gicamente, no deberíamos esperar que cuando lo los tiempos de procesamiento (en minutos) relativos a los 24 clientes consecutivos siguieran ningún patrón ordenado observable. (De hecho, una importante suposición en los procedimientos inferenciales que analizaremos de los capítulos 10 all S será que nuestras observaciones de muestra recolectadas se extraen aleatoria e independientemente.) Aquí, entonces, sería de· interés evaluar gráficamente si los datos están realmente en forma sin procesar o si existe alguna relación ínsospe-

chada.

3.7.1

Representación de la gráfica digipunto de Hunter

La gráfica digipnnto presenta simultáneamente un diagrama de tallo y hojas y

r..

una gráfica de las observaciones en el orden secuencíal.en que se obtienen.~-~ªhorizontal grañcada sobre la secuencia por lo general denota la mediana o el valor medio de la clas1ficacTónorCfeñada. (La meofañase estudiará en la sección _j.4.2.) Esta línea horizontal permite una fácil referencia para observar cualquier· patrón. Por ejemplo, como se indica en la figura 3.11, si hubiera una tendencia positiva en las observaciones de la secuencia ordenada en que se recolectaron, la porción de la gráfica dígípunto indicaría un incremento de izquierda a derecha. Para una tendencia negativa, la 'gráñca se invertiría. Así pues, en estas sítuacíones

.... ::

·.. ;'~

f.'f-;.,,,.,..;..,..,.,.~...,_ .:.~,...,.._,....._..:._·. Mediana . ·.:· ''

~

' :: : : -'-.. , :- .;,:

:

:::.

·..·

·._:_·.·T.n....;..::·:'·_ed·:~:.·:~-.·..~.'n1····~ª·.;=.:~ec..: "; : · ~

· ·~;;;;L.<~Jt(ir.i ·l.

11

~:·····\.:·. ('['.(\/':Tit:tdenC:las observadas

.- ; : ; ~ ~~:º':. : -~_·. ·. .· . ':_:~ . ,

: ·.., ... i. _.._:· ._ · ., . ..< _;·_ · _ ; _ .

'..)i ~ . ' .{ : ! ~ :,~ :i~ ~ r i ~ f i t i ~ ~ .,·_. . :·¡:/}..:¡-.:·.. :. . . . . f l

.:

-:···:nA··_~.·:-•_.:,'•.t.:~::·. _·~t.:···_:·,~·~:.ª·.',.:.v:._a,~.~'_· ·~.··T.I:..·_'-_:._·~· '...: . ~::_···. ··· ;_..·. ª~·1.';·:•.·..~:~.,~ ·..'·.._·.:~•·.•:_..-· ;. ~:_:, :__ ··

11

. ~

11

•..

· · en datos graflcados en orden secuencial.

Graficaclón

de datos en secuencia: la gráfica digipuncc

observaríamos largas secuencias de valores en un lado de la línea horizontal seguidas de largas secuencias de valores en el otro lado de la línea.' · Para desarrollarestas ideas, 'los datos del tiempo de procesamíento.del pagador del banco de la figura 3.10 se han organizado primero enun díagrarná dé tallo y hojas, se han tabulado en unadistrlbución de frecuencia y se han ilustrado gráficamente como un polígono de frecuencia [véanse los grupos (a), (b) y ·(e), respectivamente, en la figura: 3.12]. . ·:.· :.·

.es

4

8

o.·

5

. ··,·5

.~

....

.

Figura 12

:

··-:

. , . ., . . · /g
~~~'>1:.~~;,>:·.~:~:f~i~~~~;.;~:;} ; ~

...

....

1· ...

.

.

;:·~'-.::: ·,_,.,_.,'.. '.·

:_.::c:_'.;_:·.,.;_:n

·}A
, :·~. ~ ·-~~~-~;:;º:~-~; ~:et:\: ·. :-. 2· .. 5038.0 .:- .::· 3

.r~•-{~i.~.~e.~·~,.

. r

.

. . ~:g.,·. g:f,~.;g;;:~ -tj~= : t~.: , :_:,~.~:.·:.-?·.~~-'t . :·

·....

. •){;.

:'

4.p pero menor que. 5.Q··. . . : . : T . 5.Q .. pero m~·~5:irqu~.:... s~o.·~~~ ·,: •.:'..: 1 ·.. · 6.0· ·pero menor que 7.0:· ,.. . : , t · · ·. ·-, i Tot~Y> ·... :;::.-< ·. ~ :.; ·.: '24 ·::

. ..

-3

'

.

Organización y presentación ·

Fuente: fjgura 3.10,

de datos de tiempo de procesamiento "da un pagador de banco. · · · .

Aunque se observa que los datos tienden a agruparse en el intervalo de 1.0 a 2.0 minutos, no puede obtenerse ninguna información referente a los patrones potenciales en el orden secuencial de los tiempos de procesamiento delpagador de banco de estos diagramas de resumen. Para remediar esto, la figura 3.13 'descríbe una gráfica dlgípunto, un útil dispositivo gráfico desarrollado por I-Iunter (referencia 5). · Inspeccionando la figura 3.13, encontramos, como se podría suponer, que no existe evidencia de ningún patrón en la gráfica. No existe ninguna relación (y tampoco debiera haberla) entre el orden cronológico y el tiempo de procesamiento (en minutos). La más larga secuencia consecutiva de observaciones por encima de la línea del centro es 3 (observaciones. 5, 6 y 7) y la secuencia consecutiva más larga por debajo de la línea del centro también es 3 (observaciones 11, ·12 y 13).

ªº

Capftulc 3

Presentación de datos numéricos en tablas y diagramas

r

l.

~

!,{.

1

.. ..

~~

f~ ¡l;¡I "~{

. J~I~ ,: ·1

· .··· ..

~~ ~

f~

i.•;: ff.t,.

s

1

Figura 3.13

.'·~?.

:??~. . Gráfica digipunto de Hunter del tiempo de procesamiento (en minutos) de 24 clientes consecutivos en un banco de Manhattan.

~~tt·

Por

:~~: ·. ·if!,/:.

otra parte, las mayo~es oscilaciones de la gráfica por encima de la línea del cen-

tro· comparadas ton. las distancias por debajo de ésta demuestran

·~-i--·..

simetría en esta serie de datos.

la falta de

s

.ji ... :

.I>::

1--.>-.<: :I ·.: · ·

-3.-7.2

·}Í; ~-.:_•. l~

Comparando el diagrama de tallo y hojas del grupo (a) de la ñgura 3.12 con el mostrado en nuestra gráfica digípunto (figura 3.13), 'Observarnos que ¡serían Idéritícos si volteáramos de cabeza uno de ellos! Por lo tanto, al 'construír la porción de tallo y hojas de la gráfica digipunto observamos que las hojas se bifurcan hacia la izquierda de los tallos o hacia la derecha. Además, observe que los tallos se enumeran de alto a bajo, de arriba a abajo, en vez de bajo _a alto como en la figura 3.12. Esto se hace por conveniencia gráfica, puesto que el eje Y (vertical) . de una gráfica va de alto a bajo, de arriba hacia abajo. A la izquierda del eje verJic~l indicamos los tallos junto con "marcas de tictac" para los tiempos de proce. sarníento (en minutos) sobre la escala vertical. A la izquierda de los tallos '.trazamos otra línea vertical para permitir la colocación de las hojas. Después cons.-ttuimos simultáneamente la porción tallo y hoja y grafícamos los tiempos de 'i}~p~esam..iento (en minutos) el orden que se enumeran en la figura 3~10. Estos 'Y~~otes grañcan de izquierda a derecha, con distancias iguales de por medio. ·¡.qs puntos consecutivos se conectan entonces y la línea del centro se traza a través d(l~ secuencia ordenada. En la figura 3.13, la línea del centro se grafica desde el

se

fi

'i r .:.:_~ . ? · 1:,,:\;/ :·.;~. ~ ~• >

Construcción de la gráfica digipunto de Hunter

.

.

ej~ vertical en el valor de 1.6 minutos. Esta línea representa el tiempo de proce-

l~ u~r:;~~;~i~nl~

=~=st~o~~r;;7a~~~~;fa~~~~ ~:~~~~~~ 5 l~n~ac~~~:~:l~~~~ parque se intentaba veríflcar una suposicron en una sene de datos ya obtenida. f. \': (:,:;:.·.5prltrola ·:=fof;Rtra. procesos de servicios cuyo producción u otros (es parte, decir, para las gráficas se hacen interactivamente) la línea delprogreso centro se

-!~://.:·.>. ·

- ~f

en

1 ~< : ;,:.-: .

f~::;}~;}L;::>:::-~~_p~rada (el objetivo) se grañcaría inicialmente de manera que proporcionara

\~f¿:fH:':'."· ·;\.fYla:1nterpretación

visual ele patrones en el tiempo.

111·,.

Graficación de datos en secuencia: la gráfica digipur.co

Problemas de la sección 3.1 3.41

Un fabricante de pantalones de mezclilla de hombre utiliza una máquina que puede ajustarse paza variar el largo del material producido. Suponga que el plan de producción es producir pantalones que se pretende tengan un largo de 34 pulgadas. La máquina ajusta entonces para producir pantalones cuyo . largo se espera que sea de 34 pulgadas. Se selecciona una muestra de 30 paiejas consecutivas de pantalones del proceso de producción y sus largos se registran a continuación en secuencia de fila (de tzquíerda a derecha):

se

34.02 33.89 33.9¡ 33.74 34.02

3.42

Semana 1 Semana 2 Semana 3 Sernana d

Semana Semana Semana Semana

1: 2: 3: 4:

Lunes

Martes

3.3 3.9 7.2 3.1

3.7

3.8

4.3 3.3

34.05 33.88 34.05 33.94 33.9"6

34.01 33.96 34.00 33.99 34.01

33.91 33.85 33.97 34.03 33.93

33.76 33.94 33.84 34.10. 33.82

(a) Forme una gráfica dígípunto para estos datos. (b) ¿A qué conclusiones puede llegar respecto a sí el proceso de fabricación está controlado? Victor Stemberg estaba entrenando para una carrera de 5 km. Como parte de su entrenamiento, corrió un Intervalo de un cuarto de milla para rapidez de pista durante 27 días consecutivos antes de la carrera y llevó un registro de sus ensayos de tiempos. Los datos que vienen a continuación son sus tiempos de cuarto de milla (en segundos):

Dom.

3.43

34.06 33.98 34.03 33.85 33.95

90

85

80 79

Lun.

Mar.

Miér,

jue,

Vie ..

Sáb.

89

88 84 79 74

88

86

84-

79 73

78

91 84

81 78

83

81 75

83

82 72

80

76

canera

(a) Forme una gráfica digipunto para estos ensayos de tiempos usando la línea del centro de 81 segundos para este periodo de 27 días, (b) ¿Qué puede concluirse de esta gráfica? Analice. Los recibos de ventas totales (en miles de dólares) se registran díariamente en Ethel's, una boutique de vestidos en la ciudad de Nueva York, durante el periodo de 28 días de 1de"febreroa28 de febrero de 1993:

Miércoles 3.0 3.6 3.8 3.2

jueves

Viernes

Sábado

3.5 3.9 4.5 4.2

3.4

5.7 6.8 6.6 6.2

5.6

3.2

3.7

Domingo 5.0

~.!i Sj

S.4

(Observe que las vacaciones federalesy estatalesestán dentro de un cuadro.)

(a) Analice los datos construyendo una gráfica digipunto en donde la línea del centro sea de 3.9 miles de dólares. Describa cualquier cosa inusual. (b) ¿Parece haber algún patrón en los recibos de ventas totales con el tiempo?

82

Capítulo

3

Presentación de datos numéricos en tablas y diagramas

!!Jt'e l ,

.~ , ~

J!,i¡. ~

..;.~w¡!».:

:-~ :~~ ~· : · ~·¡ ··. ~ ·~.

· .. . .

~

t ·

"

'; :,fi t ·· ·. ~&-: ..

lti ·i':' :~il

··~~.:-. ·..

_,I=: _ _.;_ ·

.

~I~: :·. ...·. ·.

·i(.J~

'1·~!?.",_{.; " . Ít_~¡:-.

':

a4Y~~·.::.

:

. · :" •.

. ' · ;: : / ;'.i(}

?~r'·::l.fso de páquetes ·esfa:dísti.~os '', ',



. .. •

. .• •

• . . ..

para datos . ..

' ; ·,

nµ.rp~rfc;~.f :-~_:.·_ . .. ,,: : . '

::·i.



f: ;~ ~ tWi"f . ·. ~{~.:.~~·li~~~~%,~~;;;~'fk~~';hb l/;~~~ ~ I' fa~~~;3.14;;;:.:d:;~~~~:t~_:;~1~: ~:.I~~o.r::~~!p;e~~~~:i· ;~f.-}'{:}i;:::;.:· j~~-f~·:}}:·'. : ..;,.....·"· _,,. -·~· ~f~. ~:;figura describe diagrama pe talio_y hojas de SPSS, la figura 3.1 S

f

1

do,-la

$..~.

{W;·~:

el

·.~~:~·~.:..·..

Uso de la computadora para cabras y diag~mas con datos numéricos

m11estta1as· dfstñfüitioñ.e-.s de

I'

f>:ecüencra ·-:-de~ oi::ceñ.ta:·e 1r-:srA.T1sroc-~ras'ñautas

z~~'~Nt$~~~~tt1ft~t~~~~,~l~ir~1~~~ 1;~~i1:1l.. ~·.,;i~•,;·1 .dé,c9m~iitidora ·l)uede~rsg::i:rru(iesI:iüesfa~~la

~,··

. ·. ·: A partir.' de:vatios:.~eswtadós·

:lndtcán '.Prifil.era::·P·. .r~.i4il~t&. ~1\é.F.~:~fn.*-af~g~:1Wf.&~~~r~1~!.-~t.~i~~9i~íi~1~§.t.~;:fM~Si~m~.~ ue: 1a ofstrniutfóíf.cte':'lin" 'e%oS:i· ~ónhles''~ii~'lS~~·:effitQ~aao.s:~~uétietpiof

dónae iaS: aifetenCias: ·aé::·· étiel:o·~~¡f-ros·.:fh¿.'.'ésbs~'

ersónlfeféiéló.terrf·teados~cte

~~af:cturjo~?~~~1W~~~~t~~~~~k~f l~t\~~¿~:i~~ls~¡~a:~ lófpáq'i,i~tes Urfa've1/tjtie'.se1ogr~l'és.tOJserú~c~sifo(áh accésos

esf~díSh('.bs:

(l~

~tA\t.Ji~~~t:té~~g;i~t;;~ª~!!i~~~~t::;f1~;~:~r.~&~~~J.~%í9tf~~fk.1! TI·.·a~mas~.~~::.dE!'taUo;:·.:·.füj'as··-tes resós' ersonales'Hé'efri:'}eados''.~fo

·~f~!~!ilW.f~¡ttqi{5i~f~~á~li.ffil :f~; é'd;iV.os · afá:losAri

. :· :.( ..... ~•.

"

.:'.'.':·:·.i.

.

8.-0,0 Ex;t.i;::em~s-·

..

(·~7};

::p6)¡:,.-.:p.6)~:·.:(78').;<{f!~)./>~.2J,

~l~4 ·::·:.

,~~:~"!:::~'.0r:~:';1:~:!~~:~:~:!'M,~;t~:t1:,~1;¡; ,~~t~~~!':, ;;:;¡f

?F~~)

_11 . &l

figura 3. 14 Diagrama de tallo y-hojas para salida de SPSS. Nota: Debe señalarse que en algunas situaciones, un tallo de longitud 1'0 puede dividirse en cinco tallos basándose en los dos d!g!tos m~s bajos (;), doses y rreses (T), cuatros y cincos (F), seises y síetes (SJ, y eri !os dos dígito! más altos (.} o un tallo de longitud 10 puede dívídtrse en dos tallos basándose en dígitos bajos (Lo •)y altos (lfo .). Como se ve en la figura 3.14, SPSS utiliza los símbolos
84 3

Capitulo

Presentación de datos numéricos en tablas y dlagrarnas

1

r1

r

.

'.

'

Ji

w

1 W

1 I. ' g.

60< :·.···

:<.. ·.::10:.·

ªº

~

1

.\e.--··:.::..

9 0

. t~,;;:,~;~QTAL .

:.· :.

Wl:

Ji.

. ... ·"; ·

..

Figure 3.15

·:.· -.

.

sáJida de STATISTIX de distribuci6n de frecuencia y porcentaje

···::.::· ..; .·:-·,: .,·.· --~~:·_,·· ~.:.··.'.':."•....:.t.. :

, ..

~1~ª~!~rn

:·'90

·100.

.· RINCOME'·~

•.10

.•

;

~}f;~f:~,:<:"~ogram;i de frecuencia de salida de STATISTIX. . .Flgul'35 3.15, 3.16 y 3.17 ··),,.:~; ':':-.- ::: :. · (J.lmo ilnal!znmos en la sección 3.3.4 de la página 65, existe mucha subjetividad al seleccionar limites de clase >;.;:.< :;: . _.en l;u dlstribucion\'~• de frecuencia. AqLI! observamos que los límites de clase ·en las distribuciones d.e ~i;~B.·~:::.:· .. :fl:~enc!a >' poteenra;e obtenidos por STATISTIX en la figura 3.15 coíncíden con aquéllos para el histograma y ".{i:::::;.: ·. !:l.of.l~;¡ obtenidos por STt\TISTJX en las figuras 3.16 y 3.17. Puesto que cada paquete estadístíco se programa rnanera diferente para establecer los limites de las clases en una distribución de frecuencia, otros paquetes ·~·:i:.'.'\i>~)~n,eü~nPTCducir r~sultac:l~ d!íercntes. Sin embargo, podríamos controlar esto ejerciendo ciertas opciones. · · '-/~~i;{am~s entonces establecer los limites inferiores y superiores de Las clases según lo deseemos y nuestra .:·:/"'1~dasena C(msíst•;ncr. sin importar el paquete que elijamos.

·<~'.">'::··.:,1'.-.. ·

'.:":'.<>::-.·.:·de

Uso di3 la computadora para tablas y diagramas con datos numéricos

.·;:·:.'> : -·::_{(L{f:,: ·.:.:-.

. " ::~ ....

Figura

:.··

-".'

.. ·:·.

s.t 7

Ojiva d€ porcentaje de salida de STATISTJX.

lo

dólares ypor general se agrupan.en los veirltes pajos; para las mtijer~~1-lo ingr~só.s varían entre 1O.1 y. 62,8 míles de dólares y se agrupan abrumadoramente ei} lp.S_:_die-

._, ce~ ~~~~Qs_. ~~-c~{>l9 ~9i::~~~aJ'.lX~P~n.qfrª.~F~:~g~.)psJngr~(O.~.J?.~~s?ri?l~s.JeÍ1:1~~9~:·.e~ los'díéces áltos.Jas 'dos dlstríbucionés son.razoñablemehte'sfmllarés eniomu.L·'.·"\. :

·; :_) ·:~H~-G?-~~-~Y. _t~~l)-~~#}~s~~pk~tete~~d
·::potenciales respecto -ali,.oras Wlba1~d~s.~ 9u~;~:gq9}:i~I eqip1~·-n1un;i.~~(,r4~·l)!O,~.cr. ~ ;~i9n~s;. Un .ªh~isi.5.';~s~~dísti~~ (le~cr1p_t_ivq_ b~sád.q:eif fasf~wue.~a~ 3,":é.$$.$.'.,Yotj-~~ ·. · preguntas -referentes a·:1_a:s. :V~r!ablés: niiriié#.~a·s :~ t(r'.hcu~sJ~ -sobre)~ .~füJác<:ió_n

·-~n.?:1·~~-t~tF.~~Y~~t.c?>..~ b~~~-_de~,~?l,().·(lt9spe ·.A· me..~.lº!~.R~.cornp~e11s10J:l "~1?.P!M?.?~-~~~-de·~s~.lfl:Fon:ipps~c:;ioI1''de-l~:füett,~fde,.~~·
"respecto· al ct.és~ricllÍÓtle {in:paquéte.&:be~~do#,:a: ~iti~l~a~~s:::~/ r:.: .:_:/:}fe:: =:-<.~ .: Encuesta/Proyecto

de la sección 1.8

Los siguientes problemas se refieren a los datos de muestra obtenidos del cuestio- natio de la figura 2.6 de las páginas 28-29 y presentados en la tabla 2.3 de las páginas 33-40. Deben resolversecon la ayuda de un paquete de computadora disponible. Suponga que fue contratado como asistente de Investigación de Bud Conley, vicepresidente de recursos humanos de Ka1osha Industries. Él le ha dado una lista de preguntas (véanse los problemas 3.44 a 3.59) que necesita responder antes de su encuentro con representantes de B&L Corporatlon, la compañia consultora de beneficios a empleados que contrató. Para cada uno de los siguientes problemas (3.44 a 3.59) referentes a la Encuesta sobre la satisfacción de los empleados: (a) Forme el diagrama de tallo y hojas. (b) Forme las distribuciones de frecuencia y de porcentaje. (e) Graflque el histograma. 86

Capítulo

3

Presentación de daros numéricos en tablas y diagramas

.



. . ·: :::. ·.

.. ..

.

. -."':, .. · ·.· ···:·

.. ··.. ';: .. ·-'.

:

:-~·

:

/·..f.':L:~~;(: úni.t .: :;> -r , •

•(

of RINCOME l

:·º .

:f2)"

._5·:·.

:···

:

#

';

.....

:~:

·.

....

. : 7: ·:·.:

·:::

: : . : ... :·... ·

i ssssssssssssss6666666667n7111?1777

:~mmmii~:·7,7777~··~·.·.~···

2 :.OOÓOOOOOH.lHZ22.2233'.323J33~Ú.444

;\::;,,,.u;, · .~ -; :10 :·,:



..: .. :

ti'·> · i: ooooú111233333J444.i4.

1...: ..

4 '·00134 4

.

... ;'.·.r:.rra :>·. not~· • SEX'

.

Ei88sss8·s9999999

.·.·

.:, ·,: (; :-;:·''•.:.<:·

....-,

i:::i: .: '5.:,, . ·• ·.: ss·.·.· ·aº1. .:.f·'·:·. t5 ).2 ::!~·:·.:~:·-:.: ...,::

:·.:

·......

Stem-and·leaf

. :.:r

·.

·.

. :';

.":

.. · . . :\··:· .. ·:::

=. l

is for Mi:i.le and

.·: r: 1

SEX • · ;:::· .2.

.: ... ·:

·is far Female

Figura 3.18

~iagratnas de tallo y hoja de M1NITAB de ingresos personales de empleados de tiempo complete mujeres y hombres. Nota: üi un diagrama de tallo y hojas de M!NlTAB, los números de la primera columna son conteos acumulados de las observacioneshasta llegar a la clase que contiene el valor mediano o medio. En el grupo i.upcri.orel (29) significa que hay 29 observaciones en la clase que contiene el valor medio. Los números escritos debajo de (29) son los conteos acumulados, comenzando desde los Ingresos más grandes y r~µocediendohasta la clase que contiene el valor medio. Ademas, en estos diagramas de tallo y hojas de MINITAS, los tallos se han diVldido en d!gitos bajos (L) y altos (H), pero estas Ietras no aparecen en la Impresión: ·

·:·.J.:-: .: .: •.: '.

.3.45 3.46

(d) Grafique el polígono de porcentaje. (e) Forme la distribución de porcentaje acumulativo. (f) .Grafique la ojiva. (g) r.t:;Ml·f.!·> Escriba un memorándum a Bud Conley analizando sus hallazgos. ¿Existen diferencias en los ingresos personales de los empleados de tiempo completo de Kalosha Industries basándose en la participación de un individuo en las decisiones presupuestarias (véanse las preguntas ? y 22)? ¿Cuáles son las diferencias en los ingresos personales de los empleados de tiempo completo de Kalosha Industríes basándose en un agrupamiento ocupacional (véanse las preguntas 7 y 2)? ¿Cuáles son las características de la distribución del número de horas tipicamente trabajadas por semana por todos los empleados de tiempo completo de Kalosha Industries (pregunta 1)?

cJ

{'r\

Uso de la computadora para tablas y diagramas con datos numéricos

3.47

.3.48

3.49 3.50

3.51 3.52 3.53 3.54

3.55 3.56

3.57

3.58

3.59

11·1

¿Existen diferencias de género en el número de horas típicamente trabajadas por semana por todos los empleados de tiempo completo de Kalosha Industries (véanse preguntas 1 y 5)? ¿Existen diferencias en el número de horas típícamente trabajadas por semana por todos los empleados de tíernpo completo de KaloshaIndustríes basándose en la partú:ipació~de un individuo en las decisiones presupuestarlas (véanse preguntas 1 y 22)? . . .. . · ¿Existen diferencias en el número de horas típicamente trabajadas por semana por todos los empleados de tiempo completo de Kalosha Industries basándose en un agrupamiento ocupacional (véanse preguntas 1 y Z)? ¿Cuáles son las características de la distribución de duración del empleo (en años) entre trabajadores de tiempo completo de Kalosha Industries (véase pregunta 16)? ¿Existen díferencí,.s de género en la duración del empleo (en años) entre trabajadores de tiempo completo de Kalosha Industries (véanse preguntas 5y16)? ¿Cuáles son las características de J~ distribución de edad (en años) entre trabajadores de tiempo completo de Kalosha industries (véase pregunta 3)? ¿Existen diferencias de género en las edades de los trabajadores de tiempo completo de Kalosha Industries (véanse preguntas 3 y 5)? ¿C1.1áles son las características de la distribución de educación alcanzada (en años de enseñanza formal) entre trabajadores de tiempo completo de Kalosha Industries (véase pregunta 4)? ¿Existen diferencias de género en el nivel alcanzado de educación entre trabajadores de tiempo completo de Kalosha Industries (véanse preguntas 4 y 5}? ¿Cuáles son las características de la distribución del número de promociones recibidas al trabajar en Kalosha Industries por todos los trabajadores de tiempo completo de Kalosha Industries (véase pregunta 17)? ¿Existen diferencias de género en el número de promociones recibidas al trabajar en Kalosha Industries por todos los trabajadores de tiempo completo de Kalosha Industries (véanse preguntas S y 17}? ¿Cuáles son las características de la distribución de ingresos familiares totales ... entre trabajadores de tiempo completo de Kalosha Industries {véase pregunta 8)? ¿Cuáles son las caractertstícas de la distribución de años de empleo de tiempo completo desde la edad de 16 años para todos los trabajadores de tiempo completo de Kalosha Industries (véase pregunta 15}?

Reconocimiento y práctica de una adecuada presentación tabular y de diagramas y exploración de cuestiones éticas ·

Hasta este punto hemos estudiado cómo se prepara una serie de datos recolectados

y luego se presenta en forma tabular y diagramática a fin de hacer los datos más manejables y significativos con propósitos de análisis. Si nuestro análisis debe ampliarse mediante un despliegue visual de datos numéricos, es esencial que las

tablas y diagramas se presenten clara y cuidadosamente. Los adornos tabulares y la "basura díagramáüca" deben eliminarse para no oscurecer el mensaje dado por los datos con adornos innecesarios (referencias 3, 11, 12, y 15). Además, al presentar los diagramas debemos evitar ciertos errores comunes que distorsionan la impresión visual (referencias 2, 4 y 6). Tres de estos errores son: 1. No lograr comparar dos o más series de datos sobre una base relativa. 2. Comprimir el eje vertical. 3~ No lograr Indicar el punto cero hasta abajo del eje vertical. 88

Capítulo 3

Preseneaclón de datos numéricos en tablas y diagramas

~'

t

•f;¡,

l

3

~ji

.9.1.

Eliminación

de

la

basura

diagramática

~

1 1

AJ hojear revistas y periódicos a menudo encontramos qu~ las tablas y diagramas

están adornados con varios iconos y símbolos para haceflos atractivos a sus lectores. Desafortunadamente, avivar una tabla .o diagrama con frecuencia oculta o distorsiona el pretendido mensaje· transmitido por los datos. Por ejemplo, . algunas

:

~~·

~

:J.fi. ¡;¡¡;

representaciones visuales que "atraen la· vista" que típicamente encontramos en revistas y periódicos intentan erróneamente mostrar "áreas" de iconos representativos de información numérica. ¿Puede alguien realmente leer e .ínterpretar tales áreas bidimensionales con precisióri? La respuesta es no. Como se ve en la figura 3.19, estas gráficas pueden ser atractivas, ¡pero rara vez funcionan!

·.~~

~

A Shrlnklrig Catch

Cap,ura armal, eJijmada, de

. otras en la Bahla de . Ch~sape·akeespecificada en . : mn!ontis.debU!l~ls ·::·'··

1··

..

·.··

. · ·t.930~s: ......

..••

.

.. ~Omitfona · debusMls : r.

Figura

3.19

--'§ .

·._19~i

..

.

. 1912 1982

4 ,.

~

·. lS92.

5 3.5 18ó.OOO t>usho<s

Repre!lentación "inadecuada" de la captura estlmada de ostras (en mlllones de bushels) en la bahía de Chesapeal<e durante varios periodos, Puente: TheNew York Times, 17 de octubre de 1993, pág. 26.

; ..

. En la figura 3.19, el icono que representa los 20 millones de bushels estí·.fuados de ostras atrapadas en la década de 1890 ¿es realmente cinco veces el tamaño del icono que representa los 4 millones de bushels estimados de -ostras atrapadas en 1962? Esta ilustración puede llamar la atención, pero por ro general no muestra nada que no pueda presentarse. mejor en una tabla de resumen, una gráfica digipunto o una gráfica de los datos en el tiempo (véase .:·(:at1ftulo 19).

··

<:····.. \Y{/·:

}::}.·=}>:·>

f('!'i

,=.~"'-:j-:::.v-.-2--~0-rt-~-~o--rsm-~_-e_nel~-a-n~_-b_~l~a--acc-

_ei_o_n__d_de_d__as__et__ri_oe_s_s

_

~)!~,~~.#=>;~hfa sección 3.4 demostramos por qué es necesario comparar dos o más series de

\)(:>:. ·~tos sobre una base relativa, y las figuras 3. 7 (página 72) y 3 .9 (página 77), respec· t,:Xi{ ·.~:V~i;ne!lte, mostraban los polígonos de porcentaje y las ojivas de porcentaje ade·'}V:> :$..i:tldos a~ comparar las colegiaturas P,econocimiento a residentes fuera del de estado de 60 escuelas de tabular y de y práctica una adecuada preso?ntación r:

90

capítulo 3

Presentación de datos numéricos en tablas y diagramas

diagramas

;\=().;:j· ·J~~ Y 45 de

Carolina del Norte. El uso de conteos de frecuencia en vez de por-

\)/¡{:; ·q:~t(lj~~9 proporciones sería engañoso. Para mostrar esto, en las figuras 3.20 y 3.21 ':/iiiK\ :·4.e)a página 90 se muestran los polígonos de frecuencia y .las ojivas de frecuencia )·:~:.·:./::· .:~J?,!:!etivos que "comparan" las colegiaturas a residentes fuera del estado de óO

.;')<\-; ,_.e~uelas -, de Texas y 45 de Carolina del Norte. Además, para acentuar la distors1ón ·:.:;;e;'.{;.;:. ·~~l;.se incluyen las colegiaturas a residentes fuera del estado cobradas por los 90 ;\t~};¡:r~··::·~o1eg't!;Wy universidades de Pennsylvania (véase el Conjunto de datos especiales 1 ,:<~ ·apéndjce D en las páginas D4-DS).

P,econocimiento y práctica de una adecuada preso?ntación tabular y de diagramas 90

capítulo 3

Presentación de datos numéricos en tablas y diagramas

.

25

..

y~c ·,

.:.~:;.

".. ·.. :•

·.';•,·,,.:.'. ..

\/~~;·:~L.;: ...~·'..;:~:!

20 (/)

.!!! (l)

~~·,·:.:··). '.·.'·...

15

::i

o

(1) Q)

.,1 ~.. ~ . . . ,

Q)

"O

e

I

iO

CD

E •::J

z

I

5

.

'

:

........

.

\.,

.f . :·,:..

~

..:.· .

',\ '

..,'



..

\ .,

)~~~;.

.·:. .., , ;:)

_ ;

v ~:

\

.\

:, ..:_;_. .

:::.x:· .

o . .'......"°"'""-f-1..---'----'----'--'\~---,_~..-..·. _'il·.-...,c-=-'-==-· --=...'..\.·f-~......

, .;• ..;;9·;;:~·:· .• o

2

:;-:. -:, ' •' . 4

6

8

10

12

14

.: 15

18

20

..

22·

.. :24-..

26

Colegiaturas (en $000)

Figura 3.20

Polígonos de frecuencia "inadecuados" de las colegiaturas de residentes fuera del estado en 60 escuelas de Texas, 45 escuelas de Carolina del Norte y 90 escuelas de Pennsylvanla. Fuente: Los datos fueron tomados de las tablas 3.3 y 3.7 y de "Amerlca's Best Co!leges, 1994 College Guide", U.S. News & World Report, resumido de College Counsel 1993 de Natick, Mass. Reimpresión con permiso especial, U.S. News & World Report, iC> 1993 por U.S. News Sr Worltl Report y por College Counsel.

90 80

70 en

~:>

50

" '

40

o

Q)

el)

"O

o

~ E

z

•:>

. ....

60

,.

30 20 10

o

·:

o

··.: : ..

1

2

4 .

. 6

8

10

.11;·:·.. :11? .. Colegié\!Uras (eh $0QOj . ,•'

J.?_,. .

18

··.··.

.

.·.:·

fig.ura 3 .21 Polígonos de frecuencin acurnulatlva "inadecuados" de las colegiaturas de resldentes fuera del estado en 60 escuelas de Texas, •IS escuelas de Carollna del Norte y 90 escuelas de Pennsylvania, Fuent»: Los datos fueron tomados de las tablas 3.3 y 3.7 y de "Amertca's Best Colleges, 1994 College Gulde", U.S. News & World Report, resumtdo de College Counsel 1993 de Natick, Mass. Relrnpresíén con penntso espectal, U.S. Ncws & World lkport, © 1993 por U.S. News & WarJ.1 Report y por College Counsel.

Como puede verse: de Ias fi~ra~ 3.20 y 3.21, los: polígonos de frecuencia y las de las 45 de Carolina del Norte son abrumados por aquéllos de las 90 escuelas de Pennsylvania y no se pueden hacer comparaciones significativas de tales diagramas dístorsíonados,

"ojivas de frecuencia de las·6deseuelas de

3 .9.3

:·:··

Texas]'

·Compresión de eje vertical

Es fácil alterar la impresión ~sual de un diagráriia -manípulando los puntos de escala sobre el eje vertical o el horizontal. Para mostrar esto; .observe bien los polígonos correspondientes, ñgura 3.7 de la página ?'f. y-figura 3.20 de la página 90. Ahora observe bien las ojivas correspondientes, figura .3.9 de la página 77 y figura 3.21 de la página 90. En nuestros dos. conjuntos 'de diagramas correspondientes mantuvimos las dimensiones de puntos de escala iguales· sobre el eje horizontal. Para el eje vertical, sin embargo, tuvimos que tomar en cuenta que añadimos las 90 escuelas de Pennsylvanía a las figuras 3.20 y 3.21 y, no obstante, para su ubicación en su libro de texto, quisimos que los diagramas correspondientes ocuparan la misma cantidad de espacio en las páginas respectivas. Por lo tanto, para justificar las escuelas de Pennsylvania de la figura 3.20,. observe cómo cambia la "forma" de las curvas al comparar los polígonos que representan las escuelas de Texas y Carolina del Norte aquí y en la figura 3.7. De manera similar, para explicar las escuelas de Pennsylvania de la figura 3.21, observe cómo cambia la "inclinación" o pendiente al comparar las ojivas que representan las escuelas de Texas y Carolina del Norte aquí y en la figura 3.9.

Aun cuando ya sabíamos de la sección -3.9.2 que las figuras 3.W y 3.21 eran repre:·:

.· . .

.

·

·

.·.·.

f.U{.::

sentaciones inadecuadas de sus polígonos y ojivas correspondientes (porque las escalas verticales de las figuras 3.20 y 3.21 no usaban porcentajes o proporciones), el punto importante aquí es que una compresión de la escala sobre el eje vertical puede ocasionar una distorsión en la información visual que se está presentando . Por ejemplo, si hubiéramos construido nuestro histograma de porcentaje (véase la figura 3.5 de la página 71) seleccionando marcas de tictac sobre la escala vertical desde O hasta 100 en vez de desde O a 45, nuestro histograma se vería mucho más plano. Además, se vería antiestético en la mitad inferior del marco del recuadro, dejando espacio de fondo innecesario en la mitad superior (véase el problema 3.60 de la página 93). Una buena regla general, entonces, es construir sus diagramas de manera que utilicen todo el marco del recuadro.

3 .9.4

Fracaso al indicar el punto cero sobre el eje vertical

El punto de inicio sobre el eje vertical debe indicarse con un cero para no distorsionar la impresión visual respecto a la magnitud de los cambios que ocurren en el díagrama. Al tomar sólo un pedazo del eje vertical, tales cambios pueden exagerarse. La figura 3.22 de la página 92 muestraesta distorsión visual. Observe que en este diagrama el cero se omitió del eje vertical. Debido a esto, el lector obtiene una visión distorsionada de la magnitud de las diferencias en las transaccrones diarias. Por ejemplo, durante el periodo descrito, la sesión comercial más activa ocurrió el viernes 17 de septiembre, mientras que la sesión comercial menos activa ocurrió el lunes 12 de octubre (día de la Raza). Sin embargo, de la gráfica mal trazada, la barra vertical que representa la sesión comercial más activa es tres veces más larga que la barra vertical que representa la sesión comercial menos activa, dando la impresión de que se triplicó el número de acciones negociadas el 17 de septiembre respecto· al 12 de octubre. Si el punto cero se hubiera represen-

Reconocimiento y práctica de una adecuada presentación tabular y de diagramas

Capítulo 3

Presentación d~ datos numéricos en tablas y diagramas

..

Figura

3.21.

Representación "inadecuada" del volumen de ventas (en millones de acciones negociadas) de la Bolsa de Vnlores de NuevaYor-k en el tiempo. Fuente: The Nt!W Yori: Times, 20 de octubre de 1993, pág. 07.

.

' .:!1 ¡:: · ¿~



,

:

1:1

il

!J I·t1j · ; · }I ··i t 1 l] , · ., ·~

tado adecuadamente sobre el eje vertical, la gráfica hubiera reflejado con precisión que sólo se duplicó el número de acciones negociadas el 17 de septiembre respecto al 12 de octubre.

3.9 . .S Uso de software de computadora para tablas y diagramas

En la sección 3.8 demostramos cómo un software de computadora apropiado puede ayudamos en un análisis descriptivo de nuestros datos. La computadora es una herramienta extremadamente útil que puede almacenar, organizar y procesar información fácil y rápida y puede proporcionamos resultados, tablas y diagramas de" resumen. No obstante, debemos tener en mente que la computadora sólo es una herramienta. Veremos a lo largo de este texto, al demostrar interpretar variedad dé las salidas de computadora correspondientes a los etemas que se estudiarán en los capítulos siguientes, que es esencial usar la computadora de una manera consistente con una metodología estadística correcta. Acuérdese de. GIGO. La salida de computadora que obtengamos dependerá de cuatro cosas: la capacidad del hardware utilizado, la calidad de la impresora elegida, la capacidad del software estadístico seleccionado, así como de su habilidad para· elegir apropiadamente y usar el software provechosamente. Y cuando se le presente información tabular y_ díagramátíca proveniente de la salida de algún paquete de .software estadístico, tenga cuidado con los adornos extra que puedan estar ocultando lo que los datos tratan de transmitir.

una

3 • .9.6

Cuestiones

éticas Las consideraciones éticas surgen cuando estamos decidiendo qué datos presentar en formato tabular y díagramátíco y cuáles no presentar. Es de vital importancia, .al conducir una investigación, documentar tanto los buenos como los malos resultados, de forma tal que aquellos que.contínúen tal investigación no tengan que "volver a inventar la rueda". Además, al hacer presentaciones orales y presentar informes escrttos sobre la investigación, es esencial que lbs resultados se den de una manera equitativa, objetiva y neutral. Así pues, debemos tratar ele distinguir entre una mala presentación de datos y una presentación no ética. Nuevamente, como en nuestro análisis de las consideraciones éticas en la recolección de datos

·~.

::G:~1

{sección 2.11.6), la clave es la intencíón. A menudo, cuando se presentan adornos en tablas y díagramas o se omite información pertinente simplemente se hace por 1_gnorancia. Sin embargo, _un compo rtamiento no ético ocurre cuando un investígador desea ocultar los hechos a propósito y distorsiona una tabla o diagrama o no informa hallazgos pertinentes.

·w~ ·}}i -~

JJ¡ ·

Problemas de Ja secci6n 3.·9 . . 3.60

3.61

Según lo enunciado en el último párrafo. de la· sección 3.9 .3 de la página 91, vuelva a trazar el histograma de porcentaje (figura 3.5 de la página 71) seleccionando marcas de tictac sobre el eje vertical de O a 100 y luego comente la estética de su diagrama. (P1·oyecto del estudiante) Traíga, a la clase un diagrama de periódico o revista que considere que es una representación mal trazada de alguna variable numérica. Esté preparado para presentar el diagrama al instructor con

1¡j¡~>~i(,] ~:::::::~::~:~~:~::~::;•:d:::~ado > .. ·..

¡;

·r\.·

;-'):XJ({~t·~ó

un repaso

y una· revisión preliminar

se ve en el diagrama de resumen de la página 94, este 'capítulo trató sobre la datos. En la pág~a '54 de la s~cción 3.1 se.ie própor?onó una. . ~/·' que poma enfasis en los puntos unportantes a estudiarse en el capitulo. Revise la :;;)i: .'. :· :)_ts~irpara ver si cree que ha comprendido estos puntos clave. Pai:a estar seguro, debe · /.('.j . ·¡:;oder responder las síguíente preguntas conceptuales:

"'{;¿;i_L:~~:P'.~Z:~~n~a?ó_nd.e

lista

~9:~(-:·:/:::· 1. ¿Por qué es necesario

. r

,

e u .e ir

e, )S

organizar una serte de datos numéricos que recolectamos? . 2. ¿Cuáles son las principales diferencias entre una clasificación ordenada y un diagrama de tallo y hojas? . 3. ¿Bajo qué condiciones es más apropiado construir y usar distribuciones de frecuencia y distribuciones de porcentaje? 4. ¿Cómo difieren los histogramas y los polígonos con respecto a su construcción y uso? S. ¿Cuándo debe construirse y cómo debe usarse una ojiva de porcentaje /~re . . (es decir, un polígono de porcentaje acumulativo)? . ;.:/l~i/\: ., ~- ¿Por qué es la ojiva de porcentaje una herramienta tan útil?· /)',: ·. 7. ¿c;::uál es el propósito de una gráfica digipunto y cómo se construye? ;i:\~~:.>· · 8. ¿Cuáles son algunas de las cuestiones éticas que hay que considerar al .(':··' · · presentar datos numéricos en formato tabular o diagramátíco? ·

. ~\'.;iJ.~=,'·?{:.·_:- ~eVise la lista de preguntas para ver si realmente sabe las respuestas y.p~ede (1) /'.<":-!. . ~hcar sus respuestas a alguien que no leyó este capítulo y (2) dar referencias de

.~~'0;A:L.:)~uras o ejemplos específicos

que respalden su respuesta. Asimismo, vuelva a leer {ij~)i[J:,?t,~q_u.lerade las secciones que pudieron parecerle no muy claras para ver si ahora }~~;,};:,f~~en sentido.

$~F;;_,r,;'.f·Una vez q~le los datos numéricos recolectados han sido presentados en formaWf\7.::::!9.Jáb.ular .Y díagramátíco, como se hizo para Bud Conley de Kalosna Industries,

· .'~!>/}~amos listos para hacer varios análisis. En el siguiente capítulo, se desarrollará - .. . .,~i:}t~~ :variedad de mediciones .de resumen descriptivas útiles para el análisis e ínter':':'JP~.~tación de datos.

·.~h?.:

Presentación de datos numéricos: un repaso y una revisión preliminar

Diagrama de resumen del caplculo 3.

Juntando todo TÉRMINOS CLAVE agrupamientos de clase 62 ancho de intervalo de clase 63 88

clases 63 clasificación ordenada

gráfica digipunto histograma 70

55

límites ele clase

distribuc.ión acumulativa

57

74

distrlbución de frecuencia 62 distribución ele frecuencia relativa

Capítulo 3

forma sin procesar

"basura diagramática"

diagrama ele tallo y hojas SS diagrama de tallo y hojas revisado

94

distribución de porcentaje 79

64

polígono 71 punto medio de clase "o marca de clase" 65 ojiva (polígono acumulativo)

68

Presentación de datos numéricos en tablas y dlagramas

68

54

75

~:···

Problemas de revisión del capítulo

3.67

f.tffo11l·f.i·~ Escriba una carta a un amigo subrayando lo que considera son.las características más interesantes o más importantes de este capítulo. En sus propias palabras, explique la diferencia entre datos sin procesar y una clasificación ordenada. ¿Por qué es ventajoso usar un diagrama de tallo y hojas en vez de una clasificación ordenada? Explique las diferencias entre distribuciones de frecuencia, distribuciones de frecuencia relativa y distribuciones de porcentaje. Al comparar dos o más conjuntos de datos con diferentes tamaños de muestra, ¿por qué es necesario comparar sus distribuciones de frecuencia o de porcentaje relativas? Explique las diferencias entre histogramas, polígonos y ojivas (polígonos

3.68

acumulativos). Explique las diferencias entre diagramas de tallo y hojas y gráficas

3.62

3.63 3.64

3.65 3.66

3.69

dígípunto. Los datos sin procesar mostrados a continuación son los sueldos de inicio de una muestra aleatoria de 100 estudiantes de computación o de sistemas de cómputo que recibieron sus grados de bachillerato durante 1993: Sueldos de inicio ($000)

24.2

29.9

23.4

23.0

25.5

22.0

33.9

20.4

26.6

24.0

23.9 18.6 19.7 25.2 22.1 29.9 32.3 32.3 31.4

22.5 18.S 25.3 25.7 27.S 23.2 20.l 28.1 27.4

18.7

32.6

19.6

24.4 34.2 28.8 25.2 20.8 25.4 25.3 20.6

28.2 32.2 25.8 19.8 26.8 27.S 27.3

26.l 24.8 32.5 24.7 25.6 29.S 26.3 19.3 31.8

26.2 27.8 30.8 18.7 25.2 27.6 21.2 27.4 25.8

26.7 27.6 26.8 20.S 25.2 21.2 19.5 26.4 25.2

24.7 22.1 20.7 25.5 37.3 24.8 25.3 25.9. 26.5

22.Z 20.8 21.2 19.1 18.9 21.3 21.7

20.4 27.2 20.6 25.S 27.9 38.7 22.8 20.9 21.9

34.5 26.8

(a) Acomode los datos sin procesar en un diagrama de tallo y hojas. (Sugerencia: haga que las hojas sean los dígitos díeces.) (b) Acomode los datos en una clasificación ordenada.

3.70

•!.50

l.00 2.00

(e) Forme la distribución de frecuencia y la distribución de porcentaje. (d) Grafique el histograma de porcentaje. (e) Grafique el polígono de porcentaje. (f) Forme la distribución de porcentaje acumulativo. (g) Grafique la ojiva (polígono de porcentaje acumulativo). (h) r.r;a11,,z.1.> Escribaun breve reporte a su decano describiendo los sueldos de inicio de estos graduados recientes. Los siguientes datos son los precios al detalle de una muestra aleatoria de 30 modelos de manómetros manuales de llantas:

6.50 7.50 3.00

2.00 3.00 3.50

2.50 2.00 3.50

4.00 3.00 3.00

3.50 3.50 3.00

S.00 3.50 4.00

3.00 S.00 1.50

S.00 6.00 1.SO

5.50 4.50 2.50

Fnerite: Copyright 1993 por Consumen Union of Uníted States, tnc., Yonkers, N.Y. 10703. Adaptado con permiso de Cons11mer Reports, febrero de 1993, pp. 98-99.

Problemas de revisión del capitulo

3.71

{a) Acomode los datos sin procesar en un diagrama de tallo y hojas. (Sugerencia: haga que las hojas sean los dígitos díeces.) (b) Acomode los datos en una clasificación ordenada, (c) Forme la distribución de frecuencia y la distribución de porcentaje. (d) Graflque el histograma de porcentaje. (e) Grafique el polígono de porcentaje. (f) Forme la distribución de porcentaje acumulativo. (g) Grafique la ojiva (polígono de porcentaje acumulatívo). (h) f.t;MM•I•> Si estuviera considerando comprar un manómetro manual de llantas, ¿qué más desearía saber? Escriba una lista de preguntas que formularía en una tienda de refacciones de automóviles. Los datossíguíentes representan el costo por mes de uso (en dólares) y la calificación de prueba de limpieza (O a 100} de una muestra aleatoria de 39 marcas de pasta de dientes en tubo. ·

Pasta de dientes

Costo por mes

Calificación

.SS .66 1.02 .53 .57 .53 .52 .71

86

Ultra brite Original Gleem Caffree Regular Crest Tartar Control Fresn Mi.nt Gel Colgare Tartar Control Gel Crest Tartar Control Original Ultra brtte Gel Cool Mlnt Colgate Clear Blue Gel Ctest Cool Mint Gel Crest Regular Crest Sparkle Close-Up Tartar Control Gel Close-Up Anti-Plaque Colgate Tartar Control Paste Toni'sof Maine Cinnamint Aquafresh Tartar Control Aím Antí-Tartar Gel Aim Extra-Strength Gel Sllmer Gel Mm & Hammer Baking Soda Fresh Mint Gel Aquafresh Aquafresh Extra Fresh Close-Up Paste TopolSpearment Gel Topol Spearment Close-Up Mint Gel Alm Regular-Strength Gel Pepsodent Colgate Baklng Soda Colgare Regular ColgateJunior Gel Colgare Peak Arm & Hammer Bakíng Soda Presh Mint Rembrandt Sensodyne Original Sensodyne Gel Viadent Original Anti-Plaque Denquel Butler Protect Gel

.SS

.59 .Sl .67 .62 .66 1.07 .80 .79 .44 1.04 1.12 .79 .81 .64 1.77 . 1.32 .64 .55 .3.9 1.22 .74 .4~ .97 1.26 4.73 1.29 1.34 1.40 1.77 1.11

79 77

75 74 72 72 71 70 69 64 63 62 62 62 60 58 57 57 SS

56 53 85 82 76 72

70 58

Sl

50

39

29 28 53 80 48 53 37 20

Fuente: CQpyright 1992 por Consumers Union of United States, Inc., Yonkers,N. Y, 10703. Adaptado con permiso de Consurner Reports, septiembre 1992, pp. 604-605.

96

Capítulo 3

Presentación de datos numéricos en tablas y diagramas

f,:..:·.:··

}•·...·

~.. ...

·~ ~·

I'

.

· .



.

3.72

Bolsa norteamericana

...

(ZS artículos)

l'~i:

s 6.88

~.),,, .. ·

1~~11 ~~ •.

Para cada una de las dos variables numéricas: (a) Forme el diagrama de tallo y bojas. (b) Forme una tabla combinada de distribuciones de frecuencia y de porcentaje. (e) Grafíque el polígono de porcentaje. (d) Forme la distribución de porcentaje acumulativo. (e) Grafique la ojiva de porcentaje. (f) r·t;Ml·M·> Escriba un reporte para su profesor de mercadeo resumiendo sus hallazgos y caracterizando este producto. Dadas las series de datos basadas en el precio de cierre de acciones de muestras aleatorias de 25 artículos negociados en la Bolsa Norteamericana y SO artículos negociados en la Bolsa de Nueva York:

¡,

.

. . ·: ·.: ... . ..

·. ,.

4;,i~:; 3.73

.75 3.88 4.12 11.88 15.88 16.SO 8.75 9.25 7.50 S.38 14.38 2.50 4.88 6.38 33.62 4.88 9.00 2.0Q 20.00 14.25 4.00 15.25 2.38 49.50

Bolsa de Nueva York (SO artículos) $36.50 23.50 8.25 57.SO 27.12 3.75 25.00 15.SO 36.12 6.00 9.12 33.38 .22.50. 8.75 8.62 5.75 21.88 6.12 25.00

15.88 24.00 10.88 18.75 53.88 20.38

.$26.00 19.00 46.00 23.SO 22.62 12.88 5.50 37.50 9.88 59.12 35.25 20.62 24.00

so.so

29.38 3.75 64.75 14.25 46.38 4.75 25.00 35.00 9.00 12.38 31.00

(a) Usando anchos de intervalo de S 10, forme la distribución de frecuenciay la distribuciónde pojcentale para cada serie. (b) Grañque el histogramade frecuencia para cada serie. (e) En una gráfica, grañque el polígono de porcentaje para cada serie. (d) Forme la distribución de porcentaje acumulativo para cada serie. (e) En una gráfica, graflque la ojiva ((polígonode porcentaje acumulativo) para cada serie. . (f) f·MMHt> Escriba un breve reporte a su profesor de finanzas comparando y contrastando las dos series. Una compañia distribuidora de aparatos al por mayor.deseaba estudiar sus cuentas por cobrar de dos meses sucesivos. Se seleccionaron dos muestras independientes de 50 cuentas para cada mes. Los resultados se resumen en Ja tabla siguiente:

Froblemas de revisión del capítulo

Distribución

de frecuencia para cuentas por pagar

Cantidad $0 $2,000 $4,000 $6,000 SS,000 $10,000 Totales

3.74

hasta menos de hasta menos de hasta menos de hasta menos de hasta menos de hasta menos de

Frecuencia de marzo $2,000 $4,000 $6,000 $8,000. $10,000 $12,000

Frecuencia de abril

:.6 .13 17 10 4

-10 14 13

10

o

-º so

~

50

(a) Grafique el histograma de frecuencia para cada mes. (b) En una gráfica, grafique el polígono de porcentaje para cada mes. (e) Forme la distribución de porcentaje acumulativo para cada mes. (d) En una gráfica, grañque la ojiva ((polígono de porcentaje acumulativo) para cada mes. (e) f.r;rnm.r;¡,;. Escriba un breve reporte a su profesor de contabilidad comparando y contrastando las cuentas por cobrar de los dos meses. Usted trabaja como ingeniero de control de calidad en Chrysler Corporation y, en un esfuerzo por mejorar la calidad de los productos de su compañía, desea comparar varias características de diseño de modelos de automóviles

estadounidensesy extranjeros, La siguiente tabla contiene las distribuciones acumulativas y las distribuciones de porcentaje acumulativo de la distancia de frenado (en pies) a 80 mph para una muestra de 25 modelos de automóviles de fabricación estadounidenses y para una muestra de 72 modelos de automóviles de fabricación extranjera obtenidas en un afio reciente.

Distribuciones de frecuencia y de porcentaje acumulativas para la distancia de frenado (en pies) a 80 mph para modelos de automóviles estadounidenses y extranjeros

Distancia

de frenado

(en pies)

Modelos de automóviles estadounidenses Valores indicados "menores que" Número


Modelos de automóviles extranjeros Valores indicados (menores que)

Porcentaje

Número

210 220

o

o.o

o

1

4.0

1

230

2

8.0

3

12.0 16.0

4 19 32

240 250

260

4 8

32.0

270

11

44.0

280

17

68.0

290 300 310

21 23

320

25

84.0 92.0 100.0 100.0

zs

54 61 68 68 70 71 72

Porcentaj e

o.o 1.4 S.6

26.4 44.4 75.0 84.7 94.4 94.4 97.2 98.6 100.0

Fuente:Los datos fueron extraídos de Rolltf & Track, vol. 42, núm. 2 (octubre de 1990), pág. 47.

Basándose en estos datos, responda las siguientes preguntas: (a) ¿Cuántos modelos de automóviles de fabócación estadounidense tienen distancias de frenado de 240 pies o más? (b) ¿Cuál es el porcentaje de automóviles de fabricación estadounidense con distancias de frenado de menos de 260 pies? (c) ¿Qué grupos de modelos de carros, de fabricación estadounidense o extranjera, tienen el alcance más amplio de dístancía de frenado?

98

Capítulo

3

Presentación ele datos numéricos en tablas y diagramas

3.75

(d) ¿Cuántos modelos de automóviles de fabricación extranjera tienen distancias de frenado de entre 260 pies y 269.9 píesdnclusíve)? (e) Use las distribuciones acumulativas para construir las distribuciones de frecuencia y las distribuciones de porcentaje para cada grupo de modelos de automóviles. . (f) En una gráfica, grafíque Ias dos ojivas de porcentaje. (g) r·t!it_l'il·f·I·> Escriba un breve reporte comparando y contrastando la información de distancia de frenado para los dos grupos de modelos de automóviles. . . Usted está empleado como analista de una importante compañía de construcción de edtficios que está interesado en construir un centro comercial ya sea en Centerport o Northport, dos comunidades adyacentes en la costa norte de Long Island en el condado de Suffolk, Nueva York. La siguiente figura contiene los polígonos de frecuencia relativa acumulativa (ojivas) de ingresos familiares de dos muestras aleatorias de ;wo familias extraídas de las dos comunidades .

.;:.·

. .:

·.

Polígonos de frecuencia

. :. ·.-:.~: .

60 90 120 .' ' · Ú1gresos'famíniires (én·$~00) · ·

150

relativa acumulativa de ingresós familiares para dos comunidades.

Con base en estos datos, responda las siguientes preguntas: (a ¿Cuántas de las familias de Centerport tienen ingresos de $120,000 o más? (b) ¿Cuál es el porcentaje de familias de Centerport que tienen ingresos de menos de $90,000? (e) ¿Qué muestra tiene un mayor alcance de ingresos? (d) ¿Cuántas de las familias de Northport tienen un ingreso ele al menos $90,000 pero menos de $105,000? (e) ¿Tiene Centerport Q Northport más ingresos familiares de $60,000 o más? (f) l Qué porcentaje de familias de. Centerport tienen un ingreso menor de $60,000? (g) ¿Qué porcentaje de famílias de Centerport tienen un ingreso mayor de $~.0,000o más? (h) ¿Qué comunidad tiene más ingresos por debajo de $120,000? (i) Use las ojivas para construir la distribución de frecuencia relativa y la distribución de frecuencia para cada comunidad.

Problemas de revisión del capítulo

(j) En una gráfica, grañque los dos polígonos de frecuencia relativa. (k) PJ;il'l!•z.t·~ Escriba un breve reporte comparando y contrastando las dos distribuciones de ingresos. 3.76

Usted trabaja para una agencia consultora independiente contratada por una conocida compañía de bienes raíces especializada en la venta de casas en las Po cono Mountains en el noreste de Pennsylvanía, Sii. tarea es evaluar las tasas· de hipotecas de los propietarios de casas en dos populares comuntdades. La figura siguiente contiene las ojivas de porcentaje de las hipotecas de 100 propietarios de casas muestreados en Penn Estates y 200 propietarios muestreados en Hemlock Farros, dos comunidades de Pocono .

.90 ¡...;...-....;._¡f-:-'--.,..~.,.,...,...~ ~,..,.,.,,,..,,.,;,,.;JF;': =""""-"+'.-M-~ ;--1 soi----+----+----tt-"--~-i-.----+----~-1 701--~--1---.+-----14---..:.-

Ojivas de porcentaje de tasas de hipotecas de 100 propietarios de casas de Penn Estates y 200 de

,_...;,..-"'-4---'--1

:

\\.

Hemlock Farms.

.

'



Basándose en estos datos, responda las síguientespreguntas: (a) ¿Cuál es el alcance de las tasas de hipotecas de los propietarios de casas de Penn Estates? (b) ¿Cuál es el alcance de las tasas de hipotecas de los propietarios de casas de Hemlock Farms? (e) ¿Cincuenta por ciento de los propíetarlos de casas de Penn Estates tenía hipotecas con tasas menores a qué cantidad? (d) ¿Cincuenta por ciento de los propietarios de casas de Hemlock Farms tenía hipotecas con tasas menores a qué cantidad? (e) ¿Qué porcentaje de los propietarios de Penn Estates tenia hipotecas con tasas de al menos 7.5% pero menos de 8%? (f) ¿Qué porcentaje de los propietarios de Hemlock Parrns tenía hipotecas con tasas de menos de 8%? (g) ¿Cuántos de los propietarios de Penn Estates tenían hipotecas con tasas de 8.5% o más? (h) ¿Qué comunidad contiene el mayor porcentaje de propietarios que tenían hipotecas con tasas menores de 7 .25%? (i) Use las ojivas para construir la distribución de porcentaje y la distribución de frecuencia para cada una de las muestras. (j) Grafique los dos polígonos de porcentaje en una gráfica. (k) N!iiliíl·i·I·> Escriba un breve reporte comparando y contrastando sus dos distribuciones. ¿Qué parece ser evidente respecto a las tasas de hipotecas en estas dos comunidades? ¿Qué razón(es) puede(n) atribuirse a esto? (Sugerencia: Una de estas comunidades ha tenido un crecimiento estable durante 20 años: la otra ha crecido rápidamente durante 10 años.)

100

CapituSo 3

Presentación de datos numéricos en tablas y diagramas

3.77

(Proyecto del estudiante) Elija una acción enumerada en la NYSE y, comenzando en un lunes, registre su precio de cierre diario durante un período 'de cuatro semanas completas (20 días) en el que está abierto el mercado de valores. También registre los cambios en el precio de cierre de la sesión de negocios precedente durante este periodo de cuatro semanas. (a) Analice cada serie de datos. (b) ¿Parece haber un patrón en los precios cierre de la acción durante este período? . (e) ¿Parece haber un patrón en los cambios de los precios de cierre con el tiempo? · · (d) H!iillJl·Z·I•> Escriba un memorándum a su profesor de finanzas basándose en sus hallazgos en (b) y (e).

de

..

· . . ..

Proyectos de minicasos de aprendizaje colaborativo Nota: La clase debe dividirse en grupos de tres o cuatro estudiantes. Inicialmente se

selecciona un estudiante pata que sea coordinador del proyecto, otro estudiante es el

que registra el proyecto y un tercero es el cronometrador del proyecto. Para que cada estudiantegane experiencia en el desarrollo del trabajo de equipo y en las habilidades (le liderazgo) después de cada proyecto debe haber una rotacién de posiciones. Al prindpio de cada proyecto, los estudiantes deben trabajár silenciosa e individualmente durante ún corto periodo espectficado. Una vez que cada estudiante ha tenido la oportunidad de estudiar los asuntos y refteiar sus posibles respuestas, el grupo se reúne y se: sigue con una discusión de grupo. Si todos los miembros de un grupo están de acuerdo con las sotudones, el coordinador es responsable de presentar la solución del proyecto del equipo nl instructor con las firmas de los estudiantes indicando tal acuerdo. Por otra parte, si uno o más miembros del equipo no están de acuerdo con la 'solucum ofrecida por la mayoría del equipo) una opinión ele minoríapuede anexarse al proyecto presentado, con fitmats), CL 3.1

CL 3.2

El analista investigador de la compañía de servicios .de asesoría colegial se hirió levemente en un accidente automovílístíco y requiere ayuda para terminar su informe respecto a las colegiaturas cobradas a residentes fuera del estado por colegios y universidades en diferentes regiones del país. Con el fin de cumplir con la fecha límite para una presentación a la junta de directores, el gerente de cornercíalízacíón decide contratar a su grupo, la Corporación , para ayudar al analista investigador en sus esfuerzos. Dado el Conjunto de datos especiales 1 del apéndice D de las páginas D4-DS respecto a las colegiaturas cobradas a residentes fuera del estado en los 90 colegios y universidades del estado de Pennsylvanía, la Corporación está preparada para: (a) Delinear cómo procederán los miembros del grupo con sus tareas. (b) Formar la distribución de frecuencia y de porcentaje en la misma tabla. (c) Graflcar el polígono de porcentaje. (d) Formar la distribución de porcentaje acumulativo. (e) Grafícar la ojiva de porcentaje. (f) Realizar un análisis descriptivo comparando las colegiaturas de Pennsylvanía con las de Texas y Carolina del Norte. (g) Escribir y presentar un resumen ejecutivo, anexando todas las tablas y diagramas. (h) Preparar y ofrecer una presentación oral de diez minutos al gerente de comercialización. Una popular revista familiar interesada en publícar un artículo sobre las virtudes dietéticas (o falta de éstas) de cereales listos para comerse contrata a su grupo, la Corporaclón , para estudiar su costo y características nutrlcíonales, El tema que el artículo trata de presentar es que Jos "cereales listos pata comerse son una forma rápida y eficiente de que la familia comience el día". Contando con el Conjunto de datos especiales 2 del

Problemas de revisión del capitulo

CL 3.3

CL 3.4

apéndice D de las páginas 06-07 que muestra Informaclón útil sobre 84 de estos cereales, la Corporación está preparada para: {a) Delinear cómo procederán los miembros del grupo con sus tareas. (b) Realizar un análisis descríptívo. (c) Escribir y presentar un resumen ej.ecutivo, anexando todas las tablas y diagramas. . . (d) Preparar y ofrecer una presentación oral de diez minutos al editor de comida de la revista. · · El fabricante de conocidas fragancias de hombres y mujeres está planeando desarrollar una nueva línea de productos a comercializarse para la siguiente temporada vacacional. El director de comercialización contrata a su grupo, la Corporación , para estudiar las características de fragancias actualmente, disponibles de manera tal que el fabricante esté en mejor posición de poner precio a su línea de productos recién desarrollada. Contando con el Conjunto de datos especiales 3 del apéndice D de las páginas D8-D9 que muestra información útil sobre 83 de estas fragancias, la Corporación está preparada para: · . {a) Delinear cómo procederán los miembros del grupo consus tareas. (b) Realizar un análisis descriptivo. (c) Escribir y presentar un resumen. ejecutivo, anexando todas Ias tablas y diagramas. (d) · Preparar y ofrecer una presentacíón oral de diez minutos al director de comercialización. Un conocido periódico desea presentar un artículo especial sobre cámaras compactas de 35 mm en su sección dominical de viajes y contrata a su grupo, la Corporación , para realizar un análisis descriptivo respecto a las característlcas de equipos importantes. El tema del artículo que el edítor de viajes desea que se escriba se refiere al "importante valor de las cámaras de 35 mm para los viajes familiares". Contando con el Conjunto de datos especiales 4 del apéndice O de las páginas 010-Dll que muestra información útil sobre 59 de estas cámaras, la Corporación está preparada para: (a) Delinear cómo procederán los miembros del grupo con sus tareas. (b) Realizar un análisis descriptivo. (e) Escribir y presentar un resumen ejecutivo, anexando todas las tablas y diagramas. (d) Preparar. y ofrecer una presentación oral de diez minutos al editor de viajes. .,

Nota Final

tanto, el diagrama de tallo y hojas {revisado) es, esencialmente, una claslñcacíón ordenada, una distribución de frecuencia y un hlstogtama de frecuencia, todos en uno, sln sacrificar la información original relativa a las mismas observaciones individuales.

l. Al final de la sección 3.2 comentamos que el diagrama de tallo y hojas (revisado) es, tal vez, la técnica más versátil en estadística descriptiva porque simultáneamente organiza los datos para análisis descriptivos posteriores y los presenta tanto en forma tabular como diagramática. Por lo

Referencias

l. Charnbers.}. M., W. S. Cleveland, Il. I
Tukey, Graphical Methods for Data Analysis (Boston, MA:

Duxbury Press, 1983). 2. Croxton, F., D. Cowden, y S. Kleln, Applied General Statislics, 3d ed. (Englewood Cliffs, NJ: Prentíce-Hall, 1967).

3. Ehrenberg, A. S. C., "Rudíments of Numeracy", [oumal of the Royal Statistlcel Socíety, Series A, vol. 140 (1977), pp. 277-297. 4. Huff, D., How to Lie with Statistics (Nueva York: W.W. Norton, 1954). S. Hunter, J. S., "The Digidot Plot", The American Statistician, vol. 42 (Febrero. de 1988), p. 54. 6. Kímblc, G. A., How to Use (and Misuse) Statlsucs. (Englewood Cliffs, NJ, Prentíce-Hall,

1978).

7. MlN!TAB ReferenceManual Release 8 (State College, PA:

9. SAS Users Guide Yerslon 6 (Raleígh, NC: SAS Institute, 1988).

10. STATISTIX Version 4.0 (Tallahassee, FL: Analytícal 11.

Software, Inc., 1992.). Tufte, E. R., The Visual Display of QuantitátiveInformation (Cheshire, CT: Graphics Press, 1983).

12. Tufte, E. R., Envisíoning Information (Cheshíre, CT:

Graphlcs Press, 1990). 13. Tukey, J., Exploratory DataAnalysls (Rcadíng, MA:

Addlson-Wesley, 1977). 14. Vellernan, P. F., and D. C. Hoaglin, Applications, Bastes, and Computing o( Exploratory Data Analysis (Boston, MA: Duxbury Press, 1981). 15. Wainer, H., "How to Display Data Badly," The American Statístidan, vol. ·3g (mayo 1984), pp. 137-147.

Mlnitab, Inc., 1992).

8. Norusls, M., SPSS Guide to Data Anulysis [or SPSS-X with Addittona! Instructions for SPSS/PC+ (Chicago, ll.: SPSS Inc., 1986).

102

capítulo 3

Presentación de datos numéricos en tablas y diagramas

·

l

:~.

1

l ¡ j

1

More Documents from "Nestor Paul"