Apostila De Estatistica

  • Uploaded by: Rinaldo Francisco
  • 0
  • 0
  • February 2021
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Apostila De Estatistica as PDF for free.

More details

  • Words: 9,739
  • Pages: 42
Loading documents preview...
INSTITUTO CASTRO ALVES

DISCIPLINA

Carga Horária: h

PROFESSORA: LAURINÉSIA DE SOUSA TIGRE ALUNO:.................................................................................................................

TUCUMÃ - PA PÓLO

1 [email protected]

INSTITUTO CASTRO ALVES APRESENTAÇÃO Estatística é uma ciência cujo campo de aplicação estende-se a muitas áreas do conhecimento humano. Entretanto, um equívoco comum que nos deparamos nos dias atuais é que, em função da facilidade que o advento dos computadores nos proporciona, permitindo desenvolver cálculos avançados e aplicações de processos sofisticados com razoável eficiência e rapidez, muitos pesquisadores consideram-se aptos a fazerem análises e inferências estatísticas sem um conhecimento mais profundo dos conceitos e teorias. Tal prática, em geral, culmina em interpretações equivocadas e muitas vezes errôneas... Em sua essência, a Estatística é a ciência que

apresenta

processos

próprios

para

coletar,

apresentar

e

interpretar

adequadamente conjuntos de dados seja eles numéricos ou não. Pode- se dizer que seu objetivo é o de apresentar informações sobre dados em análise para que se tenha maior compreensão dos fatos que os mesmos representam. A Estatística subdivide-se em três áreas: descritiva, probabilística e inferencial. A estatística descritiva, como o próprio nome já diz, se preocupa em descrever os dados. A estatística inferencial, fundamentada na teoria das probabilidades, se preocupa com a análise destes dados e sua interpretação. A palavra estatística tem mais de um sentido. No singular se refere à teoria estatística e ao método pelo qual os dados são analisados enquanto que, no plural, se refere às estatísticas descritivas que são medidas, obtidas de dados selecionados. A estatística descritiva, cujo objetivo básico é o de sintetizar uma série de valores de mesma natureza, permitindo dessa forma que se tenha uma visão global da variação desses valores, organiza e descreve os dados de três maneiras: por meio de tabelas, de gráficos e de medidas descritivas.

2 [email protected]

INSTITUTO CASTRO ALVES OBJETIVOS: A Estatística para Administração visa proporcionar ao acadêmico de Administração o conhecimento de técnicas estatísticas para análise descritiva de dados, bem como proporcionar o instrumental necessário para análise inferencial. Onde ela objetiva: Proporcionar ao aluno o conhecimento de técnicas estatísticas para análise descritiva de dados, bem como proporcionar o instrumental necessário para análise inferencial; Adquirir conceitos gerais de matemática e de técnicas operatórias com vistas à sua utilização em estatística; Adquirir conceitos básicos em estatística para análise e interpretação de conjuntos de dados experimentais, mediante estudo de elementos de probabilidade e de procedimentos de inferência estatística; Abordar métodos estatísticos; Compreender noções elementares; Construir distribuição de frequências, apresentá-las em tabelas e gráficos, calcular e interpretar medidas descritivas; Conhecer os conceitos básicos da teoria da probabilidade e aplicar a distribuição normal; Conhecer os vários tipos de amostragem e escolher amostras representativas da população; Fazer estimativas por intervalo dos parâmetros populacionais com base em amostras; Estabelecer testes de hipóteses para parâmetros; Público Alvo: Alunos do curso de Bacharel em Administração. Disciplina: Estatística Ementa: Estatística descritiva e inferencial aplicada à Administração.

3 [email protected]

INSTITUTO CASTRO ALVES METODOLOGIA APLICADA Trabalhar o conteúdo de forma prática e com exemplos relacionados com a realidade diária de todos, realizando a interpretação de tabelas, gráficos, bem como sua construção e entender claramente sua finalidade; Buscar entender a importância e a relação que a estatística tem no dia-a-dia bem como no curso e consequentemente no mercado de trabalho vinculado à administração; Confeccionar gráficos, tabelas e fórmulas através da planilha eletrônica (Excel), ou seja, aulas práticas no laboratório de informática; Exposição de trabalhos e análises; Atividades avaliativas como lista de exercícios e trabalhos descritivos; Proporcionar ao aluno discussões, interações com a turma concebendo ao mesmo a liberdade de expor suas opiniões como também suas dúvidas; 6. AVALIAÇÃO: A avaliação da aprendizagem será de forma que o educando demonstre conhecimento dos conteúdos ministrados na disciplina, saiba se comunicar de forma clara e adequada dentro do contexto e aplique seus conhecimentos na resolução de pesquisas e/ou situações-problemas. Será realizada de forma contínua, durante as atividades em sala de aula, e participação individual, bem como, lista de exercícios e trabalhos de pesquisa e interpretação. Estas atividades avaliativas serão na maioria das vezes individuais, porém não descartando a possibilidade de trabalhos em grupo quando houver a necessidade de uma discussão mais aprofundada sobre o tema estipulado.

4 [email protected]

INSTITUTO CASTRO ALVES INTRODUÇÃO

Desde a Antiguidade vários povos já registravam o número de habitantes, de nascimento, de óbitos, faziam estimativas das riquezas individual e social, distribuíam equitativamente terras ao povo, cobravam impostos e até realizavam inquéritos quantitativos por processos que, hoje, se chama de Estatística. A palavra ―Estatística‖ vem de status, que significa em latim Estado. Com essa palavra faziam-se as descrições e dados relativos aos Estados, tornando a Estatística um meio de administração para os governantes. Mais recentemente se passou a falar em estatística em várias ciências de todas as áreas do conhecimento humano, onde pode definir a Estatística como ―um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos‖. Ao se estudar os fenômenos coletivos, o que interessa são os fatos que envolvem os elementos desses fenômenos, como eles se relacionam e qual o seu comportamento. Para que tal estudo possa acontecer com toda a seriedade que a ciência exige, é necessário que o levantamento seja feito através de uma pesquisa científica, sendo ela definida como a realização concreta de uma investigação planejada, desenvolvida e redigida de acordo com as normas de metodologia. A Estatística é muito mais do que a simples construção de gráficos e o cálculo de médias. As informações numéricas são obtidas com a finalidade de acumular informação para a tomada de decisão. Então, a estatística pode ser vista como um conjunto de técnicas para planejar experimentos, obter dados e organizá-los, resumi-los, analisá-los, interpretá-los e deles extrair conclusões. A informação de estatística é apresentada constantemente no rádio e na televisão, como por exemplo, a coleta de dados sobre nascimentos e mortes, a avaliação da eficiência de produtos comerciais e a previsão do tempo. As técnicas clássicas da estatística foram delineadas para serem as melhores possíveis sob-rigorosas suposições. Entretanto, a experiência tem forçado os estudiosos a conhecer que as técnicas clássicas comportam-se mal quando situações práticas não apresentam o ideal descrito por tais suposições. O 5 [email protected]

INSTITUTO CASTRO ALVES desenvolvimento recente de métodos exploratórios robustos está aumentando a eficiência da análise estatística. Os bons profissionais de estatística têm sempre olhado com detalhes os dados antes de levantar suposições estatísticas e testes de hipóteses. Mas o uso indiscriminado de pacotes estatísticos computacionais, sem o exame cuidadoso dos dados profissionais da área, conduz, às vezes, a resultados aberrantes. A análise exploratória de dados nos fornece um extenso repertório de métodos para um estudo detalhado dos dados, antes de adaptá-los. Nessa abordagem, a finalidade é obter dos dados a maior quantidade possível de informação, que indique modelos plausíveis a serem utilizados numa fase posterior, a análise confirmatória de dados ou inferência estatística. ESTATÍSTICA

DEFINIÇÕES BÁSICAS

ÁREAS DA ESTATÍSTICA Se entender Estatística como a Ciência dos Dados, será de grande valia o domínio que seu corpo de conhecimento pode oferecer. Primeiramente, como ponto de partida, pode-se dividir a Estatística em duas áreas: 

Descritiva



Inferencial (Indutiva)

Obs. Alguns autores, como por exemplo, Marcos Nascimento Magalhães e Antonio Carlos Pedroso de Lima, dizem que a estatística, grosso modo, pode ser dividida em três áreas: Estatística descritiva; Probabilidade e Inferência estatística. ESTATÍSTICA DESCRITIVA A Estatística Descritiva se preocupa com a organização, apresentação e sintetização de dados. Utilizam gráficos, tabelas e medidas descritivas como ferramentas. Utilizada na etapa inicial da análise, destinada a obter informações que indicam possíveis modelos a serem utilizados numa fase final que seria a chamada inferência estatística. 6 [email protected]

INSTITUTO CASTRO ALVES ESTATÍSTICA INFERENCIAL A Estatística Inferencial postula um conjunto de técnicas que permitem utilizar dados oriundos de uma amostra para generalizações sobre a população. Constitui esse conjunto de técnicas: a determinação do número de observações (tamanho da amostra); o esquema de seleção das unidades observacionais; o cálculo das medidas estatísticas; a determinação da confiança nas estimativas; a significância dos testes estatísticos; a precisão das estimativas; dentre outras. Essa generalização é feita a partir do processo de estimação das medidas estatísticas que podem ser calculadas, porém não sem antes se antecipar um grau de certeza de que a amostra esteja fornecendo os dados que seriam de se esperar caso toda a população fosse estudada. Nesse caso, o ramo da matemática que será utilizado para se avaliar tal grau de certeza é a probabilidade. Com ela teremos condições de mensurar a fidedignidade de cada inferência feita com base na amostra. Antes de começar a estudar os métodos estatísticos que permitirá analisar dados, sejam eles qualitativos ou quantitativos, é importante introduzir alguns conceitos preliminares a fim não apenas de dar nomes aos instrumentos, mas também adequar e equalizar a terminologia a ser utilizada ao longo do curso. MÉTODO ESTATÍSTICO

Método é o conjunto de procedimentos dispostos ordenadamente para se chegar a um desejado fim. Método Estatístico: diante da impossibilidade de manter as causas constantes, registram-se os resultados dessas variações procurando determinar a influência (os efeitos) de cada uma delas. FASES DO MÉTODO ESTATÍSTICO Podemos distinguir no método estatístico as seguintes fases:

7 [email protected]

INSTITUTO CASTRO ALVES COLETA DE DADOS Toda e qualquer ação estatística deve estar centrada em objetivos claros. O primeiro passo para um procedimento estatístico é o trabalho que envolve os dados de um estudo. Estando estes objetivos definidos, buscam-se os dados que os satisfaçam, sejam eles primários ou secundários. Dados primários são aqueles que foram prospectados sem que não tenha havido um estudo preliminar acerca da amostra em específico, ou seja, são dados originais. Dados secundários são aqueles que estão a nossa disposição oriunda de outros estudos. São fontes de dados secundários; Internet, bancos de dados, cadastros, jornais, revistas, filmes, entre muitas outras fontes. MÉTODOS DE COLETA DE DADOS A matéria prima para os estudos estatísticos são os dados de observação, tratandose dos valores que são adicionados às características. Os dados de observação são oriundos de várias fontes, podendo ser coletados de duas formas: -Enumeração: referentes a uma variável discreta; -Mensuração: referentes a uma variável contínua. A coleta de dados numéricos pode ser direta ou indireta. A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos, casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes aos prontuários dos alunos de uma faculdade ou, ainda, quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionários, como é o caso das notas de verificação e de exames, do censo demográfico etc. A coleta direta de dados pode ser classificada relativamente ao fator tempo em: a) contínua (registro) – quando feita continuamente, tal como a de nascimentos e óbitos e a de frequência dos alunos às aulas;

8 [email protected]

INSTITUTO CASTRO ALVES b) periódica – quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) e as avaliações periódicas dos alunos; c) ocasional – quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemias que assolam ou dizimam rebanhos inteiros. A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta. Nos estudos que são realizadas coletas de dados contínuas ou periódicas o interesse é a enumeração total. A estatística participa apenas no seu aspecto descritivo de apresentação de dados. Os dados são obtidos pelo próprio pesquisador, utilizando dados já existentes (dados secundários) ou através de levantamentos (dados primários) e experimentos. O pesquisador pode querer descrever o conjunto, mas o mais comum é ele querer fazer inferências a partir de amostras do total. Dessa forma a estatística participa no processo de fazer a inferência e planejar como a mesma será realizada. Nos levantamentos, como os utilizados nas pesquisas de saúde pública, a estatística indica a forma de amostragem que permite uma inferência sobre o todo. Nos experimentos ela fornece o delineamento mais adequado em cada estudo. Qualquer que seja a forma de obtenção de dados eles estarão no final do trabalho, desorganizados. Para que esses dados tenham um valor informativo (sobre o assunto investigado), deverão ser apresentados de forma concisa e compreensível, satisfazendo a dúvida. Os

estudos

estatísticos

estão

relacionados

às

situações

que

envolvem

planejamentos, coleta de dados, organização de informações, análise das informações coletadas, interpretação e divulgação de forma clara e objetiva. Os métodos de pesquisas podem ser classificados de duas formas: pesquisas de opinião ou pesquisas de mercado. Nas pesquisas de opinião, o objetivo principal é colher informações sobre determinando assunto com base em entrevistas pessoais.

9 [email protected]

INSTITUTO CASTRO ALVES CRÍTICA DOS DADOS Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo vulto, que possam influir sensivelmente nos resultados. A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas; é interna quando visa observar os elementos originais dos dados da coleta. APURAÇÃO DOS DADOS Nada mais é do que a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Pode ser manual, eletromecânica ou eletrônica. EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS Por mais diversa que seja a finalidade que se tenham em vista, os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico e ulterior obtenção de medidas típicas. ANÁLISE DOS RESULTADOS Como já dissemos, o objetivo último da Estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as fazes anteriores (Estatística Descritiva), fazemos uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões.

10 [email protected]

INSTITUTO CASTRO ALVES POPULAÇÃO E AMOSTRA Na terminologia estatística, o grande conjunto de dados que contém a característica que temos interesse recebe o nome de população. Esse termo refere-se não somente a uma coleção de indivíduos, mas também ao alvo sobre o qual reside nosso interesse. Assim, nossa população pode ser tanto todos os habitantes de Londrina como todas as lâmpadas produzidas por uma fábrica em certo período de tempo. Algumas vezes podemos acessar toda a população para estudarmos características de interesse, mas, em muitas situações, tal procedimento não pode ser realizado. Em geral, razões econômicas são determinantes dessas situações. Por exemplo, uma empresa, usualmente, não dispõe de verba suficiente para saber o que pensam todos os consumidores de seus produtos. Há ainda razões éticas, quando, por exemplo, os experimentos de laboratório que envolve o uso de seres vivos. Além disso, existem casos em que a impossibilidade de se acessar toda a população de interesse é incontornável. Por exemplo, em um experimento para determinar o tempo de funcionamento das lâmpadas produzidas por uma indústria, não podemos observar toda a população de interesse. Tendo em vista as dificuldades de várias naturezas para se observar todos os elementos da população, tomaremos alguns deles para formar um grupo a ser estudado. Este subconjunto da população, em geral com dimensão menor, é denominado amostra. POPULAÇÃO População é a totalidade de pessoas, animais, plantas ou objetos, da qual se podem recolher dados. É um grupo de interesse que se deseja descrever ou acerca do qual se deseja tirar conclusões. AMOSTRAS Amostra é um subconjunto de uma população ou universo. A amostra deve ser obtida de uma população específica e homogênea por um processo aleatório. A aleatorização é condição necessária para que a amostra seja representativa da população. 11 [email protected]

INSTITUTO CASTRO ALVES É importante que o investigador defina cuidadosa e completamente a população antes de recolher a amostra, incluindo uma descrição dos membros que devem ser incluídos. Para cada população, há muitas amostras possíveis e qualquer delas deve fornecer informação dos parâmetros da população correspondente. É importante definir os critérios que permitem determinar se um indivíduo pertence ou não à população em estudo. Para isso, define-se conceptualmente a população (ex. hipertensos). Falta ainda saber o que se entende por "hipertenso". Este é o critério operacional que vai permitir saber quem pertence à população. Tem de ficar bem definido quem é hipertenso. As amostras devem ser obtidas por métodos aleatórios, sempre que se pretende tirar conclusões sobre a população, mas muitas vezes são obtidas por métodos não aleatórios. VARIÁVEL Variável é o conjunto de resultados possíveis de um fenômeno. A variável pode ser qualitativa, quando seus valores são expressos por atributos (ex: sexo, cor), ou pode ser quantitativa, quando seus valores são expressos em números. A variável quantitativa pode ser contínua, quando assume qualquer valor entre dois limites (ex: peso, altura, medições), ou pode ser discreta, quando só pode assumir valores pertencentes a um conjunto enumerável (ex: número de filhos, contagens em geral, números inteiros). AMOSTRAGEM É o processo de colher amostras. Nesse processo, cada elemento da população passa a ter a mesma chance de ser escolhido. Dentre os processos de amostragem podem-se destacar três: amostragem casual ou aleatória simples, amostragem proporcional estratificada e amostragem sistemática.

12 [email protected]

INSTITUTO CASTRO ALVES TIPOS DE AMOSTRAGENS a) Amostragem casual ou aleatória simples: Em um sorteio, por exemplo, para retirar uma amostra de 9 alunos de uma sala de 90 alunos, utiliza-se um sorteio com todos os números dos alunos escritos em papéis dentro de um saco. Para amostras grandes utiliza-se a Tabela de Números Aleatórios. Ex: Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90 alunos de uma escola: 1º - numeramos os alunos de 1 a 90. 2º - escrevemos os números dos alunos, de 1 a 90, em pedaços iguais de papel, colocamos na urna e após mistura retiramos, um a um, nove números que formarão a amostra. OBS: quando o número de elementos da amostra é muito grande, esse tipo de sorteio torna-se muito trabalhoso. Neste caso utiliza-se uma Tabela de números aleatórios, construída de modo que os algarismos de 0 a 9 são distribuídos ao acaso nas linhas e colunas. b) Amostragem proporcional estratificada: É comum termos populações que se dividam em subpopulações (estratos) e como cada estrato pode ter um comportamento diferente do outro, a amostra deve considerar a existência desses estratos e a sua proporção em relação à população. Ex: Vamos obter uma amostra proporcional estratificada, de 10%, do exemplo anterior, supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. São, portanto dois estratos (sexo masculino e sexo feminino). Logo, temos: SEXO

POPULACÃO

10 %

AMOSTRA

MASC.

54

5,4

5

FEMIN.

36

3,6

4

Total

90

9,0

9

Numeramos então os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90, meninas e procedemos ao sorteio casual com urna ou tabela de números aleatórios. 13 [email protected]

INSTITUTO CASTRO ALVES c) Amostragem sistemática É quando a amostragem é feita através de um sistema possível de ser aplicado, pois a população já se encontra ordenada. Ex: Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra formada por 50 casas para uma pesquisa de opinião. Podemos, neste caso, usar o seguinte procedimento: como 900/50 = 18, escolhemos por sorteio casual um número de 01 a 18, o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18. Assim, suponhamos que o número sorteado fosse 4 a amostra seria: 4ª casa, 22ª casa, 40ª casa, 58ª casa, 76ª casa, etc.

d) Amostragem por conglomerados (ou agrupamentos)

Algumas populações não permitem, ou tornam extremamente difícil que se identifiquem seus elementos. Não obstante isso, pode ser relativamente fácil identificar alguns subgrupos da população. Em tais casos, uma amostra aleatória simples desses subgrupos (conglomerados) pode se colhida, e uma contagem completa deve ser feita para o conglomerado sorteado. Agrupamentos típicos são quarteirões, famílias, organizações, agências, edifícios etc. Ex: Num levantamento da população de determinada cidade, podemos dispor do mapa indicando cada quarteirão e não dispor de uma relação atualizada dos seus moradores. Pode-se, então, colher uma amostra dos quarteirões e fazer a contagem completa de todos os que residem naqueles quarteirões sorteados.

e) Amostragem acidental

Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis de se obter até completar o número de elementos da amostra. Geralmente utilizada em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos. Ex: Pesquisas de opinião em praças públicas, ruas de grandes cidades;

14 [email protected]

INSTITUTO CASTRO ALVES f) Amostragem intencional

De acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que irão compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião. Ex: Numa pesquisa sobre preferência por determinado cosmético, o pesquisador se dirige a um grande salão de beleza e entrevista as pessoas que ali se encontram

g) Amostragem por quotas

Um dos métodos de amostragem mais comumente usados em levantamentos de mercado e em prévias eleitorais. Ele abrange três fases: 1ª - classificação da população em termos de propriedades que se sabe, ou presume, serem relevantes para a característica a ser estudada; 2ª - determinação da proporção da população para cada característica, com base na constituição conhecida, presumida ou estimada, da população; 3ª - fixação de quotas para cada entrevistador a quem tocará a responsabilidade de selecionar entrevistados, de modo que a amostra total observada ou entrevistada contenha a proporção e cada classe tal como determinada na 2ª fase. Ex:

Numa pesquisa sobre o "trabalho das mulheres na atualidade", provavelmente

se terá interesse em considerar: a divisão cidade e campo, a habitação, o número de filhos, a idade dos filhos, a renda média, as faixas etárias etc. A primeira tarefa é descobrir as proporções (porcentagens) dessas características na população. Imagina-se que haja 47% de homens e 53% de mulheres na população. Logo, uma amostra de 50 pessoas deverá ter 23 homens e 27 mulheres. Então o pesquisador receberá uma "quota" para entrevistar 27 mulheres. A consideração de várias categorias exigirá uma composição amostral que atenda ao n determinado e às proporções populacionais estipuladas.

Quatro razões para uso de amostragem em levantamentos de grandes populações. 1) Economia. Em geral, torna-se bem mais econômico o levantamento de somente uma parte da população; 15 [email protected]

INSTITUTO CASTRO ALVES 2) Tempo. Numa pesquisa eleitoral, a três dias de uma eleição presidencial, não haveria tempo suficiente para pesquisar toda a população de eleitores do país, mesmo que houvesse recursos financeiros abundantes; 3) Confiabilidade dos dados. Quando se pesquisa um número reduzido de elementos, pode-se dar mais atenção aos casos individuais, evitando erros nas respostas; 4) Operacionalidade. É mais fácil realizar operações de pequena escala. Um dos problemas típicos nos grandes censos é o controle dos entrevistados. Três situações em que pode não valer a pena a realização de uma amostragem: 1. População pequena: Sobre o enfoque de amostragens aleatórias que estudaremos neste capítulo, se a população for pequena (digamos, de 50 elementos) para termos uma amostra capaz de gerar resultados precisos para os parâmetros da população, necessitamos de uma amostra relativamente grande (em torno de 80% da população). Geralmente é mais relevante o tamanho absoluto da amostra do que a porcentagem que ela representa na população. Voltemos à situação de verificar tempero de um alimento em preparação. Desde que o alimento esteja bem mexido, uma amostra de uma colher é suficiente, independente de estarmos preparando uma pequena ou uma grande quantidade de alimento. 2. Característica de fácil mensuração: Talvez a população não seja tão pequena, mas a variável que se queira observar é de tão fácil mensuração, que não compensa investir num plano de amostragem. Por exemplo, para verificar a porcentagem de funcionários favoráveis à mudança de horário de um turno de trabalho, podemos entrevistar toda a população no próprio local de trabalho. Essa atitude pode também ser politicamente, mais recomendável. 3. Necessidade de alta precisão: A cada dez anos o IBGE realiza um censo demográfico para estudar diversas características da população brasileira. Dentre essas características, tem-se o parâmetro número de habitantes residentes no país, que é fundamental para o planejamento do país. Desta forma, o parâmetro 16 [email protected]

INSTITUTO CASTRO ALVES número de habitantes precisa ser avaliado com grande precisão e, por isto, se pesquisa toda a população. Para fazermos um plano de amostragem devemos ter bem definidos os objetivos da pesquisa, a população a ser mostrada, bem como os parâmetros que precisamos estimar para atingir aos objetivos da pesquisa. Num plano de amostragem deve constar a definição da unidade de amostragem, a forma de seleção dos elementos da população e o tamanho da amostra. Os parágrafos seguintes tentam esclarecer melhor estes termos. Para efetuar a seleção dos elementos que farão parte da amostra, precisamos estabelecer a unidade de amostragem, ou seja, a unidade a ser selecionada para se chegar aos elementos da população. As unidades de amostragem podem ser os próprios elementos da população, ou, outras unidades que sejam mais fáceis de serem selecionadas e que, de alguma forma, estejam associadas aos elementos da população. Por exemplo, numa população de famílias moradoras de certa cidade, podemos planejar a seleção de domicílios residenciais da cidade. Chegando ao domicílio (unidade de amostragem), podemos chegar à família moradora deste domicílio (elemento da população). A seleção dos elementos que farão parte da amostra pode ser feita sob alguma forma de sorteio. São as chamadas amostragens aleatórias. Estas são particularmente interessantes por permitirem a utilização das técnicas clássicas de inferência estatística, facilitando a análise dos dados e fornecendo maior segurança ao generalizar resultados da amostra para a população. SÉRIES ESTATÍSTICAS TABELAS A tabela é um quadro que resume um conjunto de observações. Compõe-se de: _ corpo: linhas e colunas que contém os valores das variáveis em estudo. _ cabeçalho: parte superior que especifica o conteúdo das colunas. _ coluna indicadora: coluna que indica o conteúdo das linhas. _ casa ou célula: espaço destinado a uma só informação. 17 [email protected]

INSTITUTO CASTRO ALVES _ título: conjunto de informações sobre a tabela (O quê? Quando? Onde?) localizada no topo da tabela. Normas para células _ usar um traço horizontal (—) quando o valor é nulo quanto à natureza das coisas ou resultado do inquérito. _ três pontos (: : :) quando não temos dados. _ um ponto de interrogação (?) quando temos dúvida quanto à exatidão do valor. _ zero (0; 0,0; 0,00) quando o valor é muito pequeno para ser expresso pela grandeza utilizada. Série estatística é toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local, ou da espécie. Pode-se classificar em: histórica, geográfica, específica. a) Séries históricas (cronológicas, temporais) - descrevem os valores da variável, em determinado local, em função do tempo. b) Séries geográficas (espaciais, territoriais ou de localização) - descrevem os valores da variável, em um determinado instante, em função da região. c) Séries Específicas (categóricas) - descrevem os valores da variável, em um determinado instante e local, segundo especificações. SÉRIES CONJUGADAS E TABELA DE DUPLA ENTRADA Muitas vezes temos necessidade de apresentar, em uma única tabela, a variação de valores de mais de uma variável, isto é, fazer uma conjugação de duas ou mais séries. Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificação: uma horizontal (linha) e uma vertical (coluna).

18 [email protected]

INSTITUTO CASTRO ALVES DADOS ABSOLUTOS E DADOS RELATIVOS Dados Absolutos são dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação se não a contagem ou medida. A leitura dos dados absolutos é sempre enfadonha e inexpressiva; embora esses dados traduzam um resultado exato e fiel, não têm a virtude de ressaltar de imediato as suas conclusões numéricas. Daí o uso imprescindível que faz a Estatística dos dados relativos. O número de vezes que um valor da variável, de uma pesquisa, é citado representa a frequência absoluta daquele valor. Dados Relativos são os resultados de comparações por quociente (razões) que se estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades. Traduzem-se os dados relativos, em geral, por meio de percentagens, índices, coeficientes e taxas. A frequência relativa é o quociente entre a frequência absoluta de uma variável e o total de citações de todas as variáveis da pesquisa.

GRÁFICO ESTATÍSTICO O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à compreensão do que as séries. O gráfico é um instrumento que possibilita transmitir muitas vezes o significado de planilhas ou tabelas complexas de uma forma mais eficiente e mais simples. Não adianta você saber efetuar a confecção de um gráfico se não souber a que finalidade se destina determinado gráfico. Desta forma você correrá o risco de apresentar um gráfico que não seja adequado a uma determinada situação. O gráfico apresenta de forma detalhada, a elaboração e utilização do fichário-imagem. Uma representação gráfica tem por objetivo fazer aparecer às relações

que

existem

entre

elementos que

são

representados

prévia

e

rigorosamente de modo a garantir a monossemia que envolve a "Graphique". O exemplo utilizado é o de uma cooperativa com diferentes tipos de informações que foram representadas na forma gráfica com o auxílio do fichário-imagem.

19 [email protected]

INSTITUTO CASTRO ALVES Para se criar um gráfico é preciso primeiro conhecer o tipo de informação que se deseja transmitir, pois um gráfico poderá informar de forma visual as tendências de uma série de valores em relação a um determinado espaço de tempo, a comparação de duas ou mais situações e muitas outras. Cada tipo de gráfico é adequado para uma diferente situação a ser analisada. Se um gráfico for definido de forma incorreta, poderá ocorrer a análise errada de uma situação, causando uma série de interpretações distorcidas do assunto em questão, tornando desta forma o desenho do gráfico sem qualquer efeito aproveitável. Para tornarmos possível uma representação gráfica, estabelecemos uma correspondência entre os termos da série e determinada figura geométrica, de tal modo que cada elemento da série seja representado por uma figura proporcional. A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais para ser realmente útil: ASPECTOS BÁSICOS a) Simplicidade: O gráfico deve ser destituído de detalhes de importância secundária, assim como de traços desnecessários que possam levar o observador a uma análise morosa ou com erros; b) Clareza: O gráfico deve possibilitar uma interpretação correta dos valores representativos do fenômeno em estudo; c.)Veracidade: O gráfico deve expressar a verdade sobre o fenômeno em estudo, ou seja, cálculos devem coincidir com as marcações. TIPOS DE GRÁFICOS DIAGRAMAS Os diagramas são gráficos geométricos de, no máximo, duas dimensões; para sua construção, em geral, faz-se uso do sistema cartesiano. Dentre os principais diagramas, destacamos:

20 [email protected]

INSTITUTO CASTRO ALVES

GRÁFICO EM LINHA OU EM CURVA São ideais para ilustrar tendências em dados que ocorrem ao longo do tempo. Esse tipo de gráfico se utiliza da linha poligonal

para

representar

a

série

estatística. Constitui uma aplicação do processo de construção do gráfico de uma função no sistema de coordenadas cartesianas. GRÁFICO EM COLUNAS OU EM BARRAS É a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras).Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. Quando em barras, os retângulos têm a mesma altura e os Comprimentos são proporcionais aos respectivos dados. Desse modo, estamos garantindo a proporcionalidade entre as áreas dos retângulos e os dados estatísticos. a) Gráfico em colunas Estado Cívil (Estudo efectuado a 20 portugueses, com mais de 18 anos de idade)

demonstrar a projeção dos valores de vendas de

12 N.º de pessoas

O gráfico em questão terá a finalidade de

10

diversos produtos durante o primeiro trimestre de

8 6

um determinado ano em relação à taxa de

4 2 0

Solteiro

Casado

Viúvo

Divorciado

projeção aplicada a cada mês.

Estado Cívil

b)Gráfico em barras As Categorias são organizadas verticalmente, para focalizar a comparação de valores. São usualmente bem ilustrados num simples gráfico de barras onde a altura

da

barra

é

igual

à

frequência.

Dados

qualitativos, particularmente quando as categorias são ordenadas, Gráficos de barras empilhadas mostram o relacionamento de itens individuais com o todo. 21 [email protected]

INSTITUTO CASTRO ALVES

c) Gráfico em colunas ou em barras múltiplas

90 80 70 60 50 40 30 20 10 0

Esse tipo de gráfico é geralmente empregado quando queremos representar, simultaneamente, Norte Sul Sudeste

2003

2004

2005

dois

ou

mais

fenômenos

estudados

como

propósito de comparação.

2006

GRÁFICOS EM SETORES Esse gráfico é construído com base em um círculo,

e

é

empregado

sempre

que

desejamos ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. Obtemos cada setor por meio de regra de três simples e direta, lembrando que o total da série corresponde a

360°.Os

setores

do

gráfico

são

desenhados de tal forma que eles tenham área proporcional à frequência. DISTRIBUIÇÃO DE FREQÜÊNCIA DADOS BRUTOS Realizada a coleta dos dados, os dados são chamados de dados brutos, pois logo após a coleta, os dados podem estar numericamente desorganizados, por isso são chamados de dados brutos. Um exemplo seria o conjunto dos valores de temperaturas de uma região coletados ao longo do dia. Assim, o conjunto dos valores de temperatura foi coletado sem qualquer preocupação com a sua ordenação. 22 [email protected]

INSTITUTO CASTRO ALVES TABELA PRIMITIVA Vamos considerar a forma pela qual podemos descrever os dados estatísticos resultantes de variáveis quantitativas, como é o caso de notas obtidas pelos alunos de uma classe, estaturas de um conjunto de pessoas, salários recebidos pelos operários de uma fábrica etc. Suponhamos termos feito uma coleta de dados relativos às estaturas de quarenta alunos, que compõem uma amostra dos alunos de um colégio A, resultando a seguinte tabela de valores: TABELA 1 ESTATURAS DE 40 ALUNOS DA FACULDADE A 166

160

161

150

162

160

165

167

164

160

162

168

161

163

156

173

160

155

164

168

155

152

163

160

155

155

169

151

170

164

154

161

156

172

153

157

156

158

158

161

A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva. ROL Rol é a listagem dos dados numéricos brutos dispostos em uma determinada ordem, crescentes ou decrescentes. Assim, pode-se saber qual a maior e a menor temperatura da ambiente. A disposição dos dados em ordem crescente ou decrescente permite que se calcule a diferença entre o maior e o menor valor, a qual é chamada de amplitude total dos dados.TABELA 2 ESTATURAS DE 40 ALUNOS DA FACULDADE A 150

154

155

157

160

161

162

164

166

169

151

155

156

158

160

161

162

164

167

170

152

155

156

158

160

161

163

164

168

172

153

155

156

160

160

161

163

165

168

173 23

[email protected]

INSTITUTO CASTRO ALVES Agora, podemos saber, com relativa facilidade, qual a menor estatura (173 cm); que a amplitude de variação foi de 173 – 150 = 23 cm; e, ainda, a ordem que um valor particular da variável ocupa no conjunto. Com um exame mais acurado, vemos que há uma concentração das estaturas em algum valor entre 160 cm e 165 cm e, mais ainda, que há poucos valores abaixo de 155 cm e acima de 170 cm. TABELA DE FREQUÊNCIA OU DISTRIBUIÇÃO DE FREQUÊNCIA Com a tabela de frequência ou distribuição de frequência é possível visualizar os dados sem repetição de valores, apenas informando quantas vezes cada informação repetida aparece (frequência). Por exemplo, durante algumas horas do dia a temperatura ambiente pode se repetir, logo pode informa em uma tabela apenas os valores diferentes de temperatura e o número de vezes que cada valor de temperatura se repete (o que é conhecido como frequência da classe). No exemplo que trabalhamos, a variável em questão, estatura, será observada e estudada muito mais facilmente quando dispusermos valores ordenados em uma coluna e colocarmos, ao lado de cada valor, o número de vezes que aparece repetido. Denominamos frequência o número de alunos que fica relacionado a um determinado valor da variável. Obtemos, assim, uma tabela que recebe o nome de distribuição de frequência: TABELA 3 ESTATURAS (cm)

FREQ

161

4

162

2

163

2

164

3

150

1

165

1

151

1

166

1

152

1

167

1

153

1

168

2

154

1

169

1

155

4

170

1

156

3

172

1

157

1

173

1

158

2

Total

40

160

5 24 [email protected]

INSTITUTO CASTRO ALVES

Mas o processo dado é ainda inconveniente, já que exige muito mais espaço, mesmo quando o número de valores da variável (n) é de tamanho razoável. Sendo possível, a solução mais aceitável, pela própria natureza da variável contínua, é o agrupamento dos valores em vários intervalos. Ao agruparmos os valores da variável em classes, ganhamos em simplicidade para perdermos em pormenores. Assim, na Tabela 3 podemos verificar, facilmente, que quatro alunos têm 161 cm de altura e que não existe nenhum aluno com 171 cm de altura. Já na Tabela 4 não podemos ver se algum aluno tem a estatura de 159 cm. No entanto, sabemos, com segurança, que onze alunos têm estatura compreendida entre 158 e 162 cm. O que pretendemos com a construção dessa nova tabela é realçar o que há de essencial nos dados e, também, tornar possível o uso de técnicas analíticas para sua total descrição, até porque a estatística tem por finalidade específica analisar o conjunto de valores, desinteressando-se por casos isolados. ELEMENTOS DE UMA TABELA OU DISTRIBUIÇÃO DE FREQUÊNCIA Nesta seção serão apresentados alguns termos próprios usados para construir e interpretar uma distribuição de frequência. Exemplo: TABELA 4

ESTATURAS DE 40

ALUNOS

DA FACULDADE A - 2007 ESTATURAS (cm)

FREQUÊNCIA

150 ‫ —׀‬154

4

154 ‫ —׀‬158

9

158 ‫ —׀‬162

11

162 ‫ —׀‬166

8

166 ‫ —׀‬170

5

170 ‫ —׀‬174

3

Total

40 25

[email protected]

INSTITUTO CASTRO ALVES CLASSES Classe ou classe de frequência é cada um dos grupos em que é divido os valores totais, exemplo, na Tabela 4, 150 ‫ —׀‬154 seria uma classe. INTERVALOS E LIMITES DE CLASSES Uma classe, como exemplo, 150 ‫ —׀‬154 tem seu intervalo limitado a essa faixa de valores (de 150 até 154), onde o limite inferior da classe é 150 e o limite superior da classe é 154. TLIMITES REAIS DE CLASSES Na Tabela 4, em que é apresentada uma distribuição de frequência, a primeira classe, cujos limites são 150 e 154, congregaria, na realidade, valores compreendidos entre 151, 152 e 153. Esses limites são os limites reais de classe. REGRAS

GERAIS

PARA

ELABORAÇÃO

DE

UMA

DISTRIBUIÇÃO

DE

FREQUÊNCIA As regras apresentadas a seguir visão auxiliar na construção da distribuição de frequência, são elas: 1.

Ordenam–se os dados brutos em ordem crescente.

2.

Encontra–se a Amplitude Total (AT). AT = L(máx) – l(mín)

3.

Calcula se o número de classe ( k ) pela fórmula:

K = √ , onde n é o número de observações. Obs.: O valor K deve ser sempre arredondado para o número inteiro mais próximo. 4. Determina a amplitude dos intervalos das classes pela fórmula: h = 5.

Determina–se o limite das classes.

6.

Construir a tabela com as frequências.

7.

Elaborar um título para a tabela e colocar a sua fonte.

26 [email protected]

INSTITUTO CASTRO ALVES TABELA 5 i

ESTATURAS (cm)

fi

xi

fri

Fi

Fri

1

150 ‫ —׀‬154

4

152

0,100

4

0,100

2

154 ‫ —׀‬158

9

156

0,225

913

0,325

3

158 ‫ —׀‬162

11

160

0,275

24

0,600

4

162 ‫ —׀‬166

8

164

0,200

32

0,800

5

166 ‫ —׀‬170

5

168

0,125

37

0,925

6

170 ‫ —׀‬174

3

172

0,075

40

1,000

∑ = 40

∑ = 1,000

O conhecimento dos vários tipos de frequência ajuda-nos a responder a muitas questões com relativa facilidade, como as seguintes: a. Quantos alunos têm estatura entre 154 cm, inclusive, e 158 cm? Esses são os valores da variável que formam a segunda classe. Como f2 = 9, a resposta é: 9 alunos. b. Qual a percentagem de alunos cujas estaturas são inferiores a 154 cm? Esses valores são os que formam a primeira classe. Como fr 1 = 0,100, obtemos a resposta multiplicando a frequência relativa por 100: 0,100 x 100 = 10 Logo, a percentagem de alunos é 10%. c. Quantos alunos têm estatura não inferior a 158 cm? O número de alunos é dado por: ∑(i=1 → 6) fi = f3 + f4 + f5 + f6 = 11 + 8 + 5 + 3 = 27 Ou, então: ∑(i=1 → 6) fi – F2 = n - F2 = 40 – 13 = 27

27 [email protected]

INSTITUTO CASTRO ALVES REPRESENTAÇÃO GRÁFICA

HISTOGRAMA E POLÍGONOS DE FREQUÊNCIA Um histograma de frequência (ou simplesmente histograma) e um polígono de frequência é uma representação gráfica da distribuição de frequência. O histograma consiste em um conjunto de retângulos (barras) cujas bases (eixo horizontal – eixo x) têm seus centros no ponto médio e as larguras são iguais as amplitudes dos intervalos das classes. As alturas dos retângulos são representadas pelos valores das frequências de cada classe. Um polígono de frequência é um gráfico de linha onde se marca os pontos médios no topo de cada barra, em seguida, conectam-se os pontos médios consecutivos e, por fim, estende-se o polígono até o eixo x. A soma das áreas dos retângulos do histograma é igual à área total limitada pelo polígono de frequência e o eixo x. EXEMPLO DE HISTOGRAMA

Fonte: Dados Fictícios

28 [email protected]

INSTITUTO CASTRO ALVES EXEMPLO DE POLÍGONO DE FREQUÊNCIA. 100% 80% Série 3

60%

Série 2

40%

Série 1

20% 0% Categoria 1

Categoria 2

Categoria 3

Categoria 4

Histograma e Polígono de Frequência 16 14

Polígono de frequência Histograma

Frequência

12

8

4

51

67

83

99

115

131

147

163 Consumo (kWh)

Exercício 1. Considerando os dados coletados abaixo, relativos aos minutos gastos ao telefone durante 30 dias, os dados estão dispostos na ordem em que foram coletados: Dados brutos = [102, 124, 108, 86, 103, 82, 71, 104, 112, 118, 87, 116, 85, 122, 87, 100, 105, 97, 107, 67, 78, 125, 109, 99, 105, 99, 101, 92]. a) Faça uma tabela de distribuição de frequência: b) Encontre os valores médios de cada classe. c) Determine a frequência simples absoluta e relativa de cada classe. d) Determine a frequência acumulada absoluta e relativa, ―acima de‖ e ―abaixo de‖ para cada classe.

29 [email protected]

INSTITUTO CASTRO ALVES e) Construa o histograma de frequência e o polígono de frequência para a frequência simples absoluta e outro com os valores da frequência simples relativa. MEDIDAS DE POSIÇÃO São as estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal do gráfico da curva de frequência. As medidas de posições mais importantes são média aritmética, mediana e moda. Usaremos as seguintes notações:   

X: valor de cada indivíduo da amostra. : média amostral. n: tamanho amostral. MÉDIA ARITMÉTICA A média aritmética é calculada somando-se todos os valores da população e dividindo o resultado pelo total de elementos da população. Numa população de elementos, a média populacional é dada por:

Exemplo: Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10,14, 13, 15, 16, 18 e 12 kg, então a venda média diária na semana é: 10 14 13 15 16 18 12 7

= 14 quilos

Média Aritmética de Dados Agrupados em Intervalos Há vezes em que os dados não são verificados com seu verdadeiro valor individual, mas são representados por uma classe que pode ter um determinado intervalo. Neste caso, considerando que o intervalo não tem um valor definido e sim um conjunto de valores. Utilizaremos como representante o ponto médio de cada intervalo.

30 [email protected]

INSTITUTO CASTRO ALVES Por exemplo, a distribuição de frequência abaixo, procede-se da seguinte forma: Idade

Frequência

( anos )

( fi )

0 |– 5

2

Ponto médio (Xi )

Xi . fi

(Xi) . fi

4

2,5

10

25

5 |– 10

2

7,5

15

112,5

10 |– 15

3

12,5

37,5

468,75

15 |– 20

1

17,5

17.5

306,25

10

-

80,0

912,5

S2= S2=

. 912,5 -

. 912,5– 640 S2=

. 272,5

S2=

. 912,5 -

S2= 27,25

S=√

S= 5,22

Aplicando a fórmula para calcular a média ponderada teremos:

X

f x f i

i

=

= 8 anos

i

Desta forma a média da população avaliada é oito anos. MEDIANA Para calcular a mediana devemos, em primeiro lugar, ordenar os dados do menor para o maior valor. Se o número de observações for ímpar, a mediana será a observação central. Se o número de observações for par, a mediana será a média aritmética das duas observações centrais. Notação:

.

Exemplo: Consideremos os seguintes dados correspondentes aos comprimentos de 8 rolos de fio de aço: 65, 72, 70, 77, 60, 67, 69, 68. Ordenando os valores temos: 60, 65, 67, 68, 69, 70, 72, 77. Como o número de observações é par, a mediana é dada pela média dos dois valores centrais que são 68 e 69, isto é,

31 [email protected]

INSTITUTO CASTRO ALVES MODA A moda de um conjunto de valores é o valor que apresenta a maior frequência. Exemplo: Uma amostra de 5 barras de aço foi retirada da linha de produção e seus comprimentos foram medidos. Os valores foram: 4,5; 4,6; 4,5; 4,4; 4,5 temos que sua moda é 4,5, pois este é o valor do conjunto de dados que aparece com maior frequência.

MEDIDAS DE DISPERSÃO DISPERSÃO OU VARIABILIDADE: É a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central ( média ou mediana ) tomado como ponto de comparação. A média - ainda que considerada como um número que tem a faculdade de representar uma série de valores - não pode por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto. Consideremos os seguintes conjuntos de valores das variáveis X, Y e Z: X = { 70, 70, 70, 70, 70 } Y = { 68, 69, 70 ,71 ,72 } Z = { 5, 15, 50, 120, 160 } Observamos então que os três conjuntos apresentam a mesma média aritmética = 350/5 = 70. Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que todos os valores são iguais à média. O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação entre cada um de seus valores e a média representativa. Concluímos então que o conjunto X apresenta dispersão nula e que o conjunto Y apresenta uma dispersão menor que o conjunto Z.

32 [email protected]

INSTITUTO CASTRO ALVES AMPLITUDE TOTAL É a única medida de dispersão que não tem na média o ponto de referência. Quando os dados não estão agrupados a amplitude total é a diferença entre o maior e o menor valor observado: AT = X máximo - X mínimo. Ex:

Para os valores 40, 45, 48, 62 e 70 a amplitude total será: AT = 70 - 40 = 30

Quando os dados estão agrupados sem intervalos de classe ainda temos : AT = X máximo - X mínimo.



Ex: xi

fi

0

2

1

6

3

5

4

3

AT = 4 - 0 = 4

* Com intervalos de classe a AMPLITUDE TOTAL é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. Então: AT = L máximo - l mínimo

 AT

= 10 - 4 = 6

Ex:

Classes

fi

4 |------------- 6

6

6 |------------- 8

2

8 |------------- 10

3

A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série, descuidando do conjunto de valores intermediários. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida de cálculo rápido sem muita exatidão.

33 [email protected]

INSTITUTO CASTRO ALVES VARIÂNCIA Muitas vezes, a média não é suficiente para avaliar um conjunto de dados. Por exemplo, quando se fala em um grupo de mulheres com idade média de 18 anos. Esse dado, sozinho, não significa muito: pode ser que no grupo, muitas mulheres tenham 38 anos, e outras tantas sejam menininhas de dois! É importante, então, conhecer outra medida, a de que diferença (dispersão) existe entre a média e os valores do conjunto. Exemplo das notas de João, podemos calcular o desvio, que é a diferença de cada nota em relação à média: Notas Média Desvio 9

5,2

3,8

7

5,2

1,8

5

5,2

- 0,2

3

5,2

- 2,2

2

5,2

- 3,2

Outro dado importante em estatística é obtido pela soma dos desvios ao quadrado. Cada desvio é elevado ao quadrado e, em seguida, somados:

Valores

Quadrado dos

Média

Desvio

9

5,2

3,8

14,44

7

5,2

1,8

3,24

5

5,2

- 0,2

0,04

3

5,2

- 2,2

4,84

2

5,2

- 3,2

10,24

Soma dos quadrados dos desvios

desvios

32,8

A soma dos quadrados dos desvios dividida pelo número de ocorrências é chamada de variância. Logo: V =

34 [email protected]

INSTITUTO CASTRO ALVES

DESVIO PADRÃO É a medida de dispersão mais geralmente empregada, pois leva em consideração a totalidade dos valores da variável em estudo. É um indicador de variabilidade bastante estável. O desvio padrão baseia-se nos desvios em torno da média aritmética e a sua fórmula básica pode ser traduzida como: a raiz quadrada da média aritmética dos quadrados dos desvios e é representada por S .



A fórmula acima é empregada quando tratamos de uma população de dados não

agrupados. Ex: Calcular o desvio padrão da população representada por - 4 , -3 , -2 , 3 , 5

Xi -4

- 0,2

- 3,8

14,44

-3

- 0,2

- 2,8

7,84

-2

- 0,2

- 1,8

3,24

3

- 0,2

3,2

10,24

5

- 0,2

5,2

27,04

E=

62,8

Sabemos que n = 5 e 62,8 / 5 = 12,56. A raiz quadrada de 12,56 é o desvio padrão = 3,54 Obs.: Quando nosso interesse não se restringe à descrição dos dados mas, partindo da amostra, visamos tirar inferências válidas para a respectiva população, convém efetuar uma modificação, que consiste em usar o divisor n - 1 em lugar de n. A fórmula ficará então:

35 [email protected]

INSTITUTO CASTRO ALVES 

Se os dados - 4 , -3 , -2 , 3 , 5 representassem uma amostra o desvio padrão

amostral seria a raiz quadrada de 62,8 / (5 -1) = 3,96 Desvio padrão para dados agrupados em intervalos de classe Vamos considerar os dados abaixo, relativos às notas dos alunos de uma turma na disciplina de matemática.

Vamos realizar o cálculo do desvio padrão dos dados acima. Observe que os dados estão apresentados em intervalos de classe, por esse motivo, o cálculo do desvio padrão difere em relação aos dados não agrupados ou agrupados sem intervalos de classes. Analisando os dados da tabela, não podemos afirmar a nota de cada aluno. Temos um intervalo onde se encontra o valor da nota e quantos alunos possuem a nota em determinado intervalo. Vejamos passo a passo como proceder nessa ocasião. 1º Passo: Calcular o ponto médio dos intervalos de classe. Os pontos médios dos intervalos de classe são calculados utilizando a fórmula:

Onde:

xm → é o ponto médio do intervalo. Linf → é o limite inferior do intervalo.

Lsup → é o limite superior do intervalo.

Assim, teremos:

Calculado o ponto médio de cada intervalo, vamos ao próximo passo. 36 [email protected]

INSTITUTO CASTRO ALVES 2º Passo: Cálculo da média dos dados. O cálculo da média dos dados agrupados em intervalos de classe é dado pela fórmula:

Que é o somatório dos produtos dos pontos médios de cada intervalo de classe pela respectiva frequência, dividido pelo somatório das frequências. Teremos:

3º Passo: Cálculo do quadrado dos desvios. O cálculo do quadrado dos desvios aponta quanto cada ponto médio dos intervalos de classe está variando em torno da média. É calculado pela seguinte fórmula:

Teremos:

4º Passo: Cálculo da variância. A variância é o somatório do quadrado dos desvios dividido pelo somatório das frequências.

5º Passo: Cálculo do desvio padrão O desvio padrão é a raiz quadrada da variância. Assim, teremos:

37 [email protected]

INSTITUTO CASTRO ALVES Ou

EXEMPLO

EXERCÍCIOS 1. Um instrutor deseja registrar a média de faltas de seus alunos em determinado semestre. Em uma amostra aleatória, os dados são: [2, 4, 2, 0, 2, 4, 3, 6]. Determine qual é a média, a mediana e a moda para essa amostra. 2. Determine a amplitude total, o desvio médio, o desvio padrão e a variância dados do conjunto: [12, 6, 7, 3, 15, 10,18, 5] 3. Vinte alunos foram submetidos a um teste de aproveitamento cujos resultados foram os que se seguem. 38 [email protected]

INSTITUTO CASTRO ALVES

Calcule o desvio padrão das notas dos alunos.

26 18 20 27

28 25 21 22

24 18 15 13

13 25 28 19

18 24 17 28

COEFICIENTE DE VARIAÇÃO O coeficiente de variação é usado para analisar a dispersão em termos relativos a seu valor médio quando duas ou mais séries de valores apresentam unidades de medida diferentes. Dessa forma, podemos dizer que o coeficiente de variação é uma forma de expressar a variabilidade dos dados excluindo a influência da ordem de grandeza da variável. O cálculo do coeficiente de variação é feito através da fórmula:

Onde, s → é o desvio padrão. → é a média dos dados. CV → é o coeficiente de variação. Como o coeficiente de variação analisa a dispersão em termos relativos, ele será dado em %. Quanto menor for o valor do coeficiente de variação, mais homogêneos serão os dados, ou seja, menor será a dispersão em torno da média. De uma forma geral, se o CV: For menor ou igual a 15% → baixa dispersão: dados homogêneos For entre 15 e 30% → média dispersão For maior que 30% → alta dispersão: dados heterogêneos

39 [email protected]

INSTITUTO CASTRO ALVES Vejamos um exemplo. Exemplo: Em um grupo de moradores de determinada região foram analisadas a idade (em anos) e a altura (em metros) das pessoas. Deseja-se comparar a dispersão em termos relativos em torno da média dos dois conjuntos de dados, a fim de verificar qual deles é mais homogêneo. Na coleta dos dados verificou-se que: dade das pessoas:

=41,6 e s = 0,82

Altura das pessoas:

=1,67 e s = 0,2

Qual conjunto de dados apresenta menor dispersão relativa em torno da média? Solução: O primeiro fato a se observar é que os dados analisados possuem unidades de medida diferentes. Dessa forma, somente o desvio padrão não é suficiente para comparar os dois conjuntos. Nesse caso, é preciso calcular o coeficiente de variação para fazer a comparação da variação em torno da média dos dados. Assim, teremos: Cálculo do CV da idade.

Cálculo do CV da altura.

40 [email protected]

INSTITUTO CASTRO ALVES Interpretação dos dados: como o coeficiente de variação da idade foi menor que o coeficiente de variação da altura, pode-se afirmar que os dados relativos à idade são mais homogêneos que os dados da altura. ESTATÍSTICA INFERENCIAL A estatística inferencial tem como objetivo a extrapolação dos resultados (obtidos com a estatística descritiva) para a população. Assim sendo foram utilizados vários tipos de testes com o intuito de relacionar as diferentes variáveis.Para relações entre variáveis categóricas recorreu-se a testes de Qui quadrado e tabelas de contingência. Os testes não paramétricos usados para relações com variáveis contínuas

assimétricas

assimétrica/categórica

incluem

dicotômica

)

Mann-Whitney e

Kruskal-Wallis

(variável

contínua

(variável

contínua

assimétrica/categórica não dicotômica ).A relação existente entre as variáveis é traduzida pelo valor de p.Para valores de p<0.05 rejeita-se a hipótese nula ou seja a probabilidade das diferenças registradas na amostra serem devidas ao acaso é muito pequena ( existe portanto grande probabilidade de estas diferenças existirem de fato na população ). REFERÊNCIAS BIBLIOGRÁFICAS CRESPO, A A. Estatística Fácil. 17. ed. São Paulo: Saraiva, 2002. DANTE, L. R. Matemática Contexto e Aplicações. Ensino médio. Volume único. São Paulo: Editora Ática. 2000. DOWNING, D. Estatística Aplicada. Douglas Downing, Jeffey Clark; Tradução de Alfredo Alves de Farias. 2.ed. São Paulo: Saraiva, 2003. MARTINS, G de. Estatística Geral e Aplicada. 2.ed.. São Paulo: Atlas, 2002. BARBETTA, P. A. Estatística Aplicada às Ciências Sociais. 3 ed. Florianópolis: Ed. Da UFSC, 1999. BRAULE,

Ricardo.

Estatística

Aplicada

com

Excel:

para

cursos

de

administração e economia. Rio de Janeiro: Campus, 2001 BUSSAB, W., MORETTIN, P. A. Estatística Básica. 4.ed. São Paulo: Atual, 41 [email protected]

INSTITUTO CASTRO ALVES 1987 BOLFARINI, H , BUSSAB, W. e MORETTIN, P. A. Elementos de Amostragem. 1ª edição. Editora: Edgard Blucher. 2005. BUSSAB, W. e MORETTIN, P. A. Estatística Básica. 5ª edição. Editora: Saraiva. 2004. COSTA, S. F. Introdução Ilustrada à Estatística. 4ª edição. Editora: Harbra. 2005. DOWNING, D. e CLARK, J. Estatística Aplicada. 2ª edição. Editora: Saraiva. 2005. FARIAS, A. A., SOARES, J. F. e CÉSAR, C. C. Introdução à Estatística. 2ª edição. Editora: LTC. 2003. FONSECA, J. S. e MARTINS, G. A. Curso de Estatística. 6ª edição. Editora: Atlas.1996. LEVINE, D. M., BERENSON, M. L. e STEPHAN, D. – Estatística: Teoria e Aplicações usando o Excel. Rio de Janeiro: LTC, 2000 LIMA, A. C. P. e MAGALHÃES, M. N. Noções de Probabilidade e Estatística. 6ª edição. Editora: EDUSP. 2005. MEYER, P. L. Probabilidade: Aplicações à Estatística 2ª edição. Editora: LTC. 2000. MORETTIN, L. G. Estatística Básica. 1ª edição. Volume I e II. Editora: Makron Books. 2000. PARANÁ, Secretaria do Estado da Educação, Diretrizes Curriculares da Rede Pública de Educação Básica: Matemática. Curitiba: SEED-PR, 2006. STEVENSON, Willian J. Estatística Aplicada à Administração. São Paulo: Ed. Harbra, 1981. TRIOLA, M. F. – Introdução à Estatística. Rio de Janeiro: LTC, 1999. TRIOLA, M. F. Introdução à Estatística. 9ª edição. Editora: LTC. 2005. WONNACOTT, T. H., WONNACOTT, R. J. Estatística Aplicada à Economia e à Administração. Ed. LTC, Rio de Janeiro, 1981.

42 [email protected]

Related Documents

Apostila De Estatistica
February 2021 0
Apostila Estatistica - Uepa
February 2021 0
Estatistica
February 2021 1
Livro Estatistica
February 2021 3
Estatistica-no-excel
February 2021 1

More Documents from ""