O treinador de uma equipe de voleibol resolveu medir a altura dos jogadores

Roteiro de Estudo - medidas de dispersão Prof. Valdir Teixeira Medidas de dispersão são parâmetros estatísticos usados para determinar o grau de variabilidade dos dados de um conjunto de valores. A utilização desses parâmetros tornam a análise de uma amostra mais confiável, visto que as variáveis de tendência central (média, mediana, moda) muitas vezes escondem a homogeneidade ou não dos dados. Por exemplo, vamos considerar que um animador de festas infantis selecione as atividades de acordo com a média das idades das crianças convidadas para uma festa. Vamos considerar as idades de dois grupos de crianças que irão participar de duas festas diferentes:  Festa A: 1 ano, 2 anos, 2 anos, 12 anos, 12 anos e 13 anos  Festa B: 5 anos, 6 anos, 7 anos, 7 anos, 8 anos e 9 anos Em ambos os casos, a média é igual a 7 anos de idade. Entretanto, ao observar as idades dos participantes podemos admitir que as atividades escolhidas sejam iguais? Portanto, neste exemplo, a média não é uma medida eficiente, pois não indica o grau de dispersão dos dados. As medidas de dispersão mais usadas são: amplitude, variância, desvio padrão e coeficiente de variação. Amplitude Essa medida de dispersão é definida como a diferença entre a maior e a menor observação de um conjunto de dados, isto é: A = Xmaior - Xmenor Por ser uma medida que não leva em consideração como os dados estão efetivamente distribuídos, não é muito utilizada. Exemplo O setor de controle de qualidade de uma empresa seleciona ao acaso peças de um lote. Quando a amplitude das medidas dos diâmetros das peças ultrapassa 0,8 cm o lote é rejeitado. Considerando que em um lote foram encontrados os seguintes valores 2,1 cm; 2,0 cm; 2,2 cm; 2,9 cm; 2,4 cm, esse lote foi aprovado ou rejeitado? Solução Para calcular a amplitude, basta identificar o menor e o maior valores, que neste caso, são 2,0 cm e 2,9 cm. Calculando a amplitude, temos: A = 2,9 - 2 = 0,9 cm Nesta situação o lote foi rejeitado, pois a amplitude ultrapassou o valor limite. Variância Em conjunto de dados ( x1 , x2, ..., xn ), a variância é determinada pela média dos quadrados das diferenças entre cada uma das observações e a média aritmética da amostra. O cálculo é feito com base na seguinte fórmula: V = ( ) ( ) ( ) ( ) Sendo, V: variância xi: valor observado MA: média aritmética da amostra n: número de dados observados Exemplo Considerando as idades das crianças das duas festas indicadas anteriormente, vamos calcular a variância desses conjuntos de dados. Festa A Dados: 1 ano, 2 anos, 2 anos, 12 anos, 12 anos e 13 anos Média: MA = = = 7 anos. Variância: V = ( ) ( ) ( ) ( ) ( ) ( ) V = ≃ 28,67 anos2 . Festa B Dados: 5 anos, 6 anos, 7 anos, 7 anos, 8 anos e 9 anos Média: MA = = 7 anos. Variância: V = ( ) ( ) ( ) ( ) ( ) ( ) V = ≃ 1,67 anos2 Observe que apesar da média ser igual, o valor da variância é bem diferente, ou seja, os dados do primeiro conjunto são bem mais heterogêneos. Desvio Padrão O desvio padrão é definido como a raiz quadrada da variância. Desta forma, a unidade de medida do desvio padrão será a mesma da unidade de medida dos dados, o que não acontece com a variância. Assim, o desvio padrão é encontrado fazendo-se: DP = √ Quando todos os valores de uma amostra são iguais, o desvio padrão é igual a 0. Sendo que, quanto mais próximo de 0, menor é a dispersão dos dados. Exemplo Considerando ainda o exemplo anterior, vamos calcular o desvio padrão para as duas situações: DPa = √ = 5,35 anos DPb = √ = 1,29 anos Agora, sabemos que a variação das idades do primeiro grupo em relação a média é de aproximadamente 5 anos, enquanto que a do segundo grupo é de apenas 1 ano. Coeficiente de Variação Para encontrar o coeficiente de variação, devemos multiplicar o desvio padrão por 100 e dividir o resultado pela média. Essa medida é expressa em porcentagem. CV = O coeficiente de variação é utilizado quando precisamos comparar variáveis que apresentam médias diferentes. Como o desvio padrão representa o quanto os dados estão dispersos em relação a uma média, ao comparar amostras com médias diferentes, a sua utilização pode gerar erros de interpretação. Desta forma, ao confrontar dois conjuntos de dados, o mais homogêneo será aquele que apresentar menor coeficiente de variação. Exemplo Um professor aplicou uma prova para duas turmas e calculou a média e o desvio padrão das notas obtidas. Os valores encontrados estão na tabela abaixo. Com base nesses valores, determine o coeficiente de variação de cada turma e indique a turma mais homogênea. Solução Calculando o coeficiente de variação de cada turma, temos: CV1 = = 42 % CV2 = = 35 % Desta forma, a turma mais homogênea é a turma 2, apesar de apresentar maior desvio padrão. Exercícios Resolvidos 01) Em um dia de verão as temperaturas registradas em uma cidade ao longo de um dia estão apresentadas na tabela abaixo: Com base na tabela, indique o valor da amplitude térmica registrada neste dia. Solução: Para encontrar o valor da amplitude térmica, devemos subtrair o valor mínimo da temperatura do valor máximo. Pela tabela, identificamos que a menor temperatura foi 16 ºC e a maior 27 ºC. Desta forma, a amplitude será igual a: A = 27 - 16 = 11 ºC 02. Marco e Paulo foram classificados em um concurso. Para classificação no concurso o candidato deveria obter média aritmética na pontuação igual ou superior a 14. Em caso de empate na média, o desempate seria em favor da pontuação mais regular. No quadro a seguir são apresentados os pontos obtidos nas provas de Matemática, Português e Conhecimentos Gerais, a média, a mediana e o desvio padrão dos dois candidatos. Dados dos candidatos no concurso a) b) Marco, pois obteve menor desvio padrão. c) Paulo, pois obteve a maior pontuação da tabela, 19 em Português. d) Paulo, pois obteve maior mediana. e) Paulo, pois obteve maior desvio padrão. Solução: As médias de Marco e Paulo são iguais, mas o desvio padrão de Marco é menor, o que significa que suas notas nas provas estão mais próximas da média do que as notas de Paulo. Portanto, as notas obtidas por Marco no concurso são mais regulares, logo Marco foi melhor classificado. Opção correta é a alternativa B. 03. ( FGV ) Um conjunto de dados numéricos tem variância igual a zero. Podemos concluir que: a) a média também vale zero. b) a mediana também vale zero. c) a moda também vale zero. d) o desvio padrão também vale zero. e) todos os valores desse conjunto são iguais a zero. Solução: O desvio padrão é definido como a raiz quadrada da variância, logo se a variância é zero Dp = √ = 0. A opção correta é a D. 04) O treinador de uma equipe de voleibol resolveu medir a altura dos jogadores da sua equipe e encontrou os seguintes valores: 1,86 m; 1,97 m; 1,78 m; 2,05 m; 1,91 m; 1,80 m. Em seguida, calculou a variância e o coeficiente de variação das alturas. Os valores aproximados foram respectivamente: a) 0,08 m2 e 50% b) 0,3 m e 0,5% c) 0,0089 m2 e 4,97% d) 0,1 m e 40% Solução: 05. O desvio padrão por si só não permite comparação entre duas ou mais séries estatísticas, com respeito à dispersão ou variabilidade. Para contornar esta dificuldade e limitação do uso da medida v ” -se outra medida de dispersão, em termos relativos aos valores médios, denominada a) curtose. b) variância. c) amplitude. d) coeficiente de variação. Solução: Alternativa D. 06. Numa empresa o salário médio dos homens é de R$ 4.000,00 com um desvio padrão de R$1.500,00, e o das mulheres é na média de R$ 3.000,00 com desvio padrão de R$1.200,00. Qual dos sexos apresenta maior dispersão. a) ( ) as mulheres b) ( ) os homens c) ( ) homens e mulheres d) ( ) nenhuma das anteriores Solução: Calculando o coeficiente de variação de cada sexo, temos: CVh = = = 37, 5 % CVm = = = 40% Desta forma, o sexo mais homogêneo é o masculino, apesar de ter o maior desvio padrão. Opção correta é a alternativa B. 07. Considere as seguintes medidas descritivas das notas finais dos alunos de três turmas: Com base nesses dados, considere as seguintes afirmativas: 1. Apesar de as médias serem iguais nas três turmas, as notas dos alunos da turma B foram as que se apresentaram mais heterogêneas. 2. As três turmas tiveram a mesma média, mas com variação diferente. 3. As notas da turma A se apresentaram mais dispersas em torno da média. Assinale a alternativa correta. a) Somente a afirmativa 3 é verdadeira. b) Somente a afirmativa 2 é verdadeira. c) Somente as afirmativas 2 e 3 são verdadeiras. d) Somente as afirmativas 1 e 2 são verdadeiras. e) Somente as afirmativas 1 e 3 são verdadeiras. Solução: A afirmação 1 é verdadeira, pois quando as médias são podemos ver o conjunto mais disperso ( heterogêneo) analisando o desvio padrão. Então, como a turma B tem o maior desvio padrão as notas dos alunos são mais heterogêneas do que das outras turmas. A afirmação 2 é verdadeira, pois realmente tiveram a mesma média e com desvio padrão diferente, o que indica variações diferentes. A afirmação 3 é falsa, pois as notas da turma A tem o menor desvio padrão, logo as notas são mais homogêneas ( menos dispersas em relação à média aritmética). Portanto, a alternativa correta é D. 08. (UNEB - BA) Na revisão do texto, contido em 10 páginas de um trabalho escolar, foram identificados erros de digitação, de acordo com a tabela 25 34 32 21 FrequênciaerrosdeNúmero A variância do número de erros é igual a a) 2,0 b) 2,2 c) 3,0 d) 3,2 e) 4,0 Solução: 1º passo: Calcular a média aritmética ( MA) do número de erros. MA = = = = 3 2º passo: Aplicar a fórmula da variância. V = ( ) ( ) ( ) ( ) = = = = 2,2. Observação: Perceba que o 1 erro ocorre duas vezes, 2 erros ocorrem três vezes, 4 erros ocorrem três vezes e 5 erros ocorrem duas vezes. Então é necessário no cálculo da variância multiplicar respectivamente essas frequências pelo quadrado da diferença entre o número de erro e a média. A opção correta é a alternativa B. 09. (UFPel – RS) Em um concurso, as notas finais dos candidatos foram as seguintes: Com base na tabela anterior, é CORRETO afirmar que a variância das notas finais dos candidatos foi de: a) 0,75. b) 0,65. c) 0,65 d) 0,85 e) 0,85. Solução: 1º passo: Calcular a média aritmética ( MA) do número de erros. MA = = = = 6,5 2º passo: Aplicar a fórmula da variância. V = ( ) ( ) ( ) = = = = 0,85. Opção correta E. 10. (UFPR) Os dados abaixo representam o tempo (em segundos) para carga de um determinado aplicativo, num sistema compartilhado. Com base nesses dados, considere as afirmativas a seguir: 1. O tempo médio para carga do aplicativo é de 7,0 segundos. 2. A variância da distribuição é aproximadamente 1,33 segundos ao quadrado. 3. O desvio padrão é a raiz quadrada da variância. 4. Cinquenta por cento dos dados observados estão abaixo de 6,5 segundos. Assinale a alternativa correta. a) Somente as afirmativas 1 e 3 são verdadeiras. b) Somente as afirmativas 2 e 3 são verdadeiras. c) Somente as afirmativas 2 e 4 são verdadeiras. d) Somente as afirmativas 1, 2 e 3 são verdadeiras. e) Somente as afirmativas 1, 3 e 4 são verdadeiras. Solução: 1º passo: Calcular o valor médio de cada intervalo de tempo. Tempo (s) Nº de observações Valor médio 4 5├ 5 5 03 5 5 5├ 6 5 06 6 6 5├ 7 5 13 7 7 5├ 8,5 05 8 8 5├ 9 5 02 9 9 5├ 10 5 01 10 Total 30 2º passo: Calcular a média aritmética ( MA) do número de observações. MA = = = = 7 segundos. 3º passo: Aplicar a fórmula da variância. V = ( ) ( ) ( ) ( ) ( ) ( ) = = = = = 1,333 segundos. Os cálculos acima mostram que as afirmações 1 e 2 são verdadeiras. A afirmação 3 também é correte, pois é a definição de desvio padrão. A afirmação 4 é falsa, pois temos apenas 03+06 = 09 observações abaixo de 6,5, o que corresponde a = = 0,3 = 30 % . Portanto, a alternativa correta é a opção D.

Toplist

Última postagem

Tag