Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Loading in …3
×
1 of 180

Estatística Parte 1

9

Share

Download to read offline

A apresentação faz parte de um conjunto de aulas ministradas nos cursos de pós graduação da Fundação Universa,´módulo Métodos Quatitativos - estatística.

Related Books

Free with a 30 day trial from Scribd

See all

Related Audiobooks

Free with a 30 day trial from Scribd

See all

Estatística Parte 1

  1. 1. Métodos Quantitativos –Parte I Análise de Dados Maurício T. Damasceno [email_address]
  2. 2. Como analisar dados? ESTATÍSTICA Maurício T. Damasceno
  3. 3. Maurício T. Damasceno Estatística Estatística Descritiva Estatística Inferencial
  4. 4. Mas o que é Estatística? <ul><li>ciência dos dados </li></ul><ul><li>coleta, classificação e organização </li></ul><ul><li>análise e interpretação de dados </li></ul>Maurício T. Damasceno
  5. 5. <ul><li>Qual o objetivo da Estatística? </li></ul>Extrair informações dos dados brutos que permitam processo posterior de tomada de decisão. Maurício T. Damasceno
  6. 6. Informação Decisão Dados Brutos Estatística Maurício T. Damasceno
  7. 7. <ul><li>Conjunto de dados podem ser: </li></ul>Dados Brutos!! 1.Demonstrativos mensais de balanços; 2. Valores diários de taxas de juros; 3. Preços de fechamento de ações. Maurício T. Damasceno
  8. 8. Estatística Descritiva <ul><li>Técnicas que permitem REPRESENTAR, RESUMIR e ANALISAR um conjunto de dados. </li></ul>Maurício T. Damasceno
  9. 9. Estatística Inferencial <ul><ul><li>Técnicas que permitem utilizar dados de uma amostra para generalizações sobre a população. </li></ul></ul>Maurício T. Damasceno
  10. 10. Definições e Conceitos Básicos Conjunto de todos os dados que contém a característica que temos interesse. <ul><li>População </li></ul><ul><li>Amostra </li></ul>É um subconjunto da população. Maurício T. Damasceno
  11. 11. Definições e Conceitos Básicos <ul><li>Dados </li></ul>Conjunto de medições/identificações da variável de interesse. UE VARIÁVEIS DADOS Maurício T. Damasceno
  12. 12. Definições e Conceitos Básicos <ul><li>Unidade elementar (UE) </li></ul>A portadora da característica ou propriedade que se deseja investigar Ex: Funcionários de uma empresa. Característica, propriedade ou atributo que se deseja investigar. Ex: Idade <ul><li>Variável </li></ul>Maurício T. Damasceno
  13. 13. Tipos de Variáveis Maurício T. Damasceno TIPOS DE VARIÁVEIS QUALITATIVAS QUANTITATIVAS NOMINAL ORDINAL DISCRETOS CONTÍNUOS
  14. 14. Variáveis Qualitativas (não numéricas) <ul><li>Dados Nominais (sem hierarquia) </li></ul><ul><ul><li>Ex: Estado civil, Gênero </li></ul></ul><ul><li>Dados Ordinais (com hierarquia) </li></ul><ul><ul><li>Ex: Nível de instrução </li></ul></ul><ul><ul><li> Nível salarial </li></ul></ul>Maurício T. Damasceno
  15. 15. Variáveis Quantitativas (numéricas) <ul><li>Dados Discretos (contagem) </li></ul><ul><ul><li>Ex: Quantidade de vendas diárias; </li></ul></ul><ul><ul><li> Quantidade de transações financeiras </li></ul></ul><ul><li>Dados Contínuos (números reais) </li></ul><ul><ul><li>Ex: Valor das vendas diárias </li></ul></ul><ul><ul><li> Valor das transações financeiras do mês </li></ul></ul>Maurício T. Damasceno
  16. 16. Relembrando... Maurício T. Damasceno TIPOS DE VARIÁVEIS QUALITATIVAS QUANTITATIVAS NOMINAL ORDINAL DISCRETOS CONTÍNUOS
  17. 17. Analisando Dados Maurício T. Damasceno
  18. 18. <ul><li>Não faz sentido operações algébricas </li></ul><ul><li>Contagem => Tabulação </li></ul><ul><li>Tabelas de Freqüência </li></ul><ul><li>Gráficos </li></ul>Dados Qualitativos Maurício T. Damasceno
  19. 19. Ex: Dados de uma amostra de 24 compras de refrigerantes Dados Qualitativos Tabela 1 – Distribuição de freqüências das compras de refrigerante Fonte – Dados fictícios Maurício T. Damasceno
  20. 20. <ul><li>Gráfico de Barras </li></ul>Dados Qualitativos Maurício T. Damasceno
  21. 21. Dados Qualitativos <ul><li>Gráfico de Colunas </li></ul>Maurício T. Damasceno
  22. 22. Dados Qualitativos <ul><li>Gráfico de Setores </li></ul>Maurício T. Damasceno
  23. 23. Como NÃO fazer gráfico ! Maurício T. Damasceno
  24. 24. Forma Correta de Representação Gráfica Maurício T. Damasceno
  25. 25. Analisando Dados Quantitativos Maurício T. Damasceno
  26. 26. <ul><li>Ex: Seja uma série de dados de opções de ações negociadas por dia na bolsa de valores. </li></ul>17 negócios realizados nesse dia!! Dados Quantitativos Discretos Maurício T. Damasceno
  27. 27. Tabela de Freqüências Observações mais freqüentes!! Maurício T. Damasceno
  28. 28. <ul><li>Gráfico de Linha </li></ul>Dados Quantitativos Discretos Maurício T. Damasceno
  29. 29. Dados Quantitativos Contínuos Maurício T. Damasceno
  30. 30. Dados Quantitativos Contínuos <ul><li>Como representar graficamente dados quantitativos contínuos? </li></ul><ul><li>Gráfico de Histograma </li></ul>Maurício T. Damasceno
  31. 31. <ul><li>Condensa dados agrupando valores em classes </li></ul><ul><li>Alturas das barras refletem freqüências absolutas ou relativas (percentuais) </li></ul><ul><li>Representa uma tabela de Distribuição de Freqüências </li></ul>Histograma Maurício T. Damasceno
  32. 32. Histograma Maurício T. Damasceno
  33. 33. 0 0 Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  34. 34. 0 Absoluta ou Relativa 0 Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  35. 35. 0 1 2 3 4 5 Absoluta ou Relativa 0 Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  36. 36. 0 1 2 3 4 5 Absoluta ou Relativa 0 lim inferior Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  37. 37. 0 1 2 3 4 5 0 15 lim inferior Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  38. 38. 0 1 2 3 4 5 0 15 25 lim inferior Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  39. 39. 0 1 2 3 4 5 0 15 25 35 lim inferior Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  40. 40. 0 1 2 3 4 5 0 15 25 35 45 55 lim inferior Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  41. 41. 0 1 2 3 4 5 0 15 25 35 45 55 Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  42. 42. 0 1 2 3 4 5 0 15 25 35 45 55 Barras justapostas Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  43. 43. 0 1 2 3 4 5 0 15 25 35 45 55 Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  44. 44. Medidas Estatísticas Maurício T. Damasceno
  45. 45. Medidas Estatísticas Maurício T. Damasceno Médias Mediana Moda Posição Amplitude Variância Desvio Padrão Variação Assimetria Forma Medidas Estatísticas Coeficiente de variação Desvio médio Outras Desvio Inter-Quartílico
  46. 46. Caso Motivacional Maurício T. Damasceno ... Empregados reclamam que, na maioria, recebem apenas $200,00 por mês. $4.000,00 $700,00 $500,00 $300,00 $200,00 ... Presidente diz que, em média, eles recebem $700,00!
  47. 47. Medidas de Posição (Tendência Central) - Média - Moda - Mediana Maurício T. Damasceno
  48. 48. Média <ul><li>Uma das medidas mais utilizadas para representar os dados mais típicos </li></ul><ul><li>Reflete um ponto de equilíbrio </li></ul><ul><li>Influenciada por valores extremos </li></ul><ul><li>Só deve ser utilizada em distribuições: </li></ul><ul><ul><li>Não heterogêneas </li></ul></ul><ul><ul><li>Simétricas ou levemente assimétricas </li></ul></ul>Maurício T. Damasceno
  49. 49. Exemplo Dados: 10 4 8 11 6 9 Maurício T. Damasceno
  50. 50. Média para Tabelas de Freqüências X X  i i m    1 X i i M   1 Amostra  = População f i f i f i  f i M   de classes na população m   de classes na amostra Maurício T. Damasceno
  51. 51. Média Ponderada X  i i m   1 X i i M   1 Pesos Freqüências f i p i f i  p i Maurício T. Damasceno
  52. 52. Média Ponderada Exemplo: Distribuição de Freqüências Maurício T. Damasceno
  53. 53. Média Ponderada Exemplo 1: Média Aritmética Média Ponderada Maurício T. Damasceno
  54. 54. Média Geométrica Exemplo 1: A Taxa Média de crescimento dos preços dos produtos foi de 13,26%. Maurício T. Damasceno
  55. 55. Média Geométrica Duas observações importantes: 2. Menos afetada pelos extremos. 1. Medida de tendência central mais adequada quando as observações apresentam taxa constante de crescimento em função do tempo. Maurício T. Damasceno
  56. 56. Maurício T. Damasceno Médias Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Desvio Inter-Quartílico
  57. 57. Mediana <ul><li>Valor que divide a distribuição em duas partes iguais </li></ul><ul><ul><li>Se n for ímpar, a mediana será a obs. que ocupa a posição central </li></ul></ul><ul><ul><li>Se n for par, a mediana será a média dos dois valores centrais </li></ul></ul><ul><li>Não é influenciada por valores extremos, mas sim pelas freqüências </li></ul>Maurício T. Damasceno
  58. 58. Mediana: Método de Cálculo 1. Ordenar a série de valores 2. Encontrar o Elemento mediano (Emd) 2.1 Se n é par: 2.2 Se n é ímpar: Maurício T. Damasceno
  59. 59. Mediana – Exemplo 1 Dados: 24 22 21 23 22 Dados Ordenados: 21 22 22 23 24 n é ímpar: Maurício T. Damasceno
  60. 60. Mediana – Exemplo 2 Dados: 10 4 8 11 6 7 Dados Ordenados: 4 6 7 8 10 11 n é par: Maurício T. Damasceno
  61. 61. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Desvio Inter-Quartílico
  62. 62. Moda <ul><li>Valor mais freqüente </li></ul><ul><li>Não é afetada por valores extremos </li></ul><ul><li>Pode haver mais de uma moda </li></ul><ul><li>Pode ser utilizada para dados qualitativos e quantitativos </li></ul>Maurício T. Damasceno
  63. 63. Moda – Exemplo 1 Dados: 24 22 21 23 22 Moda = 22 Maurício T. Damasceno
  64. 64. Exemplo: Uso do Cinto de Segurança Categoria de maior freqüência, portanto, é a Moda. Maurício T. Damasceno
  65. 65. Medidas de Variação Maurício T. Damasceno
  66. 66. Caso Motivacional Maurício T. Damasceno
  67. 67. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Desvio Inter-Quartílico
  68. 68. Amplitude <ul><li>Diferença entre a maior e a menor observação </li></ul><ul><li>Ignora como os dados estão distribuídos </li></ul><ul><li>Considera apenas dois valores da distribuição </li></ul>Maurício T. Damasceno Amplitude   X x 7 8 9 10 7 8 9 10
  69. 69. Amplitude – Exemplo 1 Dados: 10 4 8 11 6 7 Dados Ordenados: 4 6 7 8 10 11 Maurício T. Damasceno
  70. 70. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Desvio Inter-Quartílico
  71. 71. Desvio Médio Indica a distância das observações em relação à média da distribuição Maurício T. Damasceno i |  X   i   | DM X n n
  72. 72. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Desvio Inter-Quartílico
  73. 73. Variância e Desvio Padrão Dados 1: 4 6 7 8 10 11 Maurício T. Damasceno
  74. 74. Variância e Desvio Padrão Dados 1: 4 6 7 8 15 11 Maurício T. Damasceno
  75. 75. Variância e Desvio Padrão Dados 1: 4 6 7 8 100 11 Maurício T. Damasceno
  76. 76. Desvio Padrão <ul><li>Medidas de variação absoluta. </li></ul><ul><li>É a distância média dos dados em relação à média. </li></ul><ul><li>Mostra como os dados estão dispersos em relação a média. </li></ul>Maurício T. Damasceno
  77. 77. Desvio Padrão Maurício T. Damasceno
  78. 78. Desvio padrão da amostra Maurício T. Damasceno
  79. 79. Exercício Para a série de dados abaixo calcule a média e desvio padrão. No Excel: = media(A1:A6) = desvpad(A1:A6) Maurício T. Damasceno
  80. 80. Medida de Forma Maurício T. Damasceno
  81. 81. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Quartis
  82. 82. Forma <ul><li>Descreve a forma da distribuição </li></ul><ul><li>Medida pelo coeficiente de assimetria </li></ul>Assimetria positiva Assimetria negativa Simétrica Média = Mediana = Moda Média Mediana Moda Moda Mediana Média Preferência: Mediana Preferência: Mediana Preferência: Media Maurício T. Damasceno
  83. 83. Exemplo: Maurício T. Damasceno ... Empregados reclamam que, na maioria, recebem apenas $200,00 por mês. $4.000,00 $700,00 $500,00 $300,00 $200,00 ... Presidente diz que, em média, eles recebem $700,00!
  84. 84. Outras Medidas Maurício T. Damasceno
  85. 85. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Quartis
  86. 86. Relembrando..... <ul><li>O desvio padrão visa medir o grau de dispersão de um conjunto de dados; </li></ul><ul><li>Quanto maior o desvio padrão menor a representatividade da média; </li></ul><ul><li>O desvio padrão é uma medida de risco. </li></ul><ul><li>Pergunta : Como comparar a dispersão entre dois conjuntos de dados? </li></ul>Maurício T. Damasceno
  87. 87. Coeficiente de Variação (CV) <ul><li>Situação problema: Qual o melhor investimento? </li></ul><ul><li>Para decidir qual o melhor investimento, considerando investidor avesso ao risco, deve-se utilizar uma medida apropriada para fazer comparação entre diferentes conjuntos de dados. </li></ul><ul><li>O coeficiente de variação é essa medida. </li></ul>Maurício T. Damasceno
  88. 88. Coeficiente de Variação <ul><li>Medida relativa de variação. </li></ul><ul><li>Indica se a distribuição é homogênea ou não. </li></ul><ul><li>Mede a dispersão dos dados em relação à média. </li></ul>Maurício T. Damasceno
  89. 89. Exercício <ul><li>Calcule a média, desvio padrão e CV </li></ul>Maurício T. Damasceno
  90. 90. Exercício <ul><li>Respostas. </li></ul>CV < 20%: Séries homogêneas!!! Maurício T. Damasceno
  91. 91. Problema!! <ul><li>Como é o relacionamento entre as ações A e B? </li></ul>Maurício T. Damasceno
  92. 92. Interpretando o exercício <ul><li>O gráfico de dispersão das ações A e B indica tendências opostas entre as ações A e B. </li></ul><ul><li>Como medir essas tendências ? </li></ul><ul><li>COVARIÂNCIA !! </li></ul>Maurício T. Damasceno
  93. 93. Covariância <ul><li>Fórmula: </li></ul><ul><li>Em amostras utilizar as médias amostrais e o tamanho da amostra (n). </li></ul>Maurício T. Damasceno
  94. 94. Covariância <ul><li>Cálculo da covariância para as ações A e B. </li></ul>O sinal é negativo !!!! Maurício T. Damasceno
  95. 95. Covariância <ul><li>É uma medida de tendência entre duas séries. </li></ul><ul><li>Objetiva identificar como os valores se inter-relacionam. </li></ul><ul><li>Avalia como duas variáveis movimentam-se ao mesmo tempo em relação à suas médias (covariam). </li></ul>Maurício T. Damasceno
  96. 96. Covariância <ul><li>COV > 0 – Indica comportamento de mesma tendência entre duas séries. </li></ul><ul><li>COV = 0 – Indica que não existe associação linear entre as séries. </li></ul><ul><li>COV < 0 – Indica comportamento de tendência contrária entre duas séries. </li></ul>Maurício T. Damasceno
  97. 97. Covariância <ul><li>Exercício : Para as séries de retornos das ações X e Y abaixo, verificar se existe associação entre elas. Interprete o resultado. </li></ul>Maurício T. Damasceno
  98. 98. Covariância <ul><li>Interpretando o resultado do exercício: </li></ul>O sinal é negativo !!!! Maurício T. Damasceno
  99. 99. Covariância < 0 <ul><li>COV(X,Y) < 0 indica associação inversa entre as ações; </li></ul><ul><li>A COV(X,Y) < 0 indica que a tendência esperada é: o retorno de uma das ações valoriza-se acima do seu retorno médio quando o retorno da outra ficar abaixo. </li></ul><ul><li>A COV(X,Y) < 0 indica que as ações estão contrabalançadas, reduzindo o risco (variância) da carteira. </li></ul><ul><li>A COV(X,Y) < 0 é o que se chama de Heding . </li></ul>Maurício T. Damasceno
  100. 100. Covariância < 0 Maurício T. Damasceno
  101. 101. Covariância > 0 <ul><li>COV(X,Y) > 0 indica expectativa de retorno das ações no mesmo sentido; </li></ul><ul><li>A COV(X,Y) > 0 indica valorizações ou desvalorizações conjuntas; </li></ul><ul><li>A COV(X,Y) > 0 indica que as ações NÃO estão contrabalançadas, aumentando o risco (variância) da carteira. </li></ul>Maurício T. Damasceno
  102. 102. Covariância > 0 Maurício T. Damasceno
  103. 103. Problema <ul><li>A covariância mede se existe e como é o relacionamento (tendência) entre duas séries de dados. </li></ul><ul><li>Mas, existindo o relacionamento, como saber o grau desse relacionamento? </li></ul><ul><li>Como saber se o grau desse relacionamento é Baixo, Médio ou Alto? </li></ul>COEFICIENTE DE CORRELAÇÃO = Maurício T. Damasceno
  104. 104. Coeficiente de Correlação <ul><li>Calculando o coeficiente de correlação: </li></ul>Maurício T. Damasceno
  105. 105. Coeficiente de Correlação <ul><li>Interpretando o resultado: </li></ul><ul><li>Indica que possuem tendências opostas; </li></ul><ul><li>Indica que as tendências são fortemente opostas. </li></ul>Maurício T. Damasceno
  106. 106. Coeficiente de Correlação <ul><li>Mede o grau de associação linear entre duas variáveis; </li></ul><ul><li>O coeficiente de correlação varia entre –1 e +1; </li></ul><ul><li>Indica a força de associação entre duas variáveis; </li></ul><ul><li>Quanto mais próxima de –1 mais inversa a associação; </li></ul><ul><li>Quanto mais próxima de +1 mais direta a associação; </li></ul><ul><li>Quanto mais próxima de 0 a associação indica que as variáveis são linearmente independentes. </li></ul>Maurício T. Damasceno
  107. 107. Coeficiente de Correlação <ul><li>Exercício 1: Para as séries abaixo verifique o grau de associação das variáveis. Interprete graficamente. </li></ul>Maurício T. Damasceno
  108. 108. Coeficiente de Correlação <ul><li>Exercício 1:Gráfico de Dispersão </li></ul>Maurício T. Damasceno
  109. 109. Coeficiente de Correlação <ul><li>Exercício 1:Gráfico de Linha das variáveis X e Y. </li></ul>Maurício T. Damasceno
  110. 110. Coeficiente de Correlação <ul><li>Exercício 1:Interpretação. </li></ul><ul><li>Forte correlação positiva : a maioria dos pares das observações estão sob a reta com declividade positiva. </li></ul><ul><li>Os acréscimos e decréscimos são iguais e na mesma direção. </li></ul><ul><li>As duas séries de observações são paralelas. </li></ul>Maurício T. Damasceno
  111. 111. Coeficiente de Correlação <ul><li>Exercício 2:Para as séries abaixo verifique o grau de associação das variáveis. Interprete graficamente. </li></ul>Maurício T. Damasceno
  112. 112. Coeficiente de Correlação <ul><li>Exercício 2:Gráfico de Dispersão </li></ul>Maurício T. Damasceno
  113. 113. Coeficiente de Correlação <ul><li>Exercício 2:Gráfico de Linha das variáveis X e Y. </li></ul>Maurício T. Damasceno
  114. 114. Coeficiente de Correlação <ul><li>Exercício 2:Interpretação. </li></ul><ul><li>Forte correlação negativa : a maioria dos pares das observações estão sob a reta com declividade negativa. </li></ul><ul><li>Os acréscimos e decréscimos são iguais mas em direções opostas. </li></ul><ul><li>As duas séries de observações não são paralelas. </li></ul>Maurício T. Damasceno
  115. 115. Coeficiente de Correlação <ul><li>Cuidado com as correlações espúrias!!! </li></ul><ul><li>Existência de correlações não implica necessariamente em causalidade! </li></ul><ul><li>Podem existir correlações sem relação de causa e efeito. </li></ul><ul><li>Exemplo: Taxa de retorno e Índice Pluviométrico. </li></ul><ul><li>Terceiro Fator: Aumento de vendas do produto em estações de chuva. </li></ul>Maurício T. Damasceno
  116. 116. Aplicação prática de Análise de Dados Maurício T. Damasceno
  117. 119. Maurício T. Damasceno
  118. 121. Analisando os dados Maurício T. Damasceno
  119. 123. Gráfico de Setores Maurício T. Damasceno
  120. 125. Gráfico de Colunas Maurício T. Damasceno
  121. 127. 1º) Selecionar F41 a F 47 2º) Digitar a fórmula em F41 * selecionar os dados * selecionar as classes D41 a D46 3º) Pressionar ao mesmo tempo: CTRL+SHIFT+ENTER
  122. 129. Qual gráfico usamos para representar a distribuição de frequências de dados contínuos? Gráfico Histograma Maurício T. Damasceno Analisando os dados
  123. 131. Gráfico Histograma Maurício T. Damasceno
  124. 132. Gráfico Histograma Maurício T. Damasceno
  125. 133. Medidas Estatísticas Maurício T. Damasceno Analisando os dados
  126. 134. Maurício T. Damasceno
  127. 137. Gráfico Histograma
  128. 138. Analisando os dados O que é cruzamento de dados?
  129. 140. Gráfico de Dispersão e Correlação Maurício T. Damasceno
  130. 142. Análise de Dados - II Maurício T. Damasceno
  131. 143. Relembrando... <ul><li>Variáveis Quantitativas – Apresentam valores numéricos que fazem algum sentido. </li></ul><ul><ul><li>Variáveis Quantitativas Discretas – valores inteiros que fazem sentido; normalmente proveniente de contagens. Ex: nº de perdas, nº de fraudes, nº de erros. </li></ul></ul><ul><ul><li>Variáveis Quantitativas Contínuas – valores fracionados que fazem sentido. Ex: Fluxo de caixa, índice de rentabilidade. </li></ul></ul>Maurício T. Damasceno
  132. 144. Distribuição Contínua <ul><li>Exemplo: </li></ul><ul><li>A área sob a curva, entre dois pontos, informa a probabilidade. </li></ul>Média Alta frequência Baixa Freqüência Distribuição Normal. Maurício T. Damasceno Freqüência Variável X
  133. 145. Distribuição Normal Maurício T. Damasceno A área total abaixo da curva é considerada como 100%. Isto é, a área total abaixo da curva é 1.
  134. 146. Distribuição Normal Maurício T. Damasceno
  135. 147. Distribuição Normal <ul><li>Parâmetros da Distribuição Normal </li></ul>Maurício T. Damasceno
  136. 148. Distribuição Normal <ul><li>Conhecendo-se a média e o desvio-padrão é possível calcular qualquer valor de probabilidade. </li></ul><ul><li>Exemplo: A média das taxas de retorno mensais de uma carteira é de 40% e o seu desvio padrão 10%. </li></ul>Maurício T. Damasceno Pergunta : Qual a probabilidade de se observar uma taxa de retorno menor ou igual a 50%?
  137. 149. Distribuição Normal <ul><li>Qual a probabilidade de se observar um retorno menor ou igual a 50%? </li></ul>Área Maurício T. Damasceno
  138. 150. Distribuição Normal <ul><li>Como calcular a área sob a curva abaixo do ponto 50? </li></ul><ul><li>A área desejada é obtida pelo cálculo da integral da função f(x). </li></ul>Maurício T. Damasceno
  139. 151. Distribuição Normal <ul><li>Área sob a curva abaixo do ponto 50: </li></ul>Maurício T. Damasceno No Excel: = DIST.NORM(50;40;10;VERDADEIRO)
  140. 152. Distribuição Normal <ul><li>Exemplo: A média das taxas de retorno mensais de uma carteira é de 12% e o seu desvio padrão 4%. </li></ul>Maurício T. Damasceno Pergunta : Qual a probabilidade de se observar uma taxa de retorno maior que a média e menor ou igual a 14,56%?
  141. 153. Distribuição Normal Padronizada 14,56 Maurício T. Damasceno Probabilidade Média = 12 desvio padrão  = 4
  142. 154. Distribuição Normal Padronizada <ul><li>Existem várias famílias de distribuições normais diferentes. </li></ul><ul><li>Essa distribuição é chamada de Distribuição Normal Padronizada. O operador de transformação é: </li></ul><ul><li>Pode-se utilizar uma única distribuição normal para calcular as probabilidades. </li></ul>Número de desvios de afastamento em relação à média. Maurício T. Damasceno
  143. 155. Distribuição Normal Padronizada Probabilidade em tabela Z Z Z = +0,64 0,64 0 Maurício T. Damasceno Probabilidade 12  = 4 14,56
  144. 156. Para Z =0,64 0,2389 Maurício T. Damasceno Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,00 0 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
  145. 157. <ul><li>A média tem Distribuição Normal </li></ul>Maurício T. Damasceno Distribuição amostral da média
  146. 158. Inferência Estatística Maurício T. Damasceno <ul><li>Quando não é possível coletar todos os dados (população) para realizar análises, pode-se retirar amostras de uma população. </li></ul><ul><li>Análises realizadas a partir de amostras para se obter conclusões para uma população são chamadas de Inferências Estatísticas. </li></ul><ul><li>De modo geral , os métodos de inferência estatística são: </li></ul><ul><ul><li>Intervalos de Confiança </li></ul></ul><ul><ul><li>Testes de Hipótese </li></ul></ul>
  147. 159. Inferência Estatística Maurício T. Damasceno <ul><li>Intervalos de Confiança </li></ul><ul><li>É uma estimativa de um parâmetro desconhecido da população (ex: média) sob a forma de intervalo. </li></ul><ul><li>O intervalo apresenta uma valor mínimo e uma valor máximo. </li></ul><ul><li>Ao intervalo está associado um grau de confiança. </li></ul>
  148. 160. Relembrando: Distribuição Normal Maurício T. Damasceno
  149. 161. Inferência Estatística Maurício T. Damasceno <ul><li>Exemplos de Intervalos de Confiança </li></ul><ul><li>O faturamento médio mensal das micro empresas prestadoras de serviço, em Brasília, no ano de 2009, foi de R$30.000,00, com intervalo de confiança ao nível de 95% entre R$ 25.000,00 a R$35.000,00. </li></ul><ul><li>A quantidade média mensal de horas extras realizadas na empresa X, no ano de 2009, por funcionário, foi de 22 horas, com intervalo de confiança ao nível de 95% entre 18 a 32. </li></ul>
  150. 162. Inferência Estatística Maurício T. Damasceno <ul><li>Construido Intervalos de Confiança para a média com variância populacional conhecida </li></ul><ul><li>Retirar a amostra e calcular a Média </li></ul><ul><li>Escolher o Grau de confiança: Exemplo, 95% gera aproximadamente dois desvios padrão (1,96). </li></ul><ul><li>Limite Superior: = </li></ul><ul><li>Limite Inferior: = </li></ul>
  151. 163. Inferência Estatística Maurício T. Damasceno <ul><li>Exemplos de Intervalos de Confiança </li></ul><ul><li>O faturamento médio mensal de 60 micro empresas prestadoras de serviço, em Brasília, no ano de 2009, foi de R$30.000,00. O desvio padrão foi de R$19.362,92 </li></ul><ul><li>Limite Inferior(95%): </li></ul><ul><li>Limite Superior (95%): </li></ul><ul><li>IC 95% [30.000,00;35.000,00] </li></ul>
  152. 164. Maurício T. Damasceno Inferência Estatística <ul><li>INTERPRETAÇÃO DO IC: </li></ul><ul><li>Para o resultado anterior, IC 95% [30.000,00;35.000,00], significa que 95% das vezes em que se extrair amostras de tamanho 60 da mesma população, espera-se que a média se encontre entre R$30.000,00 e R$35.000,00. </li></ul>
  153. 165. Maurício T. Damasceno Inferência Estatística <ul><li>Regra prática: </li></ul>* Número de desvios aproximados de uma distribuição Normal. Grau de Confiança Número de desvios (z)* 68% 1 95% 2 99% 3
  154. 166. Maurício T. Damasceno Inferência Estatística <ul><li>Exercício 1: Para uma amostra de 60 empresas, determine o Intervalo de confiança, ao nível de 95%, considerando que a média é a mesma, mas o desvio padrão é de R$10.000,00, menos dispersão. </li></ul><ul><li>Limite Inferior(95%): </li></ul><ul><li>Limite Superior (95%): </li></ul><ul><li>IC 95% [27.418,01;32.581,99] </li></ul>=> Menor desvio=> Menor IC!!!
  155. 167. Maurício T. Damasceno Inferência Estatística <ul><li>INTERPRETAÇÃO DO IC: </li></ul><ul><li>Para o IC 95% [27.418,01;32.581,99], significa que 95% das vezes em que se extrair amostras de tamanho 60 da mesma população, espera-se que a média se encontre entre R$27.418,01 e R$32.581,99. </li></ul>
  156. 168. Maurício T. Damasceno Inferência Estatística <ul><li>Limite Inferior(95%): </li></ul><ul><li>Limite Superior (95%): </li></ul><ul><li>IC 95% [21,52 ; 22,47] </li></ul><ul><li>Exercício 2: Retirada uma amostra de 40 funcionários, verificou-se que a quantidade média mensal de horas extras realizadas na empresa X, no ano de 2009, por funcionário, foi de 22 horas, e desvio padrão de 1,5 horas. Construa um intervalo de confiança ao nível de 95%. </li></ul>
  157. 169. Maurício T. Damasceno Inferência Estatística <ul><li>INTERPRETAÇÃO DO IC: </li></ul><ul><li>Para o resultado anterior, IC 95% [21,52 ; 22,47], significa que 95% das vezes em que se extrair amostras de tamanho 40 da mesma população, espera-se que a média de horas extras se encontre entre 21,52 e 22,47 horas. </li></ul><ul><li>Nesse caso o limite inferior do IC está muito próximo do limite superior indicando que há pouca variação, ou seja, para os funcionários que realizam horas extras, essa quantidade é praticamente igual entre eles. </li></ul>
  158. 170. Maurício T. Damasceno Inferência Estatística <ul><li>Considerações a respeito do IC: </li></ul><ul><li>Quando a variância da população é conhecida, utiliza-se a distribuição Normal. </li></ul><ul><li>Quando a variância da população não é conhecida, utiliza-se a distribuição de Student. </li></ul><ul><li>Quando a variância da população não é conhecida, mas a distribuição não é pequena (n > 30), pode-se utilizar a distribuição Normal, pois os resultados são muito próximos à utilização da distribuição de Student. </li></ul>
  159. 171. Inferência Estatística Maurício T. Damasceno <ul><li>Hipótese estatística </li></ul><ul><li>Qualquer afirmativa formulada sobre um valor de um parâmetro da população, por exemplo, média. </li></ul><ul><li>A hipótese não necessariamente é verdadeira; pode ser verdadeira ou falsa. </li></ul>
  160. 172. Inferência Estatística Maurício T. Damasceno <ul><li>Testes de Hipótese </li></ul><ul><li>Conhecido também como Teste de Significância </li></ul><ul><li>Permite avaliar suposições feitas sobre uma característica da população. </li></ul><ul><li>Auxilia nas tomadas de decisões. </li></ul>
  161. 173. Inferência Estatística Maurício T. Damasceno <ul><li>Exemplo de Teste de Hipótese </li></ul><ul><li>Contexto: Em uma empresa verificou-se a necessidade de um treinamento para reduzir o tempo realização de certo trabalho. </li></ul><ul><li>Antes do treinamento o tempo médio, por funcionário, para a realização do trabalho era de 3 horas. </li></ul><ul><li>Realizado o treinamento, como comprovar que o tempo médio diminuiu? </li></ul>
  162. 174. Inferência Estatística Maurício T. Damasceno <ul><li>Exemplo de Teste de Hipótese </li></ul><ul><li>Hipótese Nula (H0): o tempo médio é de 3 horas. </li></ul><ul><li>Hipótese Alternativa (H1): o tempo médio é menor que 3 horas. </li></ul><ul><li>Retirar uma amostra </li></ul><ul><li>Construir o Intervalo de Confiança </li></ul><ul><li>Verificar se a afirmação feita em H0 está contida no IC </li></ul><ul><li>Aceitar OU Rejeitar H0 </li></ul>
  163. 175. Inferência Estatística Maurício T. Damasceno <ul><li>Exemplo de Teste de Hipótese </li></ul><ul><li>Para o exemplo em questão, retirou-se uma amostra de 30 funcionários, calculou-se o tempo médio, 2,5 horas, e o desvio padrão 0,9 horas. Para um IC de 95% para o tempo médio, obteve-se: </li></ul><ul><li>Limite Inferior(95%): </li></ul><ul><li>Limite Superior (95%): </li></ul>
  164. 176. Inferência Estatística Maurício T. Damasceno <ul><li>Exemplo de Teste de Hipótese </li></ul><ul><li>Qual a decisão? Aceitar a hipótese H0 (o treinamento não surtiu efeito) ou rejeitar H0 (o treinamento surtiu efeito)? </li></ul><ul><li>Pelo IC calculado, percebe-se que o tempo médio de 3 horas não faz parte do intervalo, logo rejeita-se a Hipótese Nula (H0) e conclui-se que o treinamento surtiu efeito. </li></ul><ul><li>IC 95% [2,17 ; 2,82] </li></ul>
  165. 177. Inferência Estatística Maurício T. Damasceno <ul><li>Exercício de Teste de Hipótese </li></ul><ul><li>Contexto: Em uma empresa observou-se um elevado tempo médio de dias de afastamentos do trabalho, por semana, relacionados a doenças por Lesões por Esforço Repetitivo. </li></ul><ul><li>O departamento de gestão de pessoas decidiu trocar a empresa responsável pelo exercício laboral e após seis meses verificou o tempo médio de afastamentos. </li></ul><ul><li>Será que a nova empresa é mais eficiente? O tempo médio de afastamentos diminuiu estatisticamente? </li></ul>
  166. 178. Inferência Estatística Maurício T. Damasceno <ul><li>Exemplo de Teste de Hipótese </li></ul><ul><li>Para uma amostra de 40 funcionários, observou-se um número de afastamentos nos últimos seis meses de 197 dias. O desvio padrão da amostra é de 2,8 dias. Se o tempo médio anterior era de 7,4 dias, construa um IC de 95% para o tempo médio e verifique se houve uma redução. </li></ul><ul><li>Limite Inferior(95%): </li></ul><ul><li>Limite Superior (95%): </li></ul>
  167. 179. Inferência Estatística Maurício T. Damasceno <ul><li>Exemplo de Teste de Hipótese </li></ul><ul><li>Qual a decisão? Aceitar a hipótese H0 (a nova empresa não conseguiu reduzir o tempo médio de afastamentos) ou rejeitar H0 (o tempo médio de afastamentos diminuiu)? </li></ul><ul><li>Pelo IC calculado, percebe-se que o tempo médio de 7,4 dias não faz parte do intervalo, logo rejeita-se a Hipótese Nula (H0) e conclui-se que o tempo médio de afastamentos diminuiu. </li></ul><ul><li>IC 95% [4,53 ; 5,32] </li></ul>
  168. 180. Inferência Estatística Maurício T. Damasceno <ul><li>Exercício de Teste de Hipótese </li></ul>

Editor's Notes

  • Este slide tem que estar linkado com os próximos 5 slides.
  • Este slide tem que estar linkado com os próximos 5 slides.
  • Este slide tem que estar linkado com os próximos 5 slides.
  • Problema – não começa do zero.
  • 11 EMPREGADOS; TOTAL DE SALÁRIOS: $770,000. MODA: $20,000 ; MEDIANA: $30,000 ; MÉDIA: $700,00 (ARGUMENTO DO PRESIDENTE).
  • Acho que deve trocar n. de obs. Por n???????
  • 11 EMPREGADOS; TOTAL DE SALÁRIOS: $770,000. MODA: $20,000 ; MEDIANA: $30,000 ; MÉDIA: $700,00 (ARGUMENTO DO PRESIDENTE).
  • ×