of 18 /18
Existe, com 95% de Confiança, relação entre o “Ano de Nascimento” e o “Ano de Confirmação”? Através dos dados obtidos na seguinte tabela num artigo sobre a BSE em Portugal, foi possível elaborar um estudo estatístico e comprovar se existe ou não relação entre as diferentes variáveis. Tabela 1 Distribuição dos animais positivos (2002-2009) por ano de nascimento e ano de confirmação laboratorial

Análise (SPSS)

Embed Size (px)

Text of Análise (SPSS)

  • 1. Existe, com 95% de Confiana, relao entre o Ano deNascimento e o Ano de Confirmao?Atravs dos dados obtidos na seguinte tabela num artigo sobre a BSE emPortugal, foi possvel elaborar um estudo estatstico e comprovar se existe ou norelao entre as diferentes variveis.Tabela 1 Distribuio dos animais positivos (2002-2009) por ano de nascimento e ano de confirmao laboratorial

2. Verificao da Normalidade da varivel contnua Ano de Nascimento Dos 435 casos analisados no estudo desta varivel, foram apenas includos oscasos cujo ano de nascimento compreende o perodo entre 1984 e 2002. Destes 435casos, 435 cumpriram os requisitos, isto , foram considerados vlidos. Tabela 2 - Anlise descritiva da varivel "Ano de Nascimento"Descriptives Statistic Std. Error Ano de NascimentoMean1995,23,11395% Confidence IntervalLower Bound1995,00for Mean Upper Bound1995,455% Trimmed Mean 1995,32Median1995,00Variance5,562Std. Deviation2,358Minimum1984Maximum2002Range 18Interquartile Range3Skewness -,678 ,117Kurtosis1,980,234 A partir da tabela acima, podemos concluir que a amostra tem como Ano deNascimento mdio 1995,23, com um desvio padro de 2,358 anos e um ano mnimo emximo de 1984 e 2002, respectivamente. Com 95% de confiana, pode-se inferir que a populao de gado com BSE emPortugal nasceu, em mdia, entre 1995 e 1995,45. Como os dados da varivel Ano deNascimento esto aproximados unidade (apesar desta ser uma varivel contnua), amediana ir ter um valor absoluto (1995). A amplitude do intervalo de 95% deconfiana de 0,45 anos e tem sempre 1995 como valor aproximado, pelo que sepode considerar que a mediana pertence ao intervalo de 95% de confiana. Conclui-se,assim, que esta se encontra prxima do valor mdio da amostra, minimizando o errode vis e aumentando a exactido do estudo. 3. Em relao normalidade da varivel Ano de Nascimento, esta pode serconstatada nos seguintes grficos (Ilustraes 1, 2 e 3, respectivamente): Ilustrao 1 - Histograma relativo varivel "Ano de Nascimento"Ilustrao 2 - P-P Plot da varivel "Ano de Nascimento" 4. Ilustrao 3 - P-P Plot da varivel "Ano de Nascimento" (1) A normalidade da varivel , sobretudo, comprovada pelos testes P-P Plot, quemostram claramente uma tendncia em seguir uma distribuio normal, tendovariaes estatisticamente no significativas. 5. Verificao da Normalidade da varivel contnua Ano deConfirmaoDos 435 casos analisados, foram apenas includos no estudo desta varivel osque compreendiam o Ano de Confirmao entre 2002 e 2009. Destes 435 casos, 435cumpriram os requisitos, sendo, portanto, considerados vlidos. Da anlise inicial davarivel, obteve-se a tabela 2:Tabela 3 - Anlise descritiva da varivel "Ano de Confirmao"Descriptives Statistic Std. Error Ano de Confirmao Mean 2003,92,082 95% Confidence Interval Lower Bound 2003,76 for MeanUpper Bound 2004,08 5% Trimmed Mean 2003,78 Median2003,00 Variance 2,929 Std. Deviation 1,711 Minimum 2002 Maximum 2009 Range 7 Interquartile Range 2 Skewness 1,080 ,117 Kurtosis ,670,234A partir da tabela acima, podemos concluir que a amostra tem como Ano deConfirmao mdio 2003,92, com um desvio padro de 1,711 anos e um ano mnimo emximo de 2002 e 2009, respectivamente.Com 95% de confiana, pode-se inferir que a populao de gado com BSE emPortugal foi confirmada/detectada, em mdia, entre 2003,76 e 2004,08, com umaamplitude de 0,32 anos. A mediana (2003) no pertence ao intervalo de 95% deconfiana, logo, encontra-se afastada do valor mdio da amostra, podendo, por isso,aumentar o erro de vis e diminuir a exactido do estudo. 6. Podemos admitir que a varivel tende a seguir uma distribuio normal, j que acurva de Gauss que se apresenta na ilustrao se encontra relativamente bemenquadrada no histograma. Ilustrao 4- Histograma relativo varivel "Ano de Confirmao" 7. Ilustrao 5 - P-P Plot da varivel "Ano de Confirmao"Ilustrao 6 - P-P Plot da varivel "Ano de Confirmao" (1) 8. Os grficos P-P Plot corroboram a tendncia da varivel Ano de Confirmaopara seguir uma distribuio normal, j que conseguimos ver um ajuste dos dados curva de Gauss, com pequenas variaes em alguns pontos que no chegam a afastar-se 0,1 da normal. Correlao Linear de Pearson O coeficiente de correlao de Pearson um mtodo estatstico e paramtrico1que permite avaliar a existncia de uma relao linear entre variveis quantitativascontnuas, isto , como estas variam conjuntamente. A normalidade das variveis Anode Nascimento e Ano de Confirmao j foi anteriormente comprovada, da queseja, agora, possvel utilizar o Coeficiente de Correlao de Pearson como forma deanalisar se existe ou no uma relao entre estas duas variveis. A hiptese nula (H0) neste teste ser No existe correlao entre o Ano deNascimento e o de Confirmao e a hiptese alternativa (H1) Existe correlao entreo Ano de Nascimento e o de Confirmao. Aplicando, ento, a correlao de Pearson,obtemos as tabelas 4 e 5, respectivamente: Tabela 4 - Estatstica descritiva das variveis "Ano de Nascimento" e "Ano de Confirmao" Descriptive StatisticsMean Std. Deviation N Ano de Nascimento1995,232,358435 Ano de Confirmao 2003,921,711435 1 Obedecem aos parmetros da distribuio normal. 9. Tabela 5 - Correlao de PearsonCorrelations Ano deAno de NascimentoConfirmao Ano de Nascimento Pearson Correlation1 ,082 Sig. (2-tailed),087 N435 435 Ano de ConfirmaoPearson Correlation,082 1 Sig. (2-tailed),087 N435 435 Aps a anlise estatstica, tem-se: logo a relao baixa , logo, no se rejeita H0. Assim, com 95% de confiana, no podemos dizer que haja uma relao linearentre o ano de nascimento e o de confirmao. Sabemos agora que no temos provas e dados estatsticos suficientes para dizerque haja uma relao entre o ano de nascimento e o ano de confirmao, mas serque o mesmo se aplica idade que o animal tem quando confirmado como caso deBSE? 10. Anlise da varivel Idade de Confirmao A varivel Idade pode ser obtida subtraindo o Ano de Nascimento ao Ano deConfirmao. S os casos em que a Idade variava entre 2 e 20 anos foram includos noestudo, perfazendo um total de 435 casos, como se pode ver na tabela 6: Tabela 6 - Anlise descritiva da varivel "Idade de Confirmao" Descriptives Statistic Std. ErrorIdade de ConfirmaoMean8,69 ,13495% Confidence Interval forLower Bound8,43Mean Upper Bound8,965% Trimmed Mean 8,54Median8,00Variance 7,827Std. Deviation 2,798Minimum2Maximum 18Range 16Interquartile Range3Skewness,799 ,117Kurtosis,549 ,234 Podemos concluir a partir da tabela que a amostra da varivel Idade tem comomdia 8,69 anos, com um desvio padro de 2,798 anos e uma idade mnima e mximade 2 e 18 anos, respectivamente. Com 95% de confiana, pode-se inferir que a populao de gado com BSE emPortugal tem uma idade mdia entre 8,43 e 8,96 anos, com uma amplitude de 0,53anos. impossvel que a mediana pertena ao intervalo de confiana, uma vez queesta tem valores arredondados unidade e o intervalo de confiana no inclui essesvalores. Assim, a mediana (8 anos) no pertence ao intervalo de 95% de confiana, jque se encontra afastada do valor mdio da amostra. Podemos admitir que a varivel segue uma distribuio normal, j que a curva deGauss se encontra bem adaptada ao histograma. 11. Ilustrao 7- Histograma relativo varivel "Idade de Confirmao"Ilustrao 8 - P-P Plot relativo varivel "Idade de Confirmao" 12. Ilustrao 9 - P-P Plot relativo varivel "Idade de Confirmao" (1) A normalidade da varivel ainda corroborada pelos grficos P-P Plot, quemostram um bom ajuste curva de Gauss, com apenas pequenas variaes que noultrapassam os 0,75. Correlao Linear de Pearson Comprovada a normalidade da varivel contnua Idade, podemos recorrer,mais uma vez, ao coeficiente de correlao de Pearson para avaliar se existe umarelao linear entre a Idade e o Ano de Nascimento. Mais uma vez, a hiptese nula (H0) No existe correlao entre a Idade e oAno de Nascimento e a hiptese alternativa (H1) Existe correlao entre a Idade e oAno de Nascimento. 13. Tabela 7- Anlise descritiva das variveis "Idade" e "Ano de Nascimento"Descriptive StatisticsMeanStd. DeviationN Idade8,69 2,798435 Ano de Nascimento1995,232,358435Tabela 8 - Correlao de Pearson CorrelationsIdade deAno deConfirmao Nascimento** IdadePearson Correlation 1 -,793Sig. (2-tailed),000N435 435 ** Ano de NascimentoPearson Correlation-,793 1Sig. (2-tailed),000N435 435 **. Correlation is significant at the 0.01 level (2-tailed).Aps a anlise estatstica, tem-se:logo existe uma forte correlaologo rejeita-se H0Assim, com 95%, ou at mesmo 99% de confiana, podemos dizer que h umarelao linear inversa entre o ano de nascimento e a idade, ou seja, aceitamos ahiptese alternativa (H1).Assim sendo, estimou-se a recta de regresso linear entre as variveis 14. Tabela 9 - Parmetros da recta de regresso linear das variveis Idade de Confirmao e Ano deNascimentoModel Summary and Parameter Estimates Dependent Variable:Idade de Confirmao Model Summary Parameter Estimates EquationR Square F df1 df2 Sig. Constantb1 Linear,628 732,051 1433 ,0001884,803 -,940 The independent variable is Ano de Nascimento.Ilustrao 10 - Recta de regresso linear das variveis "Idade de Confirmao" e "Ano de Nascimento"A equao da reta de regresso , ento:Em que= Ano de Nascimento e = Idade de Confirmao.Este resultado indica que quanto mais cedo o animal nasce, mais velho serquando for confirmado como caso de BSE. Uma vez que nos princpios da epidemia eradifcil identificar um animal como suspeito, muitos destes animais no eram abatidos, 15. aumentando a sua idade at serem confirmados sendo essa a principal causa destadistribuio de idades. 16. Com 95% de Confiana, existe relao entre a Idade e o Anode Confirmao? Utilizando a Correlao de Pearson Hiptese nula (H0) No existe correlao entre a Idade e o Ano de Confirmaoe a hiptese alternativa (H1) Existe correlao entre a Idade e o Ano de Confirmao. Descriptive Statistics MeanStd. Deviation NAno de Confirmao 2003,92 1,711435Idade de Confirmao8,69 2,798435Correlations Ano de Idade de ConfirmaoConfirmao **Ano de Confirmao Pearson Correlation1 ,542 Sig. (2-tailed) ,000 N435435 **Idade de Confirmao Pearson Correlation,5421 Sig. (2-tailed),000 N435435**. Correlation is significant at the 0.01 level (2-tailed). Aps a anlise estatstica, tem-se: logo existe uma correlao moderadalogo rejeita-se H0 Assim, com 95% de Confiana (at mesmo com 99% de Confiana), podemosdizer que h uma relao linear direta entre o ano de confirmao e a idade, ou seja,aceitamos a hiptese alternativa. Assim sendo, estimou-se a reta de regresso linear entre as variveis. 17. Tabela 10 - Parmetros da recta de regresso linear das variveis Idade de Confirmao e Ano deConfirmaoModel Summary and Parameter Estimates Dependent Variable:Idade de Confirmao Model SummaryParameter EstimatesEquation R Square F df1 df2 Sig. Constant b1Linear ,294 180,443 1 433,000 -1768,018 ,887 The independent variable is Ano de Confirmao. A equao da reta de regresso em que= Ano de Confirmao e = Idade de Confirmao Este resultado indica que quanto mais tarde confirmado o caso de BSE maisvelho tende a ser o animal infetado. Isto pode parecer contraditrio, mas pode serjustificado por uma tendncia de uma infeo numa idade mais tardia ou talvez por 18. um aumento do perodo de incubao, o que leva a que a deteo de um animalinfetado seja feita quando este estiver numa idade mais avanada do que o esperado.No entanto, neste caso, seriam necessrios mais estudos de forma a perceber quais ascausas que levam a que exista esta relao entre a Idade e o Ano de Confirmao.