Caderno dedatico multivariada livro final 1

  • View
    2.080

  • Download
    0

Embed Size (px)

Text of Caderno dedatico multivariada livro final 1

  • 1. ANLISE MULTIVARIADA DA TEORIA PRTICA por Lorena ViciniOrientador: Adriano Mendona SouzaSanta Maria, RS, Brasil2005

2. V635a Vicini, Lorena Anlise multivariada da teoria prtica / LorenaVicini ; orientador Adriano Mendona Souza. - SantaMaria : UFSM, CCNE, , 2005. 215 p. : il.Originalmente apresentada como monografia doautor (especializao-Universidade Federal de SantaMaria, 2005)Inclui referncias bibliogrficas1. Estatstica 2. Estatstica Anlise multivariadaI. Souza, Adriano Mendona II. Ttulo.CDU 519.237Ficha catalogrfica elaborada porAlenir Incio Goularte CRB-10/990Biblioteca Central da UFSM 2005Todos os direitos autorais reservados a Lorena Vicini e Adriano Mendona Souza. Areproduo de partes ou do todo deste trabalho s poder ser com autorizao porescrito do autor.Fone (0xx) 54 9961-8410 ou (0xx) 55 99743167;End. Eletr: lorenavicini@pop.com.br, amsouza@smail.ufsm.br 3. SOBRE OS AUTORES Os autores so formados em matemtica, com especializao em Estatsticae Modelagem Quantitativa no Departamento de Estatstica UFSM, Adriano(amsouza@smail.ufsm.br) realizou o Mestrado em Engenharia de Produo PPGEP - UFSM, a longo tempo atrs, e doutorado tambm em Engenharia deProduo na UFSC e atuou como pesquisador na Texas A&M University Texas.Lorena (lorenavicini@pop.com.br) est realizando o curso de Mestrado noPPGEP UFSM e tem perceptivas de continuar se aprimorando. Os dois socolegas de trabalho no Departamento de Estatstica e desenvolvem a maioria desuas pesquisas com a aplicao das tcnicas multivariadas. Os dois pertencem adois grupos de pesquisa que so o Ncleo de Estatstica Aplicada e Ncleo deEstudos do Agro negcio Brasileiro. 4. NOTA DOS AUTORES A estatstica mostra-se, cada vez mais, como uma poderosa ferramenta paraa anlise e avaliao de dados, em vrias reas do conhecimento, sendo muitasvezes um tanto difcil para os profissionais trabalharem conceitos e elaboraremexemplos prticos, devido limitao de materiais didticos que expressem, comsimplicidade e clareza, mtodos e procedimentos da aplicao de certas tcnicasmultivariadas, que s passaram a ser utilizadas, em larga escala, a partir do adventodos computadores. Embora a estatstica multivariada tenha surgido por volta de 1901, apenasnos dias de hoje consegue-se desenvolver e aplicar essa tcnica, pois sem o auxiliode programas computacionais no seria possvel realizar to rpido, e com tantaclareza, os grficos que possibilitam estudar o inter-relacionamento das variveis. Pode-se verificar, no decorrer da pesquisa, que as tcnicas de anlise deagrupamentos, e anlise de componentes principais, so tcnicas matemticas, comgrande fundamentao na lgebra e na geometria, o que muitas vezes faz com queos estatsticos no considerem como tcnica estatstica. Por outro lado, figuram,quase sempre, em congressos nacionais e revistas especializadas, que tratam deassuntos sobre estatstica. A anlise fatorial, que muitas vezes confundida com anlise decomponentes principais, pelo fato de um dos modos de extrao de fatores ser a decomponentes principais, considerada uma tcnica estatstica, pois ela pressupe aexistncia de um modelo, permite que se faa inferncias e cumpre com algumaspressuposies bsicas sobre as variveis em anlise, como a multinormalidade dosdados. Nos dias atuais, o uso dessas tcnicas est bastante consolidado, masdeve-se ter o cuidado de que no basta se observar um conjunto de variveis eaplicar tcnicas multivariadas, simplesmente, com o intuito de apresentar a tcnica evalorizar a pesquisa que se est realizando. H a necessidade de que exista umaestrutura de correlao entre as variveis, pois, se as mesmas no estiverem ligadasentre si, tem-se que utilizar uma anlise univariada, uma vez que esta, se bemaplicada, capaz de fornecer um nvel muito bom de informao. A estatstica univariada, em nenhum momento deve ser dispensada, quandose realiza um trabalho estatstico, pois por meio da anlise exploratria de dados 5. que ser possvel conhecer as variveis em estudo. Como se sabe, a anlisemultivariada uma tcnica exploratria e, devido a isso, a anlise univariada sertil, tambm, para realizar um estudo confirmatrio.Com o material didtico, que est sendo apresentado, fez-se uma amplareviso de literatura, levando-se em considerao textos clssicos e atuais, poisprocura-se revelar, ao mximo, essa tcnica, que, muitas vezes, obscura para osalunos, pesquisadores e profissionais que a utilizam. O uso do software foiindispensvel, pois sem ele no seria possvel a realizao dos estudos de caso.Embora trabalhando-se com programas diferentes, existe uma similaridade entreeles. Isto , ao se saber bem interpretar os resultados de um, no se ter problemasao se interpretar resultados de outro.Devido crescente procura sobre a anlise multivariada e a busca dematerial didtico que esteja disponvel para pesquisas nesta rea, desenvolve-seeste material, que traz, passo a passo o desenvolvimento das tcnicas de anlise deagrupamentos, anlise fatorial e anlise de componentes principais, pois sabe-seque muitos materiais existem e mostram como aplicar as tcnicas, mas poucosdizem como estas so desenvolvidas.A estatstica, por ser multidisciplinar, est inserida em vrias reas doconhecimento, por isso faz-se necessrio a sua aplicao, o seu entendimento e suainterpretao como ferramenta de pesquisa.So apresentados exemplos prticos elaborados de forma clara, para quetodos que fizerem uso deste material possam compreender em que condies ecomo podero ser aplicadas as tcnicas aqui apresentadas, bem como interpretar osresultados obtidos nas anlises.Este material poder ser utilizado por todos que necessitem analisar base dedados relativamente complexas, ou seja, espaos de dimenso iguais ou superioresao R3, nos quais deve existir correlaes entre as variveis. Mostrou-se, tambm,como interpretar essas variveis, para que todos possam utilizar com segurana osmtodos da estatstica multivariada.Em relao ao uso de programas utilizados, para aplicao da tcnica,sugere-se que outros programas sejam utilizados, assim como os softwares, pois,desta forma, estimula-se o pesquisador a criar as suas prprias rotinascomputacionais. 6. Ressalta-se que a utilizao de bibliografia adicional para a compreenso datcnica assim como a sua aplicao necessria, pois o entendimento dopesquisador a cada leitura ser aprimorado e o mesmo poder tirar concluses maisacertadas da pesquisa desenvolvida.Este material didtico contempla a teoria e a prtica das tcnicas deagrupamentos,anlise fatorial e de componentes principais, voltado snecessidades de atender pesquisadores dos cursos de graduao, ps-graduao epesquisadores, que necessitem dessa ferramenta estatstica em suas pesquisaspara anlises em seu trabalho.Alm da apresentao das trs tcnicas multivariadas apresentadas nestematerial didtico, tambm apresenta-se quatro pesquisas em que foi aplicado osmtodos multivariados, estas pesquisas j foram apresentadas em eventoscientficos nacionais ou internacionais, portanto, j tiveram o crivo de avaliao dosreferidos eventos em que foram publicados.No anexo apresenta-se uma reviso de lgebra que dever ser consultadasomente se o leitor achar necessrio, pois consideramos que se o mesmo no tiverconhecimento sobre lgebra dificultar o bom entendimento das tcnicas.Salientamos que este material de responsabilidade dos autores e quequaisquer dvidas ou sugestes devem ser encaminhada para os mesmos, para quecom isso o material seja aprimorado. Os autores 7. NDICECaptulo 1 Introduo9Captulo 2 Apresentando os mtodos 132.1 Anlise de agrupamento AA13 2.1.1 Alguns coeficientes de medidas de distncias212.2 Anlise de componentes principais272.3 Anlise Fatorial AF relacionando anlise de componentes Principais ACP33Captulo 3 Compreendendo as tcnicas 413.1 Anlise de agrupamentos41 3.1.1 Mtodo de encadeamento nico, ou por ligao simples42 3.1.2 Mtodo de encadeamento completo ou por ligao completa 49 3.1.3 Como escolher o melhor mtodo?52 3.1.4 Interpretao do dendograma 583.2 Anlise de componentes principais593.3 Aplicao da anlise de componentes principais 78Captulo 4 Aplicando o software passo-a-passo954.1 Anlise de agrupamentos954.2 Aplicao da anlise fatorial AF e anlise de componentesprincipais ACP 106Captulo 5Realizando pesquisas 143 Artigo 1 Mtodos multivariados: uma metodologia para avaliar a 144 satisfao dos clientes da RBS-TV na regio noroeste do RS. Artigo 2 Aplicao da anlise multivariada em dados de 161 rendimento de ensino Artigo 3 Produo agrcola: uma sntese mediante tcnicas 169 estatsticas. Artigo 4 Avaliao da fauna edfica em campo nativo mediante 178 tcnicas da anlise multivariada.Captulo 6 Anexo 183 6.1 lgebra linear183 8. 6.1.1 Notao geral de uma matriz 183 6.1.2 Operaes com matrizes186 6.2 Sistemas lineares 196 6.2.1 Matrizes associadas a um sistema linear 197 6.3 Representao vetorial204 6.4 Distncia euclidiana208 6.5 Autovalores e autovetores de uma matriz 209Captulo 7 Bibliografia215 9. 9 1 INTRODUO A anlise multivariada um vasto campo, no qual at os estatsticos experientes movem-se cuidadosamente, devido esta ser uma rea recente da cincia, pois j se descobriu muito sobre esta tcnica estatstica, mas muito ainda est para se descobrir (MAGNUSSON, 2003).Na vida, sempre que for necessrio tomar uma deciso, deve-se levar emconta um grande nmero de fatores. Obviamente, nem todos esses pesam damesma maneira na hora de uma escolha. s vezes, por se tomar uma decisousando a intuio, no se identifica, de maneira sistemtica, esses fatores, ou essasvariveis, ou seja, no so identificadas quais as variveis que afetaram a tomadade deciso.Quando se analisa o mundo que nos cerca, identifica-se que todos osacontecimentos, sejam eles culturais ou naturais, envolvem um grande nmero devariveis. As diversas cincias tm a pretenso de conhecer a realidade, e deinterpretar os acontecimentos e os fenmenos, baseadas no conhecimento dasvariveis intervenientes, consideradas importantes nesses eventos.Estabelecer relaes, encontrar, ou propor, leis explicativas, papel prprioda cincia. Pa