Análise multivariada no statistica

Embed Size (px)

Text of Análise multivariada no statistica

  • ANLISE MULTIVARIADA DA TEORIA PRTICA

    por

    Lorena Vicini

    Orientador: Adriano Mendona Souza

    Santa Maria, RS, Brasil

    2005

  • V635a Vicini, Lorena Anlise multivariada da teoria prtica / Lorena Vicini ; orientador Adriano Mendona Souza. - Santa Maria : UFSM, CCNE, , 2005. 215 p. : il. Originalmente apresentada como monografia do autor (especializao-Universidade Federal de Santa Maria, 2005) Inclui referncias bibliogrficas

    1. Estatstica 2. Estatstica Anlise multivariada

    I. Souza, Adriano Mendona II. Ttulo.

    CDU 519.237

    Ficha catalogrfica elaborada por Alenir Incio Goularte CRB-10/990 Biblioteca Central da UFSM

    2005 Todos os direitos autorais reservados a Lorena Vicini e Adriano Mendona Souza. A reproduo de partes ou do todo deste trabalho s poder ser com autorizao por escrito do autor. Fone (0xx) 54 9961-8410 ou (0xx) 55 99743167; End. Eletr: lorenavicini@pop.com.br, amsouza@smail.ufsm.br

  • SOBRE OS AUTORES

    Os autores so formados em matemtica, com especializao em Estatstica

    e Modelagem Quantitativa no Departamento de Estatstica UFSM, Adriano

    (amsouza@smail.ufsm.br) realizou o Mestrado em Engenharia de Produo

    PPGEP - UFSM, a longo tempo atrs, e doutorado tambm em Engenharia de

    Produo na UFSC e atuou como pesquisador na Texas A&M University Texas.

    Lorena (lorenavicini@pop.com.br) est realizando o curso de Mestrado no

    PPGEP UFSM e tem perceptivas de continuar se aprimorando. Os dois so

    colegas de trabalho no Departamento de Estatstica e desenvolvem a maioria de

    suas pesquisas com a aplicao das tcnicas multivariadas. Os dois pertencem a

    dois grupos de pesquisa que so o Ncleo de Estatstica Aplicada e Ncleo de

    Estudos do Agro negcio Brasileiro.

  • NOTA DOS AUTORES

    A estatstica mostra-se, cada vez mais, como uma poderosa ferramenta para

    a anlise e avaliao de dados, em vrias reas do conhecimento, sendo muitas

    vezes um tanto difcil para os profissionais trabalharem conceitos e elaborarem

    exemplos prticos, devido limitao de materiais didticos que expressem, com

    simplicidade e clareza, mtodos e procedimentos da aplicao de certas tcnicas

    multivariadas, que s passaram a ser utilizadas, em larga escala, a partir do advento

    dos computadores.

    Embora a estatstica multivariada tenha surgido por volta de 1901, apenas

    nos dias de hoje consegue-se desenvolver e aplicar essa tcnica, pois sem o auxilio

    de programas computacionais no seria possvel realizar to rpido, e com tanta

    clareza, os grficos que possibilitam estudar o inter-relacionamento das variveis.

    Pode-se verificar, no decorrer da pesquisa, que as tcnicas de anlise de

    agrupamentos, e anlise de componentes principais, so tcnicas matemticas, com

    grande fundamentao na lgebra e na geometria, o que muitas vezes faz com que

    os estatsticos no considerem como tcnica estatstica. Por outro lado, figuram,

    quase sempre, em congressos nacionais e revistas especializadas, que tratam de

    assuntos sobre estatstica.

    A anlise fatorial, que muitas vezes confundida com anlise de

    componentes principais, pelo fato de um dos modos de extrao de fatores ser a de

    componentes principais, considerada uma tcnica estatstica, pois ela pressupe a

    existncia de um modelo, permite que se faa inferncias e cumpre com algumas

    pressuposies bsicas sobre as variveis em anlise, como a multinormalidade dos

    dados.

    Nos dias atuais, o uso dessas tcnicas est bastante consolidado, mas

    deve-se ter o cuidado de que no basta se observar um conjunto de variveis e

    aplicar tcnicas multivariadas, simplesmente, com o intuito de apresentar a tcnica e

    valorizar a pesquisa que se est realizando. H a necessidade de que exista uma

    estrutura de correlao entre as variveis, pois, se as mesmas no estiverem ligadas

    entre si, tem-se que utilizar uma anlise univariada, uma vez que esta, se bem

    aplicada, capaz de fornecer um nvel muito bom de informao.

    A estatstica univariada, em nenhum momento deve ser dispensada, quando

    se realiza um trabalho estatstico, pois por meio da anlise exploratria de dados

  • que ser possvel conhecer as variveis em estudo. Como se sabe, a anlise

    multivariada uma tcnica exploratria e, devido a isso, a anlise univariada ser

    til, tambm, para realizar um estudo confirmatrio.

    Com o material didtico, que est sendo apresentado, fez-se uma ampla

    reviso de literatura, levando-se em considerao textos clssicos e atuais, pois

    procura-se revelar, ao mximo, essa tcnica, que, muitas vezes, obscura para os

    alunos, pesquisadores e profissionais que a utilizam. O uso do software foi

    indispensvel, pois sem ele no seria possvel a realizao dos estudos de caso.

    Embora trabalhando-se com programas diferentes, existe uma similaridade entre

    eles. Isto , ao se saber bem interpretar os resultados de um, no se ter problemas

    ao se interpretar resultados de outro.

    Devido crescente procura sobre a anlise multivariada e a busca de

    material didtico que esteja disponvel para pesquisas nesta rea, desenvolve-se

    este material, que traz, passo a passo o desenvolvimento das tcnicas de anlise de

    agrupamentos, anlise fatorial e anlise de componentes principais, pois sabe-se

    que muitos materiais existem e mostram como aplicar as tcnicas, mas poucos

    dizem como estas so desenvolvidas.

    A estatstica, por ser multidisciplinar, est inserida em vrias reas do

    conhecimento, por isso faz-se necessrio a sua aplicao, o seu entendimento e sua

    interpretao como ferramenta de pesquisa.

    So apresentados exemplos prticos elaborados de forma clara, para que

    todos que fizerem uso deste material possam compreender em que condies e

    como podero ser aplicadas as tcnicas aqui apresentadas, bem como interpretar os

    resultados obtidos nas anlises.

    Este material poder ser utilizado por todos que necessitem analisar base de

    dados relativamente complexas, ou seja, espaos de dimenso iguais ou superiores

    ao R3, nos quais deve existir correlaes entre as variveis. Mostrou-se, tambm,

    como interpretar essas variveis, para que todos possam utilizar com segurana os

    mtodos da estatstica multivariada.

    Em relao ao uso de programas utilizados, para aplicao da tcnica,

    sugere-se que outros programas sejam utilizados, assim como os softwares, pois,

    desta forma, estimula-se o pesquisador a criar as suas prprias rotinas

    computacionais.

  • Ressalta-se que a utilizao de bibliografia adicional para a compreenso da

    tcnica assim como a sua aplicao necessria, pois o entendimento do

    pesquisador a cada leitura ser aprimorado e o mesmo poder tirar concluses mais

    acertadas da pesquisa desenvolvida.

    Este material didtico contempla a teoria e a prtica das tcnicas de

    agrupamentos, anlise fatorial e de componentes principais, voltado s

    necessidades de atender pesquisadores dos cursos de graduao, ps-graduao e

    pesquisadores, que necessitem dessa ferramenta estatstica em suas pesquisas

    para anlises em seu trabalho.

    Alm da apresentao das trs tcnicas multivariadas apresentadas neste

    material didtico, tambm apresenta-se quatro pesquisas em que foi aplicado os

    mtodos multivariados, estas pesquisas j foram apresentadas em eventos

    cientficos nacionais ou internacionais, portanto, j tiveram o crivo de avaliao dos

    referidos eventos em que foram publicados.

    No anexo apresenta-se uma reviso de lgebra que dever ser consultada

    somente se o leitor achar necessrio, pois consideramos que se o mesmo no tiver

    conhecimento sobre lgebra dificultar o bom entendimento das tcnicas.

    Salientamos que este material de responsabilidade dos autores e que

    quaisquer dvidas ou sugestes devem ser encaminhada para os mesmos, para que

    com isso o material seja aprimorado.

    Os autores

  • NDICE

    Captulo 1 Introduo 9

    Captulo 2 Apresentando os mtodos 13

    2.1 Anlise de agrupamento AA 13

    2.1.1 Alguns coeficientes de medidas de distncias 21

    2.2 Anlise de componentes principais 27

    2.3 Anlise Fatorial AF relacionando anlise de

    componentes Principais ACP

    33

    Captulo 3 Compreendendo as tcnicas 41

    3.1 Anlise de agrupamentos 41

    3.1.1 Mtodo de encadeamento nico, ou por ligao simples 42

    3.1.2 Mtodo de encadeamento completo ou por ligao completa 49

    3.1.3 Como escolher o melhor mtodo? 52

    3.1.4 Interpretao do dendograma 58

    3.2 Anlise de componentes principais 59

    3.3 Aplicao da anlise de componentes principais 78

    Captulo 4 Aplicando o software passo-a-passo 95

    4.1 Anlise de agrupamentos 95

    4.2 Aplicao da anlise fatorial AF e anlise de componentes

    principais ACP

    106

    Captulo 5 Realizando pesquisas 143

    Artigo 1 Mtodos multivariados: uma metodologia para avaliar a

    satisfao dos clientes da RBS-TV na regio noroeste do RS.

    144

    Artigo 2 Aplicao da anlise multivariada em dados de

    rendimento de ensino

    161

    Artigo 3 Produo agrcola: uma sntese mediante tcnicas

    estatsticas.

    169

    Artigo 4 Avaliao da fauna edfica em campo nativo mediante

    tcnicas da anlise multivariada.

    178

    Captulo