164
UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ CENTRO DE CIÊNCIAS EXATAS E TECNOLÓGICAS PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA AGRÍCOLA DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS AGRÍCOLAS REGIANE SLONGO FAGUNDES CASCAVEL - PR JANEIRO - 2017

DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

  • Upload
    dangnhu

  • View
    223

  • Download
    0

Embed Size (px)

Citation preview

Page 1: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁCENTRO DE CIÊNCIAS EXATAS E TECNOLÓGICAS

PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA AGRÍCOLA

DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS AGRÍCOLAS

REGIANE SLONGO FAGUNDES

CASCAVEL - PRJANEIRO - 2017

Page 2: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

REGIANE SLONGO FAGUNDES

DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS AGRÍCOLAS

Tese apresentada ao Programa dePós-Graduação em Engenharia Agrícolada Universidade Estadual do Oeste do Paraná,em cumprimento parcial aos requisitos para aobtenção do título de doutor em EngenhariaAgrícola, área de concentração SistemasBiológicos e Agroindustriais.

Orientador: Prof. Dr. Miguel Angel UribeOpazo

Co-orientador: Prof. Dr. Manuel Galea

Profa. Dra. Luciana PagliosaCarvalho Guedes

CASCAVEL - PRJANEIRO - 2017

Page 3: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

Dados Internacionais de Catalogação-na-Publicação (CIP)

F143dFagundes, Regiane Slongo

Distribuição slash multivariada aplicada a dados agrícolas./Regiane Slongo Fagundes. Cascavel, 2017.

164 p.

Orientador: Prof. Dr. Miguel Angel Uribe OpazoCoorientador: Prof. Dr.Manuel GaleaCoorientadora: Profª. Drª. Luciana Pagliosa Carvalho GuedesRevisão de normas, português e inglês: Ana Maria Martins Alves

Vasconcelos

Tese (Doutorado) – Universidade Estadual do Oeste do Paraná, Campus de Cascavel, 2017

Programa de Pós-Graduação Stricto Sensu em Engenharia Agrícola

1. Algoritmo EM. 2. Diagnóstico de influência global e local. 3. Modelagem espacial linear slash. 4. Testes de hipóteses. I. Uribe Opazo, Miguel Angel. II. Galea, Manuel. III.Guedes, Luciana Pagliosa Carvalho. IV.Vasconcelos, Ana Maria Martins Alves . V.Universidade Estadual do Oeste do Paraná. VI. Título.

CDD 21.ed. 519.535630

CIP-NBR 12899Ficha catalográfica elaborada por Helena Soterio Bejio – CRB 9ª/965

Revisão de português, inglês e normas realizada por Ana Maria Martins Alves Vasconcelos em 17 de fevereiro de 2017.

ii

Page 4: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes
Page 5: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

BIOGRAFIA RESUMIDA

Nome: Regiane Slongo Fagundes

Ano de nascimento: 1975

Naturalidade: Cascavel-PR

Licenciada em Matemática pela Universidade Estadual do Oeste do Paraná (UNIOESTE) no

ano de 1998. Mestre em Engenharia Agrícola pela UNIOESTE no ano de 2006. Atua na

área de educação há 23 anos sendo 13 deles dedicados ao ensino superior. Atualmente, é

professora assistente da Universidade Tecnológica Federal do Paraná (UTFPR), campus de

Toledo.

ii

Page 6: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

Apesar dos nossos defeitos, precisamos enxergar

que somos pérolas únicas no teatro da vida e

entender que não existem pessoas de sucesso e

pessoas fracassadas. O que existem são pessoas

que lutam pelos seus sonhos ou desistem deles.

[Augusto Cury]

iii

Page 7: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

Ao meu esposo, Jaderson e às minhas filhas

amadas, Natália e Julia,

dedico com carinho.

iv

Page 8: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

AGRADECIMENTOS

Primeiramente a Deus por me oferecer saúde, disposição e discernimento;

À Universidade Tecnológica Federal do Paraná (UTFPR) - campus Toledo, por

permitir afastamento integral das atividades docentes e, desta forma, possibilitar que fossem

desenvolvidas as atividades de pesquisa;

Ao Programa de Pós-Graduação em Engenharia Agrícola (PGEAGRI) da UNIOESTE,

pela oportunidade da formação acadêmica e à Fundação Araucária pelo auxílio financeiro;

Ao meu orientador, Prof. Dr. Miguel Angel Uribe Opazo, pela confiança, atenção e

orientação dada ao longo do desenvolvimento deste trabalho;

Aos co-orientadores, Prof. Dr. Manuel Galea e Prof. Dra. Luciana Pagliosa Carvalho

Guedes, pelos ensinamentos e contribuições. Foi uma honra trabalharmos juntos;

Aos docentes do programa de pós-graduação do PGEAGRI, pelos ensinamentos

durante o doutorado. À secretaria acadêmica, pelos atendimentos prestados;

De forma muito especial, ao meu esposo, Jaderson e às minhas filhas, Natália e Julia,

pelo carinho, paciência, compreensão e incentivo. Faltam palavras para expressar o quanto

vocês foram importantes nesta caminhada... Amo vocês!;

A todos meus familiares, em especial a meu pai e à minha mãe, que nunca mediram

esforços para me propiciar acesso à educação. Vocês são meu exemplo de vida e persistência;

Aos amigos, Denise (tia Dê), Daniela, Elisabeth, Fabiana, Gustavo, Perterson,

Rosângela, por compartilharem as alegrias e tristezas durante a elaboração deste trabalho,

pelas constantes conversas e pela ajuda no uso do software R e com Latex. Ao Julio Ávila,

pelo apoio na implementação das rotinas no R;

A todos meus amigos ou pessoas que, de alguma forma, contribuíram na realização

deste trabalho.

Muito Obrigada!!!

v

Page 9: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

RESUMO

DISTRIBUIÇÃO SLASH APLICADA A DADOS AGRÍCOLAS

O objetivo deste trabalho foi discutir problemas de inferência estatística multivariada ede modelagem espacial quando as observações são provenientes de uma populaçãocontínua, simétrica, com distribuição slash multivariada. Inicialmente, foi realizada umareparametrização da distribuição slash supondo existência do segundo momento finito,sendo apresentadas algumas propriedades recorrentes. Provaram-se expressões analíticaspara a função escore e matriz de informação de Fisher da distribuição reparametrizada.Abordou-se um enfoque para a estimação dos parâmetros por máxima verossimilhançaconsiderando um algoritmo do tipo EM (Esperança-Maximização). Descreveu-se a prova dehipóteses lineares sob o vetor de médias e matriz de covariância com o uso das estatísticasC(α), razão de verossimilhança, Wald e score. Estudos de simulação foram realizadospara avaliar a eficiência dos testes estatísticos e do algoritmo EM. Dados relacionados àárea agrícola ilustraram a metodologia desenvolvida, sendo aplicado sobre os mesmos ostestes de igualdade de médias, esfericidade e equicorrelação. Como ilustração da aplicaçãoda distribuição slash multivariada na área de modelagem estatística, o modelo espaciallinear slash, com e sem o uso de covariáveis, foi discutido e proposto. Com o intuito deavaliar a influência das observações no processo de estimação dos parâmetros, discussõesrelacionadas à análise de diagnóstico, global e local, foram apresentadas. Derivaram-se ascurvaturas requeridas no procedimento de influência local para o modelo slash, adequando oesquema de perturbação a distribuição e considerando diferentes esquemas de perturbação.Mapas de variabilidade espacial de atributos químicos do solo e produtividade foram geradosutilizando krigagem com drift externo. Os resultados das simulações e aplicações indicaramque a distribuição slash é uma alternativa robusta quando os dados apresentam alta curtose.

Palavras-chave: Algoritmo EM, diagnóstico de influência global e local, modelagemespacial linear slash, testes de hipóteses.

vi

Page 10: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

ABSTRACT

MULTIVARIATE SLASH DISTRIBUTION APPLIED TO AGRICULTURAL DATA

This study aimed at a discussing problems of multivariate statistical inference and linear spatialmodeling when observations are from a continuous, symmetric population, with multivariateslash distribution. Firstly, a reparametrization of slash distribution was performed, assuming theexistence of the finite second moment. Thus, some iterant properties were shown. Analyticalexpressions were tested for the score function and Fisher information matrix of reparameterizeddistribution. An approach to estimate some parameters by maximum likelihood was consideredbased at the EM (Expectation-Maximization) algorithm. Linear hypothesis tests have beendescribed regarding the means vector and the covariance matrix using statistics such asC(α), likelihood ratio, Wald, and score. Studies of simulation were carried out to evaluatethe efficiency of the statistical tests and EM algorithm. Data related to the agriculturalarea illustrated the methodology developed, and the hypothesis tests for equality of means,sphericity and equicorrelation were also applied. A slash linear spatial model, with and withoutthe use of covariates, was proposed. Were Discussed the global and local influence diagnosticanalysis in order to evaluate the influence of observations on the process of parameters’estimation. The curvatures required for the local influence procedure and based on the slashmodel were derived, in which the perturbation scheme has been chosen properly and relatedto the different perturbation schemes. Spatial variability maps of chemical attributes of soil andyield were generated by kriging with external drift. Finally results of simulations and applicationsindicated that the slash distribution is a robust alternative when the data present high kurtosis.

Keywords: EM algorithm, global and local influence, slash linear spatial model, hypothesistests.

vii

Page 11: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

SUMÁRIO

LISTA DE FIGURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xii

LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv

1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

2 OBJETIVOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2.1 Objetivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2.2 Objetivos específicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

3 REVISÃO BIBLIOGRÁFICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

3.1 Distribuição Slash . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

3.1.1 A classe MEN. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

3.1.2 Distribuição slash multivariada via distribuição β . . . . . . . . . . . . . . . . . . . . . . . 7

3.1.3 Distribuição slash multivariada reparametrizada . . . . . . . . . . . . . . . . . . . . . . . 10

3.1.4 Estimador de máxima verossimilhança . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

3.1.5 O algoritmo EM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

3.2 Inferência Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3.2.1 Teste de Hipóteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3.3 Análise de diagnóstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.3.1 Influência Global . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.3.1.1 Influência global baseada na verossimilhança . . . . . . . . . . . . . . . . . . 16

3.3.1.2 Influência global baseada na Q-function . . . . . . . . . . . . . . . . . . . . . . . . 17

3.3.1.3 Valor de Cutoff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.3.2 Influência Local e seleção de pertubação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.3.2.1 Influência local baseada no afastamento da verossimilhança . . . . . . 20

3.4 A distribuição slash multivariada e a geoestatística . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.4.1 A Geoestatística e a teoria das variáveis regionalizadas . . . . . . . . . . . . . . . . 25

3.4.2 A modelagem geoestatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.4.3 Critérios de seleção do parâmetro κ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.4.4 Krigagem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.4.4.1 Krigagem ordinária . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.4.4.2 Krigagem com modelo de deriva externa . . . . . . . . . . . . . . . . . . . . . . . 33

3.4.5 Medidas de similaridade entre mapas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.4.6 Caracterização das variáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.4.6.1 Produtividade da soja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

viii

Page 12: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

3.4.6.2 Fósforo, Potássio e Ferro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.4.6.3 Matéria Orgânica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.4.6.4 pH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4 REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

5 ARTIGOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

5.1 ARTIGO 1: O teste C(α) sobre o vetor de médias e a matriz de covariância da

distribuição slash multivariada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

5.1.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

5.1.2 Distribuição slash . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

5.1.2.1 Definição e algumas propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

5.1.2.2 Função Escore . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

5.1.3 A matriz de informação de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

5.1.4 Teste C(α) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

5.1.4.1 O Teste C(α) na análise multivariada. . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.1.4.2 Estimadores consistentes para os parâmetros de incômodo . . . . . . . 52

5.1.5 Estudo de simulação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

5.1.5.1 Teste de igualdade de médias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

5.1.5.2 Teste de equicorrelação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

5.1.6 Aplicação ao conjunto de dados reais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

5.1.6.1 Dados de commodities agrícola da soja . . . . . . . . . . . . . . . . . . . . . . . . 56

5.1.6.2 Dados de produtividade e atributos químicos do solo . . . . . . . . . . . . . 59

5.1.7 Conclusão e trabalhos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

5.1.8 Referências. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

5.1.9 Apêndice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.2 ARTIGO 2: Estimação de parâmetros por máxima verossimilhança e testes de

hipóteses a partir da distribuição slash multivariada . . . . . . . . . . . . . . . . . . . . . . . . . . 67

5.2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

5.2.2 Fundamentação teórica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

5.2.2.1 A distribuição slash . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

5.2.2.2 Estimação de parâmetros pelo algoritmo EM . . . . . . . . . . . . . . . . . . . . 69

5.2.2.3 A matriz de informação de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

5.2.3 Testes de hipóteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

5.2.4 Estudo de simulação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

5.2.5 Aplicação ao conjunto de dados reais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

5.2.6 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

5.2.7 Referências. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

5.3 ARTIGO 3: Variabilidade espacial em modelagem linear slash com segundo

momento finito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

5.3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

ix

Page 13: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

5.3.2 A distribuição slash com segundo momento finito . . . . . . . . . . . . . . . . . . . . . . 87

5.3.2.1 O modelo espacial linear com distribuição slash . . . . . . . . . . . . . . . . . 88

5.3.2.2 Estimação dos parâmetros do processo espacial slash . . . . . . . . . . . 89

5.3.2.3 Critério de seleção do parâmetro de forma η e do modelo de

dependência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

5.3.3 Diagnóstico de influência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

5.3.3.1 Influência global . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

5.3.3.2 Influência local . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

5.3.4 Estudo de simulação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

5.3.4.1 Simulação 1: Determinação de η e seleção do modelo de

dependência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

5.3.4.2 Simulação 2: Análise de diagnóstico de influência . . . . . . . . . . . . . . . 96

5.3.5 Aplicação a dados reais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

5.3.5.1 Estudo 1: Dados de um aquífero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

5.3.5.2 Aplicação aos dados de engenharia agrícola . . . . . . . . . . . . . . . . . . . . 98

5.3.6 Discussões e conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

5.3.7 Referências. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .103

5.3.8 Apêndices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

5.3.8.1 Apêndice I:Derivada da matriz de covariância . . . . . . . . . . . . . . . . . . . 107

5.3.8.2 Apêndice II:A Matriz Hessiana. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

5.3.8.3 Apêndice III:Detalhes do algoritmo EM . . . . . . . . . . . . . . . . . . . . . . . . .108

5.4 ARTIGO 4: Modelagem espacial linear slash: uma análise da produtividade da

soja em função de atributos químicos do solo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .110

5.4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .110

5.4.2 Material e Métodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .112

5.4.2.1 Descrição da área experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .112

5.4.2.2 O modelo espacial e estimação de parâmetros . . . . . . . . . . . . . . . . . .113

5.4.2.3 Teste de hipóteses sobre o vetor de parâmetros β . . . . . . . . . . . . . . .115

5.4.2.4 Diagnóstico de influência local . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .115

5.4.3 Resultados e discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

5.4.4 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

5.4.5 Referências. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .125

5.4.6 Apêndice: Derivadas da Q-function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .128

6 CONSIDERAÇÕES FINAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .130

Apêndice A -- Derivadas do logaritmo da função verossimilhança. . . . . . . . . . . . . . . . . . . . .132

A.1 A derivada de primeira ordem e a função escore . . . . . . . . . . . . . . . . . . . . . . . . . . . .132

A.1.1 Derivada de primeira ordem de wG(·, ·) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .133

A.1.1.1 A wG(·, δi) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .133

A.1.1.2 wG(η, ·) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

x

Page 14: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

A.2 A derivada de segunda ordem e a matriz de informação observada . . . . . . . . . . . .135

A.2.1 Derivada de segunda ordem de wG(·, ·) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .136

A.2.1.1 A w′

G(·, δi) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .136

A.2.1.2 A w′

G(η, ·) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

A.2.1.3 A wG(η, δi) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

Apêndice B -- Matriz de informação esperada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

Apêndice C -- Derivada Q-function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .143

C.1 Derivada de primeira ordem [Q] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .143

C.2 Derivada de segunda ordem [Q] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

C.3 Esperança de[− Q

]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .145

C.4 Derivada da Q-function para influência global . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .146

xi

Page 15: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

LISTA DE FIGURAS

Figura 1 Função de semivariância para os modelos da família Matérn, a partir de

diferentes valores de κ (a) e φ3 (b). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29Figura 2 Gráfico da distância de Mahalanobis (a) e QQ-plot das distâncias normalizadas

sobre suposição de normalidade (b) dos IFPM das commodities da soja. . . . . 59Figura 3 Gráfico da distância de Mahalanobis e QQ-plot das distâncias normalizadas

sobre suposição de normalidade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60Figura 4 Gráfico boxplot dos parâmetros ajustados de 1000 amostras aleatórias

simuladas com tamanho n = 50, para SL2(0, I, 0, 25) (a) e SL2(0, I, 0, 75) (b). 76Figura 5 Gráfico boxplot dos parâmetros ajustados de 1000 amostras aleatórias

simuladas com tamanho n = 200, para SL2(0, I, 0, 25) (a) e SL2(0, I, 0, 75)

(b). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77Figura 6 Gráfico boxplot dos parâmetros ajustados de 1000 amostras aleatórias

simuladas com tamanho n = 800, para SL2(0, I, 0, 25) (a) e SL2(0, I, 0, 75)

(b). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77Figura 7 Gráficos das distâncias de Mahalanobis e QQ-plot das distâncias normalizadas

ajustando a distribuição normal (a-b), t-Student (c-d) e slash (e-f) aos dados

dos IFPM das commodities da soja nos estados do PR, SC e RS. . . . . . . . . . . . 80Figura 8 Gráficos de influência global sob o vetor de parâmetros β (a) e de estrutura

espacial φ (b); Gráficos de influência local Cdi× ordem (c) e hmaxi× ordem (d)

pertubando a variável resposta para dados de Jones (1989). . . . . . . . . . . . . . . . . 98Figura 9 Gráficos de influência global sob o vetor de parâmetros β (a) e de estrutura

espacial φ (b); Gráficos de influência local Cdi× ordem (c) e hmaxi× ordem (d)

perturbando a variável resposta para dados de Fe. . . . . . . . . . . . . . . . . . . . . . . . . . .100Figura 10 Mapas de contorno para concentração de Fe (mg dm−3): Modelo LES com

todos os pontos (a); modelo LEG (b); LES com a remoção do ponto #82 (c);

LES com a remoção dos pontos #22, #31 e #60 (d); LES com a remoção dos

pontos #5, #6, #32 e #82 (e); LES com a remoção dos pontos #5, #6 e #32

(f). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102Figura 11 Área experimental. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .113Figura 12 Gráficos de influência local perturbando a variável resposta (a, c, e) e o preditor

linear (b, d, f), para o modelo linear espacial gaussiano (MLEG) e o modelo

linear espacial slash (MLES). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120Figura 13 Gráfico post-plot da área experimental indicando a posição das amostras

consideradas influentes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122Figura 14 Mapas de contorno para produtividade (t ha −1) em função dos atributos

químicos fósforo [P], potássio [K], potencial hidrogeniônico [pH] e matéria

orgânica [MO], considerando o modelo linear espacial gaussiano (MLEG) e

xii

Page 16: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

modelo linear espacial slash (MLES), antes e após a remoção dos pontos

influentes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

xiii

Page 17: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

LISTA DE TABELAS

Tabela 1 Matriz de erros genéricos m×m. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35Tabela 2 Tamanho empírico da estatística C(α) para o teste de igualdade de médias

ao nível de 5% de significância. Dados gerados sobre a suposição de

normalidade e sobre a suposição slash. Porcentagem de erro do Tipo I para

1000 simulações de Monte Carlo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54Tabela 3 Tamanho empírico da estatística C(α) para o teste de equicorrelação ao nível

de 5% de significância. Dados gerados sobre a suposição de normalidade e

de distribuição slash. Porcentagem de erro do Tipo I para 10 000 simulações

de Monte Carlo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56Tabela 4 Estimativas de MV ao ajustar-se a distribuição normal e slash aos dados dos

IFPM das commodities da soja dos estados do MT, GO, PR e RS. . . . . . . . . . 57Tabela 5 Médias das estimativas dos parâmetros obtidos por MV de 1000 amostras

aleatórias simuladas a partir de N2(0, I) e SL2(0, I, 0, 75) com REQM entre

parênteses. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76Tabela 6 Estimativas de MV ao ajustar-se a distribuição normal, t-Student e slash aos

dados dos IFPM das commodities da soja dos estados de PR, SC e RS. . . . 78Tabela 7 Estatísticas para os testes de igualdade de médias, esfericidade e

equicorrelação aplicados aos dados do IFPM das commodities da soja. Nível

de 5% de significância. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81Tabela 8 Percentual de identificação obtidos pelos critéiros validação cruzada (VC), traço

(Tr) e do máximo valor do logaritmo de verossimilhança (MVL) a partir de

diferentes modelos de dependência espacial, para dados simulados com η =

0, 5 (verdadeiro valor) e diferentes grades amostrais obtidas por amostragem

sistemática e aleatória. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95Tabela 9 Erro quadrático médio (EQM ) dos parâmetros estimados por máxima

verossimilhança (MV) pelo algoritmo EM nas diferentes grades amostrais

obtidas por amostragem sistemática e aleatória e simuladas considerando

η = 0, 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96Tabela 10 Porcentagem de casos em que o valor máximo extrapolado na amostra

simulada foi identificada como potencialmente influente (Ymax = Ymax +

0, 5√Y ⊤Y ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

Tabela 11 Valores dos parâmetros η e κ escolhidos pelos critéiros validação cruzada

(VC), traço (Tr) e do máximo valor do logaritmo de verossimilhança (MVL)

e estimativas de máxima verossimilhança (MV) obtidos via algoritmo EM

dos parâmetros dos modelos LEG e LES, com respectivos desvios padrões

assintóticos (entre parênteses), relacionando os casos considerados influentes

na análise de diagnóstico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

xiv

Page 18: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

Tabela 12 Estatística descritiva dos dados da produtividade (Prod) da soja (t ha−1), e da

concentração no solo de fósforo [P](mg dm −3), potássio [K] (cmol cdm−3),

potencial hidrogeniônico [pH] e matéria orgânica [MO] (g dm−3), para 78

amostras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118Tabela 13 Valores dos parâmetros η e κ selecionados a partir dos critérios validação

cruzada (VC) e traço (Tr), parâmetros do modelo linear espacial gaussiano

(MLEG) e modelo linear espacial slash (MLES) estimados por máxima

verossimilhança (MV) via algoritmo EM com respectivos desvios padrões

assintóticos (entre parênteses). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119Tabela 14 Teste da razão de verossimilhança (RV) sob o vetor de parâmetros β’s do

modelo linear espacial gaussiano (MLEG) e modelo linear espacial slash

(MLES). Nível de 5% de significância. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119Tabela 15 Valores dos parâmetros η e κ selecionados a partir dos critérios validação

cruzada (VC) e traço (Tr), parâmetros do modelo linear espacial gaussiano

(MLEG) e modelo linear espacial slash (MLES) estimados por máxima

verossimilhança (MV) via algoritmo EM e desvios padrões assintóticos (entre

parênteses) obtidos após a exclusão dos pontos influentes. . . . . . . . . . . . . . . . 123

xv

Page 19: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

1

1 INTRODUÇÃO

Na área de ciências agrárias, quando o pesquisador faz uma amostragem ou

experimento, geralmente o interesse está focado no estudo de mais de uma variável aleatória

como, por exemplo, quando deseja-se estimar a produtividade de uma determinada cultura

embasado nas informações disponíveis dos dados físicos e químicos do solo. Assim, é

recomendado o uso de técnicas estatísticas multivariadas, pois a análise dos dados pode

ser realizada considerando todas as variáveis, valendo-se da estrutura de correlação entre

elas. Grande parte da teoria de inferência estatística e modelagem linear multivariada está

apoiada na suposição de que os dados se ajustam a uma distribuição normal de probabilidade.

Porém, em muitas situações, esta premissa não é adequada, por exemplo, quando os dados

provêm de uma distribuição com caudas mais pesadas que a normal. Esta vulnerabilidade

tem impulsionado as pesquisas que buscam fornecer estatísticas robustas, em particular para

detecção e tratamento de pontos discrepantes e/ou influentes (OSORIO; PAULA; GALEA,

2009). Portanto, considerar distribuições simétricas com caudas mais pesadas que a normal

pode ser uma alternativa robusta quando se analisam e inferem-se resultados relativos aos

dados provenientes de estudos agrícolas.

Sob estas considerações, a distribuição slash multivariada (LANGE; SINSHEIMER,

1993) se torna particularmente atrativa, pois apresenta um parâmetro adicional de forma

que permite o ajuste da curtose dos dados. Esta, por sua vez, pode ser reparametrizada

supondo segundo momento finito, além de possibilitar a comparação mais direta com a

distribuição normal. Além disso, a representação estocástica da slash multivariada viabiliza o

uso do algoritmo EM no processo de estimação dos parâmetros por máxima verossimilhança

(WATANABE; YAMAGUCHI, 2004).

Uma questão importante ao se realizar uma pesquisa ou experimento agrícola é a

tomada de decisão com base em suposições relacionadas ao fenômeno em estudo. No que

se refere à inferência estatística sob o vetor de médias e matriz de covariância assumindo

distribuição slash, vários critérios podem ser utilizados. Um destes critérios é o teste C(α) de

Neyman (1959), que é invariante a transformações do espaço dos parâmetros e, supondo

que certas condições de regularidade são satisfeitas, permite substituir os parâmetros de

pertubação restringidos pela hipótese nula, por estimadores√n consistentes. Ademais, no

âmbito de análise da verossimilhança, é possível ampliar o estudo inferencial pelo uso dos

testes estatísticos razão de verossimilhança, Wald e score (WILKS, 1938; WALD, 1943; RAO,

1948). Sob certas condições de regularidade e quando se assume hipótese nula como

verdadeira, os testes apresentam o mesmo comportamento assintótico. Assim, a escolha

entre as diferentes estatísticas de prova pode ser feita considerando outros critérios como,

por exemplo, suas propriedades quando as amostras são pequenas ou por conveniência

Page 20: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

2

computacional.

Ainda que a característica de robustez esteja associada à distribuição slash, ela pode

estar vulnerável a observações influentes. Assim, torna-se essencial avaliar a sensibilidade

dos resultados obtidos em um processo de estimação e modelagem. Entre as alternativas

usuais, tem-se a análise de influência global e local. Na análise de influência global avalia-se

o impacto de uma observação sobre o processo de estimação, testes de hipóteses e ajuste

de modelos, quando esta é eliminada do conjunto de dados (COOK, 1977). Já na análise de

influência local, avalia-se o efeito de pequenos ruídos ao se inserir um vetor de pertubação no

conjunto de dados ou sobre as suposições do modelo estatístico, sem necessidade de eliminar

observações (COOK, 1986).

No contexto de aplicação aos dados agrícolas, pode-se destacar em especial a

modelagem espacial linear, a qual é utilizada, por exemplo, para modelar a variabilidade

espacial de atributos químicos e físicos do solo. Devido a sua característica de flexibilidade,

a construção de um modelo espacial embasado na suposição que os dados se ajustam à

distribuição slash pode reduzir a influência de observações atípicas a partir do ajuste da

curtose da distribuição dos dados (ASSUMPÇÃO et al., 2014; De BASTIANI et al., 2015).

Assim, este trabalho justifica-se por apresentar a distribuição slash multivariada como

alternativa na análise de dados agrícolas quando estes apresentam alto grau de curtose,

gerando dúvidas em relação à normalidade dos dados, além da discussão de testes de

hipóteses, técnicas de análise de influência, bem como uma aplicação na modelagem espacial

linear.

Page 21: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

3

2 OBJETIVOS

2.1 Objetivo Geral

O objetivo principal deste trabalho foi apresentar e estudar a distribuição slash

multivariada reparametrizada, supondo segundo momento finito, mostrando aplicações na

área de ciências agrárias.

2.2 Objetivos específicos

• Propor testes de hipóteses baseados na função de verossimilhança slash a partir do uso

das estatísticas C(α), razão de verossimilhanças, Wald e score;

• Desenvolver a estimação por máxima verossimilhança dos parâmetros da distribuição

slash por meio do algoritmo EM;

• Aplicar as estatísticas de teste com os dados relacionados à área agrícola;

• Formular o modelo espacial linear slash, com e sem covariáveis;

• Desenvolver técnicas de diagnósticos de influência, global e local, sob o modelo espacial

linear slash e construir mapas de atributos químicos do solo e produtividade da soja.

Page 22: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

4

3 REVISÃO BIBLIOGRÁFICA

3.1 Distribuição Slash

A distribuição slash é definida pela razão entre duas variáveis aleatórias independentes.

Ela é frequentemente encontrada nos estudos de simulação e modelagem estatística robusta,

pois apresenta como principal característica maior flexibilidade quanto ao grau da curtose e,

portanto é, menos sensível à presença de valores atípicos e erros que apresentam caudas

mais pesadas que a distribuição normal (JAMSHIDIAN, 2001).

A extensão multivariada da distribuição slash foi apresentada primeiramente por Lange

e Sinsheimer (1993), como um caso particular da classe mistura escala normal (MEN)

(ANDREWS; MALLOWS, 1974). Os autores consideraram a distribuição slash multivariada

como um vetor aleatório (p × 1), obtido a partir da razão de um vetor aleatório normal

independente Z, e uma distribuição estritamente positiva V com distribuição Beta, cuja função

densidade de probabilidade é dada por h(v) = νvν−1, para ν > 1.

Wang e Genton (2006), publicaram uma nova versão para slash multivariada,

considerando neste caso um vetor de média µ e matriz escala Λ, não singular, de ordem

(p × p), e ν > 0, sendo que V é uniformemente distribuída no intervalo de (0,1). Os autores

apresentam a função densidade de probabilidade (fdp), algumas propriedades e uma extensão

para o caso skew-slash multivariado.

Gómez, Quintana e Torres (2007) definiram e mostraram algumas propriedades para

a família de distribuição slash-elíptica multivariada. Essa é obtida a partir da razão entre

o vetor aleatório p-dimensional com contornos elípticos e a distribuição uniforme padrão no

intervalo (0,1), independentes. Arslan e Genç (2009) apresentaram e demonstraram algumas

propriedades para a distribuição slash multivariada generalizada considerando que o vetor

Y tem distribuição Kotz-type, introduzida por Kotz (1975), a qual é uma generalização da

distribuição normal.

Neste trabalho, optou-se por trabalhar com a versão dada por Lange e Sinsheimer

(1993). Porém, vale destacar que esta versão é equivalente a definida por Wang e Genton

(2006), como será demonstrado no Lema 3.2. A seguir, apresentam-se algumas propriedades

importantes da classe MEN e o caso particular da distribuição slash multivariada.

3.1.1 A classe MEN

Definição 3.1. Um vetor aleatório contínuo p-dimensional Y = (Y1, ..., Yp)⊤segue uma

distribuição MEN p-variada, com vetor de média µ ∈ ℜp e matriz escala positiva definida

Λ ∈ ℜp×p, se sua representação estocástica é dada por

Yd= µ+ V − 1

2Z, (3.1)

Page 23: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

5

em que Z ∼ Np(0,Λ), V é uma variável aleatória estritamente positiva com função distribuição

de probabilidade e H(v,ν) e fdp h(v,ν)- unidimensional, independente de Z. Neste caso, o

vetor aleatório Y tem distribuição denotada por Y ∼ MENp(µ,Λ;H), em que H é conhecida

como a distribuição da variável mistura V .

Aqui, assume-se que d= denota igualdade em distribuição e que ν é um parâmetro

escalar ou vetorial indexado à distribuição do fator de escala V . Esse parâmetro adicional

pode ser entendido como um parâmetro de acomodação de valores extremos. A partir da

representação estocástica de Y na equação (3.1), é possível encontrar a densidade de

probabilidade da classe MEN como segue.

Proposição 3.1. Se Y ∼ MENp(µ,Λ, H), então sua fdp é dada por

fY (y) = |2πΛ|− 12

∞∫

0

vp2 exp

− 1

2vδ

dH(v), (3.2)

em que −∞ < y <∞ e δ = (y − µ)⊤Λ−1(y − µ) é a distância de Mahalanobis.

Demonstração. Dada a representação estocástica em (3.1), é possível escrever

Y = µ+ V − 12Z

X = V

Z = X12 (Y − µ)

X = V.

Considerando o Jacobiano da transformação, tem-se

J =

∣∣∣∣∣∣

∂Z∂Y

∂Z∂X

∂V∂Y

∂V∂X

∣∣∣∣∣∣=

∣∣∣∣∣∣x1/2 (y − µ)

0 1

∣∣∣∣∣∣= xp/2.

Assim, a densidade de probabilidade conjunta de Y e X tem a forma

f(Y ,X)(y, x) = fZ,V (z, v)|J |.

Como Z e V são variáveis aleatórias independentes, tem-se

f(Y ,X)(y, x) = fZ(xp/2(y − µ))fV (x)x

p/2,

e considerando-se que fZ(·) tem distribuição normal, então,

fY (y) = |2πΛ|− 12

∞∫

0

vp2 exp

− 1

2vδ

dH(v).

Para esta família, a distância de Mahalanobis tem fundamental importância, e é

extremamente importante em testes de ajustes e para a detecção de outliers (MURRAY, 1984;

LANGE; SINSHEIMER, 1993).

A proposição a seguir descreve algumas propriedades de δ.

Page 24: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

6

Proposição 3.2. i) A Função distribuição acumulada de δ é expressa por

Pr(δ ≤ x) =xp/2

2p/2Γ(p/2)

∞∫

0

[1−H(v)

]v(p/2)−1 exp

− vx/2

.

Como consequência, a função distribuição de δ é infinitamente diferenciável, exceto e

possivelmente quando x = 0;

ii) A transformada de Laplace de δ é dada por

E(exp(−λδ)) =∞∫

0

(v

v + 2λ

)p/2

dH(v);

iii) O r-ésimo momento de δ pode ser obtido a partir de

E(δ2r) =2rΓ(r + p/2)

Γ(p/2)E[V −r].

Demonstração. Multiplicando ambos os membros da igualdade por V , tem-se que V δ =

V (y − µ)⊤Λ−1(y − µ), em que V δ tem distribuição χ2 com p graus de liberdade. Assim os

itens (i), (ii) e (iii) são conhecidos e seguem diretamente da densidade, transformada de

Laplace e momentos da χ2p.

A partir de (3.1), obtém-se que a distribuição condicional de Y dado V = v fica

da forma (Y |V = v) ∼ Np(µ, v−1Λ). Outro fato importante é que a classe de distribuição

MEN apresenta propriedades semelhantes a da distribuição normal, tornando simples de se

trabalhar e permitindo o desenvolvimento de procedimentos robustos para a estimação dos

parâmetros, como é apresentada na Proposição 3.3.

Proposição 3.3. Seja Y ∼ MENp(µ,Λ, H), então,

i) A Função característica de Y é da forma

E[exp(it⊤Y )] = exp(it⊤µ)

∞∫

0

exp

− 1

2v(t⊤Λt)

dH(v);

ii) O vetor de médias de Y é dada por E(Y ) = µ;

iii) A matriz de covariância de Y é obtida por

Cov(Y ) =

∞∫

0

v−1dH(v)Λ = EV −1Λ, se EV −1 <∞;

iv) A curtose multivariada β2,p, definida por Mardia (1970), pode ser obtida por

β2,p = E

((y − µ)⊤Λ−1(y − µ)

)2= p(p+ 2)(k + 1).

Page 25: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

7

Demonstração. A verificação destes fatos pode ser obtida nos trabalhos de Mardia (1970), Box

e Tiao (1992), Andrews e Mallows (1974) e Fang, Kotz e Ng (1990).

A definição da curtose multivariada apresentada em (iv ) estabelece uma relação

importante para a classe MEN, como relatado por Watanabe e Yamaguchi (2004), a fim de

garantir que esta distribuição apresente caudas mais pesadas do que a distribuição normal

no sentido da curtose, mesmo quando a distribuição de Z não é normal multivariada. Esta

relação é expressa no Lema 3.1.

Lema 3.1. A curtose multivariada de Y não é menor que a de Z.

Demonstração. Seja W = Y − µd= V − 1

2Z,então,

E

(W⊤E(WW⊤)−1W

)2= E

V − 1

2Z⊤E(V −1)ZZ⊤)−1V − 12Z)2

= E

(Z⊤E(ZZ⊤)−1Z

)2E(V )

2E

(V −2

)

≥ E

(Z⊤E(ZZ⊤)−1Z

)2.

Alguns exemplos da família MEN incluem, entre outros, a distribuição t-Student,

a exponencial potência, normal contaminada e a slash, todas podendo ter caudas mais

pesadas do que a distribuição normal (FANG; KOTZ; NG, 1990; LANGE; SINSHEIMER, 1993;

ARELLANO; BOLFARINE, 1995).

3.1.2 Distribuição slash multivariada via distribuição β

A forma como é definido o vetor aleatório Y na Equação (3.1) mostra que é possível

apresentar uma família de distribuição MEN considerando diferentes formas para V . Um

desses casos é a slash multivariada, apresentada primeiramente por Lange e Sinsheimer

(1993), considerando-se V ∼ Beta(ν, 1) para ν > 0. Wang e Genton (2006) também definem a

distribuição slash multivariada considerando V uniformemente distribuída no intervalo de (0,1).

As duas definições são equivalentes, como é apresentado no Lema 3.2.

Lema 3.2. Embasado na fdp definida em (3.2), cuja representação estocástica é dada em

(3.1), é possível definir a distribuição slash multivariada, de forma equivalente, considerando

V =1

vem que V ∼ Beta(ν, 1) ou V =

1

v1ν

com V ∼ U(0, 1).

Demonstração. (Lange e Sinsheimer, 1993) Considerando-se que V tem distribuição Beta

com parâmetros α = ν > 0 e β = 1, ou seja, V ∼ Beta(ν, 1), cuja densidade tem a forma

h(v) = νvν−1, tem-se a partir de (1.1) a função densidade marginal de Y , cuja forma é

expressa por

fY (y) = (2π)−p2 |Λ|− 1

2

1∫

0

vp2+ν−1 exp

− 1

2vδ

dv.

Page 26: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

8

Para Wang e Genton (2006), V ∼ U(0, 1). Assim, tem-se a função densidade marginal de Y ,

expressa por

fY (y) = (2π)−p2 |Λ|− 1

2

1∫

0

vp2ν exp

− 1

2v−

1ν δ

dv.

Usando a mudança de variáveis adequada, em que w = v−1ν , tem-se

fY (y) = (2π)−p2 |Λ|− 1

2

1∫

0

wp2+ν−1 exp

− 1

2wδ

dw.

Nas discussões futuras será considerado o caso apresentado por Lange e Sinsheimer

(1993) para definir a função densidade de probabilidade da distribuição slash multivariada.

Definição 3.2. Um vetor aleatório contínuo p-dimensional Y = (Y1, ..., Yp)⊤ tem distribuição

slash p-variada, denotada por Y ∼ Slp(µ,Λ, ν), em que V ∼ Beta(ν, 1), para ν > 0, se sua

fdp é dada por

fY (y) = ν(2π)−p2 |Λ|− 1

2

1∫

0

vp2+ν−1 exp

− 1

2vδ

dv, (3.3)

em que −∞ < y <∞, µ ∈ ℜp,Λ é a matriz escala (p× p), δ = (y − µ)⊤Λ−1(y − µ) representa

a distância de Mahalanobis.

Nota-se que, quando µ = 0 e Λ = Ip×p em (3.3), tem-se a distribuição slash

multivariada padrão, denotada por Y ∼ Slp(0, I, ν). Outro fato é que a partir da representação

estocástica (3.1) e da definição da distribuição slash multivariada apresentada em (3.2), foi

possível obter a distribuição condicional de Y dado V = v, que apresenta propriedades

importantes, como descritas na Proposição 3.4.

Proposição 3.4. Seja a distribuição condicional (Y |V = v) ∼ Np(µ, v−1Λ) em que V ∼

Beta(ν, 1). Então,

i) Y ∼ Slp(µ,Λ, ν);

ii) V |(Y =y)=γ

(p

2+ ν + 1,

δ

2

)

γ

(p

2+ ν,

δ

2

) , em que δ = (y − µ)⊤Λ−1(y − µ);

iii) E(δr)=2rΓ

(r +

p

2

)

Γ

(p

2

) .

Proposição 3.5. Seja Y ∼ Slp(µ,Λ, ν), a função geradora dos momentos de Y é dada por

MY (t) = E(exp(t⊤Y )) = ν exp(t⊤µ)

1∫

0

exp

1

2(t⊤Λt)

vν−1dv. (3.4)

Page 27: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

9

Demonstração. Da Proposição 3.4, tem-se que (Y |V = v) ∼ Np(µ, v−1)Λ). Agora,

utilizando-se as propriedades da esperança condicional, tem-se que MY (t)=EY (Y |V = v)=

EV [E(exp(t⊤Y )|V )]. Conclui-se a prova a partir do fato que V é uma variável aleatória positiva

com função distribuiçãoH(v, ν) e que Z ∼ Np(µ,Λ) em que, MY (t)=exp(t⊤µ+

(t⊤Λt)

2

).

Na proposição a seguir, apresentam-se o vetor de média e a matriz de covariância de

um vetor aleatório Slp.

Proposição 3.6. Suponha que Y ∼ Slp(µ,Λ, ν). Assim,

i) Se E

V − 1

2

<∞, então E(Y ) existe e E(Y ) = µ, se ν >

1

2;

ii) Se E

V −1

< ∞, logo, o segundo momento de Y existe e Cov(Y ) =

ν − 1

)Λ, se

ν > 1.

Demonstração. A prova é consequência direta da representação (3.1), considerando-se

V =1

ve V ∼ Beta(ν, 1), para ν > 0 e o fato de V e Z serem independentes. Assim, têm-se

E(Y ) = µ+ E

(V − 1

2

)E(Z)

e

Cov(Y ) = E

(V −1

)E(ZZ⊤).

E o resultado segue , pois E

(V − 1

2

)=

(2ν

2ν − 1

)se ν >

1

2e E

(V −1

)=

ν − 1

)se ν > 1.

A seguir, considere a transformação linear X = b + AY , em que Y ∼ Slp(µ,Λ, ν),

ν é um vetor em ℜp, e A é uma matriz não-singular. O determinante do Jacobiano da

transformação é |A|−1 e, portanto, a fdp de X é |A|−1 fY (y)(y;A−1(x−b),µ,Λ, ν), mostrando

que X tem uma distribuição slash multivariada denotada por X ∼ Slp(b + AY ,AΛA⊤, ν).

Isto implica que a distribuição slash é invariante sobre transformações linear, como retrata a

Proposição 3.7.

Proposição 3.7. Se Y ∼ Slp(µ,Λ, ν) então, X = b +AY ∼ Slp(b +AY ,AΛA⊤, ν) em que

b ∈ ℜp,A é uma matriz não-singular.

Outro resultado recorrente da Proposição 3.7 é que cada elemento do vetor aleatório

Y tem uma distribuição marginal slash. Para isso, considere em particular a partição

Y =

Y 1

Y 2

; µ =

µ1

µ2

Σ =

Λ11 Λ12

Λ21 Λ22

,

em que Y 1 e µ1 são vetores (p1 × 1), Y 2 e µ2 são vetores (p2 × 1); e na forma particionada

de Λ, Λ11 é uma matriz (p1 × p1); Λ22 é uma matriz (p2 × p2); Λ12 é (p1 × p2) e Λ12 = Λ⊤21 com

p1 + p2 = p. Por conseguinte, têm-se as Proposições abaixo.

Page 28: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

10

Proposição 3.8. (Distribuição Marginal)- Se Y ∼ Slp(µ,Λ, ν) então,

i) Y 1 ∼ Slp1(µ1,Λ11, ν);

ii) Y 2 ∼ Slp2(µ2,Λ22, ν).

Proposição 3.9. (Distribuição Condicional) Se Y ∼ Slp(µ,Λ, ν) então,

i) (Y 1|(Y 2 = y2)) ∼ Slp(µ1.2,Λ11.2, ν),

em que

µ1.2 = µ1 +Λ12Λ−122 (y2 − µ2),

Λ11.2 = Λ11 −Λ12Λ−122 Λ21.

Analogamente,

ii) (Y 2|(Y 1 = y1)) ∼ Slp(µ2.1,Λ22.1, ν+),

em que

µ2.1 = µ2 +Λ21Λ−111 (y1 − µ1),

Λ22.1 = Λ22 −Λ21Λ−111 Λ12.

3.1.3 Distribuição slash multivariada reparametrizada

Uma questão importante na modelagem e inferência estatística robusta é a suposição

da existência do segundo momento (SEBER, 1984; JOHNSON; WICHERN, 1992; RENCHER,

2002). Esta suposição pode ser garantida a partir da reparametrização da distribuição slash.

Assim, considerando-se para a distribuição Y ∼ Slp(µ,Λ, ν) a representação estocástica

reparametrizada na forma

Yd= µ+ dV − 1

2Z,

é possível escrever

Cov(Y ) = d2E

[V − 1

2Z

][V − 1

2Z

]⊤,

ou seja,

Cov(Y ) = d2E

[V −1

]Λ.

Agora, considerando-se d =√1− η, em que η =

1

νcom 0 < η < 1, então,

Cov(Y ) = Λ.

Esses resultados podem ser expressos pelo Lema a seguir.

Lema 3.3. A representação estocástica reparametrizada para a distribuição slash, denotada

Page 29: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

11

por Y ∼ SLp(µ,Σ, η) tem a forma

Yd= µ+ dV − 1

2Z, (3.5)

em que d =√1− η, e V ∼ Beta

(1

η, 1

)para 0 < η < 1 e Z ∼ Np(0,Σ), com Z e V

independentes.

A partir da representação estocástica dada em (3.5), tem-se que a condicional de Y

dado V = v é como segue.

Proposição 3.10. Se Y ∼ SLp(µ,Σ, η), então a distribuição condicional (Y |V = v) ∼Np(µ, d

2v−1Σ) em que V ∼ Beta(1/η, 1) e 0 < η < 1 .

E tomando-se Λ = (1−η)Σ e ν =1

η, é possível reescrever a Definição 3.2 para a slash

reparametrizada.

Definição 3.3. Um vetor aleatório contínuo p-dimensional Y = (Y1, ..., Yp)⊤ tem distribuição

slash p-variada reparametrizada, denotada por Y ∼ SLp(µ,Σ, η), com vetor de parâmetro de

locação µ ∈ ℜp, matriz de covariância Σ ∈ ℜp×p e parâmetro de forma η, para 0 < η < 1, se

sua fdp é dada por

fY (y) =1

η

(c(η)

) p2

|Σ| 12G(a, b), (3.6)

em que −∞ < y < ∞, sendo G(a, b) =1∫0

va−1 exp− vb

dv, b = −1

2c(η)δ para δ =

(y − µ)⊤Σ−1(y − µ) e a =p

2+

1

ηem que η é o parâmetro de forma, com 0 < η < 1.

Observa-se que tal versão reparametrizada da distribuição slash multivariada nos

permite uma comparação mais direta com a distribuição normal p-dimensional, portanto,

simplifica a estimação e interpretação dos parâmetros. Ademais, quando η → 0, a classe

de distribuição slash tem a distribuição normal multivariada como um caso limite.

A partir da reparametrização dada em (3.6), é possível reescrever algumas

propriedades importantes para a distribuição SLp(µ,Σ, η) as quais estão apresentadas no

Artigo 1. Além disso, a representação estocástica dada em (3.5) é particularmente útil

para a estimação de parâmetros por máxima verossimilhança (MV) mediante o algoritmo de

maximização tipo EM. A seguir, apresenta-se descrição do método MV e algoritmo EM.

3.1.4 Estimador de máxima verossimilhança

O método MV consiste em obter o valor do vetor θ de parâmetros que fornece a

chance mais provável de ocorrer novamente os mesmos dados que ocorreram. Assim, seja

y1, ...,yn uma amostra de vetores aleatórios independentes que se ajusta à distribuição

slash multivariada reparametrizada, sendo yi = (yi1, · · · , yip)⊤, cuja função densidade de

probabilidade é dada em (3.6). O objetivo é encontrar os estimadores que maximizam

a verossimilhança de θ = (µ⊤,φ⊤, η)⊤ em todo espaço paramétrico Θ, sendo a função

Page 30: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

12

verossimilhança dada por

L(θ) =n∏

i=1

fY (yi) =n∏

i=1

1

η

(c(η)

) p2

|Σ|− 12G(a, bi). (3.7)

Geralmente, utiliza-se o logaritmo da função de verossimilhança dada em (3.7). Isto

decorre do fato de que maximizar L(θ) e logL(θ) = l(θ) são processos equivalentes, uma vez

que a função logaritmo é contínua, monótona e crescente.

Assim, o logaritmo da função verossimilhança do vetor de parâmetros θ = (µ⊤,φ⊤, η)⊤

da distribuição slash multivariada reparametrizada assume a seguinte forma

l(θ) =n∑

i=1

li(θ), (3.8)

em que a i-ésima componente é dada por

li(θ) = − log(η)+p

2log

(c(η)

)− 1

2log |Σ|+ log

(G(a, bi)

).

Quando l(θ) é contínua e diferenciável em Θ, o estimador de MV θ de θ pode ser

obtido a partir da solução do sistema de equação homogêneo da função escore, dado por

U(θ) = 0, que é formado pelas derivadas parciais de primeira ordem em relação a cada

parâmetro desconhecido da função suporte.

A função escore pode ser particionada como

U(θ) = (U(µ)⊤,U(φ)⊤, U(η))⊤, (3.9)

sendo U(θ) =n∑

i=1

U i(θ), em que U i(θ) =∂li(θ)

∂θ, para i = 1, ..., n.

Neste trabalho, para a maximização de (3.8), optou-se pela utilização do operador "vec",

que transforma uma matriz em um vetor por sobreposição de colunas. E, sendo Σ ∈ ℜp×p

simétrica, define-se φ = vech(Σ) ∈ ℜp(p+1)/2 como o vetor obtido a partir da vetorização dos

elementos distintos da matriz Σ. Uma relação importante entre vech(Σ) e vec(Σ) é dada por

∂vec(Σ)

∂vech(Σ)⊤ = Dp

em que, Dp ∈ ℜp2×p(p+1)/2 é chamada matriz de duplicação de ordem p. Propriedades e

relações do operador de vetorização podem ser encontradas em Magnus e Neudecker (1999).

Para mais detalhes sobre a função escore veja o Apêndice A.1.

Ao se determinar o estimador θ, é importante avaliar o erro padrão assintótico

associado às estimativas de MV geradas. Vários procedimentos podem ser considerados,

todavia, neste trabalho, foi utilizado a matriz de informação de Fischer (I(θ)), expressa por

I(θ) =1

n

n∑

i=1

Eθ[U i(θ)U⊤i (θ)] ou I(θ) = Eθ

[−L(θ)

],

que correspondem às versões observada e empírica da matriz de informação,

Page 31: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

13

respectivamente, em que U i(θ) é descrita em (3.9),L(θ) =1

n

∂2l(θ)

∂θ∂θ⊤ é a matriz Hessiana

com l(θ) definida em (3.8). Mais detalhes dos elementos da matriz Hessiana ver Apêndice

A.2.

A matriz de informação esperada de Fischer para θ, embasada em (3.8), assume a

forma

I(θ) =

Iµµ(θ) 0 0

0 Iφφ(θ) Iφη(θ)

0 Iφη(θ) Iηη(θ)

=

Iµµ(θ) 0

0 IΦΦ(θ)

, (3.10)

cuja expressão para cada elemento são dados no Apêndice B. Verifica-se que o vetor de

parâmetros µ é ortogonal ao vetor de parâmetros φ e η, logo corrobora com resultados

apresentados por Lange e Sinsheimer (1993). O Lema a seguir expressa tais informações.

Lema 3.4. A matriz de informação esperada de Fischer associada à distribuição slash é bloco

diagonal, formada pelos blocos Iµµ e IΦΦ, com o vetor de parâmetro µ em um bloco e o vetor

de parâmetro φ e de forma η no outro bloco.

Uma consequência direta do Lema 3.4 é a de que os estimadores de MV de µ e Φ são

assintoticamente não-correlacionados.

3.1.5 O algoritmo EM

Note que não é possível encontrar expressões com forma fechada para U(θ),

impossibilitando a solução analítica de U(µ) = 0, U(φ) = 0 e U(η) = 0. Uma maneira de

resolver este problema é a utilização de processos iterativos. Existem muitas ferramentas

iterativas na literatura, entre elas o algoritmo EM, o qual consiste em adicionar ao vetor

de valores observados um vetor de dados aleatórios, criando assim um conjunto de dados

aumentados. Isto permite simplificar a obtenção do estimador de MV através da maximização

condicional em relação a θ, cujo limite é a resposta do problema original, garantindo a

convergência (WATANABE; YAMAGUCHI, 2004; CASELLA; BERGER, 2010).

No algoritmo EM, cada iteração é formada pelos seguintes passos: Esperança (passo

E) e Maximização (passo M). Para introduzir a ideia, sejam Y obs o vetor de dados observados

e Y mis o vetor de dados adicionados, associado à variável mistura. Desse modo, o vetor de

dados completos Y c aumenta Y obs mediante Y mis como Y c = (Y ⊤obs,Y

⊤mis)

⊤. Considere-se

l(θ|Y c) o logaritmo da função verossimilhança de dados completos para o vetor de parâmetros

θ ∈ Θ. O algoritmo EM aborda problemas com dados incompletos indiretamente mediante a

substituição da parte não observável em l(θ|Y c) por suas esperanças condicionais dado Y obs,

usando o ajuste inicial para θ. Isto é, considere a função Q (Q-function) definida como

Q(θ|θ) = Elc(θ|Y c)|Y obs, θ. (3.11)

A (r + 1)-ésima iteração do algotimo EM é definida como

Page 32: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

14

Passo E: para uma estimativa atual θ = θ(r), calcular Q(θ|θ) a partir de

Q(θ|θ) = Elc(θ|Y c)|Y obs, θ.

Passo M: escolher θ(r+1) que maximize Q(θ|θ), tal que

Q(θ(r+1)|θ) ≥ Q(θ|θ) ∀θ ∈ Θ,

sendo a maximização obtida a partir da solução de∂Q(θ|θ)∂θ

= 0.

Devem-se repetir os passos E e M repetidamente até atingir a convergência. Cada

iteração do algoritmo EM incrementa a função de verossimilhança de dados observados l(θ|Y )

e sobre condições apropriadas, o algoritmo EM apresenta convergência monótona ao máximo

global ou local de l(θ|Y ) (WU, 1983; OSORIO, 2006)

3.2 Inferência Estatística

3.2.1 Teste de Hipóteses

Um dos principais problemas da análise estatística inferencial multivarida é encontrar a

estatística de teste especifíca para abordar a distribuição estudada. Um procedimento usual,

quando a função cumpre as condições de regularidade, é considerar a aproximação assintótica

da normal (ANDERSON, 2003). Esta normalidade assintótica é uma das propriedades

estatísticas mais importantes e nos fornece uma maneira simples de encontrar estimativas

intervalares e testar hipóteses para ampla classe de distribuições adjacentes, como a

distribuição slash (MARDIA; KENT, 1979; ANDERSON, 2003; KOLLO; ROSEN, 2005).

Neste contexto, seja y1, . . . ,yn uma amostra aleatória independente que segue uma

distribuição SLp(µ,Σp, η), com θ = (µ⊤,φ⊤, η)⊤ ∈ Θ ⊂ ℜk, em que k =p(p+ 3)

2+

1 representa a quantidade de parâmetros envolvidos. As hipóteses de interesse estão

relacionadas principalmente com o contraste sobre o vetor de médias µ e sobre os elementos

da matriz de covariância Σ. De forma geral, conforme Dagenais e Dufour (1991), considere-se

o problema de testar uma hipótese linear na forma

H0 : Cθ − c = 0, (3.12)

em que (3.12) é uma função vetorial linear (k1 × 1), 1 < k1 < k, continuamente diferenciável

de θ = (θ⊤1 , · · ·,θ⊤

k )⊤, a matriz C, (k1 × k) é conhecida de posto k1, e c é um vetor, (k1 × 1),

conhecido.

Vários métodos assintóticos podem ser utilizados para testar a hipótese linear dada em

(3.12), entre eles o teste da razão de verossimilhanças (LR), teste de Wald (W ), teste escore

(S) e o teste C(α) de Neyman (RAO, 1948; DAGENAIS; DUFOUR, 1991; GOURIEROUX;

MONFORT, 1995). As estatísticas LR, W , S e C(α) dos testes são, respectivamente:

LR = 2l(θ)− l(θ

0),

Page 33: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

15

W = n(Cθ − c

)⊤[CF(θ)C⊤]−1

(Cθ − c

),

S =1

nU⊤(θ

0)F(θ

0)U⊤(θ

0)

e

C(α) =1

nU(θ)F

θC⊤[CF(θ)C⊤

]−1CF(θ)U(θ)⊤

em que, θ0

é o EMV sobre o espaço restrito, isto é, sobre a hipótese nula H0, θ é o EMV sobre

o espaço irrestrito, isto é, sobre a hipótese alternativa e θ é um estimador√n-consistente de

θ, pelo menos sobre H0· que satisfaz a condição Cθ = c. Estimativas consistentes para Fθ

podem ser obtidas pela inversa da matriz de informação esperada de Fisher, ou seja F(θ) =

I−1(θ).

Para os testes estudados, supõe-se que F(θ), F(θ0) e F(θ) tenham posto linha

completo e sobre H0, a distribuição assintótica de cada uma das estatísticas dos testes

é qui-quadrado com k1 grau de liberdade. Mais detalhes de cada um dos testes serão

apresentados nos Artigos 1 e 2.

3.3 Análise de diagnóstico

Em um processo de análise estatística e modelagem de dados, é importante

verificar possíveis afastamentos das suposições feitas bem como investigar a existência

de observações atípicas com alguma interferência desproporcional e/ou influentes nas

estimativas dos parâmetros (OSORIO; PAULA; GALEA, 2009; PAULA, 2010). Esta etapa

é conhecida como análise de diagnóstico e é constituída de diferentes metodologias de

avaliação, como a análise de influência, separada em duas linhas: a Influência global e a

Influência local.

3.3.1 Influência Global

Na análise de influência global, o objetivo é avaliar o impacto nas estimativas dos

parâmetros, quando uma ou mais observações consideradas influentes são eliminadas do

conjunto de dados. Esta prática de deleção de pontos é uma das técnicas mais conhecidas,

e analisa a ocorrência de algum desvio sistemático entre os valores observados e os valores

ajustados mediante a presença de valores extremos (COOK, 1977; BELSLEY; KUH; WESLSH,

1980; CHATTERJEE; HADI, 1988).

Uma das medidas mais utilizadas na influência global é a distância de Cook (COOK,

1977) que, originalmente, foi desenvolvida para modelos normais e rapidamente extendida

para diversas classes de modelos. Sua forma é dada por

Di(θ) = (θ[i] − θ)⊤M(θ[i] − θ), i = 1, . . . , n, (3.13)

em que θ e θ[i] são os estimadores do vetor de parâmetros θ, com e sem a i-ésima observação,

respectivamente, e M é uma matriz positiva definida apropriadamente escolhida.

Page 34: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

16

A escolha da matriz M é uma das questões mais relevantes ao se calcular D[i](θ), e

está diretamente relacionada ao método de estimação. Pregibon (1981), Cook e Weisberg

(1982) e Andersen (1992) aplicaram a estatística de Cook na análise de diagnóstico e,

definiram M como a inversa da matriz de covariância assintótica estimada por MV. Porém,

observa-se que esta escolha não garante que a matriz seja bloco diagonal, o que pode

gerar dificuldades para decompor Di(θ) em termos das componentes de interesse. Para

solucionar este problema, é possível fazer o uso da matriz informação esperada de Fisher,

I(θ) = E [−L(θ)], avaliada em θ = θ (PAN; FEI; FOSTER, 2014).

Um problema associado ao uso da função verossimilhança ocorre quando a distribuição

ajustada envolve integrais insolúveis analiticamente (DEMPSTER; LAIRD; RUBIN, 1977, SHIH;

WEISBERG, 1986). Como alternativa, Zhu et al. (2001) apresentam uma medida de deleção

de casos para modelos com dados incompletos, em que a estimação dos parâmetros pode

ser realizada via algoritmo EM. Neste estudo, os autores estendem a distância de Cook a

partir do uso da esperança condicional do logaritmo da função verossimilhança completa,

denominada Q-function, obtida no passo E do algoritmo EM, sendo a matriz M = −Q(θ|θ) em

que, Q(θ|θ) =∂2Q(θ|θ)∂θ∂θ⊤ avaliada em θ = θ. Além disso, os autores discutem propriedades

importantes e propõem procedimentos para identificar observações influentes.

Assim como no caso da verossimilhança, Pan, Fei e Foster (2014) propuseram

substituir Q(θ|θ) por E−Q(θ|θ)

, a fim de permitir que a distância de Cook seja decomposta

em relação aos seus parâmetros. Além disso, os autores demonstram a partir de um teorema

que é possível substituir l(θ) pela Q-function e, mostram que a aproximação a um passo da

estimativa de MV de θ[i] mantém a mesma acurácia.

3.3.1.1 Influência global baseada na verossimilhança

Seja l(θ) o logaritmo da função verossimilhança como foi definida em (3.8). Denotando

l[i](θ) como o logaritmo da função verossimilhança sem a i-ésima observação, e admitindo

que θ e θ[i] são os estimadores de máxima verossimilhança de θ sobre l(θ) e l[i](θ),

respectivamente, é possível calcular uma aproximação para θ[i] usando o método de

Newton-Raphson a um passo considerando a seguinte equação de atualização

θ1[i] = θ +

[−L[i](θ)

]−1U [i](θ), (3.14)

para i = 1, ...., n, em que[− L[i](θ)

]−1é a matriz de covariância assintótica e U [i](θ) é a

função escore assintótica, ambas sem a i-ésima observação.

Ao se assumir que M =[− L[i](θ)

], ou seja, a inversa da matriz de covariância

assintótica, e substituindo (3.14) em (3.13), uma aproximação da distância de Cook a um

passo é obtida a partir de

D1i (θ) =

[U [i](θ)

]⊤[−L[i](θ)

]−1[U [i](θ)

].

Page 35: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

17

Note que a determinação de[−L[i](θ)

]−1pode se tornar computacionalmente pesada

para amostras suficientemente grandes. Uma alternativa viável para superar esta dificuldade

é a troca de L[i](θ) por L(θ), para que se reduza significativamente a carga computacional.

Assim, a medida aproximada da estatística de Cook fica dada por

Di(θ) =[U [i](θ)

]⊤[−L(θ)

]−1[U [i](θ)

], (3.15)

que, ao ser comparado com D1i , apresenta medidas próximas e adequadas para avaliar as

influências (PAN; FEI; FOSTER, 2014).

Em geral,a matriz de covariância assintótica [L(θ)−1] não é bloco diagonal e gera

dificuldades para decompor a aproximação de Di(θ) em termos dos parâmetros de interesse.

A alternativa é substituir −L(θ) por E[−L(θ)] em (3.15), obtendo assim

D∗i (θ) =

[U [i](θ)

]⊤E[−L(θ)

]−1[U [i](θ)

], (3.16)

sendo

E[−L(θ)

]= I(θ) a matriz de informação esperada de Fisher, avaliada em θ = θ.

A função escore sem a i-ésima observação, avaliada em torno de θ = θ, pode ser

decomposta em

U [i](θ) =(U [i](µ)

⊤,U [i](Φ)⊤))⊤.

Assim, a estatística de Cook, ao assumir que os dados se ajustam à distribuição slash

multivariada reparametrizada, pode ser escrita por meio de

D∗i (θ) = D∗

i (µ) +D∗i (Φ), (3.17)

para i = 1, · · ·, n, sendo

D∗i (µ) =

[(U [i](µ)

]⊤[Iµµ

]−1[U [i](µ)

],

D∗i (Φ) =

[(U [i](Φ)

]⊤[IΦΦ

]−1[U [i](Φ)

].

3.3.1.2 Influência global baseada na Q-function

A estatística de Cook, apresentada em (3.15) e (3.16), pode ser difícil de se calcular

quando as derivadas são analiticamente complicadas, como no caso da distribuição slash

multivariada. Zhu et al. (2001) propuseram como alternativa calcular a estimativa θ[i] de θ

usando a aproximação a um passo, baseada na Q-function, dada por (3.11), isto é

θ[i] = θ +[− Q[i](θ|θ)

]−1Q[i](θ|θ),

em que Q[i](θ|θ) = Q[i](θ|θ)|θ=θé a Q-function formada sem a i-ésima observação, avaliada

sobre a estimador de MV θ, Q[i](θ|θ) =

[∂Q[i](θ|θ)

∂θ

]

θ=θ

e Q[i](θ|θ) =

[∂2Q[i](θ|θ)

∂θ∂θ⊤

]

θ=θ

.

Semelhante ao caso discutido para verossimilhança, Zhu et al. (2001) propuseram

substituir Q[i](θ|θ) por Q(θ|θ) , que é a derivada de segunda ordem de Q(θ|θ)|θ=θ

,

reduzindo-se desta forma o tempo computacional. Assim, a estatística de Cook baseada na

Page 36: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

18

Q-function pode ser expressa por

QDi(θ) =[Q[i](θ|θ)

]⊤[− Q(θ|θ)

]−1[Q[i](θ|θ)

].

Pan, Fei e Foster (2014) provam um teorema mostrando que também é possível

substituir −Q(θ|θ) por E[− Q(θ|θ)

], que representa a esperança da derivada de segunda

ordem da Q-function com respeito à variável resposta Y , mantendo a mesma acurácia para

a aproximação a um passo do estimador de MV θ[i]. Assim, a expressão modificada da

estatística de Cook fica da forma

QD∗[i](θ) =

[Q[i](θ|θ)

]⊤E[− Q(θ|θ)

]−1[Q[i](θ|θ)

],

em que

Q[i](θ|θ) =

−wiΣ−1ri

1

2D⊤p

[vec(Σ−1

)− wivec

(Σ−1rir

⊤i Σ

−1)]

1

η+p

ηc(η) +

1

η2ci

.

Já aE[− Q(θ|θ)

]avaliada em θ = θ é dada por

E[− Q(θ|θ)

]=

nwΣ−1

0 0

0n

2D⊤p

−1 ⊗ Σ−1]Dp 0

0 0 −[n

η2+np

2c(η)2 +

2

η3c

]

,

sendo w =∑n

i=1 wi = c(η)∑n

i=1 E(Vi|Y i, θ

)e c =

∑ni=1 E

log Vi

=∑n

i=1 E

log(Vi|Y i, θ

).

Mais detalhes são dados no Apêndice (C).

Observa-se que a matriz E[− Q(θ|θ)

]é bloco diagonal e, desta maneira, a estatística

modificada de Cook baseada na Q-function pode ser decomposta em três componentes

QD∗i (θ) = QD∗

[i](µ) +QD∗[i](φ) +QD∗

[i](η), (3.18)

para i = 1, · · ·, n, sendo

QD∗[i](µ) =

[Q[i]µ(θ|θ)]

⊤E[− Qµµ(θ|θ)

]−1[Q[i]µ(θ|θ)

],

QD∗[i](φ) =

[Q[i]φ(θ|θ)]

⊤E[− Qφφ(θ|θ)

]−1[Q[i]φ

(θ|θ)],

e

QD∗[i](η) =

[Q[i]η(θ|θ)]

⊤E[− Qηη(θ|θ)

]−1[Q[i]η(θ|θ)

].

Isto mostra que a medida de diagnóstico de θ é dada de forma independente, a partir da soma

das medidas de diagnósticos dos parâmetros β,φ, e η.

Page 37: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

19

3.3.1.3 Valor de Cutoff

Não existe um consenso quanto à definição do valor de corte (cutoff ) para avaliar se um

ponto é influente ou não. No caso da influência global embasada na verossimilhança, Belsley,

Kuh e Weslsh (1980) sugerem avaliar, após a retirada da i-ésima observação, o afastamento

do parâmetro θ[i] de θ. Cook e Weisberg (1982) comparam o valor D∗i com a distribuição χ2

com grau de liberdade adequado.

Neste trabalho propõe-se uma medida análoga à proposta por Zhu e Lee (2001) para

avaliar (3.17) e (3.18). Assim, considera-se a i-ésima observação influente seD∗i > D+2sd(D),

para i = 1, · · · , n, em que D = (D∗1, · · ·D∗

n) sendo que D e sd(D) representam a média e o

desvio padrão, respectivamente.

3.3.2 Influência Local e seleção de pertubação

Um dos problemas que pode ocorrer ao se deletarem pontos considerados influentes

é se ocultar os efeitos, denominado masking effect, ou seja, deixar de detectar pontos

conjuntamente discrepantes (PAULA, 2010). Uma alternativa foi apresentada por Cook

(1986), que propôs avaliar a influência conjunta das observações sobre pequenas mudanças

(perturbações) no modelo ou nos dados, ao invés da avaliação pela retirada individual ou

conjunta de pontos. Este método foi denominado influência local.

A partir do estudo realizado por Cook (1986), inúmeras comparações e extensões da

técnica foram publicadas. Schall e Dunne (1992) verificaram a relação entre o conceito da

colinearidade dos parâmetros e a influência local e definiram a curvatura normal proposta

por Cook no espaço ℜd, quando d ≥ 1. Poon e Poon (1999) discutem o problema da falta

de invariância da curvatura normal de Cook sobre uma transformação uniforme de escala

e propõe um método alternativo, denominado curvatura normal conformal, pelo estudo das

relações entre aproximações produzidas.

Zhu e Lee (2001) propuseram um método via algoritmo EM para avaliar a influência

local em dados incompletos e definem um ponto de corte para observações influentes, ao

estudarem o comportamento local da Q-function. Liu (2002) e Galea, Bolfarine e Labra (2005)

aplicaram a técnica de influência em modelos lineares elípticos multivariados e Osório, Paula

e Galea (2007) o fizeram em modelos lineares elípticos com estrutura longitudinal.

A influência local é embasada na geometria diferencial e compara as estimativas dos

parâmetros antes e depois de algumas mudanças nos dados ou nas hipóteses do modelo, feita

por um vetor de perturbação. Este vetor pode ser determinado a partir de qualquer esquema

bem definido, segundo a distribuição de probabilidade assumida para os dados (ZHU et al.,

2007), em que a perturbação é introduzida mediante a substituição de Y por Y ω em que

ω é um vetor q-dimensional de perturbações e assume valores em um subconjunto aberto

Ω ⊆ ℜq. Em seguida, o logaritmo da função verossimilhança perturbada l(θ|ω) para o modelo

postulado é calculado.

Algumas medidas fundamentadas na função verossimilhança são utilizadas para

Page 38: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

20

avaliar a influência da perturbação ω sobre estimador de MV de θ , entre elas o afastamento

da verossimilhança e o afastamento da Q-function proposta por Zhu e Lee (2001). Em ambos

os casos, assume-se que l(θ|ω) é duas vezes diferenciável em (θ⊤,ω⊤)⊤, e que o modelo

postulado está encaixado no modelo perturbado, isto é, existe um ω0 ∈ Ω (vetor de não

perturbação) tal que l(θ|ω0) = l(θ), para todo θ.

3.3.2.1 Influência local baseada no afastamento da verossimilhança

Considere o logaritmo da função verossimilhança do modelo slash dado em (3.8).

Suponha também que θ e θω sejam os estimadores de MV obtido ao serem maximizados

l(θ) e l(θ|ω), respectivamente. Para comparar o efeito das perturbações e avaliar se

existe estabilidade do modelo ajustado, Cook (1986) sugere estudar o comportamento do

afastamento da verossimilhança definida por

LD(ω) = 2[l(θ)− l(θ|ω)

](3.19)

em torno de ω = ω0.

As diferenças produzidas em (3.19) podem ser representadas no gráfico de LD(ω)

versus ω, formando uma superfície chamada de gráfico de influência, na qual a ideia consiste

em analisar como a superfície α(ω) = (ω⊤, LD(ω))⊤ desvia-se de seu plano tangente em ω0.

Essa análise pode ser feita pelo estudo das curvaturas das secções normais à superfície α(ω)

em ω0 na direção de h, dada por:

Ch(θ) = 2|h⊤Bh|, (3.20)

em que, h ∈ Ω ⊆ ℜn com ||h|| = 1, B = ∆⊤θω

− L(θ)

−1∆θω, sendo L(θ) =

[∂2l(θ)

∂θ∂θ⊤

]

θ=θ

a

matriz informação observada, e ∆θω =

[∂2l(θ|ω)

∂θ∂ω⊤

]

θ=θ, ω=ω0

a matriz de pertubação.

Segundo Cook (1986), uma maneira de avaliar α(ω) na prática é a partir do estudo

dos pontos extremos considerando Chi = 2|bii|, chamada de medida de influência local total

da i-ésima observação, em que bii são os elementos da diagonal principal da matriz B. Neste

caso, h = ei, em que ei é o vetor básico do ℜn, cuja a i-ésima coordenada é 1 e as demais são

zero. Ainda, segundo Cook (1986), é possível estudar por meio da medida |hmax| qual o tipo

de perturbação tem maior, ou menor, influência para o esquema de perturbação em análise,

sendo |hmax| o autovetor, normalizado, associado ao maior autovalor, em módulo, da matriz

B. Em ambos os casos, os resultados são plotados versus i (ordem dos dados), podendo

indicar a existência de observações influentes e/ou revelar qual tipo de perturbação tem maior

influência em LD(ω), na vizinhança de ω0.

Embora a curvatura normal de Cook (1986) seja usual, outras medidas para avaliar

a influência local foram propostas. A curvatura normal conformal, Cd =Ch

tr(B), proposta por

Poon e Poon (1999), cujo cálculo não requer muito mais esforço que o cálculo de Ch, possui

como vantagens os fatos de ser invariante sobre reparametrizações conformais e ser uma

Page 39: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

21

medida normalizada, o que facilita estabelecer um ponto de corte. Como as curvaturas Ch e

Cd diferem apenas por uma constante positiva, o autovetor hdmax fornece também a curvatura

conformal máxima Chdmax. Poon e Poon (1999) sugerem que as coordenadas do vetor Chdmax

,

tomadas em módulo, que apresentam valores maiores que 1√n

indicam pontos influentes. No

que diz respeito às curvaturas normais conformais na direção dos vetores básicos, Cdi =2|bii|tr(B)

,

Poon e Poon (1999) sugerem que a i-ésima observação seja considerada influente se Cdi >

2C, em que C é a média aritmética das curvaturas normais conformais básicas. Zhu e Lee

(2001) sugerem um ponto de corte que, além de considerar a média das curvaturas normais

conformais, também leva em consideração a variação dessas curvaturas. Ao se considerar um

caso particular da proposta de Zhu e Lee (2001), tem-se que a i-ésima observação é influente

quando Cdi > C+2sd(C), em que sd(C) é o desvio padrão das curvaturas normais conformais

básicas.

Uma questão fundamental ao ser aplicada a análise de influência local, é a seleção do

esquema de pertubação, pois pertubar um modelo arbitrariamente pode induzir à inferência

enganosa. Zhu et al. (2007) propuseram uma metodologia para aferir se a escolha do vetor ω

é adequado para o modelo em estudo, na qual consideram que F (ω) = Eω

U(ω)U(ω)⊤

=

diagf11(ω), · · · ,fnn(ω), é a matriz de informação esperada de Fischer com respeito ao vetor

de pertubação ω, sendo U(ω) =∂l(θ|ω)

∂ωa função escore do modelo estatístico pertubado e

Eω a esperança. Segundo os autores, a pertubação ω é apropriada se satisfaz a seguinte

condição

F (ω0) = cIn,

em que c > 0.

Em geral, F (ω0) 6= cIn. Para contornar este problema, Zhu et al. (2007) propõem uma

parametrização, definida por

ω = ω0+c− 1

2F12 (ω0)(ω − ω0), (3.21)

tal que F (ω), avaliada em ω0, seja igual a cIn.

A partir desta transformação, os componentes do vetor de perturbação ω são

independentes entre si e introduzem uma quantidade igual de perturbação no modelo, pelo

menos localmente. Alguns resultados quando consideram a pertubação adequada podem ser

encontrados em Giménez e Galea (2013), Borssoi (2014) e De Bastiani et al. (2015).

Perturbação na variável resposta

Este esquema de perturbação pode ser utilizado quando o objetivo for avaliar a

sensibilidade das estimativas ao serem introduzidas pequenas perturbações nas componentes

de cada vetor de respostas (BORSSOI, 2014) .

Neste caso, a perturbação para o vetor de respostas observadas (y⊤1 , ...,y

⊤n )

⊤ é

incorporada mediante a substituição de yi por yiω = yi + Aωi, em que ωi representa um

vetor de pertubação p-dimensional, isto é, ωi = (ωi1, · · · , ωip)⊤, para i = 1, · · ·, n, e A é uma

Page 40: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

22

matriz (p× p), simétrica e não singular, apropriadamente escolhida e que não depende de ωi.

O vetor de não perturbação é dado por ω0 = 0.

Desta forma, o logaritmo da verossimilhança perturbada para distribuição slash

reparametrizada fica dado por l(θ|ω) =∑n

i=1 li(θ|ω), com

li(θ|ω) = −p2log(2π) +

p

2log(c(η))− log

(η)− 1

2log |Σ|+ log

(G(a, biωi

)),

em que biωi=

c(η)

2δiωi

, δiωi= r⊤iωi

Σ−1riωi, riωi

= (yiωi− µ) e yiωi

= yi + Aωi para

i = 1, · · · , n e 0 < η < 1.

Borssoi (2014) e De Bastiani et al. (2015) mostram que uma escolha adequada para A

é Σ12 e, assim, a pertubação no vetor de respostas observadas fica dada por

yiωi= yi +Σ

12ωi,

cuja função escore pertubada é da forma

U i(ω) = 2wG(·, δiωi)Σ− 1

2riωi.

para i = 1 · · ·n.. Dado que∂2li(θ|ωi)

∂ωi∂ωj= 0, ∀ i 6= j,

, então a matriz F (ω) = Eω

U(ω)U(ω)⊤

= diagf11(ω), · · · ,fnn(ω), tal que, fii(ωi) =

U i(ωi)U i(ωi)

. Assim,

fii(ω) = Eω

U i(ωi)U i(ω)⊤

= 4E

w2G(·, δiωi

)

(Σ− 1

2riωir⊤iωi

Σ− 12

)= ciIp,

em que, ci =4dg

p, i = 1, · · · , n e dg = E

[w2G(·, δiωi

)||Z||2]

sendo ||Z|| a norma do vetor

Z = Σ− 12rω. Assim, temos que F (ω) = diag

c1Ip, · · · , cnIp

. Como F (ω) 6= cIn, aplica-se

a parametrização proposta por Zhu et al. (2007) dada em (3.21), cuja pertubação adequada

será da forma ωi = Σ12ωi√ci

. Assim, o vetor pertubado de respostas observadas fica dado por

yiωi= yi +Σ

12ωi√ci, i = 1, · · · , n.

Diferenciando-se l(θ|ω) =∑n

i=1 li(θ|ω) com relação a θ e ωi, restrito a θ = θ e ω = ω0,

obtém-se a matriz de pertubação ∆θω =∂2l(θ|ω)

∂θ∂ω⊤ = (∆⊤µω,∆

⊤φω,∆

⊤ηω)

⊤, sendo

∂2li(θ|ω)

∂µ∂ω⊤i

∣∣∣∣θ=θ, ω=ω0

=

( −1√dg/p

−1[wG(·, δi)Σ+ 2w

G(·, δi)rir⊤i]Σ

−1/2;

Page 41: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

23

∂2l(θ|ω)

∂φ∂ωi⊤

∣∣∣∣θ=θ, ω=ω0

=

( −1√dg/p

)r⊤i

[∂

∂φvec⊤(Σ)w

G(·, δi)[vec(Σ

−1rir

⊤i Σ

−1/2)]

+∂

∂φvec⊤(Σ

1/2)wG(·, δi)

]vec(Σ

−1);

e

∂2l(θ|ω)

∂η∂ωi

∣∣∣∣θ=θ, ω=ω0

=

( −1√dg/p

)[wG(η, δi)Σ

−1/2ri

];

sendo, wG(·, δi) =∂

∂δilogG(a, bi), w

G(·, δi) =∂

∂δiwG(·, δi) e wG(η, δi) =

∂η

[wG(·, δi)

]

avaliados δi = r⊤i Σ−1

ri, para i = 1, · · · , n e 0 < η < 1.

Perturbação na matriz escala

Este esquema de perturbação pode revelar observações que interferem na modelagem

e na estrutura de variância bem como indicar os elementos influentes na estimação do

parâmetro φ (OSORIO; PAULA; GALEA, 2009).

Considere o seguinte esquema de pertubação, ω−1i Σ no lugar de Σ, sendo o vetor

de pertubação dado por ω = (ω1, · · · , ωn)⊤, com ωi > 0, e o vetor de não pertubação ω0 =

1n, com i = 1, · · · , n. Sobre estas condições, o logaritmo da função verossimilhança para

distribuição slash reparametrizada fica dado por l(θ|ω) =∑n

i=1 li(θ|ωi), em que

li(θ|ωi) = −p2log(2π) +

p

2log(c(η))− log

(η)− 1

2log |ω−1

i Σ|+ log(G(a, biωi

))

= −p2log(2π) +

p

2log(c(η))− log

(η)+p

2log(ωi)−

1

2log |Σ|+ log

(G(a, biωi

)),

com, biωi=c(η)

2δiωi

e δiωi= ωiδi = r⊤i ωiΣ

−1ri, para i = 1, · · · , n e 0 < η < 1.

Seguindo a metodologia de Zhu et al. (2007), tem-se que

U i(ω) =p

2ωi+ wG(·, δiωi

)δi,

em que wG(·, δiωi) =

∂δiωi

logG(a, biωi).

Dado que∂2li(θ|ωi)

∂ωi∂ωj= 0, ∀ i 6= j,

então a matriz F (ω) = Eω

U(ω)U(ω)⊤

= diagf11(ω), · · · ,fnn(ω), que tem como

Page 42: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

24

elementos:

fii(ω) = Eω

U i(ω)U i(ω)⊤

= Eω

[( p

2ωi+ wG(·, δiωi

)δi

)]2

=

(p

2ωi

)2

+p

ωiEω

[1

ωiwG(·, δiωi

)δiωi

]+ Eω

[1

ωi2w2G(·, δiωi

)δ2iωi

]

=

(p

2ωi

)2

+p

ωi

(− p

2ωi

)+fg

ω2i

=−p24ω2

i

+fg

ω2i

,

em que, fg = E

[w2G(·, δiωi

)||Z||4]

e ||Z|| é a norma do vetor Z = Σ− 12r.

Para i = 1, · · · , n, tem-se

F (ω0) = diagfg

ω210

− p2

4ω210

, · · · , fgω2n0

− p2

4ω210

= diagfg − p2

4, · · · , fg − p2

4

.

Como F (ω) 6= cIn, aplica-se a parametrização proposta por Zhu et al. (2007) dada em

(5.46), cuja pertubação adequada será

ωi = 1 +ωi − 1√

fgi − 0.25p2, i = 1, · · · , n.

Desta forma, considerando que l(θ|ω) =∑n

i=1 li(θ|ωi), a matriz de pertubação ∆ω =∂2l(θ|ω)

∂θ∂ω⊤ = (∆⊤µω,∆

⊤φω,∆

⊤ηω)

⊤, avaliada em θ = θ e ω = ω0, tem como elementos:

∆µωi=∂2li(θ|ω)

∂µ∂ω⊤i

∣∣∣∣θ=θ, ω=ω0

=−2√

fg − 0.25p2

[w

G(·, δi)δi + w′

G(·, δi)][

Σ−1

ri

];

∆φωi=∂2li(θ|ω)

∂φ∂ω⊤i

∣∣∣∣θ=θ, ω=ω0

=−D⊤

p√fg − 0.25p2

[w

G(·, δi)δi + wG(·, δi)][

vec(Σ

−1rir

⊤i Σ

−1)];

e

∆ηωi=∂2li(θ|ω)

∂η∂ωi

∣∣∣∣θ=θ, ω=ω0

=1√

fg − 0.25p2

[wG(η, δi)

]δi;

sendo, wG(·, δi) =∂

∂δilogG(a, bi), w

G(·, δi) =∂

∂δiwG(·, δi) e wG(η, δi) =

∂η

[wG(·, δi)

]avaliados

δi = r⊤i Σ−1

ri, para i = 1, · · · , n e 0 < η < 1.

3.4 A distribuição slash multivariada e a geoestatística

A predição geoestatística é embasada nos modelos espaciais, os quais consideram

que os dados são provenientes de um processo aleatório, porém possuem uma estrutura

espacial estabelecida por uma função de correlação espacial. Porém, a maioria desses

Page 43: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

25

modelos assumem que os dados são provenientes de um processo estocástico gaussiano

e tornam o processo de estimação e krigagem sensível a valores atípicos e erros que

apresentam caudas mais pesadas. Neste contexto, considerar a modelagem espacial linear

embasada na distribuição slash reparametrizada constitui uma alternativa atrativa para explicar

a estrutura de variabilidade espacial, uma vez que o parâmetro η permite ajustar a curtose das

observações, e, desta forma, acomodar melhor valores atípicos.

Assim, nas seções de 3.4.1 a 3.4.5, apresenta-se uma breve revisão da teoria

geoestatística e, na seção 3.4.6, descrevem-se as variáveis provindas de um experimento

agrícola e que serão usadas nos Artigos 3 e 4.

3.4.1 A Geoestatística e a teoria das variáveis regionalizadas

A geoestatística difere da estatística clássica por considerar a localização e a

dependência espacial do conjunto de observações estudadas. Os primeiros trabalhos na

área foram publicados por Matheron (1963), que formalizou a metodologia aplicada pelo

engenheiro de minas D.G. Krige na estimativa das reservas de carvão em minas da África

do Sul. O autor denominou seu estudo de Teoria das variáveis regionalizadas, a qual definiu

que as variáveis são relacionadas de algum modo, dependendo da posição que ocupam e

no entendimento de que cada ponto no espaço não apresenta valor único, mas sim uma

distribuição de probabilidade de ocorrência de valores relacionada ao fenômeno em estudo.

Assim, um valor localizado espacialmente em si será interpretado como uma realização

da variável aleatória Y (si) e, desta forma, é possível descrever a variabilidade da função

f(y(si)

)no espaço, com Y variando e dependendo do local da amostragem. Assim, a

partir das observações medidas no espaço no qual se distribui o conjunto de amostras,

S ⊂ ℜd(d ≥ 1), tem-se as realizações das n-variáveis Y (s) =(Y (s1), · · · , Y (sn)

)⊤, conhecidas

como processo estocástico e que representa, na prática, a variável regionalizada (VR)

(SCHABENRGER; PIERCE, 2002).

Segundo Cressie (2015), o formalismo como é definido o processo estocástico

geoestatísticos só é possível quando se assume a existência de estacionaridade de segunda

ordem, ou seja, quando se assumem as seguintes propriedades:

P1) E[Y (si)] = µ(si) = µ, (média constante);

P2) A covariância entre duas variáveis aleatórias, C(·), depende somente da distância

espacial que as separa e é independente de sua localização. Desta forma:

C(Y (si), Y (sj)) = E[Y (si)Y (sj)]− E[Y (si)]E[Y (sj)] = C(hij),

em que, hij é a distância euclidiana entre si e sj ;

P3) A correlação entre duas variáveis aleatórias pode ser medida como

ρ(Y (si), Y (sj)) =C(Y (si), Y (sj))√

Var(Y (si))√

Var(Y (sj)),

Page 44: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

26

para i, j = 1, . . . , n.

A hipótese de estacionariedade de segunda ordem pode não ser satisfeita quando

os fenômenos têm uma capacidade infinita de dispersão. Quando isto ocorre, assume-se a

hipótese intrínseca na qual apenas os acréscimos da VR obedecem à estacionariedade de

segunda ordem, logo, ela se torna menos restritiva (ANDRIOTTI, 2003). Assim, E[Y (si)] −E[Y (sj)] = 0 ou seja, o incremento entre dois pontos tem esperança nula e

Var[Y (si)− Y (sj)] = E[Y (si)− Y (sj)]2 = 2γ(hij),

isto é, para todo s ∈ S ⊂ ℜd(d ≥ 1), o incremento Y (si) − Y (sj) tem variância finita, e não

depende de s para qualquer h, sendo γ(hij), definida como função de semivariância.

Outra questão importante é que a função de covariância definida em (P2), sobre

hipótese de estacionariedade intrínseca, fornece aproximadamente a mesma informação que

a função de correlação e semivariância, cuja relação é expressa por

γ(hij) = C(0)− C(hij) e ρ(hij) = 1− γ(hij)

C(0).

Assim, a escolha entre a função de semivariância, covariância ou correlação depende do

objetivo do pesquisador. Porém, Cressie (2015) afirma que a razão prática para preferir a

função semivariância no estudo da dependência espacial é que a estimativa a partir dos dados

observados é mais confiável, uma vez que não necessita de estimativa da média.

Os valores da função semivariância podem ser graficamente representados,a partir

da construção de um gráfico de dispersão dos valores de γ(h) versus a distância h. Assim,

gera-se assim o gráfico chamado de semivariograma experimental, que transmite informações

importantes a respeito da continuidade e da variabilidade espacial do processo e permite

estimar os parâmetros que definem a estrutura da dependência espacial, que são:

i) Efeito pepita (φ1 ≥ 0): revela a descontinuidade do covariograma para distâncias menores

que a menor distância entre as amostras, podendo estar associado a erros de medição ou

de variabilidade de pequena escala não captada pela amostragem. Neste caso, quando

h→ ∞, C(h) → (φ1);

ii) Contribuição (φ2 ≥ 0): denominada de variância da dispersão do processo (Sill),

representa as diferenças espaciais entre os valores de uma variável tomada em dois

pontos separados por distâncias cada vez maiores. Assim, a medida que h → 0,

C(h) → (φ1 + φ2) (patamar);

iii) Alcance (al = g(φ3)): o alcance (range) é uma função do parâmetro φ3 e consiste

na máxima distância em que os elementos amostrais apresentam-se correlacionados

espacialmente. Assim, o alcance delimita a distância a partir da qual o valor da variável,

numa localização em estudo, não tem mais influência sobre a localização vizinha.

Vale destacar ainda que uma análise detalhada do semivariograma fornece

informações importantes sobre a presença de anisotropia, ou seja, quando a variável

Page 45: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

27

estudada apresenta comportamento diferente em distintas direções. Portanto, o estudo da

dependência espacial não pode ser feito por meio de um único semivariograma, chamado

de semivariograma omnidirecional. As diretrizes para a construção dos semivariogramas

direcionais convencionais são: 00, 450, 900 e 1350. Caso seja detectado este tipo de

comportamento, uma correção deve ser aplicada, obtendo-se assim um comportamento

isotrópico. Para mais detalhes, veja Isaaks e Srivastava (1989), Diggle e Ribeiro Jr. (2007)

e Guedes, et al. (2008).

3.4.2 A modelagem geoestatística

Uma vez construído o gráfico, é necessário ajustar algum modelo que seja capaz de

representar os parâmetros da estrutura da dependência espacial e, desta forma, quantificar a

continuidade espacial de Y (s). Assume-se que este processo pode ser modelado por

Y (si) = µ(si) + ǫ(si) i = 1, · · · , n, (3.22)

em que o termo determinístico µ(si) e o termo estocástico ǫ(si) dependem da localização

espacial onde Y (si) foi obtida, sendo E[ǫ(si)] = 0. Assim, é possível expressar (3.22) na forma

matricial como

Y (s) = Xβ + ǫ (3.23)

em que Y (s) = (Y (s1), . . . , Y (sn))⊤ e ǫ = (ǫ(s1), . . . , ǫ(sn))

⊤, sendo µ = Xβ, na qual X

representa uma matriz (n× (q+ 1)) composta pelo vetor de um‘s e pelas (q+ 1) covariáveis e,

β = (β0, . . . , βq)⊤ o vetor de parâmetros desconhecidos a serem estimados.

Assume-se ainda que a dependência espacial é determinada por uma matriz escala

Σ, simétrica, não singular e positiva definida, proporcional à covariância do processo e essa

é diretamente relacionada a distribuição assumida para o processo, a qual é determinada por

C(si, sj) = cov[ǫ(si), ǫ(sj)], cuja forma paramétrica é:

Σ = φ1I + φ2R(φ3)

em que, φ1, φ2 e φ3 são conforme definidos na seção anterior e R(·) = [rij ], é uma matriz

simétrica, p × p, com rii = 1, sendo que estes dependem do modelo teórico adotado para

modelar o semivariograma experimental.

Os modelos teóricos utilizados para explicar a variância espacial são divididos em

modelos transitivos e modelos não transitivos. Os modelos não transitivos são aqueles que

não possuem patamar, ou seja, o crescimento de γ(h) é contínuo em relação a h e satisfaz

apenas a hipótese intrínseca, não apresentando variância finita. Já os modelos transitivos

são aqueles que possuem patamar e indicam a ocorrência de estacionariedade de segunda

ordem. Além disso, estes modelos consideram que a variável em estudo é isotrópica, ou

seja, apresenta a mesma característica estrutural em todas as direções do campo geométrico

(MARDIA; MARSHALL, 1984; CRESSIE, 2015).

Vários são os modelos teóricos apresentados na literatura (ISAAKS; SIRIVASTAVA,

Page 46: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

28

1989; SOARES, 2006; DIGGLE; RIBEIRO JR., 2007). Neste trabalho será utilizado o

modelo teórico transitivo da família Matérn (1986). A razão prática da escolha é por sua

flexibilidade, juntamente com a interpretação concreta do parâmetro de forma κ, que controla

a diferenciabilidade do processo latente Y (s), que pode ser [κ − 1] vezes diferenciável, em

que [κ] denota o menor inteiro maior ou igual a κ. Além disso, o modelo da família Matérn se

aproxima do modelo gaussiano quando κ → ∞, e do modelo exponencial no caso particular

κ = 0, 5 (DIGGLE; RIBEIRO JR., 2007; WEBSTER; OLIVER, 2007).

Em termos de modelo teórico, o semivariograma pode ser expresso por

γ(hij) =

0 se i = j

ϕ1 + ϕ2

(1− (2κ−1Γ(κ))−1

( hϕ3

)κKκ

( hϕ3

))se i 6= j

, (3.24)

em que κ é uma constante positiva e Kκ(·) é a função de Bessel modificada do terceiro tipo de

ordem κ, sendo Kκ(δ) =12

∫ 0∞ xκ−1 exp

− 1

2δ(x+ 1x)dx (ABRAMOWITZ; STEGUN, 1970).

Já a função de covariância é expressa pela Equação

C(hij) =

0 se i = j

ϕ2

(2κ−1Γ(κ))−1

( hϕ3

)κKκ

( hϕ3

))se i 6= j

, (3.25)

e o correlograma por

ρ(hij) =

1 se i = j

[2κ−1Γ(κ)

]−1

(h

φ3

(h

φ3

), i 6= j

.

Na família Matérn, o modelo gerado atinge o patamar apenas assintoticamente e o

comportamento próximo à origem é delimitado pelo parâmetro κ, que determina a suavização

analítica do processo, como pode ser observado na Figura 1(a). Já a variação do parâmetro

φ3 controla tanto a taxa de crescimento como a estabilização da função de semivariância,

mostrando que o raio de dependência espacial (alcance) é função de ϕ3, ou seja, al = g(φ3)

(Figura 1(b)).

Page 47: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

29

0 5 10 15

0.0

0.2

0.4

0.6

0.8

1.0

Distância

γ(h)

κ = 0, 5κ = 1, 0κ = 1, 5κ = 2, 0

(b)

0 5 10 15

0.0

0.2

0.4

0.6

0.8

1.0

Distância

γ(h)

φ(3) = 1, 0φ(3) = 1, 5φ(3) = 2, 5φ(3) = 5, 0

(c)

Figura 1 Função de semivariância para os modelos da família Matérn, a partir de diferentesvalores de κ (a) e φ3 (b).

Definido o modelo espacial linear, conforme (3.23), a próxima etapa é a obtenção

dos estimadores do vetor de parâmetro desconhecidos θ de θ = (β⊤,φ⊤)⊤, em que φ =

(φ1, φ2, φ3)⊤. Neste trabalho será aplicado o estimador de MV via algoritmo EM, que escolhe

o vetor que maximiza a função no domínio de θ, ou seja, maximiza a função de densidade de

probabilidade assumida no processo Y (s) em relação aos efeitos fixos (processo estacionário)

e aos componentes dos efeitos aleatórios. Mais detalhes ver os Artigos 3 e 4, que descrevem

a modelagem espacial ao assumir a distribuição slash multivariada.

3.4.3 Critérios de seleção do parâmetro κ

Apesar do modelo teórico da família Matérn apresentar vantagens devido a sua

flexibilidade, ocorrem problemas associados ao parâmetro κ quando se conhece uma única

realização, pois aquele não pode ser corretamente estimado por MV devido a problemas

de identificabilidade. Esta questão é discutida por Genton e Zhang (2012), como mostra a

proposição a seguir.

Proposição 3.11. Seja Pi, com i = 1, 2, uma medida de probabilidade na qual Σ tem

função distribuição Fi e Y (s), definida na equação (3.23), seja um processo estacionário

com média zero e função de covariância Matérn dada pela Equação (3.25), cujo parâmetro

φi = (φ2i, φ3i, κ). Se F1 e F2 têm o mesmo suporte, φ21φ−2κ31 = φ22φ

−2κ32 e S é um subconjunto

de ℜd, para d = 1, 2, 3, então duas medidas P1 e P2 são equivalentes para Y (s), s ∈ S.

Demonstração. Admitindo-se que o processo é estacionário e isotrópico, tem-se que o

covariograma (3.25) em ℜd tem densidade espectral isotrópica dada por:

fi(u) =φ2iφ

−2κ3i

πd/2(φ−23i + u2)(κ+d/2)

u ≥ 0. (3.26)

Segundo Stein (2004), para i = 1, 2 a equivalência entre as duas medidas de probabilidade Pi,

Page 48: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

30

sobre o caminho Y (s), s ∈ S e limitado ao subconjunto S ⊂ ℜd, será satisfeita para uma soma

finita c, se a∞∫

c

ud−1

f2(u)− f1(u)

f1(u)

2

du <∞. (3.27)

Assumindo-se que φ21φ−2κ31 = φ22φ

−2κ32 , de 3.26, tem-se

∣∣∣∣f2(u)− f1(u)

f1(u)

∣∣∣∣ =

∣∣∣∣f2(u)

f1(u)− 1

∣∣∣∣ =∣∣∣∣(φ−2

31 + u2)(κ+d/2)

(φ−232 + u2)(κ+d/2)

− 1

∣∣∣∣ .

Agora, f1(u)=u(2κ+d), pois está limitado de 0 a ∞ quando u→ ∞. Desta forma,

∣∣∣∣f2(u)− f1(u)

f1(u)

∣∣∣∣ ≤ |(φ−231 + u2)(κ+d/2) − (φ−2

32 + u2)(κ+d/2)|u2κ+d

≤ |((φ−1

31 /u)2 + 1

)(κ+d/2) −((φ−1

32 /u)2)(κ+d/2)|.

Note que: (x+ 1)α = 1 + (αx) +O(x2), quando x→ 0. Então, quando u→ ∞,

|((φ−1

31 /u)2 + 1

)(κ+d/2) −((φ−1

32 /u)2)(κ+d/2)|

≤ |(κ+ d/2)

(φ−131 /u

2

)− (κ+ d/2)

(φ−132 /u

2

)|+O(u−4)

≤ (κ+ d/2)|φ−131 − φ−1

32 |u−2 +O(u−4).

Como a integral em (3.27) é limitada, ( < ∞), para d = 1, 2, 3, logo as duas medidas são

equivalentes.

Portanto, a Proposição 3.11 mostra que, em processos espaciais sem repetições,

o vetor de parâmetros φ relacionado à estrutura de dependência espacial só poderá ser

corretamente identificado e consistente se κ for considerado fixo. Agora a questão é: "como

definir o valor adequado de κ?".

Isaaks e Srivastava (1989), Zhang (2004) e De Bastiani et al. (2015) mostram que

uma alternativa para contornar o problema de identificabilidade é a utilização de métodos

de validação cruzada (V C), que podem ser utilizados como critério de seleção de um valor

de κ adequado. Segundo Zhang (2004), a V C é um método eficiente, como mostra a

Proposição 3.11, pois não pode efetivamente detectar um covariograma incorreto uma vez

que o covariograma incorreto define uma medida equivalente à definida pela covariograma

correto quando o valor de κ foi adequadamente escolhido.

Segundo De Bastiani et al. (2015), ainda é possível utilizar como critério de escolha

do κ mais adequado o método denominado Traço (Tr), apresentado por Kano, Berkane e

Bentler (1993). Este consiste em calcular o traço da matriz de covariância assintótica da média

estimada, µ = Xβ, como um critério de escolha dos parâmetros fixos.

Para os dois métodos, o valor de κ mais adequado será determinado pelos menores

valores de V C e Tr. Mais detalhes são apresentados nos Artigos 3 e 4.

Page 49: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

31

3.4.4 Krigagem

Definido o modelo, é necessário determinar um método de interpolação que o incorpore

objetivando, desta forma, estimar a variabilidade espacial da variável em estudo em toda a

área, possibilitando a construção de mapas. Dentre estes métodos tem-se a krigagem, que

usa a dependência espacial (expressa nos parâmetros da função semivariância ou função de

covariância do modelo teórico escolhido) para estimar, em qualquer posição dentro do espaço

amostral definido, valores não amostrados (SOARES, 2006). A krigagem, diferente de outros

métodos de interpolação, atribui a partir da covariância espacial pesos diferentes às amostras,

trata a redundância dos dados, considerada à vizinhança no procedimento inferencial e avalia

o erro associado ao valor estimado (ANDRIOTTI, 2003).

Segundo Webster e Oliver (2007), o valor estimado para cada ponto s0 é dado pela

combinação linear dos dados, ou seja:

y(s0) =n∑

i=1

λiy(si), (3.28)

em que, λi são os são os ponderadores (pesos) obtidos a partir da função de semivariância ou

covariância, y(si) é o valor da variável no ponto amostrado si, y(s0) é o valor predito no local

não amostrado e n é o número de pontos amostrados.

Os valores λi, i = 1, . . . , n são escolhidos de forma que o preditor seja o melhor preditor

linear não viesado (best linear unbiased predictor - BLUP). Tais qualidades são garantidas

impondo que:

• A esperança matemática do erro é zero, isto é,

E[Y (s0)− Y (s0)

]= 0; (3.29)

• A variância de estimação é mínima, isto é, precisa-se minimizar

Var[Y (s0)− Y (s0)

]= E

[(Y (s0)− Y (s0)

)2]− E[Y (s0)− Y (s0)

]2. (3.30)

A krigagem engloba diversos métodos de estimação e varia em função de características

específicas do processo estocástico que representa a variável em estudo.

3.4.4.1 Krigagem ordinária

O processo de interpolação por krigagem ordinária é embasada na ideia de regressão

linear, onde a estimativa da variável em estudo em um local não amostrado é obtida a partir

da combinação linear dos n dados amostrados disponíveis na vizinhança do ponto analisado,

utilizando o estimador definido em (3.28) (JOURNEL, 1978).

Quando se admite que o processo estocástico é intrinsecamente estacionário tem-se

Page 50: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

32

que o erro médio, definido na Equação (3.29), será nulo se

E[Y (s0)− Y (s0)

]= 0 ⇐⇒ µ− µ

n∑

i=1

λi = 0 ⇐⇒ µ

(1−

n∑

i=1

λi

)= 0.

E assim, o estimador será não tendencioso se

n∑

i=1

λi = 1.

Além disso, na krigagem ordinária a variância de estimação será mínima dentre todos

os estimadores não tendenciosos, se em (3.30) a expressão a ser minimizada for da forma

Var[Y (s0)− Y (s0)

]= Var(Y (s0)) +

n∑

i=1

n∑

j=1

λiλjC(Y (si)Y (sj))− 2n∑

i=1

λiC(Y (si)Y (s0)).(3.31)

A minimização da variância de estimação, respeitada a condição de não-enviesamente,

é um problema que exige, para a sua solução, a utilização da técnica de Multiplicadores de

Lagrange. Acrescentando o parâmetro de Lagrange τ em (3.31) e derivando em relação a

n + 1 variáveis e igualando a zero, chega-se aos valores do λi para i = 1, · · · , n, sendo estes

soluções do sistema de equações

S :

n∑

j=1

λjC((Y (si), Y (sj)) + τ = C(Y (si), Y (s0)), 1 ≤ i ≤ n

n∑

i=1

λi = 1

. (3.32)

Utilizando a relação γ(si, sj) = Var(Y (s)) − C(Y (si), Y (sj)), em termos das semivariâncias, o

sistema de equações dado em (3.32), conhecido como sistema de krigagem ordinária, pode

ser escrito da seguinte forma

S :

n∑

j=1

γ(s1, sj)− τ = γ(s1, s), 1 ≤ i ≤ n.

n∑

i=1

λi = 1

.

ou na forma matricial, γλ = A, o que implica em λ = γ−1A, em que

γ =

γ(s1, s1) γ(s1, s2) . . . γ(s1, sn) 1

γ(s2, s1) γ(s2, s2) . . . γ(s2, sn) 1...

.... . .

......

γ(sn, s1) γ(sn, s2) . . . γ(sn, sn) 1

1 1 . . . 1 0

,

λ = (λ1, . . . , λn, τ)⊤ e A = (γ(s1, s0), . . . , γ(sn, s0), 1)

⊤.

Page 51: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

33

3.4.4.2 Krigagem com modelo de deriva externa

Na krigagem ordinária assume-se a existência de variância finita e a hipótese de

estacionariedade em relação à média, isto é, E[Y (s0)

]= µ , com µ constante para todo s0

do espaço amostral. No entanto, se uma informação auxiliar correlacionada com a variável

resposta está disponível em todos os pontos da grade, distintos espacialmente, krigagem por

regressão ou krigagem com um modelo de deriva externa deve ser usada. Os dois termos

descrevem praticamente o mesmo método e fornecem as mesmas predições, diferindo apenas

em passos metodológicos. Neste caso, a média da variável em estudo não será constante para

toda a área em estudo (HENGL; HEUVELINK; STEIN, 2003; HENGL, 2009).

Desta forma, ao se considerar que a média é não estacionária, tem-se que

µ(si) =

q∑

j=0

βjxij , (3.33)

em que xij são funções do local das coordenadas e βj é a tendência local dos coeficientes da

função xij e s ∈ S ⊂ ℜd(d ≥ 1).

Assim, o estimador de um valor em s0 será obtido por

Y (s0)−q∑

j=0

βjx0j =

n∑

i=1

λi

[Y (si)−

q∑

j=0

βjxij

]

isto é,

Y (s0) =n∑

i=1

λiY (si) +

q∑

j=0

βj

[fj(s0)−

n∑

i=1

λ1xij

]. (3.34)

imposta a restriçãon∑

i=1

λixij = x0j , j = 1, · · · , q, o estimador de (3.34) fica da forma:

Y (s0) =n∑

i=1

λiY (si), (3.35)

mostrando que a krigagem por regressão, assim como a krigagem ordinária, é um interpolador

linear (JONES; VECCHIA, 1993).

A solução para a estimativa de s0 considerando o estimador linear (3.35) pode ser

determinada a partir do modelo linear espacial, ou seja, Y (s) = µ(s) + ǫ(s), em que E(ǫ(s)) =

0 e a covariância entre Y (si) e Y (sj) dependem apenas da distância entre si e sj , isto é,

Cov(si, sj) = C(hij), em que hij é a distância euclidiana entre si e sj (DAVIS, 2002). Desta

forma, o erro de estimação de s0 pode ser escrito em termos dos resíduos como

Y (s0)− Y (s0) =n∑

i=1

λiY (si)− Y (s0) =n∑

i=1

λi(µ(si)− µ(s0)) +n∑

i=1

λi(ǫ(si)− ǫ(s0)).

Atendendo a condição de não-enviesamento( n∑

i=1

λiY (si) = Y (s0)

), o erro de estimação

Page 52: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

34

resume-se a

Y (s0)− Y (s0) =n∑

i=1

λiǫ(si)− ǫ(s0).

Desta forma, a variância de estimação pode ser escrita em função das covariâncias e dos

resíduos da seguinte maneira

E[Y (s0)− Y (s0)

]= E

[(ǫ(s0)− ǫ(s0)

)2],

ou seja,

E[Y (s0)− Y (s0)

]= C(0) +

n∑

i=1

q∑

j=1

λiλjC(si, sj)− 2n∑

i=1

C(s0, si). (3.36)

O problema de minimização é aqui idêntico ao de krigagem ordinária, isto é, deve-se

diferenciar a equação (3.36) com respeito a λi, para i = 1, . . . , n, e igualar essas derivadas

a zero. Contudo, deseja-se que as condições estabelecidas pelas p equações definidas em

(3.33) sejam satisfeitas. Assim, adiciona-se na equação (3.36) p termos nulos correspondentes

a estas condições. Então, tem-se que

Var

(Y (s0)− Y (s0)

)= C(0) +

n∑

i=1

n∑

j=1

λiλjC(si, sj)− 2n∑

i=1

C(s0, si) + 2

q∑

j=0

τj

n∑

i=1

λixij − x0j ,

em que τj são parâmetros de Lagrange. Igualando a zero as n + q derivadas com respeito a

λi, para i = 1, . . . , n, e τj , para j = 1, . . . , q, tem-se o sistema de equações lineares

S =

n∑

k=1

λkC (si, sk) +

q∑

k=0

τkxik = C (si, s0) , i = 1, . . . , n.

n∑

k=1

λkxkj = x0j , j = 1, . . . , q.

Em forma matricial, o sistema S dado em (3.4.4.2) pode ser escrito como Cλ = A, em que

C =

C (s1, s1) · · · C (s1, sn) 1 x11 · · · x1q...

. . ....

......

. . ....

C (sn, s1) · · · C (sn, sn) 1 xn1 · · · xnq

1 · · · 1 0 0 · · · 0

x11 · · · xn1 0 0 · · · 0...

. . ....

......

. . ....

xq1 · · · xnq 0 0 · · · 0

;

λ = (λ1, . . . , λn, τ1, . . . , τp)⊤ e A = (C (s1, s0) , . . . ,C (s1, s0) , 1, x01, . . . , x0q). Então, os pesos

λi, para i = 1, . . . , n, são dados por λ = C−1A.

Page 53: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

35

3.4.5 Medidas de similaridade entre mapas

Após a construção dos mapas, é importante avaliar a acurácia temática e fazem a

comparação entre eles. Para que isso se torne possível, é necessário quantificar os pixels e

determinar a concordância entre os mesmos. Estas informações podem ser obtidas a partir

da matriz de erros dos mapas.

Segundo Congalton e Green (1999), ao se avaliar a acurácia busca-se verificar a

qualidade da predição da superfície do mapa modelo em relação ao real, ou de referência,

busca-se identificar e corrigir fontes de erro, facilitar a comparação de vários algoritmos,

técnicas, modelos criadores e interpretadores e determinar a relevância dos dados produzidos

no processo de tomada de decisão. Considera-se aqui mapa de referência ou mapa real

aquele modelado utilizando todos os dados amostrais, e mapa modelo aquele obtido após a

eliminação de observações consideradas influentes.

A Tabela 1, apresenta de forma geral uma matriz de erros. O número de pixels do mapa

real é quantificado nas colunas, enquanto o número de pixels do mapa modelo é quantificado

nas linhas. Cada elemento da matriz representa os pixels pertencentes à classe i-ésima do

mapa modelo e à classe j-ésima do mapa de referência, sendo N o número total de pixels.

Tabela 1 Matriz de erros genéricos m×m.

Pixels do mapa de referência

Classes C1 C2 · · · Cm Total por linha xi·

C1 x11 x12 · · · x1m X1· =

m∑

j=1

x1j

Pixels do mapa modelo...

......

. . ....

...

Cm xm1 xm2 · · · xmm Xm· =

m∑

j=1

xmj

Total por coluna x·i X·1 =

m∑

i=1

xi1 X·2 =

m∑

i=1

xi2 · · · X·m =

m∑

i=1

xim N

Na Tabela 1 a diagonal principal (quando i = j) representa casos em que os pixels

apresentaram a mesma classificação nos dois mapas, enquanto os elementos que estão fora

da diagonal principal representam as classificações errôneas. Observa-se que, se os dois

mapas forem iguais, todos os elementos fora da diagonal principal serão nulos.

Após a construção da matriz erros, é necessário quantificar a concordância entre

os mapas. Dentre os índices de concordância, têm-se a Exatidão Global (EG) e o Kappa,

proposto por Cohen (1960).

A EG avalia a precisão do classificador e é calculada pela divisão das somas das

entradas que formam a diagonal principal da matriz de erros pelo total de pontos da mesma,

dada pela Equação (3.37)

EG =

m∑

i=1

xii

N. (3.37)

De acordo com Watzlawick et al. (2002), esse valor representa a relação entre o

Page 54: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

36

número de pontos classificados corretamente e o número total de pontos amostrais, ou seja, é

uma estatística utilizada para mensurar a similaridade entre o mapa de referência e o modelo

ajustado. O nível mínimo de precisão aceitável da exatidão global é de 0,85 (ANDERSON et

al., 1976).

Já o Kappa é um índice de concordância para escalas nominais, e mede a proporção

de concordância depois que a concordância atribuída à casualidade é retirada de consideração

(COHEN, 1960). Assim, considera-se que este índice determina a concordância esperada a

posteriori, uma vez que a concordância esperada é calculada após a elaboração da matriz de

erros, sendo determinado conforme Equação (3.38)

Kappa =

Nm∑

i=1

xii −m∑

i=1

(xi·x·i)

N2 −m∑

i=1

(xi·x·i)

, (3.38)

em que x·i é o número de pontos da classe Ci do mapa de referência e xi· o número de pixels

na classe Ci do mapa modelo.

Segundo Gong e Howarth (1990), o índice Kappa é a medida mais apropriada e

recomendada para mensurar a exatidão das classificações temáticas, pois utiliza todos os

elementos da matriz dos erros, ao invés de apenas aqueles que se situam na diagonal principal.

Krippendorff (2004) classifica o índice kappa como de baixa exatidão se Kappa < 0, 67, como

de média exatidão de 0, 67 ≤ Kappa < 0, 80 e como de alta exatidão se Kappa ≥ 0, 80.

3.4.6 Caracterização das variáveis

O objetivo desta seção é apresentar uma breve revisão sobre as variáveis que serão

utilizadas nos artigos 3 e 4, referentes ao modelo linear espacial slash. O modelo proposto

considera como variável resposta a produtividade da soja e como variáveis explicativas

atributos químicos do solo, em especial o fósforo, potássio, pH, matéria orgânica e ferro. Para

a escolha das variáveis considerou-se a alta curtose dos dados e a dependência espacial.

A análise química laboratorial das amostras de solo foram realizadas no laboratório da

Cooperativa Central de Desenvolvimento Tecnológico e Econômico Ltda (COODETEC-Brasil).

3.4.6.1 Produtividade da soja

A soja (Glycine max) é um dos principais produtos de exportação e uma das principais

commodities do planeta. Atualmente, é cultivada praticamente em todo o território nacional,

sendo o principal produto agrícola do País. Com o desenvolvimento de cultivares adaptadas às

diferentes regiões agroclimáticas, o Brasil tornou-se o segundo maior produtor mundial de soja,

predominantemente utilizada para o processamento do grão em óleo e proteína (SANTOS et

al., 2008). De modo geral, as variedades brasileiras têm ciclo entre 100 e 160 dias e, em

determinada região, são classificadas como maturação precoce, semiprecoce, intermediária,

semitardia e tardia.

Page 55: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

37

Estudos mostram que o potencial das novas cultivares de soja pode chegar a 80 sacas

ha−1, aproximadamente 3,106 t ha−1, quando há equilíbrio nutricional da planta. Quando há

uma associação entre a análise de solo, o histórico da área, o manejo do solo, entre outras

tecnologias para melhorar as recomendações e aplicações de adubação, consequentemente,

haverá o incremento da produtividade da lavoura (EMBRAPA, 2009).

3.4.6.2 Fósforo, Potássio e Ferro

O fósforo (P) é um dos elementos aplicados em maiores quantidades em solos

brasileiros, devido à baixa disponibilidade natural e grande afinidade da fração mineral do solo

por este elemento. Isso o torna um dos fatores mais limitantes da produção em solos tropicais

(MACHADO et al., 2011).

As formas mais solúveis do P no solo ocorrem na amplitude de pH entre 5,5 a 7,0.

Estima-se que o índice de aproveitamento deste elemento pela planta seja de 20 a 40%. As

adubações fosfatadas têm eficiência agronômica aumentada, quando aplicadas após calagem

adequada, na forma granulada e de maneira localizada no sulco de plantio. Malavolta (1997)

afirma que a maior parte do P absorvida pela planta é transferida e armazenada para o fruto

ou grão e concentram-se nas áreas mais ativas de crescimento.

O principal mecanismo de transporte do P no solo é a difusão, influenciada por vários

fatores, tais como: o conteúdo volumétrico de água no solo, a interação P × colóide do solo, a

distância a percorrer até as raízes, o teor do elemento e a temperatura do solo (AZEVEDO et

al., 2004).

O potássio (K) é absorvido pelas plantas na forma de íon K+. Na solução do solo,

o potássio é móvel e, também, sujeito às perdas por lixiviação, ocorrendo, principalmente,

em solos ácidos e com baixa CTC, erosão e remoção por colheitas. Um dos principais

problemas causados pela deficiência de K nos solos é a ocorrência de acamamento das

plantas, enfraquecimento de caules e atrasos na floração, consequentemente prejudicando

a produtividade da cultura.

Assim como os macronutrientes (P e K), são elementos que as plantas necessitam

em quantidades elevadas, elas também necessitam dos micronutrientes, porém em pequenas

quantidades. Em relação ao micronutriente Ferro (Fe), alguns fatores importantes para

disponibilidade desse no solo são o nível de pH e a presença de matéria orgânica e também de

P, que podem impactar na disponibilidade para as plantas. Nas plantas, o Fe é essencial para

síntese de proteínas, indispensável no processo de respiração, fotossíntese e transferência de

energia (GUERINOT; YI, 1994; MARENCO; LOPES, 2009).

3.4.6.3 Matéria Orgânica

A matéria orgânica (MO) apresenta influência reconhecida no comportamento dos

solos, nos aspectos físicos, químicos e biológicos. Seus teores e características, resultado

das taxas de produção, alteração e decomposição de resíduos orgânicos, são dependentes

Page 56: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

38

de uma série de fatores, como temperatura, aeração, pH e disponibilidade de água e nutrientes,

muitos deles condicionados pelo uso e manejo dos solos (NASCIMENTO et al., 2010).

Segundo Malavolta (1997), a perda de MO do solo reduz a capacidade de infiltração

da água e aumenta as ocorrências de erosão, a qual elimina as camadas superfíciais férteis

do solo. A perda de nutrientes pela erosão é um dos principais fatores para empobrecimento

dos solos e redução da produtividade da maioria das culturas por conseguinte, há aumento no

custo de produção e da contaminação ambiental.

3.4.6.4 pH

O pH é uma medida de acidez do solo e consiste na concentração (atividade) de íons

hidrogênio na solução do solo. Valores mais elevados do pH permitem maior disponibilidade e

aproveitamento dos nutrientes essenciais à planta. A faixa ideal está entre 6 e 7 para a maioria

das culturas agrícolas (MALAVOLTA, 1997).

A disponibilidade dos nutrientes sofrem influência do pH do solo. O nitrogênio (N) é

melhor aproveitado pela planta em solo com pH acima de 5,5. O P tem melhor disponibilidade

para as plantas em pH 6 a 6,5 e o K é melhor aproveitado em pH do solo maior que 5,5. Já

o Fe fica mais disponível com pH maior que 6,0, e a cultura da soja requer uma faixa ideal de

pH entre 5,7 e 7,0.

Page 57: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

39

4 REFERÊNCIAS

ABRAMOWITZ, M.; STEGUN, I. A. Handbook of mathematical functions. Dover Press, NewYork, 1970.

AMADO, T. J. C.; SANTI, A. L.; PONTELLI, C. B.; VEZANI, F. Agricultura de precisão comoferramenta de aprimoramento do manejo do solo. Revista Plantio Direto , Passo Fundo, p.46-54, Número especial, 2004.

ANDERSEN, E. B. Diagnostics in categorical data analysis. Journal of the Royal StatisticalSociety , v. 54, p. 781-791, 1992.

ANDERSON, J. F.; HARDY, E. E.; ROACH, J. T.; WITMER, R. E. A land use and land coverclassification system for use with remote sensor data. U.S. Geological Survey ProfessionalPaper 964, Washington, DC, p. 28, 1976.

ANDERSON, T. W. An introduction to multivariate statistical analysis . John Wiley, NewJersey, 3 ed., 2003.

ANDREWS, D. F.; MALLOWS, C. L. Scale mixtures of normal distributions. Journal of theRoyal Statistical Society , v. 36, p. 99-102, 1974.

ANDRIOTTI, J. L. S. Fundamentos de estatística e geoestatística . São Leopoldo: Unisinos,2003.

ARELLANO, R.V.; BOLFARINE, H. On some charecterizations of the t-student. Statistics &Probalility Letters , v. 25, p. 79-85, 1995.

ARSLAN, O.; GENÇ, A. A generalization of the multivariate slash distribution. Journal ofStatistical Planning and Inference , v. 139, p. 1164-1170, 2009.

ASSUMPÇÃO, R. A. B.; Uribe-Opazo, M. A.; Galea M. Analysis of local influence ingeostatistics using Student’s t-distribution. Journal Appllied Statistics . v. 41, p. 615-630,2014.

AZEVEDO, W. R.; FAQUIN, V.; FERNANDES, L. A.; OLIVEIRA Jr., A. C. Disponibilidadede fósforo para o arroz inundado sob efeito residual de calcário, gesso e esterco de curralaplicados na cultura do feijão. Revista Brasileira de Ciência do Solo , Viçosa, v. 28, p.995-1004, 2004.

BORSOI, J. Modelos mistos lineares elípticos com erros de medição. Tese de Doutorado,Instituto de Matemática e Estatística - Universidade de São Paulo, IME-USP, 2014.

BELSLEY, D. A.; KUH, E.; WESLSH, R. E. Regression diagnostics : identifying influentialdata and sources of collinearity. John Wiley, New York, 1980.

Page 58: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

40

BOX, G. E. P.; TIAO, G. C. Bayesian inference in statistical analysis. John Wiley & Sons,1992.

CASELLA, G.; BERGER, R. L. Inferência estatística - tradução da 2a edição norte-americana.São Paulo: Cengage Learning, 2010.

CHATTERJEE, S.; HADI, A. Sensitivity analysis in linear regression. John Wiley, New York,1988.

COHEN, J. A. Coefficient of agreement for nominal scales. Educational and PsychologicalMeasurement , v. 20, p. 37-46, 1960.

CONGALTON, R. G.; GREEN, K. Assessing the accuracy of remotely sensed data :principles and practices. New York: Lewis Publisher, 1999.

COOK, R. D. Detection of infuential observation in linear regression. Technometrics , v. 19, p.15-18, 1977.

COOK, R. D. Assessment of local influence (with discussions). Journal of the RoyalStatistical Society , B, v. 48, p. 133-169, 1986.

COOK, R. D.; WEISBERG, S. Residuals and influence in regression. London: Chapman &Hall, 1982.

COOPERATIVA AGROPECUÁRIA MOURÃOENSE LTDA. (COAMO) - COOPERATIVACENTRAL DE DESENVOLVIMENTO TECNOLÓGICO E ECONÔMICO LTDA. (COODETEC).Fertilidade do solo e nutrição de plantas . Cascavel, Brazil: COAMO/COODETEC, 2001.

CRESSIE, N. A. C. Statistics for spatial data . New-York: Jonh Wiley & Sons, 2015.

DAGENAIS, M. G.; DUFOUR, J. M. Invariance, nonlinear models and assymptotic tests.Econometrica , v. 59, p. 1601-1615, 1991.

DAVIS, J. C. Statistics and data analysis in geology . 3 ed. New York: John Wiley & Sons,2002.

DE BASTIANI, F.; MARIZ DE AQUINO QUEIROZ, A. H.; URIBE-OPAZO, M. A.; GALEA, M.Influence diagnostics in elliptical spatial linear linear models. TEST, v. 24, p. 322-340, 2015.

DEMPSTER, A. P.; LAIRD, N. M.; RUBIN, D. B. Maximum likelihood from incomplete data viathe EM algorithm (with discussion). Journal of the Royal Statistical Society , B, v. 39, p. 1-38,1977.

DIGGLE, P.J.; RIBEIRO JR., P. J. Model-based geoestatistics . New York: Springer Series inStatistics, 2007.

EMPRESA BRASILEIRA DE INVESTIGAÇÃO AGROPECUÁRIA (EMBRAPA). Sistemabrasileiro de classificação de solo. Rio de Janeiro: Empresa brasileira de InvestigaçãoAgropecuária-Centro Nacional de Pesquisa de Solos (Embrapa-SPI), 2009.

Page 59: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

41

FANG, K. T.; KOTZ, S.; Ng, K. W. Symmetric multivariate and related distributions .London:Chapman & Hall, 1990.

GALEA, M.; BOLFARINE, H.; LABRA, F. V. Local influence in comparative calibration modelsunder elliptical t-distributions. Biometrical Journal , v. 47, p. 691-706, 2005.

GENTON, M., ZHANG, H. Identifiability problems in some non-Gaussian spatial random fields.Chilean Journal of Statistics , v. 3, p.171-179, 2012

GIMÉNEZ, P.; GALEA, M. Influence measures on corrected score estimators in functionalheteroscedastic measurement error models. Journal of Multivariate Analysis , v. 114, p.1-15, 2013.

GÓMEZ, H. W.; QUINTANA, F. A.; TORRES, F. J.A new family of slash-distributions withelliptical contours. Statistics & Probability Letters, v. 77, p. 717-725, 2007.

GONG, P.; HOWARTH, P.J. An assessment of some factors influencing multispectral landcoverclassification. Photogrammetric Engineering and Remote Sensing , v. 56, p. 597-603, 1990.

GOURIEROUX, Ch.; MONFORT, A. Statistics and econometric models-tesing confidenceregions, model selection, and asymptotic theory . Cambridge University Press, New York, v.2, 1995.

GUEDES, L. P. C.; URIBE-OPAZO, M. A.; JOHANN, J. A.; SOUZA, E. G. Anisotropia noestudo da variabilidade espacial de algumas variáveis químicas do solo. Revista Brasileirade Ciência do Solo , v. 32, p. 2217-2226, 2008.

GUERINOT, M. A., YI, Y. Iron: Nutritious, Noxious, and Not Readily Available. PlantPhysiology . v. 104, p. 815-820, 1994.

HENGL, T. A practical guide to geostatistical mapping . Amsterdam: University ofAmsterdam, 2 ed., 2009.

HENGL, T.; HEUVELINK, G. B. M.; STEIN, A. Comparison of kriging with external drift andregression-kriging. Technical report. International Institute for Geo-information Scienceand Earth Observation (ITC), 2003. Disponível em http://www.itc.nl/library/Academic-output.

ISAAKS, E. H.; SRIVASTAVA, R. M. An introduction to applied geoestatistics . New York,Oxford University Press, 1989.

JAMSHIDIAN, M. A note on parameter and standard error estimation in adaptive robustregression. Journal of Statistics Computation and Simulation , v. 71, p. 11-27, 2001.

JOHNSON, R. A.; WICHERN, D. W. Applied multivariate statistical analysis . Third Edition.Prentice Hall, New Jersey, 1992.

JONES, R. H.; VECCHIA, A. V. Fitting continuous ARMA models to unequally spaced spatialdata. Journal of the American Statistical Association , v. 88, p. 947-954, 1993.

JOURNEL, A. G.; HUIJBREGTS, C. J. Mining geostatistcs . London, Academic Press, 1978.

Page 60: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

42

KANO, Y.; BERKANE, M.; BENTLER, P. Statistical inference based on pseudo-maximumlikelihood estimators in elliptical populations. Journal of the American StatisticalAssociation , v. 88, p. 135-143, 1993.

KOLLO T.; ROSEN, D. Advanced multivariate statistics with matrices . Springer:Netherlands, 2005.

KOTZ, S. Multivariate distributions at a cross-road.Statistical Distributions in Scientific Work,Dordrecht: Reidel Publishing Company , v. 1, p. 247-270, 1975.

KRIPPENDORFF, K. Content Analysis : an introduction to its methodology. Thousand Oaks:Sage publications, 2004.

LANGE, K., SINSHEIMER, J. S. Normal/independent distributions and their applications inrobust regression. Journal of Computational and Graphical Statistics , v. 2, p. 175-198,1993.

LIU, S. Local influence in multivariate elliptical linear regression models. Linear Algebra andits Applications , v. 354, p. 159-174, 2002.

MACHADO, V. J.;SOUZA, C. H. E.; ANDRADE, B. B.; LANA, R. M. Q.; KORNDORFER, G.H. Curvas de disponibilidade de fósforo em solos com diferentes texturas após aplicação dedoses crescentes de fosfato monoamônico. Biosciencie Jornal , Uberlândia, v. 27, p. 70-76,2011.

MAGNUS, J. R.; NEUDECKER, H. Matrix differential calculus with applications instatistics and econometrics . John Wiley, Chichester, 1999.

MALAVOLTA, E.; VITTI, G. C.; OLIVEIRA, S. A. A. Avaliação do estado nutricional dasplantas : princípios e aplicações. Piracicaba: Potafos, 2. ed., 1997.

MARDIA, K. V. Measures of multivariate skewness and kurtosis with applications. Biometrika ,v. 57, p. 519-530, 1970.

MARDIA, K. V.; KENT, J. T.; BIBBY, J. M. Multivariate analysis . London, Academic Press,1979.

MARDIA, K; MARSHALL, R. Maximum likelihood estimation of models for residual covariancein spatial regression. Biometrika , v. 71, p. 135-146, 1984.

MARENCO, R. A; LOPES, N.F. Fisiologia Vegetal: Fotossíntese, respiração,relações hídricase nutrição mineral. UFV, p. 267-297, 2009.

MATÉRN, B. Spatial variation. Lecture notes in statistics . New York, Springer, 1986.

MATHERON, G. Principles of geoestatistics. 2 ed., Economic Geology , v. 58, p. 1246-1266,1963.

MURRAY, J. D. Asymptotic analysis . New York, Springer-Verlag, 1984.

Page 61: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

43

NASCIMENTO, P. C.; LANI, J. L.; MENDONÇA, E. S.; ZOFFOLI, H. J. O.; PEIXOTO, H. T.M. Teores e características da matéria orgânica de solos hidromórficos do Espiríto Santos.Revista Brasileira de Ciência do Solo , Viçosa, v. 34, p. 339-348, 2010.

NEYMAN, J. Optimal asymptotic test of composite statistical hypothesis. In: Grenander, ed.,Probability and Statistics , Wiley, New York, p. 213-234, 1959.

OSORIO, F. Diagnósticos de influência em modelos mistos elípticos com efeitosaleatórios . Tese de Doutorado - Universidade de São Paulo, USP, São Paulo/SP, 2006.

OSORIO, F.; PAULA, G. A.; GALEA, M. Assessment of local influence in elliptical linear modelswith longitudinal structure. Computacional Statistics & Data Analysis , Holanda, v. 51, p.4354-4368, 2007.

OSORIO, F.; PAULA, G. A.; GALEA, M. On estimation and influence diagnostics for the Grubbs’model under heavy-tailed distributions. Computational Statistics & Data Analysis , v. 53, p.1249 -1263, 2009.

PAULA, G. A. Modelos de regressão com apoio computacional . São Paulo: IME:USP, 2010.

PAN, J.; FEI, Y.; FOSTER, P. Case-deletion diagnostics for linear mixed models.Technometrics , v. 56, p. 269-281, 2014.

POON, W. Y.; POON, Y. S. Conformal normal curvature and assessment of local influence.Journal of the Royal Statistical Society . Series B (Statistical Methodology), v. 61, p. 51-61,1999.

PREGIBON, D. Logistic regression diagnostics. The Annals of Statistics , v. 9, p. 705-724,1981.

RAO, C. R. Large sample tests of statistical hypotheses concerning several parameters withapplications to problems of estimation. Proceedings of the Cambridge PhilosophicalSociety , v. 44, p. 50-57, 1948.

RENCHER, C. A. Methods of multivariate analysis . New York, John Wiley, 2002.

SANTOS, F. C.; LIMA NEVES, J. C.; NOVAIS, R. F.; ALVAREZ, V. H.; SEDIYAMA, C. S.Modelagem da recomendação de corretivos e fertilizantes para a cultura da soja. RevistaBrasileira de Ciência do Solo , Viçosa, v. 32, p. 1661-1674, 2008.

SCHALL, R.; DUNNE, T. T. A note on the relationship between parameter collinearity and localinfluence. Biometrika , v. 79, p. 399-404, 1992.

SEBER, G. A. Multivariate observations . New York: John Wiley & Sons, 1984.

SCHABENBERGER, O.; PIERCE, F. J. Contemporany Statistical Models : for the plant andsoil sciences. Ed. CRC Press, Florida, 2002.

SHIH, W. J.; WEISBERG, S. Assessing influence in multiple linear regression with incompletedata. Technometrics , v. 28, p. 231-239, 1986.

Page 62: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

44

SOARES, A. Geoestatística para as ciências da terra e do ambiente . Portugal: IST Press,2. ed, 2006.

STEIN, M. L. Equivalence of gaussian measures for some nonstationary random fields.Journal of Statistical Planning and Inference , v. 123, p. 1-11, 2004.

WANG, J.; GENTON, M. G. The multivariate skew-slash distribution. Journal of StatisticalPlanning and Inference , v. 136, p. 209-220, 2006.

WALD, A. Test of statistical hypothesis concerning several parameters when the number ofobservations is large. Transactions of the American Mathematical Society , v. 54, p.426-482, 1943.

WATANABE, M.; YAMAGUCHI, K. The EM algorithm and related statistical models . MarcelDekker, Inc. New York, 2004.

WATZLAWICK, L. F.; KIRCHNER, F. F.; SANQUETTA, C. R.; SCHUMACHER, M. V. Fixação decarbono em floresta ombrófila mista em diferentes estágios de regeneração. As Floresta e oCarbono , UFPR, p. 153-173, 2002.

WEBSTER, R.; OLIVER, M. A. Geostatistics for environmental scientists . Chichester:JohnWiley & Sons, 2007.

WILKS, S. S. The large-sample distribution of the likelihood ratio for testing compositehypothesis. The Annals of Mathematical Statistics , v. 9, p. 60-62, 1938.

WU, C. F. J. On the convergence properties of the EM algorithm. The Annals of Statistics , v.11, p. 95-103, 1983.

ZHANG, H. Inconsistent estimation and asymptotically equivalent interpolations inmodel-based geostatistics. Journal of the American Statistical Association , v. 99, p.250-261, 2004.

ZHU, H. T.; LEE, S. Y.; WEI, B. C.; ZHOU, J. Case-deltion measures for Models With incompletedata. Biometrika , v. 88, p. 727-737, 2001.

ZHU, H. T.; LEE, S. Y. Local influence for incomplete-data models. Journal of the RoyalStatistical Society , B, v. 63, p. 111-126, 2001.

ZHU, H.; IBRAHIM, J. G.; LEE, S. E. ; ZHANG, H. Perturbation selection and influencemeasures in local influence analysis. The Annals of Statistics , v. 35, p. 2565-2588, 2007.

Page 63: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

45

5 ARTIGOS

5.1 ARTIGO 1: O teste C(α) sobre o vetor de médias e a matriz de covariância dadistribuição slash multivariada

Resumo: O objetivo deste trabalho foi propor testes de hipóteses sobre o

vetor de médias e matriz de covariância quando se dispõe de uma amostra

de observações provenientes de uma população contínua com distribuição slash

multivariada. Especificamente, consideram-se os testes de hipóteses lineares

sobre o vetor de parâmetros de interesse utilizando o teste C(α). Para tal, se

supôs a existência do segundo momento finito. Assim, gerou-se uma versão

reparametrizada da distribuição slash e permitiu-se desta forma, uma comparação

mais direta com a distribuição normal. Provaram-se expressões analíticas para

a função escore e a matriz de informação de Fisher. Completou-se o estudo

com dados de simulação e reais para avaliar o desempenho do teste C(α) em

amostras finitas. Os resultados mostraram que ao se trabalhar com dados em que a

distribuição dos erros não é adequada à suposição de normalidade, a estatística de

prova C(α) com a distribuição slash pode previnir problemas de má especificação

do modelo.

Palavras chave: Análise multivariada, mistura escala normal, testes de hipóteses.

5.1.1 Introdução

A técnica multivariada é a área da estatística que considera, simultaneamente, as

diversas variáveis que caracterizam um fenômeno em estudo, sendo a descrição, a análise e a

inferência realizada valendo-se da estrutura de correlação entre tais variáveis. Grande parte da

estatística inferencial multivariada (estimação de parâmetros, intervalos de confiança, testes

de hipóteses) trabalha sobre a suposição de que os dados se ajustam à distribuição normal de

probabilidade, que é vulnerável à presença de valores discrepantes ou dados provenientes de

distribuições com caudas mais pesadas (SEBER, 1984; ANDERSON, 2003; HÄRDLE; SIMAR,

2012). Por esta razão, há crescente interesse dos pesquisadores neste campo, cujo objetivo é

apresentar modelos probabilísticos multivariados mais robustos, e seus aspectos inferenciais,

partindo da generalização das técnicas e métodos univariados (MARDIA; KENT; BIBBY, 1979;

FANG; KOTZ; NG, 1990; JOHNSON; WICHERN, 1992).

Sobre este enfoque, tem-se a classe mistura escala normal multivariada (MEN), uma

subclasse da distribuição elíptica, que fornece uma família de distribuições cujo principal

Este artigo foi estruturado seguindo as normas da Journal of Multivariate Analysis.

Page 64: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

46

atrativo é permitir estender os modelos desenvolvidos sobre erro normal considerando

distribuições simétricas com caudas mais pesadas (ANDREWS; MALLOWS, 1974). A ideia

básica da classe MEN é introduzir a aleatoriedade na matriz covariância bem como no

vetor de média da distribuição normal multivariada, através de uma variável de mistura

estritamente positiva (McNEIL; FREY, 2005; MARONNA; MARTIN; YOHAY, 2006; HELLMICH;

KASSBERGER, 2011). Isto permite que se obtenha uma generalização da distribuição normal

multivariada que preserva as suas principais propriedades.

Dentre as distribuições pertencentes à classe MEN, tem-se a slash multivariada

(ROGERS; TUKEY,1972; LANGE; SINSHEIMER, 1993; WANG; GENTON, 2006). Essa

apresenta como característica particular um parâmetro adicional, que pode ser interpretado

como fator de ajuste da curtose, permitindo assim maior flexibilidade, e portanto, menos

sensíveis à presença de valores atípicos (JAMSHIDIAN, 2001). A representação estocástica

da slash multivarida é dada por

Y = µ+ V − 12Z,

em que µ ∈ ℜp, Z ∼ Np(0,Λ) independente de V com V ∼ Beta(ν, 1) para ν > 0. Para esta

distribuição, tem-se que E(Y ) = µ, se ν > 1/2 e Cov(Y ) =(ν/(ν − 1)

)Λ, se ν > 1.

Apesar do parâmetro de forma ν tornar a distribuição slash mais moldável, ele

pode restringir a existência dos momentos (ALCANTARA; CYSNEIROS, 2013) e dificultar a

inferência estatística sobre os parâmetros de interesse. Uma solução proposta para contornar

este problema é a reparametrização da distribuição, na qual se supõe a existência do segundo

momento finito. Desta maneira é possível uma comparação mais direta com a distribuição

normal multivariada (SUTRADHAR, 1993; BOLFARINE; GALEA, 1996).

No entanto, uma complicação ao realizar-se a reparametrização é que alguns testes

de hipóteses assintóticos conhecidos não são invariantes a transformações do espaço de

parâmetros ou das variáveis do modelo, restringindo a aplicação. Uma alternativa viável,

discutida neste trabalho, é o uso do teste C(α) de Neyman (1959), que é invariante a

transformações e é um teste localmente poderoso ao se testar a hipótese nula. Além

disso, C(α) dispensa estimação por máxima verossimilhança, pois utiliza-se das estimativas√n-consistente.

Assim, o objetivo deste trabalho foi apresentar uma versão reparametrizada da

distribuição slash multivariada e discutir teste de hipóteses sobre o vetor de médias e matriz

de covariância pelo uso do teste C(α). O trabalho foi dividido como segue: A Seção (5.1.2)

apresenta a distribuição slash multivariada reparametrizada, a expressão analítica da função

escore e a matriz de informação de Fisher. Na Seção (5.1.3) e (5.1.4) discute-se a questão de

invariância e teste para hipóteses lineares sobre o vetor de médias e matriz de covariância pelo

uso do teste C(α). Nas Seções (5.1.5) e (5.1.6), realiza-se estudo de simulação e ilustra-se

a metodologia desenvolvida usando dados reais da área agrícola para avaliar o desempenho

do teste C(α) em amostras finitas. Finalmente, na Seção (5.1.7), relatam-se as conclusões.

Detalhes do teste C(α) é apresentado no apêndice (5.1.9).

Page 65: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

47

5.1.2 Distribuição slash

5.1.2.1 Definição e algumas propriedades

Lange e Sinsheimer (1993) apresentaram, a partir da representação estocástica

dada na seção (5.1.1), a primeira versão da distribuição slash multivariada. Porém, uma

questão importante na modelagem e inferência estatística robusta é a prática da suposição

da existência do segundo momento, (SEBER, 1984; JOHNSON; WICHERN, 1992). Esta

suposição pode ser garantida a partir da reparametrização da distribuição slash (LANGE;

LITTLE; TAYLOR, 1989). Assim, considerando para a distribuição Y ∼ SLp(µ,Λ, ν) a

representação estocástica reparametrizada na forma

Yd= µ+ Z/

√c(η)V , (5.1)

com Z ∼ Np(0,Σ), V ∼ Beta

(1

η, 1

), η = 1/ν, para 0 < η < 1, c(η) = (1 − η)−1, tem-se que

Cov(Y ) = Σ. Assim, gera-se uma distribuição slash com segundo momento finito com média

µ e matriz de covariância Σ, definida a seguir.

Definição 5.1. Um vetor aleatório contínuo p-dimensional Y = (Y1, ..., Yp)⊤ tem distribuição

slash p-variada reparametrizada, denotada por Y ∼ SLp(µ,Σ, η), com vetor de média µ ∈ ℜp,

matriz de covariância Σ ∈ ℜp×p e parâmetro de forma η, para 0 < η < 1, se sua função

densidade de probabilidade ( fdp) é dada por

fY (y) = Kp(η)|Σ|− 12G(a, b), y ∈ ℜp (5.2)

com

Kp(η) =1

η

(c(η)

) p2

(5.3)

e

G(a, b) =

1∫

0

va−1 exp− vb

dv (5.4)

sendo, a =p

2+

1

ηe b =

1

2c(η)δ, em que c(η) = (1−η)−1 e δ = (y − µ)⊤Σ−1(y − µ) representa

a distância de Mahalanobis.

A função G(a, b) está associada à função geradora de densidade g(·) da classe elíptica

que pode ser avaliada a partir da função Gamma incompleta, cuja forma é dada por G(a, b) =

b−aΓ(a)P (a, b) (mais detalhes ver ABRAMOWITZ; STEGUN, 1970).

A partir da Definição 5.1 , é possível reescrever algumas propriedades importantes

para a distribuição SLp(µ,Σ, η) como segue.

Proposição 5.1. Seja Y ∼ SLp(µ,Σ, η) com fdp dada em 5.2. Então o vetor aleatório Y

possui as seguintes propriedades:

i) O vetor aleatório Y pode ser escrito usando a representação condicional:

(Y |V = v) ∼ Np(µ, (c(η)v)−1Σ), em que V ∼ Beta

(1

η, 1

)e 0 < η < 1;

Page 66: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

48

ii) Para V ∼ Beta

(1

η, 1

), tem-se: E

[V −r

]= 1− ηr−1, para ηr < 1;

iii) E(Y ) = µ e Cov(Y ) = Σ;

iv) Pr(δ ≤ x) = Pr(χ2p≤ x) − 21/ηΓ(p/2 + 1/η)

x1/ηΓ(p/2)Pr(χ2

p+2/η ≤ x), em que x é um número real

positivo;

v) O coeficiente de curtose multivariado (MARDIA, 1970) é dado por

β2,p = E

((Y − µ)⊤Σ−1(Y − µ)

)2= p(p+ 2)

(1− η)2

1− 2η,

em que, η < 1/2. Este resultado decorre do fato que, sendo W = Y −µd= V − 1

2Z, em que

Z ∼ Np(0,Σ) então:

β2,p = E

(W⊤E(WW⊤)−1W

)2= E

(V − 1

2Z⊤E(V −1ZZ⊤)−1V − 12Z)2

= E

(Z⊤E(ZZ⊤)−1Z

)2 E(V −2)

E(V −1)2 = p(p+ 2)

(1− η)2

1− 2η.

Além disso, como (1− η)2/(1− 2η) > 1 para 0 ≤ η ≤ 1/2 tem-se que a curtose da

distribuição slash multivariada é sempre maior que a distribuição normal (WATANABE;

YAMAGUCHI, 2004);

vi) Os momentos condicionais de V |Y = y são dados por

E(V k|y) =Γ(p2 + 1

η + k)

Γ(p2 + 1

η

)(

2

c(η)δ

)kP(p2 + 1

η + k, c(η)δ2

)

P(p2 + 1

η ,c(η)δ2

) ,

em que, P(a, b) denota a função distribuição acumulada da função γ(a, b) avaliada em

x = 1, tal que

Px(a, b) =ba

Γ(a)

x∫

0

va−1 exp− vb

dv. (5.5)

Observa-se que essa versão reparametrizada da distribuição slash multivariada nos

permite uma comparação direta com a distribuição normal p-dimensional, simplificando a

estimação e interpretação dos parâmetros. Ademais, quando η → 0, a classe de distribuição

slash tem a distribuição normal multivariada como um caso limite.

5.1.2.2 Função Escore

Seja y1, ...,yn uma amostra de vetores aleatórios independentes que se ajusta à

distribuição slash multivariada reparametrizada, sendo yi = (yi1, · · · , yip)⊤, cuja função

densidade de probabilidade é dada em (5.2). O objetivo é encontrar os estimadores que

maximizam a verossimilhança de θ = (µ⊤,φ⊤, η)⊤ em todo espaço paramétrico Θ, sendo

Page 67: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

49

φ = vech(Σ) ∈ ℜp(p+1)/2 o vetor obtido a partir da vetorização dos elementos distintos da

matriz Σ, cuja função verossimilhança é dada por

L(θ) =n∏

i=1

fY (yi) =n∏

i=1

Kp(η)|Σ|− 12G(a, bi).

Assim, o logaritmo da função verossimilhança do vetor de parâmetros θ = (µ⊤,φ⊤, η)⊤

da distribuição slash multivariada reparametrizada assume a forma

l(θ) =n∑

i=1

li(θ), (5.6)

em que, a i-ésima componente é dada por

li(θ) = logKp(η)−1

2log |Σ|+ log

(G(a, bi)

),

para i = 1, · · · , n com Kp(η) definido na Equação (5.3) e G(a, b) na Equação (5.4). A função

escore pode ser particionada como

U(θ) = (U(µ)⊤,U(φ)⊤, U(η))⊤ =n∑

i=1

U i(θ),

em que U i(θ) =∂li(θ)

∂θ= (U⊤

i (µ),U⊤i (φ), Ui(η))

⊤, para i = 1, ..., n, com

U i(µ) = −2wG(·, δi)Σ−1(yi − µ);

U i(φ) = −D⊤p vec

[wG(·, δi)

(Σ−1(yi − µ)(yi − µ)⊤Σ−1

)+ 1

2Σ−1];

Ui(η)−1

η+p

2c(η) + wG(η, ·);

em que,

wG(·, δi) = −1

2

(ηp+ 2

ηδi

)P(a+ 1, bi)

P(a, bi),

wG(η, ·) =1

η2

[log(bi)−Ψ

(a)]

− ac(η) +

∂∂ηP

(p2 + 1

η ,c(η)δi

2

)

P

(p2 + 1

η ,c(η)δi

2

) ,

sendo a e bi descrito em (5.4) e Dp ∈ ℜp2×p(p+1)/2 denota a matriz de duplicação de ordem p

(MAGNUS; NEUDECKER, 1999).

5.1.3 A matriz de informação de Fisher

Para implementar o teste C(α) é necessário obter-se a matriz de informação de

Fisher, I(θ). Supondo que a função suporte da distribuição slash atenda às condições de

regularidade (LEHMANN, 1983; MITCHELL, 1989; SUTHRADAR, 1993), é possível calcular

I(θ) considerando uma versão empírica dada por I(θ) = 1n

∑ni=1 Eθ[U i(θ)U

⊤i (θ)], em que o

valor esperado E(·) é tomado com respeito à fdp definida em (5.1). Outra alternativa usual é

dada por I(θ) = −Eθ

[1n

∑ni=1

∂2li(θ)

∂θ∂θ⊤

].

Page 68: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

50

A matriz de informação esperada de Fisher para θ embasado no logaritmo da

verossimilhança definida em (5.6) assume a forma

I(θ) =

Iµµ(θ) 0 0

0 Iφφ(θ) Iφη(θ)

0 Iφη(θ) Iηη(θ)

, (5.7)

cujos elementos são:

Iµµ(θ) = 4dg

pΣ−1,

Iφφ(θ) = D⊤p

2

fg

p(p+ 2)

(Σ−1 ⊗Σ−1

)Np +

(fg

p(p+ 2)− 1

4

)vec(Σ−1

)vec⊤

(Σ−1

)Dp,

Iφη(θ) =hg

pD⊤p vec(Σ−1),

Iηη(θ) =1

η2− p

ηc(η)−

[2

η− pc(η)

]tg1 +

p2

4c(η)2 + tg2,

em que dg = E[w2G(·, δ)||Z||2

], fg = E

[w2G(·, δ)||Z||4

], hg = E

[wG(η, δ)||Z||2

], sendo wG(η, δ) =

∂2

∂η∂δlogG(a, b) e tg1 = E[wG(η, ·)] e tg2 = E[w2

G(η, ·)]. Considera-se aqui δ = ||Z||2, sendo

Z = Σ−1/2(Y − µ), Z ∼ SLp(0, Ip, η) e Np =1

2(Ip2 + Kp) em que Kp é a matriz comutação de

ordem p2 × p2 (MAGNUS; NEUDECKER, 1999).

Pode-se observar pela Equação (5.7) que a matriz de informação esperada de Fisher é

bloco diagonal, formada pelos blocos Iµµ(θ) e IΦΦ(θ), com o parâmetro µ em um bloco e os

parâmetros φ e η no outro bloco, corroborando com resultados encontrados para distribuições

pertencente à classe MEN (ver LANGE; LITTLE; TAYLOR, 1989; MITCHELL, 1989; LANGE;

SINSHEIMER, 1993).

Para a distribuição slash multivariada, os cálculos da integrais dg, fg são analiticamente

complicadas de serem obtidas. Porém, uma aproximação assintótica para tais quantias é

descrita por Lange e Sinsheimer (1993). Já os valores de hg e tg não são calculados, pois

são desnecessários quando η é considerado fixo, porém é possível obter-se uma aproximação

numericamente.

5.1.4 Teste C(α)

Nesta seção desenvolve-se a estatística C(α) (NEYMAN, 1959) para testar hipóteses

sobre o vetor de média e matriz de covariância da distribuição slash. O teste C(α) é embasado

no resíduo da função escore de regressão para os parâmetros de interesse sobre uma

função escore para os parâmetros de pertubação. Os parâmetros de pertubação são então

substituídos pelo estimadores√n-consistente. O test C(α) é assintoticamente equivalente ao

teste razão de verossimilhanças e ao teste Wald (MORAN, 1970). A vantagem do teste C(α)

Page 69: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

51

é que este mantém, pelo menos aproximadamente, um nível pré-determinado de significância.

Ainda, segundo Barto e Puri (1967), ele é assintoticamente mais poderoso localmente e muitas

vezes produz uma estatística mais simples de calcular. Para mais detalhes do teste C(α) veja

Neyman (1959), Dagenais e Dufour (1991) e Bera e Bilias (2001).

5.1.4.1 O Teste C(α) na análise multivariada

Um dos principais problemas da análise estatística inferencial multivarida é encontrar

a estatística de teste especifíca para abordar a distribuição estudada, principalmente quando

envolvem reparametrizações, pois muitos testes conhecidos não são invariantes sobre este

aspecto (DAGENAIS; DUFOUR, 1991; GOURIEROUX; MONFORT, 1995). Outra questão é

que nem sempre é possível encontrar expressões com forma fechada para função escore. Isto

impossibilita a solução analítica de U(θ) = 0, logo é necessária a utilização de algoritmos

computacionais que convergem para θ, que é o estimador que maximiza a função de

verossimilhança (MV) do parâmetro θ. Porém, este processo pode se tornar dispensioso, como

no caso da distribuição slash.

Dagenais e Dufour (1991) mostram que uma alternativa atraente para contornar

este problema é o uso do teste C(α) de Neyman (1959), pois além de ser invariante a

especificações das hipóteses e reparametrizações do espaço paramétrico, ainda nos permite

a utilização de qualquer estimador√n-consistente restrito de θ.

Considera-se aqui o problema de testar uma hipótese linear na forma

H0 : Ψ(θ) = 0, (5.8)

em que Ψ(θ) = Cθ − c é uma função vetorial linear (k1 × 1), 1 < k1 < k, continuamente

diferenciável de θ = (θ⊤1 , · · ·,θ⊤

k )⊤, a matriz C, (k1 × k), é conhecida de posto k1 (matriz de

contraste), e c é um vetor (k1 × 1) conhecido.

Agora, seja θ um estimador√n-consistente de θ (pelo menos sobre H0) que satisfaz a

condição Ψ(θ) = 0. A estatística C(α) para testar as hipóteses (5.8) fica expressa por

Cθ(α) =1

nU(θ)

⊤I−1

C⊤[CI

−1C⊤]−1

CI−1

U(θ), (5.9)

que sobre H0, tem distribuição assintótica χ2 com k1 graus de liberdade, sendo I = I(θ). O

teste C(α) foi originalmente proposto para testar a hipótese de θ1 = θ01, em que θ = (θ⊤

1 ,θ⊤2 )

sendo θ1, (k1 × 1), um subvetor de θ. Ele pode ser visto como uma generalização do teste

Score de Rao (1948), obtido ao se substituir o EMV restrito θ0

por θ0= (θ0⊤

1 , θ⊤2 )

⊤, em que

θ01 é o subvetor de parâmetros conhecidos de θ (k1 × 1) e θ2 é um estimador

√n-consistente

localmente de θ2 de ordem ((k − k1) × 1). Além disso, quando θ é o estimador de MV de θ,

(5.9) se reduz ao teste Score para provar a hipótese dada por (5.8).

Considere os seguintes casos de interesse iniciais,

(1) H01 : µ = µ0, com µ0 conhecido e (Σ, η) desconhecidos,

(2) H02 : Σ = Σ0, com Σ0 conhecido e (µ, η) desconhecidos,

Page 70: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

52

(3) H03 : µ = µ0,Σ = Σ0 com η desconhecido.

Para a hipótese em (1), tem-se que C = (Ip,0,0) e c = µ0, enquanto para a hipótese (2)

tem-se que C = (0, Ip∗ ,0) e c = φ0. Adicionalmente, note que as hipóteses associadas à

matriz de covariância, dada por H0 : Σ = Σ0, são equivalentes a testar H0 : φ = φ0. Para

estes casos, o teste Cθ(α) (5.9) assume a seguinte forma

Cµ(α) =1

nU⊤(µ)FµµU(µ); (5.10)

CΣ(α) =1

nK⊤

φηF−1φφKφη, (5.11)

Cµ,Σ(α) = Cµ(α) + CΣ(α), (5.12)

em que Kφη = FφφU(φ) + FφηU(η) e K⊤φη = U⊤(φ)Fφφ + U(η)F⊤

φη, sendo todas as

expressões apresentadas avaliadas em θ = θ. Aqui F (··) representa os elementos da inversa

da matriz de informação esperada. Mais detalhes podem ser encontrados no apêndice (?? ).

5.1.4.2 Estimadores consistentes para os parâmetros de incômodo

Um procedimento usual para determinar um estimador consistente, quando a função

cumpre as condições de regularidade, é considerar uma aproximação assintótica da normal,

como descrita na Proposição 5.2. Ele nos fornece uma maneira simples de encontrar

estimativas intervalares e testar hipóteses (ANDERSON, 2003).

Proposição 5.2. Seja y1, ...,yn uma amostra de vetores aleatórios independentes e

identicamentes distribuídos de tamanho n, proveniente de uma população SLp(µ,Σp, η).

Seja ainda y =1

n

∑ni=1 yi e S =

1

n

∑ni=1 (yi − y)(yi − y)⊤ os estimadores não-enviasados

e consistentes de µ e Σ, respectivamente. Então, quando n→ ∞,

i)√n(y − µ)

D→Np(0,Σ);

ii)√n(vech(S)− vech(Σ)

) D→Np∗(0,Π),

em que p∗ = p(p+1)2 , e Π = (κ + 1)D⊤

p

2(Σ ⊗ Σ

)Np + κ(vecΣ)(vecΣ)⊤

Dp sendo κ o

excesso de curtose associada à distribução SLp(µ,Σ, η), cujo valor é κ =

(η2

1− 2η

)em

que, η < 1/2.

As afirmações da Proposição 5.2 são válidas para qualquer distribuição pertencente à

classe das elípticas multivariadas (ANDERSON, 2003; KOLLO; ROSEN, 2005).

O próximo passo é obter um estimador consistente para η. Segundo Gong e

Samaniego (1981), é possível obter o valor de η considerando uma estimação por pseudo

máxima verossimilhança. Este método consiste em substituir todos os parâmetros de

pertubação em um modelo por estimadores consistentes e resolver um sistema reduzido de

equações de verossimilhança. Assim, considere o logaritmo da função verossimilhança escrita

Page 71: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

53

da seguinte forma,

l(γ, η) =n∑

i=1

li(γ, η), (5.13)

em que, θ = (γ⊤, η)⊤, com γ = (µ⊤,φ⊤)⊤, sendo a i-ésima componente é dada por (5.6).

Sejam y = (1/n)∑n

i=1 yi e S = (1/n)∑n

i=1(yi − y)(yi − y)⊤ os estimadores

consistentes de µ e Σ, respectivamente, conforme apresentado na Proposição 5.2. Desta

forma, um estimador consistente de γ é dado por γ = (y⊤, vech(S)⊤)⊤. E ao substituir γ em

(5.6), a verossimilhança perfilada toma a forma

lP (γ, η) =

n∑

i=1

liP (γ, η), (5.14)

com

liP (γ, η) = logKp(η)−1

2log |S|+ logG(a, biP ),

sendo biP =1

2c(η)δiP e δiP = (yi − y)⊤S−1(yi − y) para i = 1, ...n.. O estimador de pseudo

MV, η é então obtido maximizando LP (γ, η). Geralmente, η é a raiz da equação

∂ηlP (γ, η) = 0.

Desta forma, a partir de Gong e Samaniego (1981) e Yuan e Jennrich (2000) segue o

seguinte resultado,

Lema 5.1. O estimador pseudo MV de η que maximiza a verossimilhança perfilada (5.14) é

um estimador consistente de η.

Note que, para H01, tem-se γ = (µ⊤0 , vech(S)⊤)⊤, com S = (1/n)

∑ni=1(yi − µ0)(yi −

µ0)⊤ e δiP = (µi − µ0)

⊤S−1(µi − µ0), para i = 1, ..., n. Para H02, γ = (y⊤, vech(Σ0)⊤)⊤,

δiP = (µi − µ)⊤Σ−10 (yi − y), com y = (1/n)

∑ni=1 yi, para i = 1, ..., n. Finalmente para H03,

γ = (µ⊤0 , vech(Σ0)

⊤)⊤, para δiP = (yi − µ0)⊤Σ−1

0 (yi − µ0) para i = 1, ..., n.

Considerando a proposição (5.1) item (vi), também é possível estimar η utilizando√n-consistente restrito de θ e o vetor conhecido de de parâmetros. Neste caso, um estimador

consistente para η será a solução da equação

(1− η)2

1− 2η=

β2,pp(p+ 2)

. (5.15)

5.1.5 Estudo de simulação

Nesta seção investiga-se o que foi apresentado a partir de um estudo de simulação de

Monte Carlo, que foi delineado para avaliar o desempenho do teste C(α) bem como fornecer

evidência sobre seu comportamento quando a distribuição subjacente é mal especificada.

Determinaram-se os tamanhos empíricos para provar as hipóteses igualdade de média e

equicorrelação. As amostras aleatórias dos vetores p-dimensionais y1, · · · ,yn foram gerados

para os dois cenários: a) Np(µ,Σ) e b) SLp(µ,Σ, η) com η ∈ 0, 25; 0, 50; 0, 75. Foram

escolhidos os seguintes tamanhos amostrais n = 50, 100, 200, 400, 800 e p = 2, 5, 15. Para

Page 72: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

54

cada um dos testes, realizou-se o ajuste do modelo gaussiano e slash. O nível de significância

nominal para o teste C(α) foi de 5%.

5.1.5.1 Teste de igualdade de médias

Para este estudo de simulação examina-se a hipótese de igualdade de média H0 :

µ = µ0 considerando µ0 conhecido (caso 1). Assumiu-se µ0 = 1p. Neste caso, y = µ0,

S = (1/n)∑n

i=1(yi − µ0)(yi − µ0)⊤ e δip = (yi − µ0)

⊤S−1(yi − µ0) para i = 1, ...n. Um total

de 1 000 amostras aleatórias de vetores p-dimensionais y1, · · · ,yn foram geradas a partir dos

dois cenários descritos acima com µ = 1p e Σ = 12Ip +

121p1

⊤p .

A Tabela 2 apresenta os tamanhos empíricos para o teste após o ajuste do modelo

gaussiano e slash. Nota-se que quando os dados simulados são provenientes de uma

distribuição normal, a estatística C(α) tem comportamento similar quando ajustados as duas

distribuições para os diferentes valores de η fixados. Porém, nota-se que, em todos os casos,

o ajuste slash apresenta menores índices de rejeição da hipótese nula de que o ajuste normal

(erro do Tipo I).

Tabela 2 Tamanho empírico da estatística C(α) para o teste de igualdade de médias ao nívelde 5% de significância. Dados gerados sobre a suposição de normalidade e sobrea suposição slash. Porcentagem de erro do Tipo I para 1000 simulações de MonteCarlo.

Simulação Gaussiana Simulação Slash

Ajuste Normal Slash Normal Slash

p[1] p

η[2] n[3] 2 5 15 2 5 15 2 5 15 2 5 15

50 6,8 8,9 32,2 4,8 4,1 3,9 5,9 9,0 29,5 5,1 4,9 1,8

100 6,2 6,6 14,7 5,1 3,9 3,3 5,7 7,1 15,5 5,2 4,6 4,9

0,75 200 5,3 7,4 10,2 5,0 6,1 3,6 5,3 6,0 8,2 5,4 5,0 5,6

400 5,8 5,3 7,8 5,4 5,2 5,1 4,8 4,4 6,8 3,9 4,4 4,4

800 4,7 6,5 6,6 4,7 6,1 6,1 5,2 5,5 5,4 4,8 5,2 5,0

50 6,7 9,0 33,6 4,2 3,5 1,8 5,8 6,9 29,3 4,9 4,2 1,8

100 4,5 7,4 16,7 3,7 4,8 3,7 6,8 6,7 13,5 6,0 5,3 3,7

0,50 200 5,2 5,4 8,1 5,1 4,7 3,0 4,1 7,2 8,7 4,0 6,5 4,3

400 4,8 4,4 5,4 4,4 4,1 4,2 4,9 4,6 8,5 4,7 4,5 5,7

800 5,7 5,4 7,0 5,5 5,2 5,2 4,5 5,7 4,8 4,9 5,3 4,1

50 6,7 9,0 31,9 4,9 3,7 0,9 6,4 8,6 29,4 4,3 3,7 1,1

100 5,6 6,3 16,5 5,2 4,0 4,5 6,0 6,0 14,8 5,0 4,0 2,7

0,25 200 4,9 4,7 9,5 4,5 3,5 5,1 5,1 5,8 7,3 4,5 4,0 3,7

400 5,5 4,9 7,0 5,7 4,7 4,3 5,1 4,1 6,3 4,2 3,2 4,2

800 5,2 5,2 7,5 5,0 5,0 6,6 5,2 5,2 5,6 5,0 4,3 4,5[1]variáveis; [2]parâmetro de ajuste da curtose; [3]tamanho amostral.

Ao avaliar p = 15, observa-se que para os tamanhos amostrais n = 50, 100, 200

o percentual de rejeição da hipótese nula para o ajuste normal foi bem superior

consequentemente, decresceu a diferença à medida que η decresce. Além disso, nota-se

Page 73: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

55

que quando p aumenta, o desempenho da estatística de prova piora para o caso normal.

Quando a simulação baseou-se na distribuição slash, foi observado comportamento similar,

porém, novamente, em todos os casos, o ajuste slash apresenta menores índices de rejeição

da hipótese nula. Vale destacar ainda que o ajuste slash apresenta porcentagem de rejeição

quase sempre abaixo do nível nominal quando o número de variáveis aumenta.

5.1.5.2 Teste de equicorrelação

Neste estudo o interesse consiste em testar a hipótese sobre uma estrutura particular

da matriz de covariâncias populacional em que todas as correlações entre pares de diferentes

variáveis são iguais (ρ) e todas as variâncias são homogêneas (σ2). A hipótese de interesse

é formalmente dada por H0 : Σ = Σ0 = σ2R, em que σ2 > 0 corresponde a um parâmetro

escalar e R = (1 − ρ)Ip + ρJp, com −1/(p − 1) < ρ < 1 denotando a correlação intraclasse,

sendo que Ip e Jp = 1p1⊤p correspondem as matrizes identidade e de uns de ordem (p × p),

respectivamente. Assim, sobre H0 se diz ter uma estrutura correlacionada ou de simetria

composta. Um estimador não enviesado de Σ é dado por S=S2c [(1− r)Ip + rJp], em que

S2c =

1

p

p∑

l=1

Sll e r =2

p(p− 1)S2c

p−1∑

i=1

p∑

l=i+1

Sil (5.16)

são os estimadores comum não enviesado da variância populacional σ2 e da correlação

populacional ρ, respectivamente. Mais detalhes sobre este teste de hipótese podem ser

encontrados em Ferreira (2011).

Para avaliar a performance do teste, um total de 10000 amostras aleatórias de

vetores p-dimensionais y1, · · · , yn foram geradas para Np(µ,Σ) e SLp(µ,Σ, η) com η ∈0, 25; 0, 50; 0, 75. Foi considerado

µ = 1p, Σ =1

2Ip +

1

21p1

⊤p .

Os dados da Tabela 3 indicam que quando os dados são provenientes de uma

distribuição normal, a estatística C(α), considerando os modelos ajustados normal e slash,

tem comportamento semelhante para os diferentes η fixados. Além disso, note que quando p

aumenta o desempenho da estatística de prova piora. Porém, pequena variação é observada

quando p é fixado e o tamanho amostral cresce.

No entanto, para os dados provenientes de uma distribuição com caudas mais pesadas

os resultados indicam um péssimo desempenho da estatística de prova quando se realiza o

ajuste da normal. Nota-se que no caso de ajuste da normal, para η = 0, 75 e η = 0, 50,

considerando os direntes valores de p, o desempenho do teste C(α) piora quando o tamanho

amostral aumenta. Quando η = 0, 25 e p = 2, os resultados foram similares ao dados

provenientes de uma normal. No entanto, este comportamento não se repete para os

demais valores de p. Este comportamento está associado ao ajuste gaussiano, pois gera

má especificação do problema e inconsistências do teste (FOUTZ; SRIVASTAVA, 1977).

Page 74: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

56

Entretanto, ao se realizar o ajuste considerando a distribuição slash os resultados foram

melhores.

Observe que para p = 2 com η = 0, 25 e η = 0, 50, o desempenho do teste foi similar

ao apresentado no caso normal. Para η = 0, 75 com p = 5 e p = 15, os valores foram elevados,

principalmente para amostras pequenas (n = 50; 100), porém, quando comparado com o ajuste

da normal, o desempenho é melhor. Deste modo, é possível interpretar que usar a estatística

de prova C(α) com a distribuição slash pode-se previnir problemas de má especificação do

modelo.

Tabela 3 Tamanho empírico da estatística C(α) para o teste de equicorrelação ao nível de 5%de significância. Dados gerados sobre a suposição de normalidade e de distribuiçãoslash. Porcentagem de erro do Tipo I para 10 000 simulações de Monte Carlo.

Simulação Gaussiana Simulação Slash

Ajuste Normal Slash Normal Slash

p[1] p

η[2] n[3] 2 5 15 2 5 15 2 5 15 2 5 15

50 4,3 3,0 4,2 4,2 2,8 4,0 25,6 65,6 95,6 6,9 8,1 11,5

100 5,1 5,6 5,3 4,9 5,2 4,9 30,9 78,6 99,6 5,7 7,0 10,3

0,75 200 5,0 5,6 4,7 4,8 5,1 3,8 36,1 89,8 100,0 6,5 7,2 8,1

400 4,8 4,6 3,8 4,7 4,5 3,5 42,6 94,6 100,0 4,9 4,7 6,2

800 4,4 5,5 6,4 4,6 5,2 6,0 49,2 98,0 100,0 5,3 5,3 5,2

50 4,4 3,2 3,8 4,1 2,9 3,3 12,9 34,7 74,8 5,2 5,4 5,3

100 4,8 5,4 4,5 4,6 5,0 4,1 14,2 41,1 86,2 4,8 4,9 5,9

0,50 200 4,6 4,2 5,1 4,3 3,9 4,8 16,5 52,0 93,2 5,3 6,5 5,8

400 5,1 5,4 5,2 5,1 4,9 4,7 19,0 56,1 97,2 6,6 5,1 5,0

800 5,7 5,3 4,8 5,5 5,2 4,5 20,8 63,3 99,6 5,3 5,2 5,7

50 5,3 4,3 3,6 5,2 3,7 3,4 6,3 6,7 16,8 5,1 2,7 5,2

100 6,0 4,6 3,9 5,8 4,0 3,4 5,4 7,8 18,8 4,1 3,7 5,7

0,25 200 5,4 4,4 4,4 4,9 4,1 4,1 6,4 9,3 22,0 5,5 5,2 5,9

400 5,2 4,2 5,5 4,7 3,8 5,3 6,9 8,4 23,7 4,9 4,1 5,6

800 5,4 5,3 5,4 5,3 5,0 5,1 6,1 9,2 22,8 4,7 4,2 5,5[1]variáveis; [2]parâmetro de ajuste da curtose; [3]tamanho amostral.

5.1.6 Aplicação ao conjunto de dados reais

5.1.6.1 Dados de commodities agrícola da soja

A cultura da soja tem grande importância na agricultura mundial. No Brasil, os números

da safra 2014/2015 mantêm o Centro-Oeste (88 milhões de toneladas) como a principal região

agrícola do País, seguida do Sul (77,4 milhões de toneladas), Sudeste (19,1 milhões de

toneladas), Nordeste (16,8 milhões de toneladas) e Norte (8,0 milhões de toneladas). O

Centro-Oeste ocupa essa posição desde o ano-safra 2011/2012, quando ultrapassou pela

primeira vez o Sul, na série histórica da CONAB. Mato Grosso (MT) é o principal produtor do

Centro-Oeste, com Goiás (GO) em segundo lugar na região, e primeiro e quarto no âmbito

nacional. Já a região Sul, segunda maior produtora, tem o Paraná (PR) em 2 e o Rio Grande

Page 75: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

57

do Sul (RS) em 3 nas produções nacionais.

A produção desta leguminosa no Brasil tem papel fundamental na economia.

Entretanto, o agronegócio possui um obstáculo para sua sustentabilidade, que é natureza

cíclica própria, já que sofre influências de vários fatores de mercado e apresenta elevada

volatilidade nos preços das commodities (MARTINS; MARTINELLI, 2010). Assim, uma

questão importante é seu preço, que segue um padrão mundial de comercialização, cujo

ponto balizador são os preços aferidos na bolsa de commodities de Chicago [CBOT

- Chicago Boardof Trade] (MISSÃO, 2006). Estas grandes flutuações de preço que

ocorrem frequentemente, em curtos períodos de tempo, são em função da influência

de fatores climáticos e os aspectos mercadológicos e conjunturais. O resultado é a

incerteza de renda para participantes como agricultores, armazenadores, exportadores e

agroindústrias processadoras de produtos agropecuários. Embasada na dinâmica dos

fatores de mercado que influenciam a formação do preço, trabalhou-se com os índices de

flutuações dos preços mensais (IFPM) das commodities da soja dos últimos 152 meses,

dos quatro principais produtores nacionais: MT, GO, PR e RS. O objetivo é aplicar

os testes de hipóteses de igualdade de médias, esfericidade e equicorrelação (simetria

composta) sobre os estados considerados. Os dados se encontram disponíveis na website

http://www.agrolink.com.br/cotacoes/.

Para fins comparativos considerou-se tanto o suposto de normalidade como slash

multivariada. As estimativas de MV para as duas distribuições ajustadas encontram-se na

Tabela 4, em que µ1, µ2, µ3 e µ4 denotam as médias dos estados do MT, GO, PR e RS,

respectivamente. Nota-se que as médias dos estados do PR e RS quando obtidos pelo ajuste à

distribuição normal foram superiores aos encontrados para a distribuição slash. No entanto, as

médias dos estados do MT e GO resultados inversos foram observados. Este comportamento

está associado ao peso wi do estimador da média da distribuição slash (apresentado em 5.23),

que corresponde a uma função de pesos decrescente de δi, ou seja, atribui peso maior para

distâncias menores, e vice-versa. Já os valores estimados das variâncias dos estados do MT,

GO, PR e RS, denotados respectivamente por φ11, φ22, φ33 e φ44, indicaram que os valores

associados ao ajuste slash foram todos maiores quando comparados à normal.

Tabela 4 Estimativas de MV ao ajustar-se a distribuição normal e slash aos dados dos IFPMdas commodities da soja dos estados do MT, GO, PR e RS.

Estado Parâmetros estimados Normal slash

MT µ1 0,0046 0,0070

GO µ2 0,0041 0,0049

PR µ3 0,0036 0,0027

RS µ4 0,0038 0,0033

MT φ11 0,0045 0,0048

GO φ22 0,0030 0,0032

PR φ33 0,0032 0,0050

RS φ44 0,0030 0,0045

Page 76: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

58

Com a finalidade de detectar observações discrepantes, a distância de Mahalanobis

δi = (yi − µ)⊤Σ−1(yi − µ), i = 1, · · · , n, foi examinada ajustando a distribuição normal. Para

este caso, tem-se que δi segue distribuição qui-quadrado χ20,975(p), sendo destacadas aquelas

observações que sobrepassam o ponto de corte dado 8,344 (Figura 2a). As amostras #11,

#84, #85, #95, #117, #141, #142, #144 e #150, destacadas no gráfico, estão relacionadas

ao período de colheita nos estados. Os demais casos variam durante o ano. Para avaliar

uma possível violação da suposição de normalidade, foram construídos os gráficos QQ-plot

das distâncias normalizadas. Nota-se pela Figura 2b caudas mais pesadas que a distribuição

normal. Quando foi aplicado o teste de normalidade de Mardia (MARDIA, 1970) obteve-se

p-valor de 4,381716×10−7, ou seja, a suposição de normalidade multivariada para os dados é

rejeitada a 5% de significância. Assim, é indicado o uso de uma distribuição com cauda mais

pesada como a slash é indicada.

Ao se assumir que os dados se ajustam à distribuição slash, inicialmente testou-se a

igualdade entre as médias dos IFPM das commodities da soja. Para tal considerou-se testar a

hipótese H0 : Cµ = 0, em que Cµ é o vetor de médias para o modelo transformado mediante

a matriz de contraste C, de ordem (3×4), dada por

C =

1 −1 0 0

0 1 −1 0

0 0 1 −1

.

O valor do parâmetro η estimado, utilizando a verossimilhança perfilada, foi de 0,438 e do

teste C(α) igual a 1,193. O p-valor associado à estatística de teste calculada é obtido por

distribuição qui-quadrado com 3 graus de liberdade, que resultou em 0, 754. Assim, não

existem evidências significativas para rejeitar a hipótese nula ao nível de 5% de significância

logo, pode-se assumir igualdade entre as médias dos IFPM das commodities da soja

praticados nos diferentes estados.

Page 77: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

59

0 50 100 150

05

1015

20

Ordem

Del

ta 1184

95117

141

150

83

142144

(a)

−2 −1 0 1 2

−4

−2

02

4

Quantil Teórico

Qua

ntil

Am

ostr

al

(b)

Figura 2 Gráfico da distância de Mahalanobis (a) e QQ-plot das distâncias normalizadas sobresuposição de normalidade (b) dos IFPM das commodities da soja.

Quando se trabalha com medidas repetidas no tempo dentro de uma mesma unidade

experimental, é importante realizar o teste da esfericidade para avaliar se a população

apresenta variâncias iguais e correlações nulas. Segundo Ferreira (2011), a hipótese nula

pode ser escrita como H0 : Σ = σ2I, sendo o estimador comum de σ2 dado em (5.16), cujo

valor neste estudo é S2c = 0, 0034. O teste C(α) foi igual a 12,316. Assim, como no caso

anterior, o p-value resultante é obtido utilizando a distribuição qui-quadrado com 3 graus de

liberdade que foi de 0,006. Portanto, existem fortes evidências estatísticas para se rejeitar a

hipótese nula, ou seja, os IFPM dos commodities não apresentam estrutura esférica.

Finalmente, um teste de equicorrelação foi aplicado sobre o conjunto de dados para

avaliar a hipótese de que a as correlações entre os pares de diferentes variáveis são iguais e

que todas as variâncias são homogêneas. Note que a hipótese de correlação nula foi rejeitada

no teste anterior. A hipótese, neste caso, é dada por H0 : Σ = σ2(1 − ρ)Ip + ρJp. Usando

(5.16), calcularam-se o estimador comum da variância e a correlação populacional, σ2 e ρ,

cujo valores são S2c = 0, 0034 e r = 0, 8422, respectivamente. Sobre a estatística de prova

definida em (5.9), tem-se a distribuição assintótica qui-quadrado com 8 graus de liberdade

para a hipótese de equicorrelação. O teste C(α) foi igual a 65,877, com p-valor de 0,000,

indicando que deve-se rejeitar a hipótese nula de simetria composta para o IFPM.

5.1.6.2 Dados de produtividade e atributos químicos do solo

Em uma segunda aplicação, foi usado um conjunto de 30 amostras do ano agrícola

2013/2014, referentes a uma área comercial de 167, 35 ha, localizada na região Oeste do

Paraná. As variáveis consideradas foram a produtividade de soja [Prod] (t ha−1), cálcio

[Ca] (cmolc dm−3) e magnésio [Mg] (cmolc dm−3 ). A aleatoriedade foi verificada pelo teste

proposto por Siegel (1956).

A relação cálcio e magnésio (Ca:Mg) apresenta uma competição pelos sítios de

Page 78: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

60

adsorção (adesão de moléculas de um fluido (o adsorvido) à uma superfície sólida (o

adsorvente)) no solo e na absorção pelas raízes (WLAND, 2007). Como consequência, a

presença excessiva de um pode prejudicar os processos de adsorção e absorção do outro,

afetar o desenvolvimento das plantas e consequentemente a produtividade. De acordo com

Instituto da Potassa e Fosfato (1998), e, o desequilíbrio entre cálcio e o magnésio no solo

pode acentuar a deficiência de magnésio, quando a relação Ca:Mg torna-se muito alta, as

plantas podem absorver menos magnésio. Isto pode ocorrer, por exemplo, quando o agricultor

usa somente calcário calcítico por muitos anos, em solos relativamente pobres em magnésio.

Assim, o objetivo é aplicar os testes da esfericidade e de equicorrelação sobre as variáveis

Prod, Ca e Mg e verificar se as mesmas possuem variância homogênea e apresentam

estrutura de simetria composta.

A distância de Mahalanobis δi, ajustando distribuição normal, indicou que as

observações que sobrepassam o ponto de corte 8,533 (Figura 3a) foram #8, #23 e #24. Além

disso, os gráficos QQ-plot das distâncias normalizadas, Figura 3b, indicam que os dados não

se ajustam de forma satisfatória à distribuição normal. Ao se aplicar o teste de normalidade

de Mardia (MARDIA, 1970) obteve-se p-valor de 1,75634×10−7, ou seja, a suposição de

normalidade para os dados é rejeitada.

0 5 10 15 20 25 30

05

1015

Ordem

Del

ta

8

2423

(a)

−2 −1 0 1 2

−4

−2

02

4

Quantil Teórico

Qua

ntil

Am

ostr

al

(b)

Figura 3 Gráfico da distância de Mahalanobis e QQ-plot das distâncias normalizadas sobresuposição de normalidade.

Ao assumir que os dados se ajustam a uma distribuição slash, aplicou-se o teste de

hipótese de esfericidade em que H0 : Σ = σ2I, sendo o estimador comum de σ2 igual a

S2c = 0, 999. O teste C(α) foi igual a 41,850. Assim, o p-valor resultante é obtido utilizando a

distribuição qui-quadrado com 2 graus de liberdade que foi de 0, 000. Portanto, existem fortes

evidências que se deve rejeitar a hipótese nula, ou seja, as variáveis produtividade, Ca e Mg

não apresentam estrutura esférica.

Para avaliar a hipótese de simetria composta, tem-se H0 : Σ = σ2(1 − ρ)Ip + ρJp.

A estatística de prova tem distribuição assintótica qui-quadrado com 4 graus de liberdade.

Page 79: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

61

Usando (5.16) para obter o estimador comum da variância e correlação populacional, σ2 e

ρ, tem-se S2c = 0, 999 e r = 0, 288. O p-valor é obtido por P (χ2 > 56, 382; 4), que é igual a

0,000. Assim, rejeita-se a hipótese nula de simetria composta para a estrutura de covariância

considerando as variáveis produtividade, Ca e Mg da área experimental estudada.

5.1.7 Conclusão e trabalhos futuros

Este trabalho discutiu o problema de inferência estatística sobre o vetor de médias

e matriz de covariância quando se dispõe de uma amostra proveniente de uma população

contínua com distribuição slash multivariada. As simulações indicaram que, quando a

amostra é proveniente de uma população contínua normal, o desempenho do teste C(α)

foi similar quando ajustado à distribuição normal ou slash, indiferente do tamanho amostral

ou número de variáveis testadas. Porém, quando simulou-se uma população contínua

slash, o ajuste assumiu a distribuição slash e apresentou melhor desempenho, com baixos

valores percentuais relacionados ao erro do Tipo 1 (rejeição da hipótese nula quando esta é

verdadeira). Todavia, ao ajustar-se à distribuição normal os valores de rejeição foram maiores,

principalmente para o teste de equicorrelação, e, em alguns casos, os valores chegaram a

100%, relacionados ao aumento do número de variáveis e tamanho amostral.

Os testes aplicados ao estudo de dados da commodities indicaram que as médias

dos IFPM são homogêneas, ou seja, os diferentes IFPM médios dos principais estados

produtores de soja são essencialmente os mesmos. No entanto, os testes de esfericidade e

equicorrelação indicaram que as mesmas não possuem variância homogênea e as correlações

entre os pares de variáveis não podem ser consideradas iguais. Com relação à aplicação

usando dados de atributos químicos e físicos do solo, verificou-se que as variáveis estudadas

não apresentam simetria composta, e que o estimador comum não-enviesado da correlação

amostral foi de apenas 0,288.

As informações das commodities agrícolas e as relações química/física do solo com

produtividade, geralmente, apresentam n e p consideravelmente grandes. Os resultados de

simulação indicaram que, quando o teste assumiu distribuição slash, houve desempenho

satisfatório ao compará-lo com o caso normal, quando aumentam o tamanho amostral e o

número de variáveis. Assim, pretende-se aplicar o testes considerando este valor crescente

bem como desenvolver outros teste como comparação entre grupos.

5.1.8 Referências

ABRAMOWITZ, M.; STEGUN, I. A. Handbook of mathematical functions . Dover Press, NewYork, 1970.

ALCANTARA, I. C.; CYSNEIROS, F. J. A. Linear regression models with slash-elliptical erros.Computational Statistics and Data Analysis , v. 64, p. 153-164, 2013.

ANDERSON, T. W. An introduction to multivariate statistical analysis . John Wiley, New

Page 80: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

62

Jersey, 3 ed., 2003.

ANDREWS, D. F.; MALLOWS, C. L. Scale mixtures of normal distributions. Journal of theRoyal Statistical Society , v. 36, p. 99-102, 1974.

BARTO, J. B.; PURI, P. S. On optimal asymptotic test of composite statistical hypothesis.Annals of Mathematical Statistics , v. 38, p. 1845-1852, 1967

BERA, A. K.; BILIAS, Y. Rao’s score, Neyman’s C(α) and Silvey’s LM tests: an essay onhistorical developments and some new results. Journal of Statistical Planning and Inference ,v. 97, p. 9-44, 2001.

BOLFARINE, H.; GALEA, M. On structural comparative calibration under a t-model.Computational Statistics , v. 11, p. 63-85, 1996.

DAGENAIS, M. G.; DUFOUR, J. M. Invariance, nonlinear models and asymptotic tests.Econometrica , v. 59, p. 1601-1615, 1991.

FANG, K. T.; KOTZ, S.; Ng, K. W. Symmetric multivariate and related distributions . London:Chapman & Hall, 1990.

FERREIRA, D. Estatística multivariada. Lavras, Editora UFLA, 2011.

FOUTZ, R. V.; SRIVASTAVA, R. C. The performance of the likelihood ratio test when the modelis incorrect. The Annals of Statistical . v. 5, p. 1183-1194, 1977.

GONG, G.; SAMANIEGO, F. J. Pseudo Maximum Likelihood Estimation: Theory andAppliactions. The Annals os Statistics , v .9, p. 861-869, 1981.

GOURIEROUX, Ch.; MONFORT, A. Statistics and econometric models-tesing confidenceregions, model selection, and asymptotic theory. Cambridge University Press , New York,v. 2, 1995.

HÄRDLE, W. K.; SIMAR, L. Applied Multivariate Statistical Analysis . New York: Springer, 3ed., 2012.

HELLMICH, M.; KASSBERGER, S. Efficient and robust portfolio optimization in the multivariateGeneralized Hyperbolic framework. Quantitative Finance , v. 11, p. 1503-1516, 2011.

Instituto da Potassa & Fosfato. Manual internacional de fertilidade do solo . Tradução eadaptação de Alfredo Scheid Lopes. Piracicaba: Potafos, 1998.

JAMSHIDIAN, M. A note on parameter and standard error estimation in adaptive robustregression. Journal of Statistics Computation and Simulation , v. 71, p. 11-27, 2001.

JOHNSON, R. A.; WICHERN, D. W. Applied multivariate statistical analysis. Third Edition.Prentice Hall, New Jersey, 1992.

KOLLO, T.; ROSEN, D. Advanced Multivariate Statistics with Matrices . Springer:

Page 81: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

63

Netherlands, 2005.

LANGE, K. L.; LITTLE, R. J.; TAYLOR, J. Robust statistical modelling using the t distribution.Journal of the American Statistical Association , v. 84, p. 881-896, 1989.

LANGE, K.; SINSHEIMER, J. S. Normal/independent distributions and their applications inrobust regression. Journal of Computational and Graphical Statistics , v. 2, p. 175-198,1993.

LEHMANN, E. L. Theory of point estimation . John Wiley and Sons, New York, 1983.

MAGNUS, J. R.; NEUDECKER, H. Matrix differential calculus with applications instatistics and econometrics . John Wiley, Chichester, 1999.

MARDIA, K. V. Measures of multivariate skewness and kurtosis with applications. Biometrika ,v. 57, p. 519-530, 1970.

MARDIA, K. V.; KENT, J. T.; BIBBY, J. M. Multivariate analysis . London, Academic Press,1979.

MARONNA, R.; MARTIN, D.; YOHAI, V. Robust statistics: theory and methods . John Wiley,Chichester, 2006.

MARTINS, T. M.; MARTINELLI, D. P. Ciclos e previsão Cíclica dos Preços das Commodities:um modelo de indicador antecedente para a commodity Açúcar. Revista de administração,contabilidade e economia da FUNDACE , v. 1, p. 72-83, 2010.

McNEIL, A.; FREY, R.; Embrechts, P. Quantitative risk management:concepts, techniquesand tools . Princeton University Press, New Jersey, 2005.

MISSÃO, M. R. Soja: origem, classificação, utilização e uma visão abrangente do mercado.Maringá Management , v. 3, p.7-15, 2006

MITCHELL, A. F. S. The information matrix, skewness tensor and-connections for the generalmultivariate elliptical distribution. Annals of the Institute of Statistical Mathematics , v.41, p.289-304, 1989.

MORAN, P. A. P. On asymptotically optimal tests of composite hypothesis. Biometrika , v. 57,p. 47-55, 1970.

NEYMAN, J. Optimal asymptotic test of composite statistical hypothesis. In: Grenander, ed.,Probability and Statistics , John Wiley, New York, p. 213-234, 1959.

RAO, C. R. Large sample tests of statistical hypotheses concerning several parameters withapplications to problems of estimation. Proceedings of the Cambridge PhilosophicalSociety , v. 44, p. 50-57, 1948.

RENCHER, C. A. Methods of multivariate analysis . New York, John Wiley, 2002.

Page 82: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

64

ROGERS, W. H.; TUKEY, J. W. Understanding some long-tailed symmetrical distributions.Statististica Neerlandica , v. 26, p. 211-226, 1972.

SEBER, G. A. Multivariate observations . New York: John Wiley & Sons, 1984.

SIEGEL, S. Nonparametric statistics for the behavioral sciences . McGraw-Hill, New York,1956.

SUTRADAR, B. C. Score tests for the covariance matrix of the Elliptical t-distribution. Journalof Multivariate Analysis , v. 46, p. 1-12, 1993.

WANG, J.; GENTON, M. G. The multivariate skew-slash distribution. Journal of StatisticalPlanning and Inference , v. 136, p. 209-220, 2006.

WLAND, T. Magnésio no solo e nas plantas. Informações Agronômicas , v. 117, p. 19-21,2007.

WATANABE, M.; YAMAGUCHI, K. The EM algorithm and related statistical models . MarcelDekker, Inc. New York, 2004.

YUAN, K.; JENNRICH, R. Estimating Equations With Nuisance Parameters: Theory andAppliactions. Annals of the Institute of Statistical Mathematics , v. 53, p. 343-350, 2000.

Page 83: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

65

5.1.9 Apêndice

De (5.9), tem-se que Cθ(α) =1

nA⊤B−1A, com A = CI(θ)−1U(θ)⊤ e B =

CI(θ)−1

C⊤

Para o caso 1, a hipótese em teste é H1 : µ = µ0, sendo µ0 conhecido com Σ e η

desconhecidos. Neste caso, para hipótese linear (5.26), define-se C = (Ip,0, 0) e C = µ0. A

inversa de I(θ) é dada por

I−1(θ) =

Fµµ 0 0

0 Fφφ Fφη

0 Fηφ Fηη

, (5.17)

que tem como elementos, Fµµ =p

dgΣ, Fφη = −I−1

φφIφηc−1, Fφη = F⊤

ηφ, Fφφ = I−1φφ

(I −

I⊤φηFφη

), Fηη = c−1 em que c =

(I − IηφI

−1φφIφη

).

Como

A =[Ip 0 0

]

Fµµ 0 0

0 Fφφ Fφη

0 Fηφ Fηη

[U(µ) U(φ) U(η)

]⊤= FµµU(µ)

e

B =[Ip 0 0

]

Fµµ 0 0

0 Fφφ Fφη

0 Fηφ Fηη

[Ip 0 0

]⊤= Fµµ,

então,

Cµ(α) =1

nU⊤(µ)FµµU(µ).

No caso 2, a hipótese em teste é H2 : Σ = Σ0, sendo Σ0 conhecido com µ e η

desconhecidos, em que Σ = Σ0 é equivalente φ = φ0.

Para este caso, considera-se C = (0, Ip∗) e C = φ0, sendo p∗ = p(p+1)2

Como:

A =[0 Ip∗ 0

]

Fµµ 0 0

0 Fφφ Fφη

0 Fηφ Fηη

[U(µ) U(φ) U(η)

]⊤= FφφU(φ) +FφηU(η)

e

B =[0 Ip∗ 0

]

Fµµ 0 0

0 Fφφ Fφη

0 Fηφ Fηη

[0 Ip∗ 0

]⊤= Fφφ,

Page 84: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

66

então,

CΣ(α) =1

n

[FφφU(φ) +FφηU(η)

]⊤Fφφ

−1[FφφU(φ) +FφηU(η)

]

=1

nK⊤

φηF−1φφKφη,

em que

K⊤φη = U⊤(φ)Fφφ + U(η)F⊤

φη e Kφη = FφφU(φ) +FφηU(η).

Finalmente, para o Caso 3, testa-se H03 : µ = µ0; Σ = Σ0, sendo µ0 e Σ0 conhecido

e η desconhecido. Para este caso, considera-se C =

Ip 0 0

0 Ip∗ 0

e C = µ0;φ0.

Como

A =

Ip 0 0

0 Ip∗ 0

Fµµ 0 0

0 Fφφ Fφη

0 Fηφ Fηη

[U(µ) U(φ) U(η)

]⊤=

FµµU(µ)

FφφU(φ) +FφηU(η)

e

B =

Ip 0 0

0 Ip∗ 0

Fµµ 0 0

0 Fφφ Fφη

0 Fηφ Fηη

Ip 0 0

0 Ip∗ 0

=

Fµµ 0

0 Fφφ

,

então,

Cµ,Σ(α) =1

n

FµµU(µ)

FφφU(φ) +FφηU(η)

⊤ Fµµ 0

0 Fφφ

−1 FµµU(µ)

FφφU(φ) +FφηU(η)

=1

n

U⊤(µ)FµµU(µ) +

(U⊤(φ) + UηF(η)φF−1

φφ

)(FφφU(φ) +FφηU(η)

).

Portanto,

Cµ,Σ(α) = Cµ(α) + CΣ(α)

Page 85: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

67

5.2 ARTIGO 2: Estimação de parâmetros por máxima verossimilhança e te stes dehipóteses a partir da distribuição slash multivariada

Resumo: Este trabalho tem como objetivo apresentar o método de estimação

de parâmetros por máxima verossimilhança (MV) e investigar as estatísticas de

testes razão de verossimilhanças, Wald e score quando se dispõe de amostras

provenientes de uma população contínua com distribuição slash multivariada.

Particularmente, as hipóteses lineares sobre o vetor de médias e matriz

de covariâncias foram discutidas. Abordou-se uma versão do algoritmo EM

(Esperança-Maximização) para estimação dos parâmetros, incluindo o parâmetro

de forma, que foi reparametrizado possibilitando. Assim, foi possível supor a

existência do segundo momento finito. Apresentaram-se expressões analíticas

para a função escore e matriz de informação de Fisher. Completou-se o estudo com

a avaliação do desempenho do algoritmo EM por meio de simulação e aplicou-se

os testes discutidos na análise dos índices de flutuações dos preços mensais das

commodities da soja. Os resultados indicaram que o algoritmo EM permite inserir

procedimentos eficientes para executar a estimação dos parâmetros bem como

realizar uma abordagem multivariada para os testes de hipóteses.

Palavras-chave: Algoritmo EM, distribuição robusta, inferência estatística.

5.2.1 Introdução

O problema de testar hipóteses sobre o vetor de médias e/ou matriz de variância

apareceu frequentemente na análise de dados experimentais. Diversos procedimentos

baseados na estimação por máxima verossimilhanças (MV) são comumente utilizados,

como o teste de razão de verossimilhanças (RV ), teste de Wald (W ) e teste score

(S), cujas estatísticas foram estudadas por Wilks (1938), Wald (1943) e Rao (1948),

respectivamente. Sobre certas condições de regulariadade, as três estatísticas são

assintoticamente equivalentes sobre a hipótese nula, possuem distribuição assintótica

qui-quadrado e propriedades ótimas. Assim, a escolha entre os diferentes testes leva

em consideração outros aspectos como o desempenho sobre amostras pequenas ou a

conveniência computacional.

No entanto, grande parte da inferência estatística associada a esses testes está

embasada no pressuposto de normalidade, a qual pode se tornar ineficiente quando a curtose

da distribuição populacional for relativamente elevada (ANDERSON, 2003). Neste caso, vários

trabalhos apontam como alternativa a inferência usando distribuições mais robustas, como

as pertencentes à classe mistura escala normal (MEN), membro da família elíptica, pois

apresentam boas propriedades como a normal. São relativamentes simples de se trabalhar

e viabilizam um procedimento robusto perante possíveis valores discrepantes no conjunto de

Este artigo foi estruturado seguindo as normas da Journal of Multivariate Analysis.

Page 86: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

68

dados (ANDREWS; MALLOWS, 1974; BUTLER et al.,1990; GÓMEZ; QUINTANA; TORRES,

2007).

Neste trabalho, discute-se em particular a distribuição slash, (ROGER; TUKEY, 1975;

KAFADAR, 1982), cuja versão multivariada foi introduzida por Lange e Sinsheimer (1993)

sendo sua representação estocástica é dada por Y = µ+V − 12Z, em que µ ∈ ℜp, Z ∼ Np(0,Λ)

independente de V com V ∼ Beta(ν, 1) para ν > 0. Esta distribuição apresenta como

característica particular o parâmetro adicional ν, que proporciona o ajuste da curtose. Porém,

ele pode restringir a existência dos momentos e dificultar a inferência sobre os parâmetros de

interesse. Uma solução para contornar esta dificuldade é a reparametrização do parâmetro

de forma, na qual se supõe a existência do segundo momento finito. Desta forma, é possível

uma comparação mais direta com a distribuição normal (SUTRADHAR,1993; BOLFARINE;

GALEA, 1996). Trabalhos sobre este mesmo enfoque foram desenvolvidos por Lange, Little

e Taylor, (1989) e Fiorentini, Sentana e Calzolari (2003) considerando a distribuição t-Student

multivariada.

Outro fator relevante para escolha da distribuição slash é que sua representação

estocástica viabiliza a implementação do algoritmo EM para a estimação dos parâmetros

por MV, como foram discutidos nos trabalhos de Lange e Sinsheimer (1993), Watanabe

e Yamaguchi, (2004); Osorio, Paula e Galea (2009); Moradi et al. (2014). Portanto, a

maximização da função de verossimilhança, que é analiticamente problemática por não possuir

forma fechada, pode ser simplificada ao se admitir a existência de valores adicionais, ou seja,

a utilização de modelos hierárquicos.

Assim, este trabalho tem como objetivo abordar a estimação dos parâmetros por MV

para a distribuição slash usando o algoritmo EM e discutir testes de hipóteses dos parâmetros

do modelo fazendo uso das estatísticas dos testes RV , W e S. O trabalho foi dividido

como segue: A Seção (5.2.2) apresenta a distribuição slash multivariada reparametrizada,

reformulando o algoritmo EM para estimação dos parâmetros da distribuição, incluindo o

parâmetro de forma, além de apresentar uma expressão analítica da função escore e matriz

de informação de Fisher. Na Seção (5.2.3), discutem-se os testes para hipóteses lineares

sobre o vetor de médias e matriz de covariância. A Seção (5.2.4) apresenta um estudo de

simulação para avaliar o desempenho do algoritmo EM no processo de estimação por MV. Na

Seção (5.2.5), ilustra-se o estudo em um conjunto de dados reais relacionados à área agrícola

e, finalmente, na Seção (5.2.6) relatam-se as conclusões.

5.2.2 Fundamentação teórica

5.2.2.1 A distribuição slash

Diz-se que um vetor aleatório contínuo p-dimensional Y = (Y1, ..., Yp)⊤ tem distribuição

slash p-variada, com vetor de média µ ∈ ℜp, matriz de covariância Σ ∈ ℜp×p e parâmetro de

forma η, para 0 < η < 1, se a função densidade de probabilidade (fdp) é dada por

fY (y) = κp(η)|Σ|− 12G(a, b), (5.18)

Page 87: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

69

sendo κp(η) =1

η

(c(η)

) p2

, G(a, b) =1∫0

va−1 exp− vb

dv, em que V ∼ Beta

(1

η, 1

), a =

p

2+1

η,

b = −1

2c(η)δ na qual δ = (y − µ)⊤Σ−1(y − µ) representa a distância de Mahalanobis e c(η) =

(1− η

)−1.

Se um vetor aleatório tem fdp dada conforme (5.18), será denotado por Y ∼SLp(µ,Σ, η), cuja representação estocástica é dada por:

Yd= µ+ Z/

√c(η)V , (5.19)

com Z ∼ Np(0,Σ), V ∼ Beta

(1

η, 1

), independentes, e 0 < η < 1.

Nota-se que, fazendo µ = 0 e Σ = Ip×p em (5.18) tem-se a distribuição slash

multivariada padrão, denotada por Y ∼ SLp(0, I, η). Outro fato é que na distribuição

slash reparametrizada µ e Σ correspondem ao vetor de médias e matriz de covariâncias,

respectivamente. Desta forma, é possível uma comparação mais direta com a distribuição

normal multivariada. Ademais, o parâmetro de forma η permite o ajuste da curtose da

distribuição, sendo a normal multivariada um caso limite desta classe quando η → 0. Vale

destacar que, para esta família, a distância de Mahalanobis tem fundamental importância e é

extremamente útil tanto em testes de ajustes como na detecção de outliers (MURRAY, 1984;

LANGE; SINSHEIMER, 1993).

5.2.2.2 Estimação de parâmetros pelo algoritmo EM

Seja y1, ...,yn uma amostra de vetores aleatórios independentes que se ajusta à

distribuição slash multivariada, sendo yi = (yi1, · · · , yip)⊤, cuja fdp é dada em (5.18). O

objetivo é encontrar os estimadores que maximizam a verossimilhança de θ = (µ⊤,φ⊤, η)⊤

em todo espaço paramétrico Θ, sendo φ = vech(Σ) ∈ ℜp(p+1)/2 o vetor obtido a partir da

vetorização dos elementos distintos da matriz Σ, cujo logaritmo da função verossimilhança é

dado por

l(θ) =n∑

i=1

li(θ), (5.20)

em que a i-ésima componente é dada por li(θ) = log(κp(η))−1

2log |Σ|+ log

(G(a, bi)

).

A partir de (5.20), a função escore é dada por

U(θ) =n∑

i=1

U i(θ),

em que U i(θ) = (U⊤i (µ),U

⊤i (φ), Ui(η))

⊤ para i = 1, ..., n, com

Page 88: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

70

U i(µ) =∂li(θ)

∂µ= wG(·, δi)Σ−1(yi − µ),

U i(φ) =∂l(θ)

∂φ=

1

2D⊤p vec

[wG(·, δi)

(Σ−1(yi − µ)(yi − µ)⊤Σ−1

)−Σ−1

],

Ui(η) =∂l(θ)

∂η= −1

η+p

2c(η) + wG(η, ·),

em que wG(·, δi) =(ηp+ 2

ηδi

)P(a+ 1, bi)

P(a, bi),

wG(η, ·) =1

η2

[log(bi)−Ψ

(a)]

−ac(η)+∂∂ηP

(p2 + 1

η ,c(η)δi

2

)

P

(p2 + 1

η ,c(η)δi

2

) e Dp ∈ ℜp2×p(p+1)/2 denota a matriz

de duplicação de ordem p (MAGNUS; NEUDECKER, 1999).

As expressões obtidas a partir da maximização da função (5.20) em relação aos

parâmetros de interesse dificultam obteção de um estimador de MV θ, uma vez que a

solução U(θ) = 0 não apresenta forma fechada. Uma forma de contornar este problema

é a utilização de algoritmos computacionais. A representação mistura escala da distribuição

slash, dada em (5.19), viabiliza o uso do algoritmo EM (DEMPSTER; LAIRD; RUBIN, 1977).

Este procedimento consiste em adicionar um vetor de dados aleatórios ao vetor de valores

observados, criando um conjunto de dados aumentados (completos).

Assim, considere o logaritmo da função verossimilhança dos dados completos,

denotado por lc(θ|Y c), em que Y c = (Y ⊤obs,Y

⊤mis)

⊤ é o vetor de dados completos, sendo

Y obs o vetor de dados observados e Y mis o vetor de dados adicionados. O algoritmo EM

maximiza o logaritmo da função verossimilhança dos dados observados, denotado aqui por

l(θ;yobs), iterativamente alternando as seguintes etapas:

Passo E: para uma estimação atual θ(r), calcular a esperança condicional

Q(θ|θ(r)) = Elc(θ|Y c)|Y obs,θ(r).

Passo M: atualizar θ(r+1) maximizando Q(θ|θ(r+1)), com respeito a θ.

Isto permite simplificar a obtenção do estimador de MV através da maximização

condicional em relação a θ, cujo limite é a resposta do problema original bem como

garantir a convergência a um ponto estacionário de l(θ;yobs) (LANGE; SINSCHEIMER, 1993;

WATANABE; YAMAGUCHI, 2004; OSORIO; PAULA; GALEA, 2009; BULUT; ARSLAN, 2015).

Para executar a estimação de MV no contexto da distribuição slash, aumenta-se o

conjunto de dados observados, Y obs = Y ⊤1 , · · · ,Y ⊤

n incorporando as variáveis latentes, de

modo que Y c = (Y ⊤1 , v1), · · · , (Y ⊤

n , vn)⊤. Deste modo, é possível considerar o seguinte

modelo hierárquico (Y i|vi) ind∼ Np(µ, v−1i Σ) em que h(vi)

ind∼ Beta(1/η, 1), com 0 < η < 1, para

i = 1, · · · , n.

Dado que a densidade conjunta de Y e V pode ser escrita como:

fY i|Vi(yi, vi) =

1

(2π)p2 |v−1

i (1− η)Σ| 12exp

− 1

2(1− η)viδi

,

Page 89: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

71

sendo δi = (yi − µ)⊤Σ−1(yi − µ), tem-se que o logaritmo da função verossimilhança para os

dados completos será da forma

lc(θ|Y c) =np

2

[log c(η)− log(2π)

]−n2log |Σ| − 1

2

n∑

i=1

vic(η)δi

−n log η +(p

2+

1

η− 1

) n∑

i=1

log vi. (5.21)

Para calcular o passo E (esperança) do algoritmo, deve-se obter Q(θ;θ(r)) =

Elc(θ|Y c)|Y obs,θ(r), que é a esperança condicional de lc dado Y obs, sendo θ(r) =

(γ(r)⊤ , η(r)

)⊤ a estimativa de θ para a r -ésima iteração em que, γ(r) =(µ(r)⊤ ,φ(r)⊤

)⊤. Assim

Q(θ;θ(r)) = Q(γ;θ(r)) +Q(η;θ(r)), (5.22)

em que Q(θ;θ(r)) =∑n

i=1Qi(θ;θ(r)), sendo

Q(γ;θ(r)) = −np2

log(2π)− n

2log |Σ| − 1

2

n∑

i=1

w(r)i δi(γ

(r))

e

Q(η;θ(r)) = −n log η + np

2log c(η) +

(p

2+

1

η− 1

) n∑

i=1

c(r)i ,

na qual w(r)i = c(η)E

Vi|Y i,θ

(r)

e c(r)i = E

log(Vi|Y i,θ

(r)).

O peso w(r)i pode ser obtido a partir da razão (LANGE; SINSCHEIMER, 1993; OSORIO;

PAULA; GALEA, 2009)

w(r)i =

1∫0

(c(η)vi

) p2+ 1

η exp− 1

2c(η)viδi(γ

(r))dv

1∫0

(c(η)vi

) p2+ 1

η−1

exp− 1

2c(η)viδi(γ(r))

dv

= c(η)

G

(p

2+

1

η+ 1,

c(η)δi(θ(r))

2

)

G

(p

2+

1

η,c(η)δi(θ

(r))

2

) .

Considerando que, G(a, bi) = b−ai γ(a, bi), em que γ(a, bi) = Γ(a)P(a, bi) =

1

Γ(a)

bi∫0

ta−1e(−t)dt,

para t = vbi e i = 1, ..., n (mais detalhes ver ABRAMOWITZ; STEGUN, 1970; MOORE, 1982).

Então, é possível avaliar a w(r)i a partir de

w(r)i =

(pη + 2

ηδi(γ(r))

)P

(p

2+

1

η+ 1,

c(η)δi(γ(r))

2

)

P

(p

2+

1

η,c(η)δi(γ

(r))

2

) .

Já o valor de c(r)i é dado por

c(r)i =

1∫0

log(vi)vp2+ 1

η−1

i exp− 1

2vic(η)δi(γ

(r))dv

1∫0

vp2+ 1

η−1

i exp− 1

2vic(η)δi(γ(r))

dv

,

cuja aproximação assintótica pode ser obtida por (LANGE; SINSHEIMER, 1993; JAMSHIDIAN,

Page 90: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

72

1999)

c(r)i ≃ 1

η2

[log

(c(η)δi(γ

(r))

2

)− ψ

(p

2+

1

η

)]−(p

2+

1

η

)c(η) +

∂ηP

(p2 + 1

η ,c(η)δi(γ

(r))2

)

P

(p2 + 1

η ,c(η)δi(γ(r))

2

) ,

em que, ψ(·) é a função digamma.

Atualizando γ(r+1) por meio da maximização de Q(γ; θ(r)

) (passo M) em (?? ), com

relação a µ e φ, tem-se:

µ(r+1) =n∑

i=1

w(r)i yi/

n∑

i=1

w(r)i , (5.23)

Σ(r+1) =1

n

n∑

i=1

w(r)i (yi − µ(r+1))(yi − µ(r+1))⊤. (5.24)

Já a atualização da estimação do parâmetro de forma da distribuição slash pode ser

realizada de forma independente de θ(r+1), maximizando Q(η|θ(r)) com respeito a η de forma

perfilada, ou seja, para cada etapa do algoritmo EM, encontra-se η(r) maximizando a equação

(5.22) em η, avaliada em µ = µ(r) e Σ = Σ(r). Assim, a atualização de η(r+1) será dada a

partir da solução da equação∂Q(η|θ(r))

∂η= 0.

Esses passos devem ser repetidos até atingir a convergência. Cada iteração do

algoritmo EM incrementa a função verossimilhança dos dados observados l(θ|Y ) e sobre

condições apropriadas o algoritmo EM apresenta convergência monótona ao máximo global

ou local de l(θ|Y )(WU, 1983).

5.2.2.3 A matriz de informação de Fisher

Para implementar alguns dos testes de hipóteses, é necessário obter a matriz de

informação de Fisher. Supondo que a função suporte da distribuição slash atenda às

condições de regularidade (LEHMANN, 1983; MITCHELL, 1989; SUTHRADAR, 1993), ao usar

a função escore dada em (5.20), a matriz de informação de Fisher para θ para o logaritmo da

função verossimlhante definida em (5.18) assume a forma

I(θ) = Eθ[U(θ)U⊤(θ)] =

Iµµ(θ) 0 0

0 Iφφ(θ) Iφη(θ)

0 Iφη(θ) Iηη(θ)

, (5.25)

cujos elementos são

Iµµ(θ) =dg

pΣ−1; Iφη(θ) = −1

2hgD⊤

p vec(Σ−1);

Iφφ(θ) =1

4D⊤p

2

fg

p(p+ 2)

(Σ−1 ⊗Σ−1

)Np +

(fg

p(p+ 2)− 1

)vec(Σ−1

)vec⊤

(Σ−1

)Dp;

Iφη(θ) = −1

2hgD⊤

p vec(Σ−1); Iηη(θ) =1

η2− p

ηc(η)−

[2

η−pc(η)

]tg1+

p2

4c(η)2+

tg2;

em que dg = E[w2G(·, δ)||Z||2

], fg = E

[w2G(·, δ)||Z||4

], hg = E

[wG(η, δ)||Z||2

], sendo

Page 91: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

73

wG(η, δ) =∂2

∂η∂δlogG(a, b) e tg1 = E[wG(η, ·)] e tg2 = E[w2

G(η, ·)]. Considera-se aqui δ = ||Z||2,

sendo Z = Σ−1/2(Y − µ), Z ∼ SLp(0, Ip, η) e Np =1

2(Ip2 + Kp) em que Kp é a matriz

comutação de ordem p2 × p2 (MAGNUS; NEUDECKER, 1999).

A distribuição amostral assintótica para o estimador de MV θ segue distribuição

assintoticamente normal, dada por

√n(θ − θ)

D→Nk(0, I−1

(θ)),

em que I(θ) = limn→∞I(θ) e k = p(p+ 3) + 2/2.

5.2.3 Testes de hipóteses

Nesta seção, investigam-se testes assintóticos conhecidos para avaliar a significância

dos parâmetros. Assumindo-se que os dados são provenientes de uma amostra aleatória

com distribuição slash multivariada. Serão aplicados testes para grandes amostras, em que

as estatísticas de testes baseiam-se na função de verossimilhança, pois essas apresentam

propriedades de otimalidade (MARDIA; KENT, 1992; ANDERSON, 2003; KOLLO; ROSEN,

2005).

Neste contexto, seja y1, · · ·,yn uma amostra aleatória independente que segue uma

distribuição SLp(µ,Σ, η), com θ = (µ⊤,φ⊤, η)⊤ ∈ Θ, sendo Θ o espaço paramétrico, Θ ⊂ ℜk,

em que k =p(p+ 3)

2+ 1 representa a quantidade de parâmetros envolvidos. As hipóteses

de interesse estão relacionadas principalmente com o contraste sobre o vetor de médias µ e

sobre os elementos da matriz de covariância Σ, sendo elas descritas como:

i) H01 : µ = µ0, sendo µ0 conhecido, e (φ⊤, η) desconhecido;

ii) H02 : Σ = Σ0 sendo Σ0 conhecido e (µ⊤, η) desconhecido;

iii) H03 : µ = µ0 e Σ = Σ0, sendo µ0 e Σ0 conhecido com η desconhecido;

nas quais as hipóteses associadas à matriz de covarância Σ = Σ0 são equivalentes a provar

φ = φ0.

O interesse aqui é em testar hipóteses lineares na forma

H0• : Cθ − c = 0 (5.26)

em que, H0• : Cθ − c é uma função vetorial linear (k1 × 1), 1 < k1 < k, continuamente

diferenciável de θ, a matriz C, (k1 × k), é conhecida de posto k1, e c é um vetor, (k1 × 1), de

valores nominais, em que c ∈ Θ0, espaço paramétrico restrito e Θ0 ⊂ Θ. Neste caso, em H01

tem-se C =[Ip,0, 0

]e c = µ0, em H02 tem-se C =

[0, Ip∗, 0

]e c = φ0, sendo p∗ = p(p+1)

2 e,

finalmente, para H03 tem-se C =

Ip 0 0

0 Ip∗ 0

, sendo c = (µ⊤

0 ,φ⊤0 )

⊤.

Vários métodos assintóticos podem ser utilizados para testar a hipótese linear geral

dada em (5.26), entre eles os testes RV , W e S, que são assintoticamente equivalentes sobre

Page 92: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

74

certas condições gerais (SUNDBERG, 1974) e assumindo-se H0• verdadeiro.

A estatística RV , (WILKS, 1938), mensura o quanto as evidências estatísticas

corroboram com valores para o vetor de parâmetros diferentes daqueles especificados porH0• ,

ou seja, altos valores da razão de verossimilhanças não apoiam a plausibilidade da hipótese

nula. A estatística RV é definida como

RV = 2l(θ)− l(θ

0), (5.27)

em que l(θ) é o logaritmo da função verossimilhança relativo a θ, definida em (5.20), θ0

e θ são

os estimadores de MV do parâmetro que indexa o modelo restrito e irrestrito, respectivamente.

Por outro lado, as estatísticas W (WALD, 1943) e S (RAO, 1948) são comumente

utilizadas para medir a distância entre as hipóteses nula e alternativa. Sejam U(θ) a função

escore e I(θ) a informação esperada, relacionadas ao vetor θ, apresentadas na seção

(5.2.2.3), as estatísticas W e S são expressas, respectivamente, por

W = n(Cθ − c

)⊤[CI−1(θ)C⊤]−1

(Cθ − c

), (5.28)

e

S =1

nU⊤(θ

0)I−1(θ

0)U(θ

0). (5.29)

Considerando certas condições de regularidade e sobre a hipótese nula, a distribuição

assintótica de RV , W e S é qui-quadrado, com k1 graus de liberdade (WILKS, 1938).

Pode-se observar de (5.28), que a vantagem da escolha da estatística W está

relacionada principalmente à conveniência computacional, pois esse requer para seu cálculo

somente os estimadores irrestritos do modelo, assim como sua matriz de covariância estimada.

Todavia, os outros dois métodos exigem a re-estimativa do modelo no âmbito de cada

restrição testada. Porém, ao contrário do teste RV , este teste é não invariante perante

reparametrizações ou restrições equivalentes, e seu desempenho para amostras pequenas

não apresenta boa aproximação assintótica quando comparado com outros testes (TSAI;

KOZIOL, 1988; CASTRO; GALEA, BOLFARINE, 2008). Já a estatística S requer somente

o estimador sobre o espaço restrito e este permanece invariante dependendo da forma como

a matriz de informação de Fisher é estimada (DAGENAIS: DUFOUR, 1991).

Para ilustrar o estudo, considere-se em particular o caso (iii), com µ0 e Σ0 conhecido e

η desconhecido,em que c = (µ0⊤,φ0

⊤)⊤ e c ∈ ℜk1 . As hipóteses em teste são do tipo

H03 : C(µ⊤,φ⊤)⊤ = (µ0⊤,φ0

⊤)⊤ versus H13 : C(µ⊤,φ⊤)⊤ 6= (µ0⊤,φ0

⊤)⊤.

A partir dos elementos da função escore e F(θ) = I−1(θ), conforme ortoganilidade

apresentada em (5.25), é possível mostrar que para as estatisticas dadas em (5.28) e (5.29),

a hipótese H03 pode ser testada conjuntamente, H03 : H01 ∩H02 , cuja forma é expressa por

W = n

[(µ− µ0

)⊤F−1

µµ(θ)(µ− µ0

)+(φ− φ0

)⊤F−1

φφ(θ)(φ− φ0

)](5.30)

Page 93: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

75

e

S =1

n

[U⊤(µ0)Fµµ(θ0)U(µ0) +U⊤(φ

0)Fφφ(θ0)U(φ0)

], (5.31)

respectivamente, sendo

Fµµ(θ) =p

dgΣ

e

Fφφ(θ) = I−1φφ

(I − I⊤

φηFφη

),

em que Fφη = −I−1φφIφηc

−1, com c =(Iηη − IηφI

−1φφIφη

), cujos elementos estão definidos

na Equação (5.25). Em contrapartida, a estatística RV mantém uma forma simples, já definida

em (5.27).

5.2.4 Estudo de simulação

Um pequeno estudo de simulação foi conduzido para ilustrar o desempenho prático

do algoritmo EM no processo de estimação dos parâmetros da distribuição reparametrizada.

Foram geradas 1000 amostras aleatórias SL2(0, I, 0, 25) e SL2(0, I, 0, 75) usando a

representação estocástica dada na Equação (5.19). Escolheram-se os seguintes tamanhos

amostrais n = 50, 200, 800. Na Tabela 1 são apresentadas as médias das estimativas obtidas

por MV e a raiz do erro quadrado médio (REQM) - entre parênteses-, sendo as notações µ1 e

µ2 relacionadas ao vetor de médias, φ11 e φ22 relacionadas às variâncias e η relacionado ao

parâmetro de ajuste da curtose.

Nota-se que quando simuladas amostras com η = 0, 25, as médias dos valores

estimados para o vetor de média foram próximas ao valor central 0, enquanto as médias

dos valores estimados das variâncias ficaram levemente abaixo de 1. Em todos os casos, o

REQM diminui à medida que o tamanho amostral cresce. Os gráficos boxplot dos parâmetros

ajustados a cada amostra aleatória são representados pelas Figuras 4a, 5a e 6a. Nota-se

pequena dispersão, com medianas próximas aos valores iniciais de simulação. Além disso,

a medida que o tamanho amostral cresce, os dados tendem a se concentrar em torno dos

valores centrados.

Na simulação com η = 0, 75, em média, o comportamento dos valores estimados para

o vetor de média foi semelhante ao caso anterior. Já as médias dos valores estimados das

variâncias foram levemente superiores a 1, sendo os maiores valores dos REQM relacionados

a n=50. Os gráficos boxplot dos parâmetros ajustados a cada amostra aleatória, apresentados

nas Figuras 4b, 5b e 6b, mostram que, ao contrário do caso anterior, o crescimento do

tamanho amostral aumenta a dispersão das estimativas da variância, ocorrendo deslocamento

da mediana em relação ao valor central 1. Este fato pode estar relacionado ao aumento da

curtose dos dados, tornando o comportamento da densidade mais leptocúrtica.

Page 94: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

76

Tabela 5 Médias das estimativas dos parâmetros obtidos por MV de 1000 amostras aleatóriassimuladas a partir de N2(0, I) e SL2(0, I, 0, 75) com REQM entre parênteses.

η = 0, 25 η = 0, 75

µ1 µ2 φ11 φ22 η µ1 µ2 φ11 φ22 η

n = 50 0,004 -0,002 0,988 0,990 0,224 -0,008 -0,015 1,040 1,006 0,707

(0,149) (0,139) (0,204) (0,202) (0,512) (0,104) (0,101) (0,660) (0,603) (0,130)

η = 0, 25 η = 0, 75

µ1 µ2 φ11 φ22 η µ1 µ2 φ11 φ22 η

n = 200 -0,001 -0,003 0,999 1,003 0,251 0,003 0,004 1,038 1,016 0,713

(0,069) (0,069) (0,095) (0,102) (0,355) (0,049) (0,053) (0,298) (0,287) (0,124)

η = 0, 25 η = 0, 75

µ1 µ2 φ11 φ22 η µ1 µ2 φ11 φ22 η

n = 800 0,002 -0,008 0,998 0,999 0,256 0,000 0,000 1,003 1,002 0,741

(0,039) (0,036) (0,051) (0,060) (0,270) (0,023) (0,178) (0,188) (0,014) (0,012)

mu1 mu2 phi1 phi2

−0.

50.

00.

51.

01.

5

(a) η = 0, 25

mu1 mu2 phi1 phi2

01

23

4

(b) η = 0, 75

Figura 4 Gráfico boxplot dos parâmetros ajustados de 1000 amostras aleatórias simuladascom tamanho n = 50, para SL2(0, I, 0, 25) (a) e SL2(0, I, 0, 75) (b).

Page 95: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

77

mu1 mu2 phi1 phi2

0.0

0.5

1.0

(a) η = 0, 25

mu1 mu2 phi1 phi2

0.0

0.5

1.0

1.5

2.0

(b) η = 0, 75

Figura 5 Gráfico boxplot dos parâmetros ajustados de 1000 amostras aleatórias simuladascom tamanho n = 200, para SL2(0, I, 0, 25) (a) e SL2(0, I, 0, 75) (b).

mu1 mu2 phi1 phi2

0.0

0.2

0.4

0.6

0.8

1.0

1.2

(a) η = 0, 25

mu1 mu2 phi1 phi2

0.0

0.5

1.0

1.5

2.0

2.5

3.0

(b) η = 0, 75

Figura 6 Gráfico boxplot dos parâmetros ajustados de 1000 amostras aleatórias simuladascom tamanho n = 800, para SL2(0, I, 0, 25) (a) e SL2(0, I, 0, 75) (b).

5.2.5 Aplicação ao conjunto de dados reais

O Sul do Brasil, formado pelos estados de Paraná (PR), Santa Catarina (SC) e Rio

Grande do Sul (RS), tem papel fundamental no agronegócio da soja. Tanto o PR e RS

ocupam o segundo e terceiro lugar, respectivamente, na produção de soja do país e o grão

é um dos fatores que contribuem para o superavit da balança comercial dos estados. O

estado de SC ocupa o décimo primeiro lugar em produção no País. Apesar da colocação,

esse estado é auto-suficiente e consegue atender à demanda interna, e os grãos são

utilizados principalmente para fabricação de ração animal (BRASIL, 2014). O preço da soja

Page 96: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

78

segue um padrão mundial de comercialização, que tem como ponto delimitador os preços

aferidos na bolsa de commodities de Chicago [CBOT - Chicago Boardof Trade] (MISSÃO,

2006). Desta maneira, é importante mensurar os efeitos de indicadores de preços das

commodities da soja na região Sul, cujos preços variam em função das demandas externa

e interna, fatores climáticos que interferem na produtividade e aspectos mercadológicos.

Embasada nesta dinâmica, trabalhou-se com os índices de flutuações dos preços mensais

(IFPM) das commodities da soja. Neste estudo, foram usados os índices dos últimos 152

meses relacionados aos estados que compõe a região Sul do País. Os dados se encontram

disponíveis na website http://www.agrolink.com.br/cotacoes/. O objetivo é aplicar os

testes de hipóteses de igualdade de médias, esfericidade e equicorrelação (simetria composta)

e fazer inferências estatísticas sobre o comportamento dos IFPM.

Para fins comparativos considerou-se tanto o suposto de normalidade como t-Student

e slash multivariada. A escolha da distribuição t está relacionada ao fato desta pertencer

à classe MEN, e, assim como a slash, apresenta um parâmetro adicional que permite

o ajuste da curtose. Ambas as distribuições são usadas como alternativa à normal por

apresentarem cauda mais pesada e, portanto, proporcionarem um procedimento robusto

perante possíveis outliers presentes no conjunto de dados (LANGE; LITTLE; TAYLOR,

1989; LANGE; SINSHEIMER, 1993). A versão da t-Student multivariada ajustada também

está reparametrizada, proporcionando assim uma comparação mais direta com a normal

(SUTRADHAR,1993; FIORENTINI; SENTANA; CALZOLARI, 2003).

As estimativas de MV para as três distribuições ajustadas encontram-se na Tabela

6. Nota-se que os valores estimados do vetor de médias dos estados PR, SC e RS,

denotados por µ1, µ2 e µ3, respectivamente, quando obtidos pelo ajuste à distribuição normal

foram superiores aos encontrados nas outras duas distribuições. Este comportamento está

associado ao peso wi do estimador da média, que corresponde a uma função de pesos

decrescente de δi. Para o caso slash, wi é apresentada em (5.23) e mais detalhes relacionados

à wi da distribuição t-Student podem ser encontrados em Kent et al. (1994).

No entanto, os valores estimados das variâncias dos estados PR, SC e RS, denotados

respectivamente por φ11, φ22 e φ33, indicaram que os valores associados ao ajuste t-Student e

slash foram maiores quando comparados à normal.

Tabela 6 Estimativas de MV ao ajustar-se a distribuição normal, t-Student e slash aos dadosdos IFPM das commodities da soja dos estados de PR, SC e RS.

Parâmetros estimados Normal t-Student slash

µ1 0,0036 0,0024 0,0027

µ2 0,0038 0,0026 0,0029

µ3 0,0038 0,0033 0,0033

φ11 0,0032 0,0041 0,0050

φ22 0,0030 0,0036 0,0044

φ33 0,0030 0,0036 0,0045

η - 0,226 0,707

LMV 969,445 986,223 988,458

Page 97: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

79

A distância de Mahalanobis δi = (yi − µ)⊤Σ−1(yi − µ), i = 1, · · · , n, foi calculada

com o intuito de detectar observações discrepantes. No caso normal, δi segue distribuição

qui-quadrado com p-graus de liberdade, sendo destacadas aquelas observações que

sobrepassam o ponto de corte 6,587 (Figura 7a). Para a distribuição slash, destacaram-se

as que ultrapassaram o valor 13,386 (Figura 7e), associado ao quantil teórico da distribuição e

para distribuição t-Student 13,324 (Figura 7c), obtidos a partir do quantil teórico da distribuição

F.

Pode-se observar pela Figura 7a que, sobre suposição de normalidade um, grande

número de observações aparece e, possivelmente, elas exerceram influência no processo de

estimação dos parâmetros. Quando assume-se que os dados ajustam-se a distribuções com

cauda mais pesada, como a t-Student e a slash, o número de observações que sobrepassam

o ponto de corte decresce. A Figura 7e, associada à distribuição slash, indica que apenas

a amostra 132 e 141 foram superiores ao ponto de corte, e esses pontos também foram

identificados nos demais gráficos. Para avaliar a qualidade do ajuste a cada distribuição

assumida, foram construídos os gráficos QQ-plot das distâncias normalizadas,apresentadas

nas Figuras 7b, 7d e 7f. Nota-se que a distribuição slash apresentou melhor ajuste à

distribuição amostral, quando comparada com a normal, porém em relação à t-Student, o

comportamento foi similar.

Com o intuito de avaliar a qualidade do ajuste ao se assumir distribuição slash ao invés

da normal, aplicou-se o teste RV considerando a seguinte hipótese

H0 : η = 0 versus H1 : η > 0,

em que η = 0, 707 com logaritmo da função verossimilhança associada de lSL(θ0) = 988, 458.

Sobre hipótese nula, tem-se o modelo normal cujo logaritmo da função verossimilhança,

avaliada em θ0= (µ0⊤, φ0⊤)⊤, foi igual a lN (θ

0) = 969, 445. Assim, a estatística da razão de

verossimilhança é RV = 33, 556. A distribuição assintótica da estatística RV para a hipótese

anterior corresponde a uma mescla de 50:50 de distribuição qui-quadrado, com zero e um grau

de liberdade, cujo valor crítico a um nível de significância de 5% é 2,7055 (SONG; ZHANG;

QU, 2007). Isto indica que o suposto de normalidade não é suportado pelo conjunto de dados.

Como relatado, as distribuições t-Student e slash apresentaram comportamento

similares. Neste caso, para fins de comparação e escolha, utilizaram-se os critérios LMV

e de informação de Akaike, dado por AIC = −2l(θ) + 2p, em que l(θ) é o logaritmo da

função verossimilhança para o parâmetro θ associado à distribuição avaliada em θ = θ e

p é a dimensão do espaço paramétrico. Um modelo com AIC menor e LMV maior será o

mais adequado. Os valores encontrados foram LMV = 986, 223 e AIC = −1966, 446 para a

distribuição t-Student e LMV = 988, 458 e AIC = −1970, 916 para a slash, indicando que a

última é a escolha mais adequada.

Page 98: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

80

0 50 100 150

05

1015

20

Ordem

Del

ta

22

54

57

83 9596

97

101

110

112122

131

132

139

141

142

144150

(a)

−2 −1 0 1 2

−4

−2

02

4

Quantil Teórico

Qua

ntil

Am

ostr

al

(b)

0 50 100 150

05

1015

20

ordem

Del

ta

132

141142

(c)

−2 −1 0 1 2

−4

−2

02

4

Quantil teórico

Qua

ntil

amos

tral

(d)

0 50 100 150

05

1015

20

Ordem

Del

ta

132

141

(e)

−2 −1 0 1 2

−4

−2

02

4

Quantil teórico

Qua

ntil

amos

tral

(f)

Figura 7 Gráficos das distâncias de Mahalanobis e QQ-plot das distâncias normalizadasajustando a distribuição normal (a-b), t-Student (c-d) e slash (e-f) aos dados dos IFPMdas commodities da soja nos estados do PR, SC e RS.

Sob a suposição de que os dados se ajustam a distribuição slash, inicialmente

testou-se a igualdade entre os IFPM das commodities da soja entre os estados que compõem

a região Sul. Para tal, considerou-se testar a hipótese H0 : Cµ = 0, em que Cµ é o vetor de

Page 99: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

81

médias para o modelo transformado mediante a matriz de contraste C, (2×3), dada por

C =

1 0 −1

0 1 −1

.

Os resultados dos testes encontram-se na Tabela 7. O p-valor foi obtido pela

distribuição qui-quadrado com 2 graus de liberdade. Os resultados de todos os testes,

indicaram que não existem evidências para rejeitar a hipótese nula ao nível de 5% de

significância. Portanto, é possível se supor igualdade entre as médias dos IFPM das

commodities de soja praticados nos diferentes estados.

Uma das motivações da escolha dos dados está relacionada à elevada instabilidade

dos preços das commodities da soja. Os preços sofrem grandes flutuações, que ocorrem

em curtos períodos de tempo. Assim, torna-se fundamental verificar, a partir dos testes

de hipóteses, se as estruturas de variâncias são iguais e se a correlação entre os pares

de variáveis são iguais ou nula, se torna fundamental para detectar possíveis interferência

dos grandes estados produtores no IFPM. Quando se aplicou o teste de esfericidade, cuja

hipótese nula pode ser escrita como H0 : Σ = σ2I, conclui-se pelos resultados apresentados

na Tabela 7 que há fortes evidências para se rejeitar a hipótese nula, ou seja, os IFPM dos

commodities não possuem a mesma variância. O teste de equicorrelação, cuja hipótese é

dada por H0 : Σ = (1 − ρ)Ip + ρJp, em que ρ e σ2 estimados são iguais a 0,00435 e 0,9456,

respectivamente, também indicou que deve-se rejeitar a hipótese nula de simetria composta

para o IFPM.

Tabela 7 Estatísticas para os testes de igualdade de médias, esfericidade e equicorrelaçãoaplicados aos dados do IFPM das commodities da soja. Nível de 5% de significância.

Igualdade Esfericidade Equicorrelação

de médias

Estatística de Teste Valor p-valor Valor p-valor Valor p-valor

RV 0,1431 0,9309NS 571,818 0,0000∗ 16,8781 0,0020∗

Wald 0,1658 0,9204NS 588,985 0,0000∗ 17,4583 0,0016∗

Score 0,1435 0,9308NS 517,727 0,0000∗ 14,1073 0,0070∗

*Teste significativo a 5% de probabilidade; NS teste não significativo.

5.2.6 Conclusão

Este trabalho discutiu estimação de parâmetros por máxima verossimilhança via

algoritmo EM e testes de hipóteses, quando se dispõe de observações provenientes de uma

população contínua com distribuição slash. Se supôs a existência do segundo momento finito a

partir da reparametrização da distribuição, permitindo assim uma comparação mais direta com

a distribuição normal. Os resultados das simulações indicaram que à medida que aumenta

o tamanho amostral a REQM diminui, indiferente do valor da curtose. Além disso, quando

Page 100: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

82

simulado valores de curtose alta (0, 75), as estimativas relacionadas à variância são mais

dispersas; já para η = 0, 25, as estimativas tendem a ser mais concentradas.

Vale destacar ainda que o algoritmo EM permitiu inserir procedimentos eficientes

para executar a estimação sobre as restrição delineada a partir das hipóteses de interesse

ao se aplicar os testes de prova RV , W e S. Quando avaliados os dados do IFPM das

commodities da soja, os resultados indicaram que as médias dos IFPM são equivalentes, ou

seja, os diferentes IFPM médios praticados nos estados de PR, SC e RG são estatisticamente

iguais. No entanto, os testes de esfericidade e equicorrelação indicaram que as mesmas não

possuem variância homogênea e as correlações entre os pares de variáveis não podem ser

consideradas iguais.

Portanto, a distribuição slash pode ser vista como uma distribuição simétrica alternativa

a normal. Portanto é possível assumir para os erros aleatórios uma distribuição com caudas

mais pesadas. Isso reduz a influência de pontos discrepantes no processo de estimação dos

parâmetros e testes de hipóteses.

5.2.7 Referências

ABRAMOWITZ, M.; STEGUN, I. A. Handbook of mathematical functions . Dover Press, NewYork, 1970.

ANDERSON, T. W. An introduction to multivariate statistical analysis . John Wiley, NewJersey, 3 ed., 2003.

ANDREWS, D. F.; MALLOWS, C. L. Scale mixtures of normal distributions. Journal of theRoyal Statistical Society , v. 36, p. 99-102, 1974.

BOLFARINE, H.; GALEA, M. On structural comparative calibration under a t-model.Computational Statistics , v. 11, p. 63-85, 1996.

BRASIL. Ministério da Agricultura, Pecuária e Abastecimento. Projeções do Agronegócio :BRASIL 2013/2014 a 2023/2024, Assessoria de Gestão Estratégica. Brasília, 2014.

BULUT, M. Y.; ARSLAN, O. Matrix variate slash distribution. Journal of Multivariate Analysis ,v. 137, p. 173-178, 2015.

BUTLER, R. J.; MCDONALD, J. B.; NELSON, R. D.; WHITE, S. B. Robust and partially adaptiveestimation of regression models. The Review of Economics and Statistics , v. 72, p. 321-327,1990.

CASTRO, M.; GALEA, M.; BOLFARINE, H. Hypothesis testing in an error in variables modelwith heteroscedastic measurement errors. Statistics and Medicine , v. 27, p. 5217-5234,2008.

DAGENAIS, M. G.; DUFOUR, J. M. Invariance, nonlinear models and asymptotic tests.Econometrica , v. 59, p. 1601-1615, 1991.

Page 101: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

83

DEMPSTER, A. P.; LAIRD, N. M.; RUBIN, D. B. Maximum likelihood from incomplete data viathe EM algorithm (with discussion). Journal of the Royal Statistical Society , B, v. 39, p. 1-38,1977.

FIORENTINI, G.; SENTANA, E.; CALZOLARI, G. Maximum likelihood estimation and inferencein multivariate conditionally heteroscedastic dynamic regression models with Student tinnovations. Journal of Business and Economic Statistics , v. 21, p. 532-546, 2003.

GÓMEZ, H. W.; QUINTANA, F. A.; TORRES, F. J. A new family of slash-distributions withelliptical contours. Statistics & Probability Letters , v. 77, p. 717-725, 2007.

JAMSHIDIAN, M. A note on parameter and standard error estimation in adaptive robustregression. Journal of Statistics Computation and Simulation , v. 71, p. 11-27, 2001.

KAFADAR, K. A biweight approach to the one-sample problem. Journal of the AmericanStatistical Association , v. 77, p.416-424, 1982.

KENT, J. T.; TYLER, D. E.; VARDI, Y. A curious likelihood identity for the multivariatet-distribution. Communications in Statistics-Simulation and Computation v. 23, p. 441-453,1994.

KOLLO T.; ROSEN, D. Advanced Multivariate Statistics with Matrices . Springer,Netherlands, 2005.

LANGE, K. L.; LITTLE, R. J.; TAYLOR, J. Robust statistical modelling using the t distribution.Journal of the American Statistical Association , v. 84, p. 881-896, 1989.

LANGE, K., SINSHEIMER, J. S. Normal/independent distributions and their applications inrobust regression. Journal of Computational and Graphical Statistics , v. 2, p. 175-198,1993.

LEHMANN, E. L. Theory of point estimation . John Wiley and Sons, New York, 1983.

MAGNUS, J. R.; NEUDECKER, H. Matrix differential calculus with applications instatistics and econometrics . John Wiley, Chichester, 1999.

MARDIA, K. V.; KENT, J. T.; BIBBY, J. M. Multivariate Analysis. Academic Press, London,1992.

MISSÃO, M. R. Soja: origem, classificação, utilização e uma visão abrangente do mercado .Maringá Management , v. 3, p. 7-15, 2006

MITCHELL, A. F. S. The information matrix, skewness tensor and-connections for the generalmultivariate elliptical distribution. Annals of the Institute of Statistical Mathematics , v. 41, p.289-304, 1989.

MORADI, Z. G.; ARASHI, M.; ARSLAN, O.; IRANMANESH, A. A new family of multivariateslash distributions. Communications in Statistics - Theory and Methods , v. 45, p. 1-72014.

Page 102: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

84

MOORE, R. J. Algorithm AS 187: Derivatives of the incomplete gamma integral. AppliedStatistics , v. 31, p. 330-335, 1982.

MURRAY, J. D. Asymptotic analysis . New York, Springer-Verlag, 1984.

OSORIO, F.; PAULA, G. A.; GALEA, M. On estimation and influence diagnostics for the Grubbs’model under heavy-tailed distributions. Computational Statistics and Data Analysis , v. 53,p. 1249-1263, 2009.

RAO, C. R. Large sample tests of statistical hypotheses concerning several parameters withapplications to problems of estimation. Proceedings of the Cambridge PhilosophicalSociety , v. 44, p. 50-57, 1948.

ROGERS, W. H.; TUKEY, J. W. Understanding some long-tailed symmetrical distributions.Statististica Neerlandica , v. 26, p. 211-226, 1972.

SONG, P. X. K.; ZHANG, P.; QU, A. Maximum likelihood inference in robust linear mixed-effectsmodels using the multivariate t distributions. Statistica Sinica , v. 17, p. 929-943, 2007.

SUNDBERG, R. Maximum likelihood theory incomplete data from an exponential family.Scandinavian Journal of Statistics , v. 1, p. 49-58, 1974.

SUTRADAR, B. C. Score tests for the covariance matrix of the Elliptical t-distribution. Journalof Multivariate Analysis , v. 46, p. 1-12,1993.

TSAI, K. T.; KOZIOL, J. A. Score and Wald tests for the multivariate growth curve model withmissing data. Annals of the Institute of Statistical Mathematics , v. 40, p. 179-186, 1988.

WALD, A. Test of statistical hypothesis concerning several parameters when the number ofobservations is large. Transactions of the American Mathematical Society , v. 54, p.426-482, 1943.

WILKS, S. S. The large-sample distribution of the likelyhood ratio for testing compositehypothesis. The Annals of Mathematical Statistics , v. 9, p. 60-62, 1938.

WATANABE, M.; YAMAGUCHI, K. The EM algorithm and related statistical models . MarcelDekker, Inc. New York, 2004.

WU, C. F. J. On the convergence properties of the EM algorithm. The Annals of Statistics , v.11, p. 95-103, 1983.

Page 103: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

85

5.3 ARTIGO 3: Variabilidade espacial em modelagem linear slash com segund omomento finito

Resumo: Este trabalho tem por objetivo estudar a dependência em modelos

espaciais lineares usando a distribuição slash com segundo momento finito. Os

parâmetros do modelo são estimados por máxima verossimilhança utilizando o

algoritmo EM. A fim de evitar problemas de identificabilidade, aplica-se critério de

validação cruzada, traço e máximo valor do logaritmo de verossimilhança para a

escolha do parâmetro de ajuste da curtose da distribuição slash e de seleção do

modelo usado para explicar a dependência espacial. Técnicas de diagnóstico de

influência global e local para investigar a sensibilidade dos estimadores quando à

presença de possíveis pontos influentes foram apresentados. Desenvolveram-se

estudos de simulação para avaliar a eficiência dos métodos. Como aplicação,

estudaram-se dois conjuntos de dados reais e os resultados mostraram que

a presença de valores influentes nos dados amostrais muda a estrutura de

dependência espacial e a construção do mapa temático.

Palavras-chave: Algoritmo EM, análise de dados espaciais, geoestatística,

Influência global e local, modelagem robusta.

5.3.1 Introdução

A geoestatística é fundamentada na Teoria das variáveis regionalizadas, a qual define

que as variáveis são relacionadas, dependendo da posição que ocupam no espaço, e na

suposição de que elas podem ser descritas por uma distribuição de probabilidade relacionada

ao fenômeno em estudo (Matheron 1963). Esta definição permite determinar a estrutura de

dependência espacial dos dados, considerando-os provenientes de um processo estocástico

estacionário e isotrópico. Entre os modelos que estudam a dependência espacial, têm-se os

apresentados por Mardia e Marshall (1984) e que foram estudados assumindo um processo

estocástico gaussiano (Christensen et al. 1996; Militino et al. 2006; Diggle e Ribeiro Jr. 2007;

Borssoi et al. 2011; Uribe-Opazo et al. 2012; Grzegozewski et al. 2013).

A modelagem estatística baseada na distribuição normal é sensível a valores atípicos e

erros que apresentam caudas mais pesadas. Por esta razão tem ocorrido crescente interesse

dos pesquisadores em apresentar distribuições que permitam a modelagem mais robusta

(Assumpção et al. 2014; De Bastiani et al. 2015). Neste contexto, o modelo linear espacial

slash (LES) constitui uma alternativa atrativa para explicar a estrutura de dependência espacial,

pois incorpora um parâmetro de forma adicional (ν > 0), que pode ser interpretado como

fator de ajuste da curtose, permitindo assim maior flexibilidade, e portanto, menos sensíveis a

presença de outliers (Jamshidian 2001; Osorio 2009; Alcantara e Cysneiros 2013).

Este artigo foi submetido ao Journal of Agricultural, Biological and Environmental Statistics, e a estrutura segueas normas da revista.

Page 104: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

86

Embora o parâmetro de forma adicional ν torne a distribuição slash mais flexível, ele

pode restringir a existência dos momentos, podendo se tornar um problema, por exemplo,

na determinação da matriz escala (Σ), que define a estrutura de dependência espacial do

processo. Embasada no trabalho de Lange et al. (1989), propõe-se uma alternativa para

contornar esta restrição a partir da reparametrização da distribuição slash. Para tal supôs-se a

existência do segundo momento finito, possibilitando desta forma uma comparação mais direta

com a distribuição normal multivariada. A representação estocástica gerada a partir desta

reparametrização viabiliza a implementação do algoritmo EM para a estimação dos parâmetros

por máxima verossimilhança (MV) (Lange e Sinsheimer 1993; Watanabe e Yamaguchi 2004;

Osorio et al. 2009). Porém, nos processos espaciais sem repetição, a estimação por MV

do parâmetro de ajuste da curtose, ν, recai no problema de identificabilidade, uma vez

que as variáveis aleatórias a serem modeladas constituem um vetor n-variado da qual se

conhece uma única realização. Segundo Zhang (2004), fato semelhante ocorre com relação

ao parâmetro de forma (κ) quando o modelo de dependência da família Martérn (Matérn 1986)

é usado para explicar a dependência espacial. De Bastiani et al. (2015), embasados no

trabalho de Kano et al. (1993) e Zhang (2004), propuseram a utilização da validação cruzada

(VC) e traço (Tr) como critério de seleção desses parâmetros ao trabalharem com processos

espaciais.

Vale ressaltar que, apesar do modelo espacial linear estar fundamentado sob

uma distribuição que apresenta características de maior flexibilidade quanto ao grau de

curtose, é importante que se realizem estudos de sensibilidade, investigando como possíveis

observações influentes podem interferir na estimação dos parâmetros e na construção dos

mapas (Christensen et al. 1996; Militino et al. 2006; Uribe-Opazo et al. 2012; Assumpção

et al. 2014; De Bastiani et al. 2015). Esta etapa é conhecida como análise de diagnóstico

e é constituída de diferentes metodologias de avaliação, como a influência global que avalia

o impacto nas estimativas dos parâmetros, quando uma observação considerada influente é

eliminada do conjunto de dados (Cook 1977; Belsley et al. 1980; Militino et al. 2006; Pan et al.

2014). Um dos problemas que podem ocorrer ao se deletarem pontos considerados influentes

é ocultarem-se os efeitos. Uma alternativa foi apresentada por Cook (1986), que propõe avaliar

a influência conjunta das observações sob pequenas mudanças (perturbações) no modelo, ao

invés da avaliação pela retirada individual de pontos. Esse método é denominado influência

local, sendo apresentado neste trabalho um esquema de perturbação a variável resposta

adequado ao modelo proposto, usando a metodologia proposta por Zhu et al. (2007).

O trabalho foi organizado da seguinte forma: A Seção 5.3.2 descreve a distribuição

slash reparametrizada, estimador de MV e critérios de seleção dos parâmetros que envolvem

a modelagem proposta e a Seção 5.3.3 apresenta a metodologia para análise de influência

global e local. Na Seção 5.3.4 e 5.3.5, apresentam-se estudos de simulação e estudo de

dois conjuntos de dados reais, respectivamente. Finalmente, na Seção 5.3.6, apresentam-se

as discussões e conclusões. Os detalhes de alguns cálculos são apresentados no Apêndice

5.3.8.

Page 105: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

87

5.3.2 A distribuição slash com segundo momento finito

A distribuição slash multivariada foi apresentada por Lange e Sinsheimer (1993),

pertencente à classe de distribuições mistura escala normal. A ideia básica desta classe é

introduzir aleatoriedade na matriz covariância bem como no vetor de média da distribuição

normal multivariada (Z), através de uma variável de mistura estritamente positiva (V ). Sua

função densidade de probabilidade (fdp) é dada por

fY (y) = ν

1∫

0

vν−1φn(y|µ, v−1Λ)dv,

em que φn(·|µ,Λ) é a fdp da distribuição normal padrão n-variada com parâmetro de locação µ

e matriz escala positiva definida Λ. A distribuição de V é Beta(ν, 1) para ν > 0, com momentos

recíprocos E[V ]−1 = ν/ν−m, for m > ν, e a distância de Mahalanobis tem função distribuição

acumulada dada por Pr(δ ≤ x) = Pr(χ2n ≤ x) − [2νΓ(n/p + ν)/xνΓ(n/2)]Pr(χ2

n + 2ν ≤ x).

A distribuição slash se reduz à distribuição normal quando ν → ∞. Para mais detalhes da

distribuição veja Lange e Sinsheimer (1993), Jamshidian (2001) e Osorio et al. (2009).

Note que o parâmetro de forma ν pode restringir a exitência dos momentos. Embasado

nos estudos de Lange et al. (1989), neste trabalho, aplicou-se uma reparametrização sob

a distribuição slash considerando o segundo momento finito e η = 1/ν. O objetivo principal

desta reparametrização é garantir que o vetor µ e a matriz Σ correspondam ao vetor de média

e matriz de covariância, respectivamente. Desta forma, é possível uma comparação mais

direta com a distribuição normal.

Assim, um vetor aleatório contínuo n-dimensional Y = (Y1, ..., Yn)⊤ tem distribuição

slash n-variada reparametrizada, denotada por Y ∼ SLn(µ,Σ, η), com vetor de média µ,

n×1, matriz de covariância Σ, n×n, simétrica e positiva definida e parâmetro de forma η, para

0 < η < 1, se sua função densidade de probabilidade fdp é dada por

fY (y) = Kn(η)|Σ|− 12G(a, b), y ∈ ℜn (5.32)

com

Kn(η) =1

η

(c(η)

)n2

e G(a, b) =

1∫

0

va−1 exp− vb

dv,

sendo, a =n

2+

1

ηe b =

1

2c(η)δ em que, c(η) = (1−η)−1 e δ = (y − µ)⊤Σ−1(y − µ) representa

a distância de Mahalanobis.

A função G(a, b) está associada à função geradora de densidade g(·) da classe elíptica,

pode ser avaliada a partir da função Gamma incompleta (γ(a, b)), cuja forma é dada por

G(a, b) = b−aΓ(a)P(a, b), em que P(a, b) denota a função distribuição acumulada de γ(a, b)

avaliada em x = 1, tal que Px(a, b) =ba

Γ(a)

x∫0

va−1e

−vbdv (Abramowitz e Stegun 1970). Neste

caso, a representação estocástica de Y é expressa por

Yd= µ+ Z/

√c(η)V , (5.33)

Page 106: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

88

com Z ∼ Np(0,Σ), V ∼ Beta(1/η, 1

), independentes, e 0 < η < 1.

Fazendo-se µ = 0 e Σ = In×n em (5.32), tem-se a distribuição slash multivariada

padrão, denotada por Y ∼ SLn(0, I, η). E no caso, η → 0 a distribuição slash tem a distribuição

normal n-variada como um caso limite.

5.3.2.1 O modelo espacial linear com distribuição slash

Para modelar os dados de variáveis georreferenciadas, considere um processo

estocástico estacionário de segunda ordem e isotrópico Y (si), si ∈ S, S ⊂ ℜ2, em que

ℜ2 é o espaço euclidiano bi-dimensional. Suponha que Y = (Y (si), · · · , Y (sn))⊤ segue uma

distribuição de probabilidade slash n-variada, denotada por Y ∼ SLn(µ,Σ, η) e, ainda, que

cada elemento Y (si) possui localizações espaciais conhecidas si, com i = 1, · · · , n, que pode

ser expresso como um modelo espacial linear da seguinte forma:

Y (si) = µ(si) + ǫ(si) i = 1, · · · , n, (5.34)

em que tanto o termo determinístico µ(si) como o termo estocástico ǫ(si) dependem da

localização espacial na qual Y (si) é observada. Assume-se que o erro estocástico ǫ(si)

tem média zero, isto é, E[ǫ(si)

]= 0 e que a variação entre pontos no espaço é determinada

por alguma função de covariância C(si, sj) = covǫ(si), ǫ(sj). Esta função de covariância

é especificada por um vetor de parâmetros φ = (φ1, φ2, φ3)⊤, e esses são definidos pela

estrutura de dependência espacial.

O termo determinístico µ(si) pode ser obtido supondo-se que para alguma função

conhecida de si, x⊤i = (x1(si), · · · , xq(si)), e assim a média do processo estocástico é

µ(si) = x⊤i β, sendo β = (β1, · · · , βq)⊤ o vetor de parâmetros desconhecidos a serem

estimados. Considerando-se ainda que X é uma matriz n × q com a i-ésima linha x⊤i e

que ǫ = (ǫ(s1), · · · , ǫ(sn)⊤, com i = 1, · · ·n e j = 1, · · · q, é possível escrever o modelo espacial

linear (5.34) em notação matricial como segue

Y = Xβ + ǫ, (5.35)

em que Y ∼ SLn(Xβ,Σ, η), ǫ ∼ SLn(0,Σ, η), sendo a matriz de covariância Σ = [(σij)],

em que (σij) = C(si, sj). Assume-se que Σ é simétrica, não singular e positiva definida, cuja

forma paramétrica particular é dada por (Mardia e Marshall 1984)

Σ = Σ(φ) = φ1In + φ2R(φ3) (5.36)

em que, In é a matriz identidade n× n, φ1 ≥ 0 e φ2 ≥ 0 são os parâmetros conhecidos como

efeito pepita e contribuição, respectivamente, enquanto φ3 ≥ 0 é um parâmetro relacionado

ao raio de dependência espacial al = g(φ3). A matriz R(φ3) =[(rij)

]é simétrica, n × n, e

seus elementos (rij) representam a correlação da variável georreferenciada entre os pontos

localizados em si e sj , sendo que rij = 1, se i = j; rij = φ−12 σij se i 6= j e φ2 6= 0; e rij = 0 se

i 6= j e φ2 = 0, em que, σij = C(si, sj) = C(hij) e hij = ||si − sj || é a distância euclidiana.

Page 107: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

89

A forma específica para C(hij) depende do modelo escolhido para explicar a

dependência espacial, por exemplo, a família Matérn (Matérn 1986), na qual o parâmetro de

forma κ controla o comportamento próximo à origem e à suavização analítica do processo.

Sua função de covariância é dada por

C(hij) =

φ1 + φ2, i = j

φ22κ−1Γ(κ)

(hijφ3

(hijφ3

), i 6= j

(5.37)

em que, Kκ(δ) = 12

∞∫0

xκ−1e−12δ(x+x−1)dx é a função de Bessel modificada do terceiro tipo de

ordem κ > 0, e Γ(·) é a função gamma (Gradshteyn e Ryzhik 2000). No entanto, devido a

problemas de identificabilidade, usualmente, fixa-se cada valor de κ de acordo com o contexto

da aplicação, ou escolhe-se entre um conjunto limitado de valores (Genton 2012). A função de

covariância gaussiana é um caso particular da família Matérn quando κ→ ∞, sendo C(hij) =

φ2 exp(−(hij/φ3)2), se i 6= j, e para κ = 0, 5 tem-se a função de covariância exponencial, em

que C(hij) = φ2 exp(−(hij/φ3)). Diggle e Ribeiro Jr. (2007) recomendam ainda considerar

valores para o parâmetro de forma κ ∈ 1, 5; 2, 5.

5.3.2.2 Estimação dos parâmetros do processo espacial slash

Dado o modelo espacial linear em (5.35), em que Y ∼ SLn(Xβ,Σ, η), o interesse

é se obter a estimação do vetor de parâmetros desconhecidos θ = (β⊤,φ⊤)⊤, sendo β =

(β0, · · · , βq)⊤, e φ = (φ1, φ2, φ3)⊤. O parâmetro de forma η será considerado fixo para este

estudo com, variação no intervalo 0 < η < 1, (ver subseção 5.3.2.3).

A função verossimilhança para θ, baseada nas observações Y (s1), · · · , Y (sn) de Y ,

é obtida a partir de (5.32) e seu correspondente logaritmo da função verossimilhança é descrito

por

l(θ) = − log(η)+n

2log

(c(η)

)− 1

2log |Σ|+ log

(G(a, b)

). (5.38)

em que, G(a, b) é definida em (5.32), Σ tem estrutura conforme apresentada em (5.36).

Sem perda de generalidade, para a maximização de (5.38) optou-se pela utilização do

operador "vec", que transforma a matriz Σ em um vetor por sobreposição de colunas (Magnus

e Neudecker 1999). Assim, os estimadores θ de θ são encontrados a partir da solução do

sistema de equação homogêneo da função escore, dado por U(θ) = 0, cujos elementos são

U(β) = −2wG(·, δ)X⊤Σ−1ε e U(φ) = −1

2

∂vec⊤(Σ)

∂φvec[2wG(·, δ)

(Σ−1εε⊤Σ−1

)+Σ−1

],

sendo, ε = Y − Xβ, wG(·, δ) = −1

2

(ηp+ 2

ηδ

)P(a+ 1, b)

P(a, b). Detalhes das derivadas

∂vec⊤(Σ)

∂φcom respeito a φ = (φ1, φ2, φ3)

⊤ são apresentados no Apêndice 5.3.8.1.

Note que não existe solução analítica fechada para o sistema de equação da função

escore, dificultando a convergência dos estimadores dos parâmetros. Uma maneira de se

solucionar este problema é a utilização do algoritmo EM, um método computacional que

Page 108: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

90

gera aproximações por MV de forma iterativa (Lange e Sinsheimer 1993; Jamshidian 2001;

Watanabe e Yamaguchi 2004). Este método consiste em adicionar ao vetor de valores

observados um vetor de dados aleatórios. Assim, cria-se um conjunto de dados aumentados.

Isto permite simplificar a obtenção do estimador de MV pela maximização condicional em

relação a θ . Mais detalhes do algoritmo EM são apresentados no Apêndice 5.3.8.3.

Os erros padrões assintóticos associados aos estimadores de MV θ de θ podem ser

calculado a partir da inversa da matriz de informação esperada ou matriz de Fisher (I(θ)).

Supondo que a função suporte da distribuição slash atenda às condições de regularidade

(Lange et al. 1989; Mitchell 1989), é possível calcular I(θ) considerando uma versão empírica

dada por I(θ) = Eθ[U(θ)U(θ)⊤], em que, o valor esperado E(·) é tomado com respeito à fdp

definida em (5.32), cuja expressão matricial assume a forma

I(θ) =

Iββ(θ) 0

0 Iφφ(θ)

, (5.39)

que tem como elementos

Iββ(θ) = 4dg

nX⊤Σ−1X,

Iφφ(θ) =∂vec⊤(Σ)

∂φ

2fg

n(n+ 2)

(Σ−1 ⊗Σ−1

)Nn +

(fg

n(n+ 2)− 1

4

)vec(Σ−1)vec⊤(Σ−1)

∂vec(Σ)

∂φ⊤ ,

em que dg = E[w2G(·, δ)||Z||2

], fg = E

[w2G(·, δ)||Z||4

]. Considera-se aqui δ = ||Z||2, sendo

Z = Σ−1/2ε, Z ∼ SLn(0, In, η) e Nn =1

2(In2 + Kn), em que Kn é a matriz comutação de

ordem n2 × n2 (Magnus e Neudecker 1999).

5.3.2.3 Critério de seleção do parâmetro de forma η e do modelo de dependência

A escolha da modelagem espacial robusta com base na distribuição slash se torna

vantajosa, pois permite ajustar a curtose dos dados a partir de η. No entanto, a estimativa

por MV deste parâmetro recai sobre problemas de identificabilidade uma vez que se tem um

processo espacial estacionário de segunda ordem, na qual se conhece uma única realização

(Genton 2012). Isto implica que numa estimação por MV, tomando-se dois valores distintos

para o parâmetro de forma, haverá duas medidas de probabilidades equivalentes, ou seja,

para η1 6= η2, Y ∼ SLn(Xβ,Σ, η1) ≡ Y ∼ SLn(Xβ,Σ, η2) (ver Kano et al. 1993; Genton

2012).

Fato semelhante ocorre em relação à escolha do parâmetro de forma κ quando o

modelo teórico da família Matern é escolhido para explicar a dependência espacial, como

relatado por Zhang (2004). O autor mostra que sendo Y (si), si ∈ S, S ⊂ ℜd, d = 1, 2, ou

3 um processo estacionário de segunda ordem e isotrópico, com média constante e função

de covariância da família Matérn, como descrito em (5.37), o vetor de paramâmetros θ só é

estimado consistentemente se o parâmetro forma κ for conhecido ou fixado.

Page 109: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

91

Uma alternativa para se determinar o valor de η e do modelo para explicar a

dependência espacial mais adequada é a utilização de VC e Tr como um critério de escolha

(Kano et al. 1993; De Bastiani et al. 2015). A VC é definida como

V C =1

n

n∑

i=1

Y (si)− Y[i](si)

1− hii

2

, (5.40)

em que Y[i](si) = X⊤[i]β[i], sendo Xi a i-ésima linha da matriz X, β[i] o estimador de β,

ambas sem considerar a i-ésima observaçâo, e hii é o i-ésimo elemento da matriz de projeção

definida como H = X(X⊤Σ−1

X)−1X⊤Σ−1

para i = 1, . . . , n. O valor β[i] pode ser aproximado

por β[i] ≈ β + I−1

ββ(θ)U [i](β), em que Iββ(θ) é apresentado em (5.39) e

U [i]ˆ(β) = −2wG(·, δ[i])X⊤Σ

−1ε[i], (5.41)

em que, wG(·, δ[i]) = −1

2

(η(pn− 1) + 2

ηδ[i]

)P(a[i] + 1, b[i])

P(a[i], b[i]), a[i] =

(n− 1

2+

1

η

), b[i] =

(1

2c(η)δ[i]

)

e δ[i] = ε⊤[i]Σ−1

ε[i] com ε[i] = Y [i] −X[i]β, sendo a matriz X[i] de ordem (n− 1)× (q + 1) sem

a i-ésima linha, e Y (i) de ordem (n − 1) × 1 sem o i-ésimo valor da variável resposta, para

i = 1, . . . , n. Neste caso, a matriz Σ−1

é de ordem (n− 1)× (n− 1).

Já o método Tr consiste em calcular o traço da matriz de covariância assintótica da

média estimada, µ = Xβ, como um critério de escolha dos parâmetros fixos (Kano et al.

1993). Assim, é possível escrever:

Tr =n

4dgtr(X⊤X)(X⊤Σ

−1X)−1

. (5.42)

em que, dg = E[w2G(·, δ)||Z||2

]. Para os dois métodos, o valor de η e o modelo mais adequado

serão determinados pelos menores valores de VC e Tr. Outro critério usual, também adotado

neste trabalho, é a avaliação do máximo valor do logaritmo de verossimilhança (MLV).

5.3.3 Diagnóstico de influência

Um estudo importante na modelagem espacial é a verificação de possíveis

afastamentos das suposições feitas sob o modelo, bem como investigar a existência de

observações extremas com alguma interferência desproporcional e/ou influentes na estimação

dos parâmetros (Osorio 2009). Este estudo é conhecido como análise de diagnóstico e

é constituída de diferentes metodologias de avaliação, como análise de influência global e

Influência local.

5.3.3.1 Influência global

A análise de diagnóstico de influência global tem como objetivo avaliar o grau de

sensibilidade do modelo ou da estimatimativas dos parâmetros, quando uma observação

considerada influente é eliminada do conjunto de dados (Cook 1977; Zhu et al. 2001; Pan

et al. 2014). Uma das medidas mais utilizadas em estudo de influência global é a distância de

Page 110: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

92

Cook (Cook 1977) que, originalmente, foi desenvolvida para modelos normais e rapidamente

extendida para diversas classes de modelos. Sua forma é dada por:

Di(θ) = (θ[i] − θ)⊤M(θ[i] − θ), i = 1, . . . , n, (5.43)

sendo θ e θ[i] os estimadores do vetor de parâmetros θ, com e sem a i-ésima observação,

respectivamente, e M é uma matriz positiva definida que está diretamente relacionada ao

método de estimação (Zhu et al. 2001; Pan et al. 2014).

Uma estimação de θ[i] usando a aproximação de Newton-Raphson a um passo é

dado por θ(1)[i] = θ +

[− L[i](θ)

]−1U [i](θ), em que, L[i](θ) = ∂2l[i](θ)/∂θ∂θ

⊤, avaliada em

θ = θ e U [i](θ) é a função escore assintótica, ambas sem a i-ésima observação. Note que

a determinação de[− L[i](θ)

]−1pode se tornar computacionalmente difícil para amostras

suficientemente grandes. Pan et al. (2014) mostraram que é possível substituir L[i](θ) por

L(θ), ou ainda por I(θ) avaliada em θ = θ, bem como reduzir o tempo computacional, sem

grandes perdas de informações. Assim, a medida aproximada da estatística de Cook é dada

por

D∗i (θ) =

[U [i](θ)

]⊤[I(θ)

]−1[U [i](θ)

], (5.44)

que pode ser decomposta por D∗i (θ) = D∗

i (β) +D∗i (φ), sendo:

D∗i (β) =

[(U [i](β)

]⊤[Iββ(θ)

]−1[U [i](β)

]e D∗

i (φ) =[(U [i](φ)

]⊤[Iφφ(θ)

]−1[U [i](φ)

].

Não existe um consenso quanto à definição do valor de cutoff para avaliar se um ponto

é infuente ou não. Neste trabalho, propõe-se uma medida análoga à proposta por Zhu e

Lee (2001), que consideram a i-ésima observação influente se D∗i > D + 2sd(D), para i =

1, · · · , n, em que D = (D∗1, · · ·D∗

n) sendo que D e sd(D) representam a média e desvio padrão,

respectivamente.

5.3.3.2 Influência local

A influência local é embasada na geometria diferencial, e compara os estimadores dos

parâmetros antes e depois de algumas mudanças nos dados ou nas suposições do modelo,

feitas por um vetor de perturbação.

Assim, seja l(θ) o logarítmo da função verossimilhança para o vetor de parâmetros θ

do modelo dado em (5.35). Considere ainda l(θ|ω) o logaritmo da função verossimilhança

perturbada por ω, sendo ω = (ω1, · · · , ωn)⊤ ∈ Ω ⊂ ℜn um vetor perturbação, n × 1, em que

Ω é um conjunto aberto de pertubações e θω o estimador de MV obtida ao maximizar l(θ|ω).

Adicionalmente, seja ω0 ∈ Ω um vetor de não perturbação, n × 1, isto é, l(θ|ω0) = l(θ). Para

que sejam comparados o efeito da perturbação e a estabilidade do modelo ajustado, considere

o comportamento do afastamento da verossimilhança

LD(ω) = 2[l(θ)−l(θω)

], (5.45)

em torno de ω = ω0, sendo as diferenças produzidas representadas no gráfico LD(ω) versus

ω, formando a superfície de influência α(ω).

Page 111: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

93

Cook (1986) propõe detectar os possíveis pontos influentes ao investigar como α(ω)

se desvia de seu plano tangente em ω0. Para tal, o autor sugere estudar a curvatura normal

na direção h, dado por Cd = 2|h⊤Bh|, sendo h um vetor unitário, B = ∆⊤θω

− L(θ)

−1∆θω,

em que L(θ) é a matriz Hessiana avaliada em θ = θ e ∆θω = ∂2l(θ|ω)/∂θ∂ω⊤ é a matriz

de perturbação avaliada em θ = θ e ω = ω0. Veja detalhes da matriz Hessiana no Apêndice

5.3.8.2.

Neste trabalho utilizam-se duas medidas de referência para a identificação de possíveis

casos influentes na vizinhança de ω0. A primeira é dada por Cdi = 2|bii|/tr(2B) em que bii

representa os elementos da diagonal principal da matriz B com i = 1, · · · , n. Neste caso, a

i-ésima observação é considerada influente se Cdi > C + 2sd(C), sendo C = n−1∑n

i=1Cdi

e sd(C) o desvio padrão (Poon e Poon 1999; Zhu e Lee 2001). A segunda verifica as

maiores mudanças locais em LD(ω) por meio da medida |hmax|, sendo |hmax| o autovetor

unitário, normalizado, associado ao maior autovalor, em módulo, da matriz B (Cook 1986).

Similarmente, o caso i será considerado influente se |hmaxi| > h + 2sd(h), em que h denota

a média dos elementos, em valor absoluto, do vetor |hmax| e sd(h) o desvio padrão. O

gráfico com os elementos Cdi e |hmaxi| versus i (order of data) são plotados para revelarem os

possíveis pontos influentes.

Zhu et al. (2007) propuseram aferir se a escolha do vetor ω é adequada para o modelo

em estudo, considerando F (ω) = Eω

U(ω)U(ω)⊤

que é a matriz de informação esperada

de Fisher com respeito ao vetor de perturbação ω, sendo que U(ω) = ∂l(θ|ω)/∂ω é a função

escore pertubada e Eω a esperança. Segundo os autores, a perturbação ω é apropriada se

satisfaz a condição de F (ω0) = cIn em que, c > 0, o que, em geral, não acontece. Logo para

contornar este problema, eles propuseram uma parametrização do esquema de perturbação,

definida por

ω = ω0+c− 1

2F12 (ω0)(ω − ω0), (5.46)

tal que, F (ω), avaliada em ω0 seja igual a cIn.

Perturbação na variável resposta

Este esquema de perturbação pode ser utilizado quando o objetivo for avaliar a

sensibilidade das estimativas ao serem introduzidas pequenas perturbações nas componentes

de cada vetor de respostas. Neste caso, a perturbação para o vetor de respostas observadas

Y (s) = (Y (s1), ..., Y (sn))⊤ é incorporada fazendo de Y ω(s) = Y (s)+Aω, em que ω representa

um vetor de perturbação n-dimensional, isto é, ω = (ω1, · · · , ωn)⊤ ∈ ℜn, e A é uma matriz n×n,

simétrica e não singular, apropriadamente escolhida e que não depende de ω. O vetor de não

perturbação é dado por ω0 = 0 de ordem n× 1.

Desta forma, o logaritmo da verossimilhança perturbada é dado por

l(θ|ω) = − log(η)−n2log(2π) +

n

2log(c(η))− 1

2log |Σ|+ log

(G(a, bω)

), (5.47)

em que, bω = c(η)δω/2, δω = ε⊤ωΣ−1εω, com εω = (Y ω −Xβ) = (Y + Aω −Xβ) = (ε+ Aω)

Page 112: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

94

para 0 < η < 1, sendo ε = (Y −Xβ). A partir de (5.47), tem-se que a função escore pertubada

é da forma U(ω) = ∂l(θ|ω)/∂ω = 2wG(·, δω)AΣ−1εω, e,

F (ω) = 4Eω

U(ω)U(ω)⊤

= 4AΣ−1

dg

nΣ+ E

[w2G(·, δω)A(ωω⊤)A

]AΣ−1.

Ao avaliar F (ω) sob ω0, uma condição para satisfazer (5.46) é tomar A = Σ12 e gerar o vetor

de respostas observadas pertubado dado por Y ω = Y +Σ12ω/

√c, em que, c = 4dg/n.

Diferenciando l(θ|ω) com relação a θ e ω, restrito a θ = θ e ω = ω0, obtém-se a matriz

perturbação ∆θω = ∂2l(θ|ω)/∂θ∂ω⊤ = (∆⊤βω,∆

⊤φω)

⊤, que tem como elementos

∆βω = CX⊤Σ−1[wG(·, δ)Σ+ 2w

G(·, δ)εε⊤]Σ

−1/2e

∆φω =Cε⊤[∂

∂φvec⊤(Σ)w

G(·, δ)[vec(Σ

−1εε⊤Σ

−1/2)]+ wG(·, δ)

[ ∂∂φ

vec⊤(Σ1/2

)

+∂

∂φvec⊤(Σ)vec(Σ

1/2)]]

vec(Σ

−1),

sendo C = (−1/√dg/n), w

G(·, δ) = ∂(wG(·, δ))/∂δ, δ = ε⊤Σ−1

ε para ε = (Y −Xβ). Detalhes

sobre a ∂vec⊤(Σ1/2

)/∂φ podem ser encontrados em De Bastiani et al. (2015).

5.3.4 Estudo de simulação

O estudo de simulação foi aplicado com dois objetivos específicos: avaliar o

desempenho do método de VC, Tr e VML na determinação do parâmetro fixo η e na seleção

do modelo mais apropriado, e avaliar a performance da metodologia de análise de diagnóstico

na detecção de pontos influentes.

As variáveis aleatórias foram geradas a partir da simulação de Monte Carlo,

assumindo-se variáveis estacionárias com distribuição de probabilidade slash, cuja

representação estocástica é dada em (5.33). A matriz de covariância Σ tem estrutura espacial

conforme definida em (5.36), isotrópica. Os parâmetros de simulação iniciais foram escolhidos

com base nos estudos de Zang (2004). As simulações, análises geoestatísticas e de influência

local foram realizadas com auxílio do software R (www.R-project.org; R TEAM, 2015) e seus

pacotes: geoR (Ribeiro JR. e Diggle, 2001) e MASS (Venabels e Ripley, 2002).

5.3.4.1 Simulação 1: Determinação de η e seleção do modelo de dependência

Neste estudo, construiu-se inicialmente uma região de simulação regular A = (x, y) :[0; 0, 1] × [0; 0, 1] com 400 pontos. Duas técnicas de amostragem foram realizadas sobre

ela: sistemática e aleatória. Em cada técnica tamanhos amostrais n = 49 e n = 100

foram considerados, formando 4 grades amostrais. O valor de uma variável aleatória com

distribuição de probabilidade slash foi simulado em cada ponto de cada grade considerando

η = 0, 5 (verdadeiro valor), β = 0, φ1 = 0, 1, φ2 = 1, φ3 = 0, 01 e covariância descrita

Page 113: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

95

pelo modelo da família Matérn com κ ∈ 0, 5; 1, 5; 2, 5;κ → ∞. No caso k = 0, 5 (modelo

exponencial) e κ → ∞ (modelo gaussiano), considera-se C(hij) conforme descrito na Seção

5.3.2.1, envolvendo-se assim um menor número de parâmetros na simulação. Realizaram-se

500 réplicas em cada caso de cada cenário. As estimativas de MV θ de θ = (β⊤,φ⊤)⊤ foram

obtidas utilizando o algoritmo EM.

A Tabela 8 apresenta a porcentagem de reconhecimento do valor η = 0, 5 nos diferentes

critérios e modelos de dependência, sendo testados η ∈ 0, 75; 0, 50; η → 0 (note que η → 0

a distribuição normal é caso limite). Observa-se que nas grades geradas por amostragem

sistemática, com n = 49 e modelo exponencial o desempenho foi inferior a 90% e nos demais

casos a escolha variou de 90,6 a 93,6% para VC, de 91,2 a 95,6% para Tr, e 91,6 a 95,6%

para VML. Para n = 100, todos os critérios apresentaram reconhecimento superior a 90%,

incluindo o cenário considerando o modelo exponencial.

Na amostragem aleatória, note que para o modelo exponencial a performance dos

critérios foram inferiores a 90%, exceto no caso Tr com n = 100. Em particular para o modelo

Matérn com k = 1, 5, o critério VC apresentou desempenho inferior ao se comparar com a

grade sistemática. Nos demais modelos e tamanhos amostrais, a performance dos critérios

Tr e VML da amostragem aleatória foi similar a sistemática. Note que quando se aumenta o

tamanho amostral a performance de reconhecimento dos diferentes critérios melhora.

Tabela 8 Percentual de identificação obtidos pelos critéiros validação cruzada (VC), traço (Tr)e do máximo valor do logaritmo de verossimilhança (MVL) a partir de diferentesmodelos de dependência espacial, para dados simulados com η = 0, 5 (verdadeirovalor) e diferentes grades amostrais obtidas por amostragem sistemática e aleatória.

Sistemática Aleatória

n=49 n=100 n=49 n=100

Estrutura η VC Tr VML VC Tr VML VC Tr VML VC Tr VML

0,75 4,4 0 3,4 3,2 0 2,2 18,0 2,0 6,0 4,0 0 8,4

Exponencial 0,5 68,0 76,0 92,8 90,8 98,4 90,2 66,4 64,8 84,8 80,0 98,0 89,0

η → 0 27,6 24,0 4,0 8,0 4,0 7,6 15,6 33,2 9,2 16,0 2,0 2,6

Matérn 0,75 5,4 0 4,2 6,0 0 0 6,8 10,0 9,8 9,4 0,8 1,8

κ = 1, 5 0,5 90,6 92,6 92,4 90,6 97,8 93,8 86,4 80,4 87,4 88,8 97,8 94,8

η → 0 4,0 4,4 5,4 3,4 2,2 6,2 6,8 9,6 2,8 9,8 1,4 3,4

Matérn 0,75 2,4 3,8 2,6 2,2 1,4 2,8 6,8 7,4 5,8 4,4 6,0 4,2

κ = 2, 5 0,5 93,6 91,2 91,6 93,2 95,2 95,8 89,8 91,2 92,6 91,2 93,2 94,6

η → 0 4,0 5,0 5,8 6,6 3,4 1,4 3,4 1,4 1,6 2,4 0,8 1,2

0,75 6,0 0,4 1,4 1,4 0 2,6 6,8 4,2 4,4 2,8 0,2 1,4

Gaussiano 0,5 90,8 95,6 95,6 94,4 96,0 93,4 90,6 90,8 91,0 94,0 96,0 97,6

η → 0 3,2 4,0 3,0 4,2 4,0 4,0 2,6 4,0 4,6 3,2 3,8 1,0

Para avaliar a eficiência do estimador θi empiricamente, usou-se a medida do erro

quadrático médio (EQM ) dado por: EQM(θi) =1r

∑rj=1(θij − θi)

2 em que, θij é a estimativa

de MV de θi ∈ β, φ1, φ2, φ3 na j-ésima réplica e j = 1, · · · , 500. A Tabela 9 apresenta os

valores obtidos para os correspondentes estimadores nas diferentes grades no caso η = 0, 5.

Na amostragem sistemática, comparando-se n = 49 com n = 100, verifica-se que ocorre

Page 114: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

96

decréscimo dos EQM dos estimadores φ1, φ2 e φ3 em todos os modelos testados. Já na

amostragem aleatória, o decréscimo ocorreu para os estimadores φ2 e φ3. Note que na

amostragem aleatória, os EQM dos parâmetros estimados são menores do que os valores

obtidos em relação à amostragem sistemática, na maioria dos modelos testados.

Tabela 9 Erro quadrático médio (EQM ) dos parâmetros estimados por máximaverossimilhança (MV) pelo algoritmo EM nas diferentes grades amostrais obtidas poramostragem sistemática e aleatória e simuladas considerando η = 0, 5.

EQM(θi) - Sistemática

n=49 n=100

Estrutura β φ1 φ2 φ3 β φ1 φ2 φ3

Exponencial 1,6130 0,0587 0,9062 0,0801 1,8241 0,0085 0,8835 0,0007

Matérn, κ = 1, 5 0,9845 0,1002 0,2644 0,0098 0,0503 0,0400 0,0107 0,0001

Matérn, κ = 2, 5 0,1447 0,9908 0,4501 0,0102 1,8349 0,0187 0,2760 0,0019

Gaussiano 0,0827 0,7854 0,1770 0,0008 0,6896 0,0019 0,1194 0,0001

EQM(θi) - Aleatória

n=49 n=100

Estrutura β φ1 φ2 φ3 β φ1 φ2 φ3

Exponencial 0,9851 0,0017 0,8331 0,0002 0,2713 0,0050 0,0741 0,0001

Matérn, κ = 1, 5 0,0175 0,0011 0,0870 0,0003 0,1252 0,0067 0,0021 0,0001

Matérn, κ = 2, 5 0,0471 0,3250 0,2008 0,0125 0,0509 0,0450 0,1179 0,0001

Gaussiano 0,1055 0,0010 0,1108 0,0008 0,0112 0,0056 0,0667 0,0005

5.3.4.2 Simulação 2: Análise de diagnóstico de influência

Considerando a grade gerada por amostragem sistemática com n = 100 e os os

mesmos valores iniciais para estrutura espacial definidos na Seção 5.3.4.1, simularam-se 100

réplicas considerando η = 0, 75; 0, 50 e η → 0 e os modelos de ajustes exponencial, gaussiano

e Matérn com parâmetro de forma κ = 1, 5. O conjunto amostral foi contaminado considerando

seu valor máximo, utilizando a expressão Ymax = Ymax + d√Y ⊤Y proposta por Galea, et al.

(2008), em que d ∈ [0, 1]. Aqui assume-se d = 0, 5. Avaliou-se o desempenho das 5 medidas

de influências propostas (D∗i (β), D

∗i (φ), D

∗i (θ), Cdi, hmax), a partir do reconhecimento do Ymax

como um valor influente, considerando as desigualdades descritas na seção ?? como ponto

de corte.

Os resultados obtidos se encontram na Tabela 10. Verifica-se que quando a distribuição

dos dados se aproximam da normal (η → 0), as diferentes técnicas de diagnóstico mostraram

elevada porcentagem de reconhecimento, associando o Ymax como influente na estimação

dos parâmetros. No entanto, quando η → 1, percentual menor foi asociado com o

valor contaminado. É possível observar que, para o diagnóstico de influência global, os

maiores percentuais de reconhecimento do ponto extrapolado estão associados à medida

D∗i (β), contrapondo-se à medida D∗

i (φ), que apresentou menores valores. Estes resultados

mostraram que o uso de distribuições que têm caudas mais pesadas proporciona maior

robustez por ser menos sensível à presença de outliers. Para os demais tamanhos amostrais,

Page 115: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

97

os resultados foram similares e serão omitidos aqui.

Tabela 10 Porcentagem de casos em que o valor máximo extrapolado na amostra simulada foiidentificada como potencialmente influente (Ymax = Ymax + 0, 5

√Y ⊤Y ).

Medida de diagnóstico

η Estrutura D∗

i (β) D∗

i (φ) D∗

i (θ) Cdi hmax

Exponencial 65 47 67 61 57

0,75 Matérn; κ = 1, 5 61 53 65 67 56

Gaussiano 64 43 65 61 58

Exponencial 67 59 65 67 61

0,50 Matérn; κ = 1, 5 69 61 61 65 59

Gaussiano 69 63 65 68 61

Exponencial 94 80 94 95 87

η → 0 Matérn; κ = 1, 5 93 86 94 91 89

Gaussiano 93 83 93 89 86

5.3.5 Aplicação a dados reais

5.3.5.1 Estudo 1: Dados de um aquífero

Neste estudo consideram-se dados de 93 poços pertencentes a um aquífero no Vale

de Saratoga, perto de Wyoming, disponíveis em Jones (1989). A altura da água em cada

poço, denotada por Y (si), está em metros acima do nível do mar e as coordenadas x e

y estão em quilômetros (km). Como em Christensen et al. (1992) e De Bastiani et al.

(2015), considerou-se a função de covariância gaussiana. O modelo espacial estabelecido

foi Y (si) = β0 + β1x1(si) + β2x2(si) + ǫ(si), em que x1 = x, x2 = y. Para este conjunto

de dados, os critérios VC, Tr e VML indicaram um valor de η = 0, 18. As estimativas

dos parâmetros e seus repectivos desvios padrões assintóticos (entre parênteses) foram:

β0 = 2245, 708(30.1763), β1 = −0, 6521(1, 2026), β3 = −3, 0191(1, 2026), φ1 = 22, 7659(9, 7588),

φ2 = 767, 5909(323, 3945), φ3 = 7, 1449(0, 0007), resultando em um raio de dependência

espacial estimado al = 12, 146 km.

As Figuras 8a e 8b apresentam a análise de influência global. Note que a observação

#1 é considerada influente na estimação do vetor de parâmetros β, enquanto que as

observações #49 e #50 são influentes na estimação do vetor de parâmetros φ. Já no estudo

de influência local, as Figuras 8c e 8d indicaram valores diferentes, sendo eles #19, #22, #23

e #78. Christensen et al. (1992) utilizaram diagnóstico de deleção de casos e modelo linear

espacial gaussiano (LEG) diagnosticaram como observações influentes os pontos #1, #2, #49,

#50 e #69. Uribe-Opazo et al. (2012), utilizaram o modelo LEG e uma medida análoga à

distância de Cook e identificaram os pontos #1, #49 e #64. De Bastiani et al. (2015), ao

aplicarem diagnóstico de influência local sob o modelo espacial linear elíptico, encontraram os

pontos #1, #22, #78, #79,#81 e #85 ao considerarem a distribuição normal e os pontos #1 e

#2 no caso da distribuição t-student e ν = 5 (grau de liberdade).

Page 116: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

98

0 20 40 60 80

0.00

0.02

0.04

0.06

0.08

Index

1

(a) D∗

i β

0 20 40 60 80

0.5

1.0

1.5

2.0

2.5

3.0

Index

50

49

(b) D∗

i φ

0 20 40 60 80

0.00

0.02

0.04

0.06

0.08

Index

Cdi

19

22

23

78

(c) Cdi

0 20 40 60 80

0.00

0.05

0.10

0.15

0.20

0.25

0.30

0.35

Index

|hm

ax|

19 2378

(d) hmaxi

Figura 8 Gráficos de influência global sob o vetor de parâmetros β (a) e de estrutura espacialφ (b); Gráficos de influência local Cdi× ordem (c) e hmaxi

× ordem (d) pertubando avariável resposta para dados de Jones (1989).

5.3.5.2 Aplicação aos dados de engenharia agrícola

Este estudo avalia 87 dados referentes à concentração de ferro [Fe] (mg dm−3) no

solo de uma área comercial de produção de grãos de 167,35 ha. A mesma fica localizada

no município de Cascavel, região Oeste do Paraná - Brasil, cujas coordenadas geográficas

são, aproximadamente, 24,95o S/53, 57o W, com altitude média de 650 m. Os dados foram

obtidos por amostragem sistemática lattice plus close pairs. Esta área é monitorada desde

2009, sendo utilizadas neste trabalho as informações referentes ao ano agrícola 2010/2011. A

escolha da variável esta realicionada a alta curtose associado aos dados. Mais detalhes da

área podem ser encontrados em Grzegozewski et al. (2013).

A análise exploratória dos dados indicou média amostral de 34,08 mg dm−3, sendo

o desvio padrão, coeficiente de variação e de curtose iguais a 8,28, 24,30%, e 18,38,

respectivamente. Estas estatísticas descritivas indicam dispersão em torno do valor médio

Page 117: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

99

e alto nível de curtose. Foi identificada a presença de um valor discrepante, que corresponde

a amostra #82, localizada na região Norte/Oeste da área. Observou-se que os vizinhos mais

próximos apresentaram valores inferiores de concentração de Fe, segundo a classificação por

quartis. Uma análise padrão dos semivariogramas direcionais usando as direções 00, 450, 900

e 1350 mostrou que os semivariogramas direcionais possuem comportamento semelhante até

aproximadamente 0,750 km. Portanto, pode-se assumir comportamento isotrópico até essa

distância.

O modelo espacial linear da concentração de Fe na área em estudo pode ser descrito

como, Y = Xβ + ǫ com, X = 1n e β = µ. O alto valor da curtose indica que a utilização

do modelo LES poderá proporcionar uma modelagem mais robusta. Assim, considerando

ǫ ∼ SLn(0,Σ, η), os critérios de VC, Tr e VML indicaram que o valor adequado para o ajuste

da curtose é η = 0, 25 e o modelo mais adequado para explicar a dependência espacial é o

gaussiano.

Os parâmetros estimados por MV utilizando o algoritmo EM e seus repectivos erros

padrões assintóticos encontram-se na Tabela 11. Para fins de comparação, estudou-se o

mesmo conjunto de dados considerando o modelo LEG, em que ǫ ∼ Nn(0,Σ). Os valores

estimados são apresentados na Tabela 11. Nota-se que os valores de β foram próximos entre

si, no entanto, verifica-se diferença ao se compararem os valores estimados de φ, sendo que

os maiores valores do erro padrão assintótico estão associados ao modelo LEG.

Tabela 11 Valores dos parâmetros η e κ escolhidos pelos critéiros validação cruzada(VC), traço (Tr) e do máximo valor do logaritmo de verossimilhança (MVL)e estimativas de máxima verossimilhança (MV) obtidos via algoritmo EM dosparâmetros dos modelos LEG e LES, com respectivos desvios padrões assintóticos(entre parênteses), relacionando os casos considerados influentes na análise dediagnóstico.

Modelo Estrutura η β φ1 φ2 φ3 al (km)

LES Gaussiano 0,35 34,5451 10,4534 44,0525 0,118 0,2044

(1,2264) (10,3188) (9,9004) (0,0001)

LEG Gaussiano - 35,5221 9,1368 60,9531 0,2012 0,348

(1,8682) (15,3051) (14,8505) (0,0013)

LES excluindo #82 Matérn 0,05 33,7624 23,7120 11,8700 0,2306 1,095

κ = 1, 5 (1,0920) (6,2984) (7,5763) (0,0099)

LES excluindo #22, #31, Gaussiano 0,25 35,5422 7,1237 59,5827 0,2270 0,393

e #60 (1,9221) (4,4095) (13,3322) (0,0011)

LES excluindo #5, #6, Matérn 0,05 33,8919 23,2449 12,5593 0,2808 1,3338

#32 e # 82 κ = 1, 5 (1,1044) (6,6221) (8,0534) (0,0095)

LES excluindo #5, #6 Matérn 0,25 35,5640 18,5641 59,9113 0,1438 0,683

e #32 κ = 1, 5 (1,6609) (14,7328) (7,8853) (0,0016)

LES: modelo Linear espacial slash; LEG: modelo linear espacial gaussiano

Para avaliar a performance de cada modelo, utilizaram-se os critérios VML e de

informação de Akaike dado por AIC = −2l(θ) + 2r, em que l(θ) é o logaritmo da função

verossimilhança para o parâmetro θ associado ao modelo avaliado em θ = θ e r é a dimensão

Page 118: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

100

do espaço paramétrico. Um modelo com AIC menor e VML maior será o mais adequado.

Os valores encontrados foram VML = −325, 67 e AIC = 659.8221 para o modelo LEG e

VML = −304, 8109 e AIC = 617.6218 para o modelo LES, os quais indicam que o último é a

escolha mais adequada.

Para verificar a presença de possíveis pontos influentes que possam interferir na

qualidade do ajuste do modelo LES, aplicou-se a análise diagnóstico. A influência global

mostra que o valor identificado como outlier foi influente na estimação do parâmetro β (Figura

9a) e, para o vetor de parâmetros φ, as observações influentes foram #22, #31 e #60 ( Figura

9b). Já a análise de influência local considerando as medidas Cdi e hmax (Figura 9c e 9d),

identificaram conjuntamente como influentes as amostras #5, #6, e #32, sendo o ponto #82

detectado apenas pela medida Cdi.

0 20 40 60 80

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

Index

82

(a) D∗

i β

0 20 40 60 80

02

46

8

Index

31

6022

(b) D∗

i β

0 20 40 60 80

0.00

0.05

0.10

0.15

Index

Cdi

5

632

82

(c) Cdi

0 20 40 60 80

0.0

0.2

0.4

0.6

0.8

Index

h max

i 5

6 32

(d) hmaxi

Figura 9 Gráficos de influência global sob o vetor de parâmetros β (a) e de estrutura espacialφ (b); Gráficos de influência local Cdi× ordem (c) e hmaxi

× ordem (d) perturbando avariável resposta para dados de Fe.

Na análise de diagnóstico em modelagem espacial, uma vez detectado um ou mais

Page 119: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

101

pontos influentes, esses são removidos do conjunto de dados para investigar como sua retirada

afeta na seleção do modelo, estimação dos parâmetros e construção dos mapas. Na Tabela

11 encontram-se os valores de η e κ selecionados utilizando a VC, Tr e VML e os parâmetros

estimados do modelo LES utilizando o algoritmo EM após exclusão. Verifica-se que a retirada

dos pontos considerados influentes alterou os parâmetros estimados e, em alguns casos,

reduziu o valor dos desvios padrões assintóticos quando comparado com o modelo sem

exclusão. Porém, nota-se que, em todos os casos, o raio de dependência espacial estimado

(al) aumentou, principalmente quando o ponto #82 foi retirado. Isto se deve a uma mudança

no modelo de covariograma escolhido para descrever a variabilidade espacial.

A Figura 10 exibe os mapas de contorno da concentração de Fe pela interpolação

por krigagem ordinária e os parâmetros apresentados na Tabela 11. Os mapas foram

gerados com base nos cenários: (i) usando o modelo LES e todo o conjunto de dados

(mapa de referência), (ii) usando o modelo LEG, e (iii) usando o modelo LES e removendo

as observações consideradas influentes de acordo com o critério de análise de diagnóstico

aplicado. Para a construição dos mapas, consideram-se cinco classes obtidas pela divisão em

partes iguais do intervalo de varição da concentração de Fe estimada.

De acordo com os mapas da Figura 10, verificam-se diferenças entre os mapas gerados

no cenário (iii) (Figura 10c a 10f) e o mapa de referência (Figura 10a), principalmente o

construído a partir da retirada do ponto #82 (Figura 10c) quando aplicada a medida D∗i (β),

e dos pontos #5, #6, #32 e #82 (Figura 10e) quando do uso da medida Cdi. Os índices de

Exatidão glogal (EG) e kappa foram calculados com o objetivo de avaliar a acurácia dos mapas

após a retirada dos pontos influentes. No casoD∗i (β), tem-seEG = 0, 78 e paraCdi EG = 0, 77.

De acordo com a classificação de Anderson et al. (1976), tais valores indicam que, quando

comparado com o mapa de referência, os mapas em que o #82 foi retirado apresentaram

baixa similaridade. Tomando-se como base a classificação de Krippendorff (2004) para o

índice kappa, obteve-se resultado semelhante. Nos demais casos, os valores de EG indicam

elevada similaridade e o índice kappa de média a alta similaridade.

5.3.6 Discussões e conclusão

Este trabalho propôs um modelo espacial com distribuição slash e segundo momento

finito como alternativa ao modelo LEG. O modelo possibilita o ajuste da curtose dos dados a

partir da determinação do parâmetro de forma η, a fim de superar distorções na especificação

do modelo, causadas por possíveis outliers, tornando a modelagem mais robusta. Propôs-se

a utilização dos critérios de seleção VC, Tr e VML para escolha do modelo de dependência

usado para explicar a variabilidade espacial, determinar o parâmetro η e contornar problemas

de identificabilidade.

Page 120: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

102

239.5 240.0 240.5 241.0

7237

.072

37.5

7238

.072

38.5

X Coord

Y C

oord

↑ N [21.79; 32.87](32.87; 43.95](43.95; 55.03](55.03; 66.11](66.11;77.19]

(a) Modelo LES com todos os pontos

239.5 240.0 240.5 241.0

7237

.072

37.5

7238

.072

38.5

X Coord

Y C

oord

↑ N [21.79; 32.87](32.87; 43.95](43.95; 55.03](55.03; 66.11](66.11;77.19]

(b) modelo LEG

239.5 240.0 240.5 241.0

7237

.072

37.5

7238

.072

38.5

X Coord

Y C

oord

↑ N [21.79; 32.87](32.87; 43.95](43.95; 55.03](55.03; 66.11](66.11;77.19]

(c) LES removendo o ponto #82

239.5 240.0 240.5 241.0

7237

.072

37.5

7238

.072

38.5

X Coord

Y C

oord

↑ N [21.79; 32.87](32.87; 43.95](43.95; 55.03](55.03; 66.11](66.11;77.19]

(d) LES removendo o ponto #22, #31 e

#60

239.5 240.0 240.5 241.0

7237

.072

37.5

7238

.072

38.5

X Coord

Y C

oord

↑ N [21.79; 32.87](32.87; 43.95](43.95; 55.03](55.03; 66.11](66.11;77.19]

(e) LES removendo os pontos #5, #6,

#32 e #82

239.5 240.0 240.5 241.0

7237

.072

37.5

7238

.072

38.5

X Coord

Y C

oord

↑ N [21.79; 32.87](32.87; 43.95](43.95; 55.03](55.03; 66.11](66.11;77.19]

(f) LES removendo os pontos #5, #6 e

#32

Figura 10 Mapas de contorno para concentração de Fe (mg dm−3): Modelo LES com todosos pontos (a); modelo LEG (b); LES com a remoção do ponto #82 (c); LES com aremoção dos pontos #22, #31 e #60 (d); LES com a remoção dos pontos #5, #6, #32e #82 (e); LES com a remoção dos pontos #5, #6 e #32 (f).

Os resultados da simulação, Tabela 8, indicaram que o modelo de dependência

exponencial e modelo Matérn com κ = 1, 5 apresentaram as menores porcentagens de

reconhecimento entre os diferentes métodos. No entanto, nota-se que o aumento do tamanho

amostral melhora a performance dos dois. Este comportamento pode estar relacionado à

suavização analítica do processo, provocado pelo parâmetro de forma κ e a diferenciabilidade

Page 121: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

103

latente do processo (Diggle e Ribeiro Jr. 2007). Porém, vale ressaltar que, em pelo menos um

dos critérios, o percentual foi superior a 89%. Assim, para escolha mais confiável, os critérios

de seleção devem ser utilizados conjuntamente.

Discutiu-se a estimatição de parâmetros por MV via algoritmo EM, a partir de

expressões analíticas para a função escore e matriz de informação de Fisher. Estas

expressões permitiram determinar os erros padrões assintóticos associados às estimativas dos

parâmetros. Além disso, a forma bloco diagonal da matriz de informação de Fisher possibilitou

decompor a medida de influência global sobre o parâmetro θ em duas medidas independentes,

uma relacionada ao vetor de efeito fixo β e outra sobre o vetor de efeito aleatório φ. As

simulações de Monte Carlo e estudo com dados reais, (veja Figura 8 e Figura 9), mostraram

que a estimação do parâmetro β é mais influenciada por outliers do que a estimação do vetor

φ.

As simulações relacionadas com a análise de diagnóstico, apresentadas na Tabela 3,

mostraram que o valor contaminado não foi detectada em todas as medidas de diagnóstico

aplicadas a cada réplica. Militino et al. (2006) utilizaram a distância de Cook (1977)

encontraram resultados semelhantes em estudos de simulações. Os autores mostraram

que elevados pontos de alavanca não são os únicos que influenciam no processo preditivo.

Uribe-Opazo et al. (2012), considerando o modelo LEG e Assumpção et al. (2014) para

modelos t-Student, aplicaram técnicas de diagnóstico de influência global e local e também

encontraram diferenças entre os pontos influentes e outlier. Portanto, a utilização simultânea

de diferentes medidas de diagnósticos de influência são necessários para evitar efeito perigoso

de mascaramento na análise espacial.

Finalmente, percebe-se pela Tabela 11 (Estudo 2) que a remoção dos pontos influentes

causou mudanças no raio de dependência espacial estimado, al, e por conseguinte, aumentou

o alcance prático. Nota-se que quando o ponto #82 foi excluído, o valor selecionado de η =

0, 05, aproximou a distribuição assintótica dos dados do processo gaussiano, uma vez que

para η → 0 tem-se a distribuição normal como caso limite (Lange e Sinsheimer 1993). Quando

avaliado em particular os mapas em que o ponto #82 foi removido, nota-se que a região com

alto índice de Fe deixou de ser detectada. Todavia, isso não ocorre quando o modelo LES é

aplicado com todos os pontos. Quando relacionado ao estudo agrícola, tal remoção pode ser

um problema, pois deixa-se de investigar uma área limitante para o crescimento da planta.

5.3.7 Referências

Abramowitz, M., and Stegun, I. ( 1970), Handbook of mathematical functions DoverPublications, New York.

Akaike, H. (1974), “A new look at statistical model identification,” IEEE Transactions onAutomatic Control, 19, 716-723.

Alcantara, I. C., and Cysneiros, F. J. A. (2013), “Linear regression models with slash-elliptical

Page 122: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

104

errors,” Computational Statistics and Data Analysis, 64, 153-164.

Anderson, J. F., Hardy, E. E., Roach, J. T., and Witmer, R. E. (1976), “A land use and land coverclassification system for use with remote sensor data,” U.S. Geological Survey ProfessionalPaper 964, Washington.

Assumpção, R. A. B., Uribe-Opazo, M. A. and Galea, M. (2014),“ Analysis of local influence ingeostatistics using Student-t distribution,” Journal of Applied Statistics, 41, 2323-2341.

Belsley, D. A., Kuh, E., and Weslsh, R. E. (1980), “Regression diagnostics: identifying influentialdata and sources of collinearity,” John Wiley, New York.

Borssoi, J. A., Uribe-Opazo, M. A., Galea, M. (2011), “Técnicas de diagnóstico de influênciaLocal na análise espacial da produtividade da soja,” Engenharia agrícola, 31, 376-387.

Christensen, R., Johnson, W., and Pearson L. (1996), “Crediction diagnostics for spatial linearmodels,” Biometrika, 79, 583-591.

Cook, R. D. (1977), “Detection of influential observations in linear regression,” Technometrics,19(1), 15-18.

Cook, R. D. (1986), “Assessment of local influence,” Journal of the Royal Statistical Society, B48, 133-169.

De Bastiani, F., Mariz de Aquino Cysneiros, A. H., Uribe-Opazo, M. A., and Galea, M. (2015),“Influence diagnostics in elliptical spatial linear models,” TEST, 24 (2), 322-340.

Diggle, P.J., and Ribeiro Jr., P. J. (2007), Model-based Geostatistics Springer, New York.

Galea, M., Díaz-García, J. A., and Vilca, F. (2008), “Influence diagnostics in the capital assetpricing model under elliptical distributions,” Journal of Applied Statistics, 35, 179-192.

Genton, M., and Zhang, H., (2012), “Identifiability problems in some non-gaussian spatialrandom fields,” Chilean Journal of Statistics, 3 (2), 171-179.

Gradshteyn, I., and Ryzhik, I. (2000), Tables of Integrals, Series and Products Academic Press,New York.

Grzegozewski, D. M., Uribe-Opazo, M ., De Bastiani, F., and Galea, M. (2013) “Localinfluence when fitting gaussian spatial linear models: an agriculture application,” Ciencia andInvestigación Agraria, 40, 235-252.

Jamshidian, M. (2001), “A note on parameter and standard error estimation in adaptive robustregression,” Journal of Statistics Computation and Simulation, 71, 11-27.

Jones, R. (1989), “Fitting a stochastic partial differential equation to aquifer data,” Stoch HydrolHydraul, 3, 85-96.

Kano, Y., Berkane, M., and Bentler, P. M. (1993), “Statistical inference based on

Page 123: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

105

pseudo-maximum likelihood estimators in elliptical populations,” Journal of the AmericanStatistical Association, 88 (421), 135-143.

Krippendorff, K. (2004), Content Analysis: an Introduction to its Methodology Sage, ThousandOaks.

Lange, K., Little, R., and Taylor, J. (1989), “Robust statistical modeling using the t distribution,”Journal of the American Statistical Association, 84, 881-896.

Lange, K., and Sinsheimer, J. S. (1993), “Normal/independent distributions and theirapplications in robust regression,” Journal of Computational and Graphical Statistics, 2,175-198.

Magnus, J., and Neudecker, H. (1999), Matrix differential calculus with applications in statisticsand econometrics John Wiley & Sons, New York.

Mardia, K., and Marshall, R. (1984), “Maximum likelihood estimation of models for residualcovariance in spatial regression,” Biometrika, 71, 135-146.

Matérn, B. (1986), Lecture notes in statistics Springer, New York.

Matheron, G. (1963), “Principles of geoestatistics,” Economic Geology, 58 (1), 1246-1266.

Militino, A., Palacius, M., and Ugarte, M. (2006), “Outliers detection in multivariate spatial linearmodels,” Journal of Statistical Planning and Inference, 136, 125-146.

Mitchell, A. (1989), “The information matrix, skewness tensor and α-connections for the generalmultivariate elliptic distribution,” Annals of the Institute of Statistical Mathematics, 41, 289-304.

Osorio, F., Paula, G., and Galea, M. (2009), “On estimation and influence diagnostics for thegrubbs model under heavy-tailed distributions,” Computational Statistics and Data Analysis, 53(4), 1249-1263.

Pan, J., Fei, Y., and Foster, P. (2014), “Case-deletion diagnostics for linear mixed models,”Technometrics, 56 (3), 269-281.

Poon, W., and Poon, Y. S. (1999), “Conformal normal curvature and assessment of localinfluence,” Journal of the Royal Statistical Society, B 61, 51-61.

Ribeiro Jr., P. J., and Diggle, P. J. (2001), “Geor: a package for geostatistical analysis,” R-NEWS1 (2), 15-18.

Team, R. D. C. (2016), R: A Language and Environment for Statistical Computing, R Foundationfor Statistical Computing, Vienna, Austria.

Uribe-Opazo, M., Borssoi, J., and Galea, M. (2012), “Influence diagnostics in gaussian spatiallinear models,” Journal of Applied Statistics, 39 (3), 615-630.

Venables, W. N., and Ripley, B. D. (2002), Modern Applied Statistics with S Springer, New York.

Page 124: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

106

Watanabe, M., and Yamaguchi, K. (2004), The EM algorithm and related statistical modelsMarcel Dekker, New York.

Zhang, H. (2004), “Inconsistent estimation and asymptotically equivalent interpolations inmodel based geostatistics,” Journal of the American Statistical Association, 99, 250-261.

Zhu, H., Ibrahim, J., Lee, S., and Zhang, H. (2007), “Perturbation selection and influencemeasures in local influence analysis,” Annals of Statistics, 35, 2565-2588.

Zhu, H. T., Lee, S. Y., Wei, B. C., and Zhou, J. (2001), “Case-deletion measures for models withincomplete data,” Biometrika, 88, 727-737.

Page 125: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

107

5.3.8 Apêndices

5.3.8.1 Apêndice I:Derivada da matriz de covariância

Seja a estrutura da matriz de covariância conforme definida em (5.36), em que φ =

(φ1, φ2, φ3)⊤, são os parâmetros desconhecidos, In é a matriz identidade de ordem n × n

e a matriz R n × n, simétrica é descrita pelo modelo da família Matérn, com parâmetro de

forma κ fixo. Aplicando-se o operador "vec", tem-se que, vec⊤(Σ) = φvec⊤(I)+φ2vec⊤R(φ3).

Consequentemente,∂vec⊤(Σ)

∂φ=∂φ1vec⊤(I)

∂φ+∂φ2vec⊤R(φ3)

∂φ. (5.48)

A primeira parte da Equação 5.48 é dada por:

∂φ1vec⊤(I)∂φ

=

(∂φ1vec⊤(I)

∂φ1

,∂φ1vec⊤(I)

∂φ2

,∂φ1vec⊤(I)

∂φ3

)⊤= (vec⊤(I), 0, 0)⊤,

e segunda parte de (5.48) por:

∂φ2vec⊤R(φ3)

∂φ=

(∂φ2vec⊤R(φ3)

∂φ1

,∂φ2vec⊤R(φ3)

∂φ2

,∂φ2vec⊤R(φ3)

∂φ1

)⊤

=

(0, vec⊤

(∂R(φ3)

∂φ2

), φ2vec⊤

(∂R(φ3)

∂φ3

))⊤.

Assim, a solução da Equação 5.48 é uma matriz 3× p2, dada por:

∂vec⊤(Σ)

∂φ=

(vec⊤(I), vec⊤R(φ3), φ2vec⊤

(∂R(φ3)

∂φ3

) )⊤.

Os valores da ∂R(φ3)/∂φ3, para a função de covariância da família Matérn, são apresentados

em Uribe-Opazo et al. (2012).

5.3.8.2 Apêndice II:A Matriz Hessiana

Seja o logaritmo da função verossimilhança, l(θ), conforme (5.38). A matriz de

Hessiana é dada por L(θ) =∂2l(θ)

∂θ∂θ⊤ , cujos elementos são:

L(ββ)(θ) =∂2l(θ)

∂β∂β⊤ = wG(·, δ)∂2δ

∂β∂β⊤ + w′

G(·, δ)∂δ

∂β

∂δ

∂β⊤

= 2X⊤[wG(·, δ)Σ−1 + 2w

G(·, δ)Σ−1εε⊤Σ−1

]X,

sendo, ε = Y −Xβ, w′

G(·, δ) =∂

∂δwG(·, δ) =

1

δ2

[(S − b)(a− S) + S

],com S =

γ(a+ 1, b)

γ(a, b), a e

b definido em (5.38) e γ(·, ·) a função gamma incompleta.

L(βφ) =∂2l(θ)

∂β∂φ⊤ = wG(·, δ)∂2δ

∂β∂β⊤ + w′

G(·, δ)∂δ

∂β

∂δ

∂β⊤

= 2X⊤wG(·, δ)

[ε⊤ ⊗ Ip

]+w

G(·, δ)[Σ−1ε

][ε⊗ ε

][(Σ−1 ⊗Σ−1)

]∂vec(Σ)

∂φ⊤ ;

Page 126: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

108

L(βφ) = L⊤(φβ),

sendo;

L(φφ) =∂2l(θ)

∂φ∂φ⊤ = −1

2

∂2

∂φ∂φ⊤

[log |Σ|

]+ wG(·, δ)

∂2δ

∂φ∂φ⊤ + w′

G(·, δ)∂δ

∂φ

∂δ

∂φ⊤ ,

sendo:

∂2

∂φ∂φ⊤

[log |Σ|

]= −

∂vec⊤(Σ)

∂φ[Σ−1 ⊗Σ−1]

∂vec(Σ)

∂φ⊤ + [vec⊤(Σ−1)⊗ Ip]∂vec

∂φ⊤

[∂vec⊤(Σ)

∂φ

],

∂2δ

∂φ∂φ⊤ = 2∂vec⊤(Σ)

∂φ

[Σ−1 ⊗Σ−1εε⊤Σ−1

]∂vec(Σ)

∂φ⊤

vec⊤[Σ−1 ⊗Σ−1εε⊤Σ−1

]⊗ Ip

∂vec

∂φ⊤

[∂vec⊤(Σ)

∂φ

],

em que, Ip é a matriz identidade de ordem p = 3 parâmetros, e

∂δ

∂φ

∂δ

∂φ⊤ =∂vec⊤(Σ)

∂φ

(Σ−1 ⊗Σ−1)

[εε⊤ ⊗ ε(ε⊤

](Σ−1 ⊗Σ−1)

∂vec

∂φ⊤

[∂vec⊤(Σ)

∂φ

].

5.3.8.3 Apêndice III:Detalhes do algoritmo EM

Para o algoritmo EM, cada iteração é formada pelos passos a seguir: Esperança (passo

E) e Maximização (passo M). Seja Y c = (Y ⊤obs,Y

⊤mis)

⊤ o vetor de dados completos, tal que

Y obs seja o vetor de dados observados e Ymis o vetor de dados adicionados, associado à

variável mistura. Y ∼ SLn(Xβ,Σ, η), V ∼ Beta(1

η, 1

). A distribuição condicional de Y dado

V é normal n-variada com vetor de média Xβ e matriz de covariância (c(η)v)−1Σ, ou seja,

(Y |V = v) ∼ Np(Xβ, (c(η)v)−1Σ), com 0 < v < 1 para 0 < η < 1.

Passo E : Denotando por θ(r)

= (β(r)⊤

, φ(r)⊤

)⊤, a estimativa de θ para a r -ésima

iteração é obtida calculandoQ(θ|θ(r)) = Elc(θ|Y c)|Y obs, θ

(r), que é a esperança condicional

de lc (logarítmo da verossimilhança completa) dado Y obs, conhecida como Q-function, cuja

expressão é dada por:

Q(θ|θ(r)) = − log η +

p

2log

(c(η)

)− 1

2log |Σ| − 1

2wδ +

(n

2+

1

η− 1

)c

sendo os valores w(r) = c(η)EV |Y obs, θ

(r)

e c(r) = Elog(V |Y obs, θ

(r))(mais detalhes

ver Lange e Sinsheimer, 1993; Jamshidian, 2001; Osório et al., 2009).

Passo M: Para atualizar θ(r+1)

, maximiza-se Q(θ|θ(r)), com relação a β e φ, que leva

as seguintes equações:

β = (X⊤Σ−1X)−1X⊤Σ−1Y .

Σ = Σ(φ) = w(Y −Xβ)(Y −Xβ)⊤.

Page 127: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

109

A sequência obtida a partir das iterações do algotimo EM converge para a estimativa de

máxima verossimilhança de θ.

Page 128: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

110

5.4 ARTIGO 4: Modelagem espacial linear slash: uma análise da produtivida de da sojaem função de atributos químicos do solo

Resumo: Na modelagem geoestatística das propriedades químicas do solo, os

parâmetros são estimados considerando a posição georreferenciada das variáveis

em estudo. Posteriormente, esses parâmetros são utilizados no processo de

interpolação para determinar os locais não amostrados. Porém, a presença de uma

ou mais observações influentes nos dados amostrais podem interferir na estimação

dos parâmetros, principalmente quando assume-se a suposição de normalidade

dos dados, bem como afetar a construção dos mapas de contorno. O objetivo deste

trabalho foi propor um modelo espacial linear mais robusto utilizando a distribuição

slash multivariada. Essa permite o ajuste da curtose e faz com que o processo de

modelagem seja menos sensível à presença de observações discrepantes. Para

avaliar a significância dos parâmetros associados ao vetor de médias do modelo

espacial linear (β’s), aplicou-se o teste razão de verossimilhança (RV ). Avaliou-se a

sensibilidade dos estimadores de máxima verossimilhança do modelo pela análise

de influência local sob a variável resposta e sob o preditor linear. Na aplicação do

modelo proposto foram usados dados de produtividade da soja e atributos químicos

do solo provenientes de uma área experimental de 127,18 ha, localizada na região

Oeste do Paraná. Identificou-se pelo teste RV que as covariáveis fósforo, potássio,

pH e matéria orgânica foram significativas na formulação do modelo. O mapa

gerado utilizando o modelo espacial linear slash foi menos afetado pela presença

de valores influentes quando comparado com o modelo embasado na distribuição

normal.

Palavras-chave: Máxima verossimilhança, máxima verossimilhança completa,

testes de hipóteses, variabilidade espacial.

5.4.1 Introdução

A caracterização da variabilidade espacial da produtividade da soja e sua relação com

os atributos químicos do solo são essenciais para o gerenciamento dessa cultura. Áreas

consideradas pedologicamente similares podem apresentar variabilidade distinta quando

submetidas a diferentes práticas de manejo do solo, que podem alterar diretamente sua

estrutura e atividade biológica e, consequentemente, sua fertilidade, com reflexos na qualidade

ambiental e produtividade (Corá et al., 2004). Conhecer a distribuição desses atributos permite

a identificação de padrões espaciais de solo e o estabelecimento de zonas de manejos. Desta

forma, é possível a otimização das aplicações localizadas de corretivos e fertilizantes, melhorar

o controle do sistema de produção da cultura, minimizar os impactos ambientais provocado

Este artigo foi estruturado seguindo as normas da Revista Brasileira de Ciência do Solo.

Page 129: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

111

pelo excesso de nutrientes e reduzir os custos gerados pela aplicação desnecessária de

insumos (Amado et al., 2009; Cherubin et al., 2014).

Um método utilizado nesta caracterização é a geoestatística, que leva em consideração

a variação espacial e oferece técnicas que permite a construção de mapas de contornos

associados a uma ou mais variáveis explicativas (Oliveira Jr. et al., 2010). Entre os diferentes

métodos aplicados nos estudos geoestatísticos, têm-se os modelos espaciais lineares,

amplamente estudados assumindo-se um processo estocástico gaussiano (Uribe-Opazo et

al., 2012; Grzegozewski et al., 2013; Nesi et al., 2013). Esta técnica de modelagem permite a

estimação dos parâmetros que definem a estrutura de dependência espacial pelo método de

máxima verossimilhança (MV) viabilizando estudos inferenciais.

Porém, como relatado por Assumpção et al. (2014), a modelagem da dependência

espacial baseada na distribuição gaussiana é sensível a valores discrepantes e distribuição

de erros que apresentam caudas mais pesadas que a normal, podendo gerar mapas que

divergem da realidade. Uma alternativa para contornar este problema é a utilização de

modelos mais robustos embasados em distribuições que apresentem caudas mais pesadas.

Neste contexto, a distribuição slash multivariada é uma opção muito atrativa, pois possui um

parâmetro adicional, que possibilita o ajuste da curtose e torna o processo de modelagem

mais flexível perante a presença de valores discrepantes (Osorio et al., 2009; Alcantara e

Cysneiros, 2013). A distribuição slash multivariada foi apresentada por Lange e Sinsheimer

(1993) e pertence à classe de distribuições mistura escala normal. A ideia básica desta

classe de distribuição é introduzir aleatoriedade na matriz covariância bem como no vetor de

média da distribuição normal multivariada, por uma variável de mistura estritamente positiva.

Isto permite obter uma generalização da distribuição normal multivariada que preserva suas

principais propriedades.

Embora mais robusta, é possível que a modelagem espacial embasada na distribuição

slash ainda sofra o efeito de observações influentes. Neste sentido, é importante a realização

de estudos de sensibilidade sobre ela, pela análise de diagnóstico de influência. Esta etapa

é constituída de diferentes metodologias de avaliação, sendo uma delas a influência local que

avalia a qualidade do ajuste do modelo e também a robustez de suas estimativas quando

pequenas pertubações são introduzidas no modelo e/ou no conjunto de dados (Cook, 1986;

Zhu et al., 2001; Zhu et al., 2007).

Para dados georreferenciados, Borssoi et al. (2011) e Uribe Opazo et al. (2012)

avaliaram a sensibilidade dos estimadores, das funções de covariância e do preditor linear

sob pequenas perturbações nos dados e/ou modelo espacial linear com distribuição normal.

Assumpcão et al. (2014) apresentaram técnicas de influência local para dados com distribuição

t-student, com o grau de liberdade fixo, considerando a perturbação aditiva na variável

resposta. De Bastiani et al. (2015) apresentaram técnicas de influência local para dados

que pertence à família elíptica e discutiram a adequação da perturbação quanto à distribuição

em estudo embasado na metodologia de Zhu et al. (2007).

Diante do exposto, este estudo teve como objetivo avaliar a variabilidade espacial do

Page 130: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

112

rendimento da soja em função das propriedades químicas do solo, utilizando um modelo linear

espacial baseado na distribuição slash. Além disso, foi proposto uma análise de influência

local sobre as variáveis de resposta e sobre os preditores lineares.

5.4.2 Material e Métodos

5.4.2.1 Descrição da área experimental

Os dados foram obtidos no experimento de campo de uma área comercial de produção

de grãos, localizada no município de Cascavel, região Oeste do Paraná, cujas coordenadas

geográficas são, aproximadamente, 24,95o S e 53,57o W, com altitude média de 650m. O solo

é classificado como Latossolo Vermelho Distroférico, de textura argilosa (EMBRAPA, 2009).

O clima regional é classificado como temperado mesotérmico e superúmido, tipo climático

Cfa (Köeppen) e temperatura anual média de 21oC. Os dados são referentes ao ano agrícola

2014/2015. A área possui 127,18 ha, e sobre ela foi realizada uma amostragem sistemática

centrada com pares de pontos próximos (lattice plus close pairs). O georreferenciamento foi

realizado com o auxílio de um aparelho receptor de sinal de GPS (Global Positioning System)

GEOEXPLORE 3, em um sistema espacial de coordenadas UTM, cujo total é de 78 pontos

(Figura 11).

Na aplicação do modelo proposto considerou-se como variável resposta a

produtividade da soja, estimada a partir da quantidade de grãos colhidos de plantas

distribuídas em duas fileiras, ao longo de um metro de comprimento de cada ponto,

representando a parcela. Após a trilha das plantas, foi feita a pesagem de grãos para cada

parcela, verificados o teor de água e correção para 13% de umidade e então convertido em

t ha−1. Como variáveis explicativas, foram selecionados os atributos fósforo [P](mg dm−3),

potássio [K](mg dm−3), potencial Hidrogeniônico [pH] e matéria orgânica [MO] (g dm−3). Para

determinar a concentração no solo, foram coletadas cinco amostras na profundidade de 0-20

cm, nas proximidades de cada ponto georreferenciado e, em seguida, misturadas para produzir

o elemento amostral representativo da parcela. A análise foi realizada no laboratório da

Cooperativa Central de Desenvolvimento Tecnológico e Econômico Ltda, (COODETEC, Brasil).

Na escolha das variáveis esplicativas consideram-se os seguintes fatores: (i) alta

curtose e dependência espacial; (ii) o P aumenta o potencial de rendimento nos estádios

reprodutivos iniciais da planta e é um dos elementos aplicados em maiores quantidades

nos solos brasileiros, devido à sua baixa disponibilidade natural; (iii) o K desempenha papel

importante na fotossíntese e respiração, auxilia na formação de amidos e açúcares, dá vigor às

plantas, aumentando-lhe a resistência; (iv) os solos brasileiros apresentam elevados índices

de acidez (pH), os quais podem causar limitação à produtividade agrícola; e (v) a MO fornece

nutrientes para a produção vegetal sustentável, aumenta a capacidade de infiltração da água

e diminui a ocorrência de erosão (Santos, et al. 2006, EMBRAPA, 2009).

Page 131: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

113

Figura 11 Área experimental.

5.4.2.2 O modelo espacial e estimação de parâmetros

Para modelar os dados das variáveis espacialmente correlacionadas, considerou-se

um processo estocástico Y (si), si ∈ S, definido em uma região S ⊂ ℜ2, em que cada

elemento Y (si) da produtividade da soja possui localizações conhecidas si, com i = 1, · · · , n.

Supôs-se que o processo é estacionário e isotrópico, e que Y = (Y (si), · · · , Y (sn))⊤ segue

uma distribuição de probabilidade slash n-variada, com parâmetro de ajuste da curtose (η) fixo.

Neste trabalho, adota-se uma reparametrização da distribuição slash apresentada por Lange

e Sinsheimer (1993), supondo segundo momento finito, sendo denotada por SLn(Xβ,Σ, η).

Sob estas condições, o modelo linear espacial slash (MLES) pode ser descrito por

Y = Xβ + ǫ, (5.49)

em que Y = (Y (si), · · · , Y (sn))⊤, n × 1, é o vetor das variáveis; X = (1,X⊤

1 , · · · ,X⊤q )⊤,

n × (q + 1), é a matriz formada pelo vetor de 1’s e pelas q covariáveis; β = (β0, · · · , βq)⊤

é o vetor de parâmetros desconhecidos a serem estimados, (q + 1) × 1 a ser estimado; e

ǫ = (ǫ(s1), · · · , ǫ(sn)⊤, n × 1, é o vetor dos erros aleatórios que segue distribuição slash, tal

que E[ǫ] = 0 e Cov(ǫ) = Σ. Desta forma, para a área em estudo, o modelo da produtividade

da soja na localização si foi expresso por

Prod(si) = β0 + β1P + β2K + β3pH + β4MO + ǫ(si), i = 1, · · · , n.

Assumiu-se em (5.49) que a dependência espacial é determinada pela matriz de

covariância Σ, n × n, simétrica, não singular e positiva definida, proporcional a Cov(ǫ), e que

Cov(ǫ(si), ǫ(sj)) depende apenas da distância euclidiana entre as localizações si e sj , isto é,

Cov(ǫ(si), ǫ(sj))=C(hij), em que hij = ||si − sj ||. Uma forma paramétrica particular para Σ é

Page 132: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

114

dada por

Σ = Σ(φ) = φ1In + φ2R(φ3), (5.50)

em que In é a matriz identidade n × n, φ1 ≥ 0 e φ2 ≥ 0 são os parâmetros efeito pepita

e contribuição, respectivamente, enquanto , φ3 ≥ 0 é um parâmetro relacionado ao raio de

dependência espacial al = g(φ3). A matriz R(φ3) =[(rij)

]é simétrica, n × n, em que

seus elementos (rij) representam a correlação da variável georreferenciada entre os pontos

localizados em si e sj , sendo que rij = 1, se i = j e

rij = φ−12 C(hij), i 6= j, φ2 6= 0

rij = 0, i 6= j, φ2 = 0,

for i, j = 1, · · ·n.

A forma específica para C(hij) depende do modelo escolhido para explicar a

dependência espacial. Neste trabalho, foi utilizado o modelo da família Matérn (Matérn, 1986),

considerando-se os parâmetros de suavidade κ ∈ 0, 5; 1, 5; 2, 5 cuja relação com o alcance

prático é dado por 3φ3, 4, 75φ3 e 5, 92φ3, respectivamente (Diggle e Ribeiro Jr., 2007). No caso

κ = 0, 5 a função de covariância Matérn se reduz à função de covariância exponencial.

Os vetores de parâmetros desconhecidos do modelo em (5.49) e (5.50), θ = (β⊤,φ⊤)⊤

foram estimados pela maximização do logaritmo da função verossimilhança, cuja forma é

expressa por

l(θ) = − log(η)+n

2log

(c(η)

)− 1

2log |Σ|+ log

( 1∫

0

va−1 exp− vb

dv), (5.51)

sendo, a = (n/2 + η−1), b = c(η)δ/2, com δ = (Y −Xβ)⊤Σ−1(Y −Xβ) e c(η) = (1 − η)−1,

para 0 < η < 1, em que η representa o parâmetro de ajuste da curtose. Neste caso, o método

de MV define o estimador θ de θ como o vetor que maximiza l(θ) sobre o espaço paramétrico

Θ, ou seja, θ = argθmax l(θ). Quando este valor está associado a um processo estacionário

e isotrópico, ele pode ser obtido pela solução do sistema homogêneo de equações formuladas

a partir do vetor escore dado por∂l(θ)

∂β= 0 e

∂l(θ)

∂φ= 0.

Note que não existe solução analítica fechada para este sistema de equações. Então,

neste trabalho, o estimador MV de θ foi calculado utilizando algoritmo EM (Esperança Máxima),

um método computacional que gera aproximações de forma iterativa a partir da maximização

da esperança do logaritmo da função verossimilhança para dados completos, conhecida por

Q-function, cuja expressão é dada por

Q(θ|θ) = − log η +n

2log

(c(η)

)− 1

2log |Σ| − 1

2wδ +

(n

2+

1

η− 1

)c, (5.52)

sendo os valores w = c(η)EV |Y , θ

e c = E

log(V |Y , θ

), em que V ∼ β

(1

η, 1

)e (Y |V =

v) ∼ Nn(Xβ, c(η)−1v−1Σ). Para mais detalhes ver Lange e Sinsheimer (1993) e Osorio et al.

(2009).

Page 133: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

115

A fim de que se evitem problemas de identificabilidade em um processo de estimação

por MV, os valores apropriados do parâmetro de ajuste da curtose η e de suavização κ

do modelo família Matérn, foram determinados aplicando os critérios de validação cruzada

(V C)(De Bastiani et al., 2015) e o critério traço (Tr)(Kano et al., 1993).

5.4.2.3 Teste de hipóteses sobre o vetor de parâmetros β

Na construção de um modelo espacial é importante a aplicação testes de hipóteses

para verificar a significância dos parâmetros β, principalmente quando envolvem covariáveis.

Vários métodos assintóticos podem ser utilizados, entre eles a estatística da razão de

verossimilhança (RV). As vantagens da utilização deste teste são: a invariância perante

reparametrizações ou restrições equivalentes e seu desempenho para amostras pequenas

apresenta boa aproximação assintótica quando comparado com outros testes (Dagenais e

Dufour, 1991).

Neste contexto, considere o modelo linear espacial slash definido na Equação 5.49, e

o problema de testar H0 : β1 = β(0)1 versus H1 : β1 6= β

(0)1 , em que β = (β⊤

1 ,β⊤2 ) é o

vetor particionado de parâmetros desconhecidos β, q × 1, sendo β1 = (β1, · · · , βk1)⊤ o vetor

de parâmetros de interesse, β2 = (βk1+1, · · · , βq)⊤ e φ o vetor de parâmetros de perturbação

e β(0)1 um vetor especificado de dimensão k1(k1 ≤ q). A estatística RV para testar H0 pode ser

escrita como:

RV = 2(l(β1, β2, φ)− l(β

(0)1 , β2, φ)

)(5.53)

em que, l(·) é o logaritmo da função de verossimilhança definido na Equação 5.51; β1, β2, φ

são os estimadores de máxima verossimilhança irrestritos de β1,β2 e φ, respectivamente,

enquanto β2 e φ são os estimadores de β2 e φ sob H0. Sob condições de regularidade e sob

hipótese nula H0, a estatística descrita por (5.53) tem distribuição assintótica qui-quadrado

com k1 graus de liberdade. A um nível de significância α, se |RV | ≥ χ2(k1,α/2)

, então rejeita-se

H0 (Dagenais e Dufour, 1991).

5.4.2.4 Diagnóstico de influência local

Após a estimação dos parâmetros que compõe o modelo, foi construído o mapa da

variabilidade da produtividade da soja em função das covariáveis P, K, pH e MO utilizando

krigagem por regressão (Hengl et al., 2003). A análise de influência local na variável

resposta e no preditor linear foi realizada para investigar a presença de observações que

possam ter interferido no processo de predição dos valores em locais não amostrados. Neste

trabalho o esquema de perturbação foi aplicado à variável resposta, sendo este obtido a partir

metodologia proposta por Zhu et al. (2007), cuja expressão embasado na distribuição de

probabilidade slash é dada por

Y ω = Y +Σ12ω√c,

Page 134: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

116

sendo ω = (ω1, · · · , ωn)⊤ ∈ Ω ⊂ ℜn o vetor perturbação, n × 1; c =

4dg

n, em que dg =

E[w2G(·, δ)||Z||2

]com wG(·, δ) = −1

2

(ηn+ 2

ηδ

)ba

Γ(a)

1∫0

va−1e

−vbdv. Considera-se aqui que

δ = ||Z||2, sendo Z = Σ−1/2(Y −Xβ) com Z ∼ SLn(0, In, η). .

Conforme proposto por Cook (1986), a partir de (5.51), investigaram-se os possíveis

pontos influentes na variável resposta pelo estudo da curvatura normal do gráfico de influência

ω×LD(ω) em uma vizinhança do ponto de não perturbação ω0, na direção de um vetor unitário

h, em que LD(ω) = 2[l(θ)−l(θω)

], sendo θ e θω, os estimadores de MV de θ sob o modelo

postulado e o modelo perturbado por ω, respectivamente. Para tal, considerou-se a medida de

referência |h[L]max|, que corresponde ao autovetor unitário, normalizado, associado ao maior

autovalor, em módulo, da matriz BL = ∆⊤Lω

[− L(θ)

]−1∆Lω, sendo L(θ) =

∂2l(θ)

∂θ∂θ⊤

∣∣∣∣θ=θ

e

∆Lω =∂2l(θ|ω)

∂θ∂ω⊤

∣∣∣∣θ=θ;ω=ω0

, na qual ∆Lω é a matriz (q + 4)× n de perturbação.

De maneira análoga, como proposto por Zhu e Lee (2001), estudou-se também a

análise de influência local sobre a Q-function dada em (5.52), cuja função de deslocamento

é expressa por QD(ω) = 2[Q(θ|θ)−Q(θ,ω|θ)

]. Neste caso, para a medida de referência

|h[Q]max|, tem-se que BQ = ∆⊤Qω

[−Q(θ|θ)

]−1∆Qω, em que Q(θ|θ) = ∂2Q(θ|θ)

∂θ∂θ⊤

∣∣∣∣θ=θ

e ∆Qω =

∂2Q(θ,ω|θ)∂θ∂ω⊤

∣∣∣∣θ=θ;ω=ω0

, sendo Q(θ,ω|θ) a esperança do logaritmo da função verossimilhança

dos dados completos perturbada por ω. Para mais detalhes das derivadas veja Apêndice 5.4.6.

Em ambos os casos, o gráfico |h[·]maxi| versus ordem dos dados foi usado para ilustrar

a sensibilidade da variável resposta, sendo considerada a i-ésima observação influente se

|h[·]maxi| > D + 2sd(D), em que D denota a média dos elementos, em valor absoluto, do vetor

|h[·]max| e sd(D) o desvio padrão.

Para avaliar a influência local no preditor linear, considerou-se Y0 = Y (s0) o preditor

da krigagem por regressão na localização s0 ∈ S ⊂ ℜ2. Neste caso, a média de Y0 é dada

por X⊤0 β, em que X⊤

0 = (1, x01, · · · , x0q) e x0j = xj(s0) para j = 1, · · · , q, são os valores das

covariáveis na posição s0, cujo preditor do menor erro quadrático médio é dado por p(s0,θ) =

X⊤0 β+C⊤

0 Σ−1(Y −Xβ), em que C⊤0 = (C(h10), · · · ,C(hn0)), com hi0||si−s0|| para i = 1, · · ·n.

Então, um estimador pontual para Y0 é expresso por Y0 = p(s0, θ) = X⊤0 β+ C⊤

0 Σ−1

(Y −Xβ).

A partir do logaritmo da função verossimilhança dado em (5.51), a influência foi medida

pela expressão S(h) = h⊤pL(s0,θ), em que ||h = 1|| e pL(s0,θ) é o vetor n× 1 dado por

pL(s0,θ) =

−∆⊤

[L(θ)

]−1∂p(s0,θ)∂θ

∣∣∣∣θ=θ

, (5.54)

sendo,∂p(s0,θ)

∂θ=

(∂p(s0,θ)∂β⊤ ,

∂p(s0,θ)∂φ⊤

)⊤. A direção de maior influência foi obtida por Lp =

pL(s0,θ)

||pL(s0,θ)||, sendo considerada a i-ésima observação influente se Lpi > L + 2sd(L), em que

L = (Lp1, · · · , Lpn) e L e sd(L) representam a média e o desvio padrão, respectivamente.

Page 135: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

117

No caso em que considerou-se a Q-function dado em (5.52), tem-se

pQ(s0,θ) =

−∆⊤

[Q(θ|θ)

]−1∂pQ(s0,θ)

∂θ

∣∣∣∣θ=θ

, (5.55)

sendo a direção de maior influência obtida por Qp =pQ(s0,θ)

||pQ(s0,θ)||, e a i-ésima observação

influente se Qpi > Q + 2sd(Q), em que Q = (Qp1, · · · , Qpn) e Q e sd(Q)representam a média

e o desvio padrão, respectivamente.

Com o objetivo de avaliar a acurácia temática dos mapas antes e depois da análise

de influência, calcularam-se os índices kappa e Exatidão global (EG). De acordo com a

classificação de Krippendorff (2004), os mapas apresentaram baixa similaridade se kappa <

0, 67, média similaridade se 0, 67 ≤ kappa ≤ 0, 80, e alta similaridade se kappa > 0, 80. Já no

caso da exatidão Global os mapas foram similares se EG > 0, 85 (Anderson et al., 1976).

As análises geoestatísticas e de influência local foram realizadas quando se utilizou o

software R (www.R-project.org; R TEAM, 2015) na versão 3.3.1.

5.4.3 Resultados e discussão

Na Tabela 12 apresenta-se a análise exploratória dos dados da variável resposta e das

covariáveis atributos químicos do solo P, K, pH e MO. Verifica-se que a produtividade média

da soja foi 2,37 t ha−1, sendo este valor inferior à média nacional de estimada em 3,03 t ha−1

para o ano agrícola 2014/2015 (IBGE, 2015). O desvio padrão e o coeficiente de variação

foram iguais a 0,87 t ha−1 e 11,48%, respectivamente, indicando baixa dispersão em torno

da média e homogeneidade dos dados. A construção do gráfico box-plot indicou a presença

de um valor discrepante, que corresponde à amostra #33, com produtividade de 3,18 t ha−1.

Uma análise padrão dos semivariogramas direcionais construído para as direções 00, 450, 900

e 1350 mostrou comportamentos semelhantes, indicando isotropia no semivariograma.

As estatísticas descritivas relacionadas aos atributos químicos do solo (Tabela 12)

indicaram que, para a área em estudo, os valores médios dos teores de P e K são classificados

como muito altos para a cultura de soja (COAMO/COODETEC, 2001). Além disso, o desvio

padrão e coeficiente de variação de P e K indicaram alta dispersão em torno da média e

comportamento heterogêneo. No caso dos teores de pH, classificou-se o solo como de alta

acidez (pH entre 4,31 e 5,00), com pequena dispersão em torno da média, enquanto o valor

médio de MO foi classificado com alto (35,01 e 60,00 g dm−3) e coeficiente de variação de

12,50% (COAMO/COODETEC, 2001).

De acordo com Amado et al. (2009), a elevada variação dos teores de P e K pode

decorrer das sucessivas aplicações de fertilizantes à taxa fixa na linha de semeadura. Isso

contribui para a manutenção e, ou, o aumento da micro e macrovariabilidade espacial nas

áreas. Já a razão do alto valor de MO e acidez do solo pode estar associado ao sistema de

plantio direto (SPD) implementado na área experimental. Segundo Dalchiavon et al. (2012), o

uso prolongado do SPD aumenta a quantidade de palhada mantida na superfície do solo, que

traz como consequência a alteração no teor de MO, tanto em quantidade como em qualidade,

Page 136: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

118

e isto tem implicações graduais nas alterações do pH (associada aos seus teores de cátions

de reação básica e carbono orgânico solúvel). Além disso, o SPD pode ter sido um limitante da

correção por calagem que normalmente fica restrita às zonas de aplicação, concentrando-se,

principalmente, nas camadas superficiais do solo.

Tabela 12 Estatística descritiva dos dados da produtividade (Prod) da soja (t ha−1), e daconcentração no solo de fósforo [P](mg dm −3), potássio [K] (cmol cdm−3), potencialhidrogeniônico [pH] e matéria orgânica [MO] (g dm−3), para 78 amostras.

Variáveis Prod P K pH MO

Média 2,37 19,19 0,31 4,82 50,63

Variância 0,07 123,56 0,02 0,17 40,05

Coeficiente de Variação % 11,48 57,91 45,35 8,43 12,50

Assimetria 0,51 1,34 0,60 1,08 0,02

Curtose 0,11 1,73 -0,56 1,31 -0,56

Estudou-se o conjunto de dados considerando-se todas as amostras e o MLES,

assumindo-se Y ∼ SLn(Xβ,Σ, η). Para fins de comparação, o modelo linear espacial

gaussiano (MLEG), em que Y ∼ Nn(Xβ,Σ) também foi usado. Desta forma, foi possível

avaliar a robustez dos modelos e o efeito dos valores discrepantes e/ou influentes na estimação

dos parâmetros e geração dos mapas. Os critérios de VC e Tr indicaram que, para o MLES, os

valores adequados para o parâmetro de forma de ajuste da curtose η = 0, 25 e de suavização

para o modelo Matérn κ = 2, 5. Para o MLEG, o modelo mais adequado para explicar a

estrutura de dependência espacial também foi o Matérn com parâmetro de suavização κ = 2, 5.

Os valores dos parâmetros estimados obtidos por MV encontram-se na Tabela

13. Os desvios padrões assintóticos (em parênteses) foram calculados a partir da matriz

de informação de Fisher. Nota-se que os valores estimados do vetor de parâmetros β

foram similares em ambos os modelos e os menores valores dos desvios padrões estão

associados ao MLEG, exceto para o caso de β1 que foi igual. No entanto, ao serem

comparados os parâmetros referentes à estrutura de covariância do processo espacial,

verificaram-se diferenças relevantes, sendo os menores desvios padrão gerados na estimação

dos parâmetros do MLES. Calculou-se a razão φ1/(φ1 + φ2) e verificou-se que o MLES

apresentou um índice de dependência espacial de 0,6671. Todavia, para o MLEG, este índice

foi de 0,7468. Dado que o valor do parâmetro de suavização de ambos os modelos foi κ = 2, 5,

tem-se que o alcance prático para o MLES foi 485,37 m, porém que para o MLEG, este valor

foi de 311,78 m. Segundo Landim (2006), as melhores estimativas são obtidas quando os

modelos são baseados em funções de covariância que apresentam a menor razão “efeito

pepita/patamar” e, também, o maior alcance.

A partir dos dados da Tabela 2, foi possível estabelecer o MLEG da produtividade

estimada na posição si para a área em estudo, que é expresso por

Prod(si) = 2, 0301 + 0, 0032P (si)− 0, 1208K(si) + 0, 0326pH(si) + 0, 003MO(si)

com estrutura da matriz de covariância estimada dada por Σ = 0, 0531I78+0, 0180R(52, 6658),

Page 137: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

119

e no caso do MLES por

Prod(si) = 1, 9933 + 0, 0029P (si)− 0, 1094K(si) + 0, 0336pH(si) + 0, 0039MO(si)

com estrutura da matriz de covariância estimada dada por Σ = 0, 0513I78 + 0, 0256R(81, 988).

Em ambos os casos, os elementos da matriz de correlação R foram determinados pela função

de correlação da família Matérn com κ = 2, 5.

Tabela 13 Valores dos parâmetros η e κ selecionados a partir dos critérios validação cruzada(VC) e traço (Tr), parâmetros do modelo linear espacial gaussiano (MLEG) emodelo linear espacial slash (MLES) estimados por máxima verossimilhança (MV)via algoritmo EM com respectivos desvios padrões assintóticos (entre parênteses).

Parâmetros estimados

Modelo Estrutura β0 β1 β2 β3 β4 φ1 φ2 φ3

MLEG Matérn 2,031 0,0032 -0,1208 0,0326 0,0031 0,0531 0,0180 52,6658

κ = 2, 5 (0,412) (0,003) (0,228) (0,076) (0,005) (0,059) (0,059) (0,007)

MLES Matérn 1,993 0,0029 -0,1094 0,0336 0,0039 0,0513 0,0256 81,988

η = 0, 25 κ = 2, 5 (0,516) (0,003) (0,288) (0,095) (0,006) (0,036) (0,013) (0,006)

O teste de hipótese sobre o vetor de parâmetros β foi aplicado conjunta e

individualmente, para ambos modelos. A Tabela 14 apresenta os resultados da estatística

RV e seus respectivos p-valores. Verifica-se que a hipótese nula H0 : β1 = β2 = β3 = β4 = 0 é

rejeitada ao nível de 5% de probabilidade para ambos os modelos. O teste individual também

apresentou como significativos os valores dos parâmetros β’s. Portanto, as covariáveis P, K,

pH e MO foram mantidas na formulação dos modelos.

Tabela 14 Teste da razão de verossimilhança (RV) sob o vetor de parâmetros β’s do modelolinear espacial gaussiano (MLEG) e modelo linear espacial slash (MLES). Nível de5% de significância.

MLEG MLES

Hipóteses RV p-valor RV p-valor

β1 = 0 6,6871 0,0364* 11.6585 0,0040*

β2 = 0 7,0013 0,0319* 15.2148 0,0008*

β3 = 0 5,9527 0,0496* 8.5673 0,0161*

β4 = 0 6,2574 0,0437* 9,1132 0,0126*

β1 = β2 = β3 = β4 = 0 7,8651 0,0385* 13,8974 0,0033*

* teste significativo a 5% de probabilidade.

Aplicou-se a análise diagnóstico de influência local para avaliar a sensibilidade das

estimativas do modelo e do processo de predição perante a presença de valores discrepantes

e/ou influentes. Para o MLEG, foi usado o esquema de perturbação adequado à distribuição

normal apresentado por De Bastiani et al. (2015). De acordo com a Figura 12a, nota-se, que

para o MLEG, as amostras influentes sobre as variáveis respostas foram #15 e #71. Todavia,

sobre o preditor linear foram identificados como influentes as amostra #15, #58, #65 e #72

(Figura 12b).

Page 138: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

120

0 20 40 60 80

0.0

0.1

0.2

0.3

0.4

0.5

Ordem

h Lm

axi

15

72

(a) MLEG-|hLmax|

0 20 40 60 80

0.0

0.1

0.2

0.3

0.4

0.5

Ordem

Lp

15

5865

72

(b) MLEG-Lp

0 20 40 60 80

0.0

0.1

0.2

0.3

0.4

0.5

Ordem

h Lm

axi

(c) MLES-|hLmax|

0 20 40 60 80

0.0

0.1

0.2

0.3

0.4

0.5

Ordem

Lp 1

71

(d) MLES-Lp

0 20 40 60 80

0.0

0.1

0.2

0.3

0.4

0.5

Ordem

h Qm

axi

71

(e) MLES-|hQmax|

0 20 40 60 80

0.0

0.1

0.2

0.3

0.4

0.5

Ordem

Qp 13

6271

(f) MLES-Qp

Figura 12 Gráficos de influência local perturbando a variável resposta (a, c, e) e o preditorlinear (b, d, f), para o modelo linear espacial gaussiano (MLEG) e o modelo linearespacial slash (MLES).

Ao analisar a influência local na variável resposta perturbada e o MLES, observa-se por

meio da Figura 12c que nenhum ponto foi identificado como influente. Já a medida |h[Q]max|,Figura 12e, indica a amostra #71 como influente. Considerando-se a perturbação no preditor

Page 139: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

121

linear, as amostras #1 e #71 foram influentes (Figura 12d) quando a medida dada na Equação

5.54 foi usada, e para a perturbação sobre a Q-function, dada por (5.55), as amostras #1, #3,

#62 e #71 (Figura 12f) foram identificadas influentes no preditor linear.

Destaca-se que em nenhum dos casos a amostra discrepante #33 foi identificada como

influente na resposta produtividade de soja. Estes resultados corroboram com Uribe-Opazo et

al. (2012) que ao usarem o MLEG, mostraram a partir de diferentes técnicas de diagnóstico

de influência que nem todo ponto discrepante é influente na determinação do modelo

quando considera-se um estudo com covariáveis. Assumpção et al. (2014), considerando

a distribuição t-Student, também encontraram diferenças entre o valor discrepante e os

influentes, destacando a relevância de usar o método de influência local ao invés de uma

simples análise do gráfico box-plot. Ainda, o menor número de casos influentes encontrados

quando o MLES é ajustado condiz com o estudo de De Bastiani et al. (2015). Esses autores

usaram distribuições com caudas mais pesadas e obtiveram maior robustez no processo de

modelagem.

A Figura 13 exibe o gráfico post-plot da área experimental e indica espacialmente a

posição das amostras influentes. Nota-se que, para o MLEG, a produtividade da amostra #72

ficou entre [1,87 e 2,18 t ha−1) e das amostras #58 e #65 ficaram entre [2,18 e 2,55 t ha−1),

no entanto, é possível perceber que seus vizinhos mais próximos apresentaram valores de

produtividade superiores. No caso da amostra #15, observa-se que a mesma esta localizada

em uma região com altos valores de produtividade. Ao considerar o MLES, verifica-se que a

produtividade das amostras #1, #62 e #71 ficaram entre [2,55 e 3,18 t ha−1), e da amostra

#3 ficou entre [2,33 e 2,55 t ha−1). Quando as amostras foram analisadas espacialmente,

percebeu-se que os vizinhos à esquerda da amostra #71 apresentaram valores inferiores de

produtividade e que as amostras #1 e #3 são próximas à borda do talhão estudado.

Page 140: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

122

239500 240000 240500 241000

7236

500

7237

000

7237

500

7238

000

Coords X

Coo

rds

Y

1,87 − 2,182,18 − 2,332,33 − 2,552,55 − 3,18

OO

O

O

O

OO

O

↑ N

62

71 72

15

58

65

1 3

Figura 13 Gráfico post-plot da área experimental indicando a posição das amostrasconsideradas influentes.

No estudo de diagnóstico, quando detectado um ou mais casos influentes, esses são

removidos do conjunto de dados para investigar como sua retirada afeta na seleção do modelo,

na estimação dos parâmetros e na construção dos mapas de contorno (Assumpção et al.,

2011). Para o MLEG, as amostras #15 e #72 foram retiradas, uma vez que foram identificadas

como influentes ao serem aplicadas as medidas |hLmax| e Lp. Para o MLES, as amostras #1

e #71 foram removidas usando o mesmo critério e considerando ainda as medidas |hQmax| e

Qp. Na Tabela 15 encontram-se os valores de η e κ selecionados utilizando os critérios VC

e Tr e os parâmetros estimados para ambos os modelos. Nota-se que não ocorreu alteração

na escolha do modelo para descrever a estrutura de dependência espacial. No entanto, a

retirada das amostras consideradas influentes alterou os parâmetros estimados e aumentou,

na maioria dos casos, o valor dos desvios padrões assintóticos quando comparado com os

valores do modelo sem exclusão da Tabela 13. Além disso, nota-se redução dos valores de φ1

e do raio de dependência espacial estimado sendo do MLEG 170,73 m, mas para o MLES, o

alcance reduziu-se a 348,57 m.

Page 141: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

123

Tabela 15 Valores dos parâmetros η e κ selecionados a partir dos critérios validação cruzada(VC) e traço (Tr), parâmetros do modelo linear espacial gaussiano (MLEG) emodelo linear espacial slash (MLES) estimados por máxima verossimilhança (MV)via algoritmo EM e desvios padrões assintóticos (entre parênteses) obtidos após aexclusão dos pontos influentes.

Modelo Estrutura β0 β1 β2 β3 β4 φ1 φ2 φ3

MLEG sem #15 e #72 Matérn 2,0660 0,0033 -0,1024 0,0387 0,0017 0,0000 0,0741 28,840

κ = 2, 5 (0,423) (0,003) (0,238) (0,078) (0,006) (0,986) (0,987) (0,003)

MLES sem #1 e#71 Matérn 2,1716 0,0035 -0,1637 0,0529 -0,0016 0,0506 0,0102 58,880

η = 0, 2 κ = 2, 5 (0,493) (0,003) (0,277) (0,009) (0,006) (0,030) (0,007) (0,003)

A Figura 14 exibe os mapas de contorno da produtividade em função das covariáveis

utilizando interpolação por krigagem e os parâmetros apresentados nas Tabelas 13 e 15. Os

mapas foram gerados com base nos seguintes cenários: C1- usando todo o conjunto de

dados (Figura 14a) e o MLEG; C2 - usando todo o conjunto de dados e o MLES (Figura

14b); C3 - removendo as observações consideradas influentes para no MLEG (Figura 14c)

e C4 - removendo as observações consideradas influentes no MLES (Figura 14d). Foram

consideradas quatro classes de mesmo tamanho para a construição dos mapas, as quais

foram obtidas pela divisão do intervalo de variação da produtividade estimada.

Comparando-se a Figura 14b com a Figura 14a, notam-se contornos semelhantes,

porém o mapa gerado a partir do MLES, com φ1 = 0, 0513 e alcance de 485,37 m, apresentou

estrutura mais contínua, enquanto o mapa do MLEG, com φ1 = 0, 0531 e alcance de 311,78 m,

é constituído por formas de pequenas dimensões. Soares (2006) afirma que este efeito está

diretamente relacionado aos parâmetros que descrevem a estrutura de dependência espacial.

Segundo o autor, quando o efeito pepita é baixo ou nulo, a influência do conjunto total de

amostras é maior, e a superfície do mapa torna-se mais atenuada para alcances maiores.

Analisando Figura 14c, em que o mapa de contorno é construído considerando o MLEG

sem as amostras influentes, nota-se a ocorrência uma considerável variação a pequenas

distâncias. Este comportamento está relacionado a uma estrutura com patamar e sem efeito

pepita, que produz, no processo de estimação, um efeito de ”ecrã”, caracterizado por maiores

ponderadores em torno do ponto e por ponderadores quase nulos ou mesmo negativos,

atribuídos às amostras localizadas além do alcance prático (Soares, 2006). Já no caso da

Figura 14d, uma análise empírica indica que a retirada das amostras influentes provocaram

poucas alterações no contorno do mapa.

Page 142: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

124

239500 240000 240500 2410007236

500

7237

000

7237

500

7238

000

↑ N

[2,05; 2,19](2,19; 2,33](2,33; 2,47](2,47; 2,61]

.

(a) C1: MLEG considerando todos os pontos

amostrais

239500 240000 240500 2410007236

500

7237

000

7237

500

7238

000

↑ N

[2,05; 2,19](2,19; 2,33](2,33; 2,47](2,47; 2,61]

(b) C2: MLES considerando todos os pontos

amostrais

239500 240000 240500 2410007236

500

7237

000

7237

500

7238

000

↑ N

[2,05; 2,19](2,19; 2,33](2,33; 2,47](2,47; 2,61]

(c) C3: MLEG removendo os pontos #15 e #72

239500 240000 240500 2410007236

500

7237

000

7237

500

7238

000

↑ N

[2,05; 2,19](2,19; 2,33](2,33; 2,47](2,47; 2,61]

(d) C4: MLES removendo os pontos #1 e #71

Figura 14 Mapas de contorno para produtividade (t ha −1) em função dos atributos químicosfósforo [P], potássio [K], potencial hidrogeniônico [pH] e matéria orgânica [MO],considerando o modelo linear espacial gaussiano (MLEG) e modelo linear espacialslash (MLES), antes e após a remoção dos pontos influentes.

Aplicando-se as medidas de acurácia Kappa e EG, ao comparar o mapa gerado no

cenário C1 com o mapa do cenário C2, obteve-se kappa = 0, 78, indicando média similaridade,

enquanto o índice EG = 0, 88 indicou similaridade entre os mapas. Comparando-se o cenário

C1 com o cenário C3, os índices encontrados foram kappa = 0, 59 e EG = 0, 67, indicando

que esses não foram similares, e a retirada dos pontos #15, e #72 alterou os contornos do

mapa. Já, no caso do cenário C2 com o cenário C4, os mapas foram similares com índices

kappa = 0, 87 e EG = 0, 86 .

5.4.4 Conclusões

A análise de diagnóstico de influência local na variável resposta e no preditor linear

indicou que nem sempre um valor discrepante é influente, uma vez que a modelagem espacial

leva em consideração a posição que a variável ocupa no espaço, e essa pode ser determinante

Page 143: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

125

no processo de predição. Portanto, um valor discrepante não deve ser eliminado da amostra

antes de ser realizada uma análise de diagnóstico de influência.

O teste de hipótese aplicado sob o vetor de parâmetros β’s indicou que as covariáveis

fósforo, potássio, pH e matéria orgânica foram significativas na formulação do MLEG e

MLES e, consequentemente, na construção do mapa que ilustra a variabilidade espacial da

produtividade da soja na área em estudo.

Na comparação dos mapas, observou-se que o mapa gerado pela distribuição slash é

menos sensível à remoção de um valor de influente do que o mapa gerado pela distribuição

normal. A modelagem espacial linear slash possibilita uma modelagem mais robusta perante a

presença de observações influente. Portanto, torna-se uma alternativa para o modelo espacial

embasado na distribuição normal.

5.4.5 Referências

Alcantara IC, Cysneiros, FJA. Linear regression models with slash-elliptical errors. Comp StatData Anal. 2013; 64:53-164.

Amado TJC, Pes LZ, Lemainski CL, Schenato RB. Atributos químicos e físicos de latossolose sua relação com os rendimentos de milho e feijão irrigados. Rev Bras Cienc Solo. 2009;33:831-843.

Anderson JF, Hardy EE, Roach JT, Witmer, RE. A land use and land cover classification systemfor use with remote sensor data. U.S. Geological Survey Professional Paper 964, Washington,DC, p.28, 1976.

Assumpção RAB, Uribe-Opazo MA, Galea M. Local influence for spatial analysis of soil physicalproperties and soybean yield using student’s t-distribution. Rev Bras Cienc Solo. 2011;35:1917-1926.

Assumpção RAB, Uribe-Opazo MA, Galea M. Analysis of local influence in geostatistics usingStudent’s t-distribution. J Appl Stat. 2014; 41:615-630.

Borssoi JA, Uribe-Opazo MA, Galea M. Técnicas de diagnóstico de influência local na análiseespacial da produtividade da soja. Eng Agr. 2011; 31:376-387.

Cook RD. Assessment of local influence (with discussion). J R Stat Soc B Methodol. 1986;48:133-169.

Cherubin MR, Santi AL, Eitelwein MT, Menegol DR, Ros CO, Pias OHC, Berghetti J. Eficiênciade malhas amostrais utilizadas na caracterização da variabilidade espacial de fósforo epotássio. Cienc Rural. 2014; 44:425-432.

Corá JE, Araújo AV, Pereira GT, Beraldo JMG. Variabilidade espacial de atributos do solo paraadoção do sistema de agricultura de precisão na cultura de cana-de-açúcar. Rev Bras CiencSolo. 2004; 28:1013-1021.

Page 144: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

126

Cooperativa Agropecuária Mourãoense LTDA- COAMO; Cooperativa Central deDesenvolvimento Tecnológico e Econômico LTDA - COODETEC. Fertilidade do solo enutrição de plantas.Cascavel, Brazil: COAMO/COODETEC, 2001.

Dagenais MG, Dufour JM. Invariance, nonlinear models, and asymptotic tests. Econometrica.1991; 59:1601-1615.

Dalchiavon, FC, Carvalho MP, Andreotti M, Montanari R. Variabilidade espacial de atributos dafertilidade de um Latossolo Vermelho Distroférrico sob Sistema Plantio Direto. Rev Cien Agr.2012; 43:453-461.

De Bastiani F, Mariz De Aquino Queiroz AH, Uribe-Opazo MA, Galea M. Influence diagnosticsin elliptical spatial linear linear models. TEST. 2015; 24:322-340.

Diggle PJ, Ribeiro Jr. PJ. Model-based Geoestatistics. New York: Springer; 2007.

Empresa Brasileira de Pesquisa Agropecuária - Embrapa. Centro Nacional de Pesquisa deSolos. Sistema brasileiro de classificação de solos. 2a ed. Rio de Janeiro: 2006.

Grezegozewski DM, Uribe-Opazo M, De Bastiani F, Galea M. Local influence when fittingGaussian spatial linear models: an agriculture application. Cienc Investig Agrar. 2013;40:235-252.

Hengl T; Heuvelink GBM, Stein A. Comparison of kriging with external drift andregression-kriging. Technical report. International Institute for Geo-information Scienceand Earth Observation (ITC), 2003 [Acesso em 17 de set 2016]. Disponível emhttp://www.itc.nl/library/Academic-output.

Instituito Brasileiro de Geografia e Estatística -IBGE. Banco de Dados Agregados-SistemaIBGE de Recuperação Automática-SIDRA; 2016 [Acesso em 10 de out 2016]. Disponível em:http://www.sidra.ibge.gov.br.

Kano Y, Berkane M, Bentler P. Statistical inference based on pseudo-maximum likelihoodestimators in elliptical populations. J Am Stat Assoc. 1993; 88:135-143.

Krippendorff K. Content Analysis: an introduction to its methodology. Thousand Oaks: Sagepublications; 2004.

Landim PMB. Sobre geoestatística e mapas. Terræ Didat. 2006; 2:19-33.

Lange K, Sinsheimer JS. Normal/independent distributions and their applications in robustregression. J Comp Graph Stat. 1993; 2:175-198.

Lange KL, Little RJA, Taylor JMG. Robust statistical modeling using the t distribution. J Am StatAssoc. 1989; 84:881-896.

Matérn B. Spatial variation. Lecture notes in statistics. 2a ed. New York: Springer; 1986.

Nesi CN, Ribeiro A, Bonat WH, Ribeiro JR. PJ. Verossimilhança na seleção de modelos parapredição espacial. Rev Bras Cienc Solo. 2013; 37:352-358.

Page 145: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

127

Oliveira Jr. JC, Souza LCP, Melo VF. Variabilidade de atributos físicos e químicos de solos daFormação Guabirotuba em diferentes unidades de amostragem. Rev Bras Cienc Solo. 2010;34:1491-1502.

Osorio F, Paula GA, Galea M. On estimation and influence diagnostics for the Grubbs’ modelunder heavy-tailed distributions. Comp Stat Data Anal. 2009; 53:1249-1263.

R DEVELOPMENT CORE TEAM. R: A language and environment for statistical computing.R Foundation for StatisticalComputing, Vienna, Austria, 2016 [Acesso em 08 de ago 2016].Disponível em: <http://www.R-project.org>.

Santos HG dos, Jacomine PKT, Anjos LHC, Oliveira VA de, Oliveira JB de, Coelho MR,Lumbreras JF, Cunha TJF (Ed.). Sistema brasileiro de classificação de solos. 2a ed. Riode Janeiro: Embrapa Solos; 2006.

Soares, A. Geoestatística para as ciências da terra e do ambiente. 2a ed. Portugal: IST Press;2006.

Uribe-Opazo MA, Borssoi JA, Galea, M. Influence diagnostics in Gaussian spatial linear models.J Appl Stat. 2012; 39:615-630.

Zhu HT, Lee SY. Local influence for incomplete-data models. J R Stat Soc B Stat Methodol.2001; 63:111-126.

Zhu H, Ibrahim JG, Lee S, Zhang H. Perturbation selection and influence measures in localinfluence analysis. Ann Stat. 2007; 35:2565-2588.

Page 146: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

128

5.4.6 Apêndice: Derivadas da Q-function

Considere-se a Q-function para MLES dada por

Q(θ|θ) = − log η +n

2log

(c(η)

)− 1

2log |Σ| − 1

2wδ +

(n

2+

1

η− 1

)c (5.56)

sendo os valores w = c(η)EV |Y , θ

e c = E

log(V |Y , θ

).

A derivada de primeira ordem Q(θ|θ) com respeito a θ = (β⊤,φ⊤)⊤, com η fixo, tem

como elementos

Qβ =∂(θ|θ)∂β

= wX⊤Σ−1(Y −Xβ);

e

Qφ =∂(θ|θ)∂φ

=1

2

∂vec⊤Σ∂φ

[wvec(Σ−1(Y −Xβ)⊤(Y −Xβ)Σ−1)− vec(Σ−1)

].

A derivada de segunda ordem Q(θ|θ) com respeito a θ = (β⊤,φ⊤)⊤, com η fixo,

assume a forma

Q(θ|θ) =

Qββ Qβφ

Qφβ Qφφ

,

em que, Qββ é uma matriz (q + 1)× (q + 1), dada por

Qββ =∂2(θ|θ)∂β∂β⊤ = −wX⊤Σ−1X;

Qβφ = Q⊤βφ é uma matriz (q + 1)× 3, dada por

Qβφ =∂2(θ|θ)∂β∂φ⊤ = w

∂φ⊤

[X⊤Σ−1(Y −Xβ

]= −wX⊤[(Y −Xβ)⊤ ⊗ In

][Σ−1 ⊗Σ−1

]∂vec(Σ)

∂φ⊤ ;

e Qφφ é uma matriz 3× 3, dada por

Qφφ =∂2(θ|θ)∂φ∂φ⊤ =

1

2

w

∂φ⊤

[∂vec⊤Σ∂φ

vec(Σ−1(Y −Xβ)⊤(Y −Xβ)Σ−1)

]

︸ ︷︷ ︸I

− ∂

∂φ⊤

[∂vec⊤Σ∂φ

vec(Σ−1)

]

︸ ︷︷ ︸II

sendo

I =∂vec⊤(Σ)

∂φ

[Σ−1 ⊗Σ−1(Y −Xβ)(Y −Xβ)⊤Σ−1

]∂vec(Σ)

∂φ⊤

vec⊤[Σ−1(Y −Xβ)(Y −Xβ)⊤Σ−1

]⊗ I3

∂φ⊤ vec[∂vec⊤(Σ)

∂φ

].

Page 147: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

129

e

II =∂vec⊤(Σ)

∂φ

[Σ−1 ⊗Σ−1

]∂vec(Σ)

∂φ⊤ −[vec⊤(Σ)−1 ⊗ I3

] ∂

∂φ⊤ vec[∂vec⊤(Σ)

∂φ

]

Page 148: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

130

6 CONSIDERAÇÕES FINAIS

Os resultados desta tese foram apresentados em forma de artigos. Apresentam-se

aqui as principais contribuições verificadas durante o desenvolvimento do trabalho:

• No artigo 1 apresentou-se a reparametrização da distribuição slash com segundo

momento finito e discutiu-se o teste C(α). Os resultados das simulações indicaram

que para dados provenientes de uma distribuição com caudas mais pesadas, o teste

C(α) ajustado à distribuição slash torna-se mais eficiente perante más especificações

do modelo, principalmente quando o número de variáveis consideradas na análise

multivariada é relativamente grande;

• No artigo 2 foram abordados procedimentos que possibilitaram implementar

computacionalmente o algoritmo EM para estimação dos parâmetros por máxima

verossimilhança da distribuição slash. Esta formulação hierárquica permitiu executar

as estatísticas de prova razão de verossimilhança, Wald e score de forma eficaz.

Em especial, examinaram-se os testes de igualdade de médias, esfericidade e

homogeneidade de variância, que mostraram-se eficientes na aplicação a dados de

índices de flutuações do preço das commodities da soja, uma vez que essas envolvem

medidas repetidas no tempo;

• Finalmente, nos artigos 3 e 4, discutiu-se o modelo espacial linear, baseado na

distribuição slash, para o estudo de dados com distribuição amostral simétrica, porém

com alta curtose. Estudou-se o modelo espacial sem a utilização de covariáveis bem

como um modelo com número finito de covariáveis. Em ambos os casos, foram

desenvolvidas técnicas para a estimação dos parâmetros do modelo por máxima

verossimilhança executando o algoritmo EM, que mostrou-se computacionalmente

estável e eficiente. O critério de validação cruzada e traço foi aplicado para escolha

do parâmetro de ajuste da curtose, para que se evitem problemas de identificabilidade.

Desenvolveram-se técnicas, global e local, de diagnósticos para o modelo espacial linear

slash, que mostraram-se eficientes na detecção de casos influentes e indicaram que

nem todo valor discrepante em uma amostra é influente no processo de estimação de

parâmetros ou predição espacial. Estudo de similaridade entre o mapa original e mapas

construídos a partir da retirada de pontos influentes foi realizado, mostrando mudanças

consideráveis.

Além das contribuições apresentadas acima, surgiram ao longo do desenvolvimento da

tese alguns possíveis problemas a serem investigados em estudos futuros:

• Abordar a análise de influência local embasada na Q-function para o modelo linear

Page 149: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

131

espacial slash considerando um esquema adequado de perturbação à variável resposta

e à matriz de variância e covariância;

• Extender o modelo linear espacial slash para dados com repetição e realizar estudo de

inferência e análise de diagnóstico;

• Desenvolver um pacote na plataforma R para uso com a distribuição slash que permita

ao usuário estimar parâmetros, realizar de testes de hipóteses, análise de diagnóstico e

modelagem;

Page 150: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

132

APÊNDICE A -- Derivadas do logaritmo da função

verossimilhança

A.1 A derivada de primeira ordem e a função escore

O logaritmo da função verossimilhança da distribuição slash reparametrizada, denotada

como Y ∼ SLp(µ,Σ, η), é dado por

l(θ) =n∑

i=1

li(θ),

em que

li(θ) = − log(η)+p

2log

(c(η)

)− 1

2log |Σ|+ log

(G(a, bi)

),

sendo G(a, bi) =1∫0

va−1 exp− vb

dv, bi =

1

2c(η)δi, com δi = (yi − µ)⊤Σ−1(yi − µ) e a =

p

2+

1

η, para 0 < η < 1.

Derivando com relação a cada componente do vetor θ, tem-se a função escore U(θ),

cuja forma particionada é dada por U i(θ) = (U i(µ)⊤,U i(φ)

⊤, Ui(η))⊤, para i = 1, ..., n, cujos

elementos são apresentados a seguir.

U i(µ) =∂li(θ)

∂µ=

∂µlog(G(a, bi)

)=

∂δilog(G(a, bi)

)∂δi∂µ

= −2wG(·, δi)Σ−1(yi − µ),

em que wG(·, δi) =∂

∂δilogG(a, bi), sendo logG(a, bi) avaliada a partir da função Gamma

incompleta, cuja forma é dada por G(a, bi) = b−ai γ(a, bi), para i = 1, ..., n e (·) constante em

relação à variável a ser derivada.

Na derivada em relação a φ, foi considerado φ = vech(Σ), que denota os diferentes

elementos da matriz Σ (MAGNUS; NEUDECKER, 1999). Desta forma,

U i(φ) =∂li(θ)

∂φ= −1

2

∂φlog |Σ|+ ∂

∂φlog(G(a, bi)

),

= −1

2

∂φvec⊤(Σ)vec(Σ−1) +

∂δilog(G(a, bi)

) δiδφ

.

Sabendo-se que∂δi∂φ

= − ∂

∂φvec⊤(Σ)vec

(Σ−1(yi − µ)(yi − µ)⊤Σ−1

), então,

U i(φ) = −1

2

∂φvec⊤(Σ)vec(Σ−1)− wG(·, δi)

∂φvec⊤(Σ)vec

(Σ−1(yi − µ)(yi − µ)⊤Σ−1

).

Page 151: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

133

Como a matriz Σ é simétrica, então é possível escrever∂

∂φvec⊤(Σ) = D⊤

p . Assim,

U i(φ) = −D⊤p vec

[wG(·, δi)

(Σ−1(yi − µ)(yi − µ)⊤Σ−1

)+

1

2Σ−1

],

em que Dp ∈ ℜp2×p(p+1)/2 denota a matriz de duplicação de ordem p (MAGNUS; NEUDECKER,

1999).

Ui(η) =∂li(θ)

∂η=

∂η

[− log

(η)+p

2log

(c(η)

)+ log

(G(a, bi)

)]

= −1

η+p

2c(η) + wG(η, ·),

em que wG(η, ·) =∂

∂ηlog(G(a, bi)

).

A.1.1 Derivada de primeira ordem de wG(·, ·)

A.1.1.1 A wG(·, δi)

Seja wG(·, δi) a derivada de log(G(a, bi)

)em relação a δi. Da regra da cadeia, é

possível escrever

wG(·, δi) =∂

∂δi

[log(G(a, bi)

))]=

1(G(a, bi)

) ∂

∂bi

(G(a, bi)

)

︸ ︷︷ ︸D1

∂δibi

︸ ︷︷ ︸D2

.

Para a solução de D1, considere a Regra de Liebnitz dada pela Proposição A.1.

Proposição A.1. Se f(y, θ), c(θ) e d(θ) são diferenciáveis com respeito a θ, então

d

d(θ)

d(θ)∫

c(θ)

f(y, θ)dy = f(d(θ), θ

) d

d(θ)d(θ)− f(c(θ), θ)

d

d(θ)c(θ) +

d(θ)∫

c(θ)

∂θf(y, θ)dy. (A.1)

Como para este estudo, c(θ) e d(θ) são constantes em (A.1), tem-se um caso especial

da regra de Liebnitz, que pode ser expressa a partir de

d

d(θ)

d∫

c

f(y, θ)dy =

d∫

c

∂θf(y, θ)dy. (A.2)

Assim, para f(y, θ) = G(a, bi), c = 0, d = 1 e θ = a, bi, segue por (A.2) que

∂bi

(G(a, bi)

)=

1∫0

∂bi

[va−1e−vbidv

]= −

1∫

0

vae−vbidv

︸ ︷︷ ︸I.D1

.

Aplicando-se integração por partes em I.D1, em que

u = va

du = ava−1dve

dx = e−vbi

x =1

bie−vbi

, resulta que

Page 152: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

134

∂bi

(G(a, bi)

)= −e

−bi

bi+a

bi

1∫

0

va−1e−vbidv

︸ ︷︷ ︸II.D1

.

Resolvendo-se II.D1 separadamente por mudança de variável, tal que

t = vb

dv =dt

bi

t = vb

v =t

bi

ev → 0 ⇒ t→ 0

v → 1 ⇒ t→ b

tem-se, II.D1 = ab−(a+1)i γ(a, bi).

A partir da fórmula recorrente, bai e−bi = aγ(a, bi)−γ(a+1, bi) ( ABRAMOWITZ; STEGUN,

1970), tem-se que

∂bi

(G(a, bi)

)= − 1

ba+1i

γ(a+ 1, bi).

Já a solução de D2 é simples, uma vez que

D2 =∂

∂δibi =

∂δi

[1

2c(η)δi

]=

1

2c(η).

Desta forma,∂

∂δi

[log(G(a, bi)

))]= − 1

δi

γ(a+ 1, bi)

γ(a, bi). (A.3)

Agora, considerando-se a relação γ(a+1, bi) = aΓ(a)P(a, bi) e γ(a, bi) = Γ(a)P(a, bi),

e sabendo-se que a =p

2+

1

η, o resultado segue, e

wG(·, δi) = −1

2

(ηp+ 2

δiη

)P(a+ 1, b)

P(a, b).

A.1.1.2 wG(η, ·)

Seja wG(η, ·) a derivada de log(G(a, bi)

)em relação a η e considere ainda a seguinte

relação ( ABRAMOWITZ; STEGUN, 1970),

G(a, bi) = b−ai γ(a, bi) = b−a

i Γ(a)P(a, bi)

em que, P(a, bi) é a FDA da distribuição γ(a, bi), isto é,

P(a, bi) =1

Γ(a)

bi∫

0

ta−1 exp(−t)dt,

com t = vbi.

Logo,

∂ηlog(G(a, bi)

)=

∂η

[log(bi

−aΓ(a)P(a, bi))]

=∂

∂η

[−a log bi + log Γ(a) + logP(a, bi)

].

Como,

∂η

[−alog(bi)

]= − ∂

∂η

[p

2+

1

η

]log

[c(η)δi2

]−[p

2+

1

η

]∂

∂ηlog

[c(η)δi2

]=

1

η2log(bi)− ac(η)

Page 153: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

135

Assim,

wG(η, ·) =1

η2

[log(bi)− ψ

(a)]

− ac(η) +

∂∂ηP

(p2 + 1

η ,c(η)δi

2

)

P

(p2 + 1

η ,c(η)δi

2

) , (A.4)

avaliada conforme descrito anteriormente, sendo que ψ(a)

representa a função

digamma.

A.2 A derivada de segunda ordem e a matriz de informação observada

A matriz de informação observada é dada por I(θ) = −L(θ), sendo L(θ) =

1

n

n∑

i=1

Li(θ), para Li(θ) =∂2li(θ)

∂θ∂θ⊤ com i = 1, ..., n, cujos elementos são apresentados a seguir.

Li(µµ) =∂2li(θ)

∂µ∂µ⊤ =∂

∂µ⊤

[U i(µ)

]=

∂µ⊤

[− 2wG(·, δi)Σ−1(yi − µ)

]

= 2wG(·, δi)Σ−1 + 4w′

G(·, δi)Σ−1(yi − µ)(yi − µ)⊤Σ−1,

em que w′

G(·, δi) =∂

∂δi

[wG(·, δi)

];

Li(µφ) =∂2li(θ)

∂µ∂φ⊤ =∂

∂φ⊤

[U i(µ)

]=

∂φ⊤

[− 2wG(·, δi)Σ−1(yi − µ)

]

= 2

wG(·, δi)

[(yi − µ)⊤ ⊗ Ip

][(Σ−1 ⊗Σ−1)Dp

]

+w′

G(·, δi)[Σ−1(yi − µ)

][vec(Σ−1(yi − µ)(yi − µ)⊤Σ−1)Dp

];

Li(µφ) = L⊤i (φµ);

Li(φφ) =∂2li(θ; )

∂φ∂φ⊤ =∂

∂φ⊤

[U i(φ)

]

= −1

2

∂φ⊤

[∂

∂φlog |Σ|

]+ wG(·, δi)

∂2δi

∂φ∂φ⊤ + w′

G(·, δi)∂δi∂φ

∂δi

∂φ⊤ ,

sendo

−1

2

∂φ⊤

[∂

∂φlog |Σ|

]=

1

2

D⊤p [Σ

−1 ⊗Σ−1]Dp − [vec⊤(Σ−1)⊗ Iq]∂

∂φ⊤ vec[D⊤p ]

,

∂2δi

∂φ∂φ⊤ = 2D⊤p

[Σ−1 ⊗Σ−1(yi − µ)(yi − µ)⊤Σ−1

]Dp

vec⊤[Σ−1 ⊗Σ−1(yi − µ)(yi − µ)⊤Σ−1

]⊗ Iq

∂φ⊤ vec(

D⊤p

),

Page 154: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

136

em que, Iq é a matriz identidade de ordem q =p(p+ 1)

2parâmetros,

∂δi∂φ

∂δi

∂φ⊤ = D⊤p

(Σ−1 ⊗Σ−1)

[(yi − µ)(yi − µ)⊤ ⊗ (yi − µ)(yi − µ)⊤

](Σ−1 ⊗Σ−1)

Dp

e w′

G(·, δi) =∂

∂δi

[wG(·, δi)

];

Li(ηµ) =∂2li(θ)

∂η∂µ⊤ =∂

∂η

[U i(µ)

]=

∂η

[wG(·, δi)

∂δi∂µ

]

= −2wG(η, δi)Σ−1(yi − µ),

em que, wG(η, δi) =∂

∂η

[wG(·, δi)

]

Li(ηφ) =∂2li(θ)

∂η∂φ⊤ =∂

∂η

[U i(φ)

]

=∂

∂η

[− 1

2

∂φvec⊤(Σ)vec(Σ−1)− wG(·, δi)

∂φvec⊤Σvec

(Σ−1(yi − µ)(yi − µ)⊤Σ−1

)]

= −D⊤p wG(η, δi)vec(Σ−1(yi − µ)(yi − µ)⊤Σ−1);

Li(ηη) =∂2li(θ)

∂η∂η=

∂η

[Ui(η)

]=

∂η

[− 1

η+p

2c(η) + wG(η, ·)

]

=1

η2+p

2c(η)2 + w

G(η, ·),

em que w′

G(η, ·) =∂

∂η

[wG(η, ·)

].

A.2.1 Derivada de segunda ordem de wG(·, ·)

A.2.1.1 A w′

G(·, δi)

Seja w′

G(·, δi) =∂

∂δi

[wG(·, δi)

], ou seja, a derivada de segunda ordem de log

(G(a, bi)

)

em relação a δi. Usando o resultado dado em (A.3) e a regra da cadeia, é possível escrever

w′

G(·, δi) =∂

∂2δi

[log(G(a, bi)

)]=

∂δi

[− 1

δi

γ(a+ 1, biγ(a, bi)

]

=1

δ2i

γ(a+ 1, biγ(a, bi)

− 1

δi

∂δi

[γ(a+ 1, biγ(a, bi)

]

︸ ︷︷ ︸D3

.

Resolvendo D3 separadamente, tem-se

∂δi

[γ(a+ 1, biγ(a, bi)

]=

∂bi

[γ(a+ 1, bi)

γ(a, bi)

]∂

∂δibi.

Page 155: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

137

Como,

∂bi

[γ(a+ 1, bi)

γ(a, bi)

]= a− γ(a+ 1, bi)

γ(a, bi)− a

b

γ(a+ 1, bi)

γ(a, bi)+

1

bi

[γ(a+ 1, bi)

γ(a, bi)

]2

e∂

∂δibi =

1

2c(η),

então

w′

G(·, δi) =1

δ2γ(a+ 1, bi)

γ(a, bi)− 1

δi

c(η)

2

[a− γ(a+ 1, bi)

γ(a, bi)− a

b

γ(a+ 1, bi)

γ(a, bi)+

1

bi

[γ(a+ 1, bi)

γ(a, bi)

]2].

Chamando-se S =γ(a+ 1, bi)

γ(a, bi), o resultado segue, e

w′

G(·, δi) =1

δ2

[(S − bi)(a− S) + S

].

A.2.1.2 A w′

G(η, ·)

Seja w′

G(η, ·) =∂

∂η

[wG(η, ·)

]. Ao usar-se o resultado dados em A.4, é possível

escrever

w′

G(η, ·) =∂

∂2η

[log(G(a, bi)

)]

=∂

∂η

[1

η2

[log(bi)− ψ

(a)]

− ac(η) +

∂∂ηP

(p2 + 1

η ,c(η)δi

2

)

P

(p2 + 1

η ,c(η)δi

2

)].

Chamando-se D =

∂∂ηP(a, bi)

P(a, bi), então

w′

G(η, ·) = − 2

η3[log(bi) + ψ(a)

]+ η−4

(a) + b−1]+ η−2c(η) + ac(η)−2 +

∂ηD.

A.2.1.3 A wG(η, δi)

Seja wG(η, δi) =∂

∂η

[wG(·, δi)

]. Ao usar-se o resultado dado em (A.3), é possível

escrever

wG(η, δi) =∂

∂η

[− 1

2

(ηp+ 2

δiη

)P(a+ 1, b)

P(a, b)

].

Aplicando a regra da cadeia, tem-se

wG(η, δi) =1

δiη

4η−1P(a+ 1, b)

P(a, b)− 2(ηp+ 2)

∂η

P(a+ 1, b)

P(a, b)

.

Page 156: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

138

APÊNDICE B -- Matriz de informação esperada

Ao se determinar o estimador de máxima verossimilhança θ do vetor de parâmetros

θ, é importante avaliar o erro padrão assintótico associado. Vários procedimentos podem ser

considerados, entre eles a inversa da matriz de informação esperada ou matriz de Fischer

(I(θ)). Ao se supor que a função suporte da distribuição slash atenda às condições de

regularidade (LEHMANN, 1983; MITCHELL, 1989 e SUTHRADAR, 1993), é possível calcular

I(θ) considerando-se uma versão empírica dada por

I(θ) =1

n

n∑

i=1

Eθ[U i(θ)U⊤i (θ)],

em que o valor esperado E(·) é tomado com respeito à função densidade de probabilidade da

slash multivariada. Outra alternativa usual é dada por

I(θ) = −Eθ

[1

n

n∑

i=1

∂2li(θ)

∂θ∂θ⊤

].

Além disso, vamos considerar o Lema 3, adaptado dos resultados de Mitchell (1989) e

Suthradar (1993), sendo a distância de Mahalanobis escrita da seguinte forma

δ = (Y − µ)⊤Σ− 12Σ− 1

2 (Y − µ)

= r⊤Σ− 12Σ− 1

2r

= Z⊤Z

= ||Z||2.

em que ||Z|| é a norma do vetor Z = Σ− 12r e Z∼SLp(0, Ip, η).

Lema B.1. Considere que Z∼SLp(0, Ip, η), em que Z = Σ− 12r, sendo r = (Y − µ), Ip a

matriz identidade de ordem p× p, η parâmetro de forma, para 0 < η < 1 e c = wG(·, δ), então:

i) E

[cZ]= 0;

ii) E

[cZZ⊤

]= Ip;

iii) E

[c2ZZ⊤

]=dg

pIp, em que dg = E

[w2G(·, δ)||Z||2

];

iv) E

[c2(

vec(ZZ⊤)Z⊤)]

= 0;

v) E

[c2(

vec(ZZ⊤)vec(ZZ⊤)⊤)]

= E

[c2(ZZ⊤ ⊗ ZZ⊤

)]=

fg

p(p+ 2)

[2Np +

Page 157: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

139

vec(Ip)vec⊤(Ip)

], em que fg = E

[w2G(·, δ)||Z||4

]e Np =

1

2

[Ip2 + Kp

]sendo Kp a

matriz comutação de ordem p2 × p2 (MAGNUS; NEUDECKER, 1999).

Assim, a informação de Fisher individual fica como segue.

Informação de Fisher para µµ

I i(µµ) = E

U i(µ)U

⊤i (µ)

,

em que,

U i(µ)U⊤i (µ) =

− 2wG(·, δi)Σ− 1

2zi

− 2wG(·, δi)Σ− 1

2zi

= 4w2G(·, δi)

(Σ− 1

2ziz⊤i Σ

− 12

).

Fazendo-se

E

U i(µ)U

⊤i (µ)

= 4E

w2G(·, δi)

(Σ− 1

2ziz⊤i Σ

− 12

),

tem-se, pelo item iii) do Lema 3 que

I i(µµ) = 4dg

pΣ−1.

Informação de Fisher para µφ

I i(µφ) = E

U i(µ)U

⊤i (φ)

,

em que

U i(µ)U⊤i (φ) =

− 2wG(·, δi)Σ− 1

2zi

− 1

2

∂φvec⊤(Σ)vec(Σ−1)

−wG(·, δi)∂

∂φvec⊤(Σ)vec

(Σ−

1

2ziz⊤i Σ

−1

2

)⊤

= wG(·, δi)Σ−1

2zivec⊤(Σ−1)∂

∂φ⊤ vec(Σ)

+2w2G(·, δi)Σ− 1

2zivec⊤(Σ−

1

2ziz⊤i Σ

−1

2

) ∂

∂φ⊤ vec(Σ).

Agora, fazendo-se

E

U i(µ)U

⊤i (φ)

= E

wG(·, δi)Σ−

1

2zivec⊤(Σ−1)∂

∂φ⊤ vec(Σ)

+2E

w2G(·, δi)Σ− 1

2zivec⊤(Σ−

1

2ziz⊤i Σ

−1

2

) ∂

∂φ⊤vec(Σ)

,

e valendo-se do fato, vec(Σ− 1

2ziz⊤i Σ

−1

2

)= vec

(Σ−

1

2Σ−1

2

)vec(ziz

⊤i

), então, pelo item i) e

iv) do Lema 3, tem-se que

I i(µφ) = 0.

Page 158: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

140

Informação de Fisher para φφ

I i(φφ) = EU i(φ)U

⊤i (φ)

,

em que

U i(φ)U⊤i (φ) =

− 1

2

∂φvec⊤(Σ)vec(Σ−1)− wG(·, δi)

(∂

∂φvec⊤(Σ)vec

(Σ−

1

2ziz⊤i Σ

−1

2

))2

=1

4

∂φvec⊤(Σ)vec(Σ−1)vec⊤(Σ−1)

∂φ⊤ vec(Σ)

+1

2wG(·, δi)

∂φvec⊤(Σ)vec(Σ−1)vec

(Σ−

1

2zizTi Σ

−1

2

) ∂

∂φTvec(Σ)

+1

2wG(·, δi)

∂φvec⊤(Σ)vec

(Σ−

1

2ziz⊤i Σ

−1

2

)vec⊤

(Σ) ∂

∂φ⊤ vec(Σ)

+w2G(·, δi)

∂φvec⊤(Σ)vec

(Σ−

1

2ziz⊤i Σ

−1

2

)vec⊤

(Σ−

1

2ziz⊤i Σ

−1

2

) ∂

∂φ⊤ vec(Σ).

Fazendo-se E

U i(φ)U

⊤i (φ)

= E

(S1)+ E

(S2)+ E

(S3)+ E

(S4)

e ao serem calculadas as

esperanças separadamente, tem-se

E(S1)=

1

4D⊤p vec(Σ−1)vec⊤(Σ−1)Dp.

E(S2)=

1

2E

wG(·, δi)D⊤

p vec(Σ−1)vec(Σ−

1

2ziz⊤i Σ

−1

2

) ∂

∂φ⊤Dp

.

Como, vec(Σ−

1

2ziz⊤i Σ

−1

2

)= vec

(Σ−

1

2Σ−1

2

)vec(ziz

⊤i

), então

E(S2)=

1

2D⊤p vec(Σ−1)E

wG(·, δi)vec⊤(ziz

⊤i )

vec⊤(Σ−

1

2Σ−1

2 )Dp.

Do item ii) do lema 3, tem-se

E(S2)= −1

4D⊤p vec(Σ−1)vec⊤(Σ−1)Dp.

E(S3)= E

(S2).

E(S4)= E

w2G(·, δi)

∂φvec⊤(Σ)vec

(Σ−

1

2ziz⊤i Σ

−1

2

)vec⊤

(Σ−

1

2ziz⊤i Σ

−1

2

) ∂

∂φ⊤ vec(Σ)

Como

vec(Σ−

1

2ziz⊤i Σ

−1

2

)vec⊤

(Σ−

1

2ziz⊤i Σ

−1

2

)=(Σ−

1

2 ⊗Σ−1

2

)[ziz

⊤i ⊗ ziz

⊤i

](Σ−

1

2 ⊗Σ−1

2

),

tem-se que

E(S4)= D⊤

p

(Σ−

1

2 ⊗Σ−1

2

)E

w2G(·, δi)

[ziz

⊤i ⊗ ziz

⊤i

](Σ−

1

2 ⊗Σ−1

2

)Dp.

Page 159: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

141

Usando-se o item v) do Lema 3, segue que

E(S4)= D⊤

p

(Σ−

1

2 ⊗Σ−1

2

) fg

p(p+ 2)

[2Np + vec(Ip)vec⊤(Ip)

](Σ−

1

2 ⊗Σ−1

2

)Dp.

Denominando(Σ−

1

2 ⊗Σ−1

2

)[2Np + vec(Ip)vec⊤(Ip)

](Σ−

1

2 ⊗Σ−1

2

)= J, tem-se

J =(Σ−

1

2 ⊗Σ−1

2

)[Ip2

(Σ−

1

2 ⊗Σ−1

2

)+ Ip

(Σ−

1

2 ⊗Σ−1

2

)+ vec(Ip)vec⊤(Ip)

(Σ−

1

2 ⊗Σ−1

2

)],

=(Σ−1 ⊗Σ−1

)+(Σ−

1

2 ⊗Σ−1

2

)(Σ−

1

2 ⊗Σ−1

2

)Ip + vec(Σ−1)vec⊤(Σ−1),

=(Σ−1 ⊗Σ−1

)(Ip2 + Ip

)+ vec(Σ−1)vec⊤(Σ−1).

Assim,

E(S4)=

fg

p(p+ 2)D⊤p

2(Σ−1 ⊗Σ−1

)Np + vec(Σ−1)vec⊤(Σ−1)

Dp.

Consequentemente

I i(φφ) = E

U i(φ)U

⊤i (φ)

= E

(S1)+ E

(S2)+ E

(S3)+ E

(S4)

= −1

4D⊤p vec(Σ−1)vec⊤(Σ−1)Dp

+fg

p(p+ 2)D⊤p

2(Σ−1 ⊗Σ−1

)Np + vec(Σ−1)vec⊤(Σ−1)

Dp

= D⊤p

2

fg

p(p+ 2)

(Σ−1 ⊗Σ−1

)Np +

(fg

p(p+ 2)− 1

4

)vec(Σ−1)vec⊤(Σ−1)

Dp

Informação de Fisher para µη

I i(µη) = E

U i(µ)Ui(η)

em que

U i(µ)Ui(η) =

− 2wG(·, δi)Σ− 1

2zi

− 1

η+p

2c(η) + wG(η, ·)

.

Fazendo-se,

E

U i(µ)U i(η)

= − c(η)pE

wG(·, δi)Σ−

1

2zi

+

2

ηE

wG(·, δi)Σ−

1

2zi

+1

η2E

wG(·, δi)Σ− 1

2ziwG(η, ·),

então, pelo item i) do Lema 3, tem-se

I i(µη) = 0.

Informação de Fisher para φη

Page 160: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

142

Para este caso, optou-se por calcular I(θ) = E [−L(θ)] . Assim,

I i(φη) = E

− ∂2l(θ;yi)

∂η∂φ

= E

wG(η, δi)

(D⊤p vec(Σ− 1

2ziz⊤i Σ

− 12 ))

= E

wG(η, δi)ziz

⊤i

D⊤p vec(Σ−1);

Informação de Fisher para ηη

Ii(ηη) = E

Ui(η)Ui(η)

,

em que

Ui(η)Ui(η) =

− 1

η+p

2c(η) + wG(η, ·)

2

.

Então,

Ii(ηη) =1

η2− p

ηc(η) +

p2

4c(η)2 −

[2

η− pc(η)

]E

[wG(η, ·)

]+ E

[w2G(η, ·)

].

Page 161: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

143

APÊNDICE C -- Derivada Q-function

Considerando-se que Q(θ|θ∗) = Elc(θ|Y c)

, em que Q(θ|θ∗) =

∑ni=1Qi(θ|θ∗),

tem-se que a Q-function fica da seguinte forma

Q(θ|θ∗) = − np

2log(2π)− n

2log |Σ∗| − 1

2

n∑

i=1

w∗i r

∗i⊤Σ∗−1r∗i (C.1)

+np

2log c(η)− n log η∗ +

(p

2+

1

η∗− 1

) n∑

i=1

c∗i ,

em que r∗i = (yi − µ∗), com µ∗ =

∑ni=1w

∗i yi∑n

i=1w∗i

, Σ∗ =1

n

∑ni=1w

∗i r

∗i r

∗i⊤, η∗ = arg max Q(η|θ∗),

sendo w∗i = E

Vi|Y i,θ

e c∗i = E

log(Vi|Y i,θ

∗), na qual θ∗ = (µ∗⊤,φ∗⊤, η∗)⊤ é a

estimativa do parâmetro de θ = (µ⊤,φ⊤, η)⊤, obtida na r-ésima iteração do algoritmo EM.

C.1 Derivada de primeira ordem [Q]

Com base na Equação (C.2), a derivada de primeira ordem de Q(θ|θ∗) com respeito a

θ = (µ⊤,φ⊤, η)⊤ é dada por:

Qµ(θ|θ∗) =∂

∂µ

[− 1

2

n∑

i=1

w∗i r

∗i⊤Σ∗−1r∗i

]

=n∑

i=1

w∗iΣ

∗−1r∗i ;

Qφ(θ|θ∗) =∂

∂φ

[n

2log |Σ∗|

]− 1

2

∂φ

[ n∑

i=1

w∗i r

∗i⊤Σ∗−1r∗i

]

=1

2D⊤p vec

[ n∑

i=1

w∗i (Σ

∗−1r∗i r∗i⊤Σ∗−1)− n(Σ∗−1)

];

Qη(θ|θ∗) =∂

η

[n log η∗ +

(p

2+

1

η∗− 1

) n∑

i=1

c∗i

]

= − n

η∗+np

2c(η∗)− 1

η∗2

n∑

i=1

c∗i .

Ao se avaliar θ = θ∗ = θ, na qual θ é o estimador de máxima verossimilhança de θ,

têm-se

Q(θ|θ) =[Q(θ|θ∗)

]

θ=θ∗=θ

= 0,

Page 162: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

144

que gera os seguintes resultados:

∑ni=1 wiΣ

−1ri = 0

D⊤p vec

[∑ni=1 wi(Σ

−1rir

⊤i Σ

−1)− n(Σ

−1)]= 0

−nη+np

2c(η)− 1

η2∑n

i=1 ci = 0

(C.2)

C.2 Derivada de segunda ordem [Q]

Com base nas derivadas de primeira ordem, a derivada de segunda ordem de Q(θ|θ∗)

com respeito a θ, pode ser obtida como segue:

Para µµ

Qµµ(θ|θ∗) =∂2Q(θ|θ∗)∂µ∂µ⊤ =

∂µ⊤

[Qµ(θ|θ∗)

]

= −n∑

i=1

w∗iΣ

∗−1;

Para φφ

Qφφ(θ|θ∗) =∂2Q(θ|θ∗)

∂φ∂φ⊤ =∂

∂φ⊤

[Qφ(θ|θ∗)

]

= −n2

∂φ⊤

[D⊤p vec(Σ∗−1)

]

︸ ︷︷ ︸I.C

+1

2

∂φ⊤

[D⊤p

n∑

i=1

w∗i vec(Σ∗−1rir

⊤i Σ

∗−1)

]

︸ ︷︷ ︸II.C

;

Resolvendo I.C e II.C separadamente, tem-se

(I.C)

−n2

∂φ⊤

[D⊤p vec(Σ∗−1)

]= −n

2D⊤p

[−[Σ∗−1 ⊗Σ∗−1

] ∂

∂φ⊤ vecΣ]

=n

2D⊤p

[Σ∗−1 ⊗Σ∗−1

]Dp,

(II.C)

1

2

∂φ⊤

[D⊤p

n∑

i=1

w∗i vec(Σ∗−1r∗i r

∗i⊤Σ∗−1)

]=

1

2D⊤p

[ n∑

i=1

w∗i

∂φ⊤ vec(Σ∗−1r∗i r

∗i⊤Σ∗−1)

]

= −D⊤p

[ n∑

i=1

w∗i

[Σ∗−1 ⊗Σ∗−1rir

⊤i Σ

∗−1]]

Dp.

Voltando a Qφφ(θ|θ∗), tem-se

Qφφ(θ|θ∗) =n

2D⊤p

[Σ∗−1 ⊗Σ∗−1

]Dp − D⊤

p

[ n∑

i=1

w∗i

[Σ∗−1 ⊗Σ∗−1r∗i r

∗i⊤Σ∗−1

]]Dp;

Page 163: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

145

Para µφ

Qµφ(θ|θ∗) =∂2Q(θ|θ∗)

∂µ∂φ⊤ =∂

∂φ⊤

[Qµ(θ|θ∗)

]

=n∑

i=1

w∗i

∂φ⊤ vec(Σ∗−1)r∗i

= −n∑

i=1

w∗i (r

∗i⊤ ⊗ Ip)

[Σ∗−1 ⊗Σ∗−1

]Dp;

Para ηφ

Qηφ(θ|θ∗) =∂2Q(θ|θ∗)∂η∂φ

=∂

∂η

[Qφ(θ|θ∗)

]= 0;

Para ηµ

Qηµ(θ|θ∗) =∂2Q(θ|θ∗)∂η∂µ

=∂

∂η

[Qµ(θ|θ∗)

]= 0;

Para ηη

Qηη(θ|θ∗) =∂2Q(θ|θ∗)∂η∂η

=∂

∂η

[Qη(θ|θ∗)

]

=∂

∂η

[−nη∗

]+

∂η

[np

2c(η)

]− ∂

∂η

[1

η∗2

n∑

i=1

c∗i

]

=n

η∗2+np

2c(η)2 +

2

η∗3

n∑

i=1

c∗i .

C.3 Esperança de[− Q

]

A esperança condicional de[− Q

], avaliada em θ = θ∗ = θ, tem-se

E[− Qµµ

]∣∣∣θ=θ∗=θ

= nwΣ−1

;

E[− Qµφ⊤

]∣∣∣θ=θ∗=θ

= 0;

E[− Qφφ⊤

]∣∣∣θ=θ∗=θ

=n

2D⊤p

−1 ⊗ Σ−1]

Dp;

E[− Qµη⊤

]∣∣∣θ=θ∗=θ

= 0;

E[− Qφη⊤

]∣∣∣θ=θ∗=θ

= 0;

E[− Qηη⊤

]∣∣∣θ=θ∗=θ

= − n

η2− np

2c(η)2 − 2n

η3c.

Page 164: DISTRIBUIÇÃO SLASH MULTIVARIADA APLICADA A DADOS …tede.unioeste.br/bitstream/tede/3087/2/Regiane_Fagundes2017.pdf · esquema de perturbação a distribuição e considerando diferentes

146

Portanto,− E

[Q(θ|θ)

]deve ser da forma

−E[Q(θ|θ)

]=

nwΣ−1

0 0

0n

2D⊤p

−1 ⊗ Σ−1]Dp 0

0 0 − n

η2− np

2c(η)2 − 2n

η3c

,

sendo w =∑n

i=1 wi =∑n

i=1E(Vi|Y i, θ

)e c =

∑ni=1E

log Vi

=∑n

i=1Elog(Vi|Y i, θ

).

C.4 Derivada da Q-function para influência global

Quando a i-ésima observação é deletada para o estudo de influência global, a

Q-function será dada por

Q[i](θ|θ∗) =n∑

k=1;k 6=i

Qk(θ|θ∗),

cuja forma é expressa por:

Q[i](θ|θ∗) = − p(n− 1)

2log(2π)− (n− 1)

2log |Σ∗| − 1

2

n∑

k=1;k 6=i

w∗kr

∗k⊤Σ∗−1r∗k

+p(n− 1)

2log(c(η))− (n− 1) log η∗ +

(p

2+

1

η∗− 1

) n∑

k=1;k 6=i

c∗k. (C.3)

Assim, pode-se verificar que a derivada de primeira ordem de Q[i](θ|θ∗) é

˙Q[i]µ(θ|θ∗) =n∑

k=1;k 6=i

w∗kΣ

∗−1r∗k;

˙Q[i]φ(θ|θ∗) = −(n− 1)

2D⊤p vec(Σ∗−1) +

1

2D⊤p

n∑

k=1;k 6=i

w∗k(Σ

∗−1r∗kr∗k⊤Σ∗−1);

˙Q[i]µ(θ|θ∗) = −(n− 1)

η∗+p(n− 1)

2c(η∗)− 1

η∗2

n∑

k=1;k 6=i

c∗k;

Avaliando-se Q[i](θ|θ) =

[Q[i](θ|θ∗)

]

θ=θ∗=θ

= 0, e usando os resultados dados pela

equação (C.2), obtêm-se que:

Q[i](θ|θ) =

−wiΣ−1

ri1

2D⊤p vec

−1 − wi(Σ−1

riri⊤Σ

−1)

]

−1

η+p

2c(η)− 1

η2ci

.

em que , ri = yi − µ e µ, Σ e η são os estimadores de máxima verossimilhança de µ, Σ e η,

respectivamente.