TeseCarlosUchoa2003

  • Upload
    rioand

  • View
    114

  • Download
    0

Embed Size (px)

Citation preview

Carlos Augusto Ucha da Silva

UM MTODO PARA ESTIMAR OBSERVVEIS GPS USANDO REDES NEURAIS ARTIFICIAIS

Tese apresentada Escola de Engenharia de So Carlos da Universidade de So Paulo, como parte dos requisitos para obteno do ttulo de Doutor em Engenharia Civil: Transportes.

Orientador: Prof. Associado Paulo Cesar Lima Segantine

So Carlos 2003

DEDICATRIA

minha esposa Ktia Cynara e meus filhos Rayra, Rahym e Raimi, meus maiores presentes.

AGRADECIMENTOS

A Deus pela esperana, pelos dons, pelo existir. A Ktia, a mulher que amo, por seu amor, por se tornar pai e me de nossos filhos em meus interminveis devaneios pelo mundo acadmico. A Maina por sua dedicao e carinho. A Aristides, meu pai, por seu apoio. Seu carter, inteligncia e criatividade sempre me inspiraram. A Helena, minha me, por seu amor. Sua emoo, por vezes inocente, mesmo distncia, sempre me afagaram. Ao cl dos Uchas, Conce, Beth e Humberto pela torcida, pela saudade e pelo carinho. A Rita, que com sua amizade, generosidade e desapego, tornou possvel mais esse passo. Aos meus cunhados. Os dois, cada um ao seu tempo, cada um de seu jeito, foram importantes. Antnio no incio, na sada de Belm e a Csar por sua ajuda providencial em nosso regresso. Ao amigos do forninho. Genival, Tule, Maurcio e Rodrigo so os irmos que escolhi em So Carlos, considerem o Meio-inteiros meu agradecimento especial a cada um e a todos os amigos nele citados. A Rodrigo, em especial por sua essencial ajuda ao desenvolvimento desse projeto, seu talento e doao fizeram dele o autor de diversas das implementaes computacionais utilizadas nesta pesquisa.

A meu orientador, Prof. Associado Paulo Csar Lima Segantine, por suas correes e sugestes para este trabalho. A Ktia Duarte, do Departamento de geodsia do IBGE pelo fornecimento dos dados da RBMC. A Profa. Roseli Romero, por sua ajuda na conduo da escolha da modelagem neural. Aos amigos do CEFET-Pa, pela torcida, pela fora, um agradecimento especial aos amigos Expedito, Srgio e Luis Carlos. Finalmente, a toda minha famlia, em especial a Rita Barbosa, minha av, ela se foi em 1994. Acho que herdei dela o seu melhor. Sua perseverana e altivez sempre encontraram eco em mim e definitivamente me impulsionaram a chegar at aqui, sinto saudades.

SUMRIOLISTA DE FIGURAS .......................................................................................... i LISTA DE TABELAS........................................................................................ iv LISTA DE SIGLAS .............................................................................................v RESUMO.......................................................................................................... vii ABSTRACT ..................................................................................................... viii 1 INTRODUO ..............................................................................................1 1.1. Objetivos.......................................................................................................4 1.2. Justificativas ................................................................................................4 2 O ESTADO DA ARTE ...................................................................................6 3 O SISTEMA DE POSICIONAMENTO GLOBAL NAVSTAR/GPS.............9 3.1. O Sinal GPS ...............................................................................................10 3.2 As observveis GPS ....................................................................................12 3.2.1. Pseudodistncia ......................................................................................13 3.2.2 Fase da portadora ....................................................................................14 3.3 O Processamento de dados GPS .................................................................17 3.3.1 Posicionamento Pontual Preciso (PPP) ...................................................18 3.3.1.1 O Auto-GIPSY (AG) .............................................................................20 3.4 O formato RINEX........................................................................................22 4 REDES NEURAIS ARTIFICIAIS (RNAs) .................................................24 4.1 Inspirao Biolgica ....................................................................................25 4.2 Neurnio Artificial ......................................................................................27 4.3 Topologia tima. ..........................................................................................28 4.4 Caractersticas e propriedades teis das RNAs.........................................29

4.5 Os Modelos Neurais. ...................................................................................30 4.5.1 O Modelo Perceptron Multi Camadas (Multilayer Perceptrons ou MLP). ...........................................................................................................31 4.5.2 O algoritmo backpropagation ..................................................................33 4.5.2.1 Algoritmo de treinamento rpido .........................................................35 5 MATERIAIS E MTODOS .........................................................................37 5.1 Materiais. ....................................................................................................37 5.1.1 Critrios adotados para escolha dos dados e desenvolvimento do mtodo proposto...........................................................................................46 5.2 Metodologia .................................................................................................48 5.2.1 Etapas realizadas nesta investigao .....................................................49 5.2.2 Procedimentos adotados ..........................................................................50 5.2.2.1 Formao dos conjuntos de dados para treinamento, validao e testes do modelo neural...............................................................................51 5.2.3 Estratgias de Processamento.................................................................52 5.2.3.1 rvore de testes para definio da topologia adequada melhor generalizao da rede neural ......................................................................53 5.2.3.2 Processamentos dos dados GPS............................................................56 5.3 O Programa MORE-GPS verso 1.0 Manipulao e Modelagem de Observveis GPS por Redes Neurais Artificiais ........................................57 6 APRESENTAO DOS RESULTADOS....................................................65 6.1 A topologia escolhida...................................................................................65 6.2 O tempo de observao ...............................................................................70 6.3 Caractersticas do agrupamento das estaes RBMC mais adequado ao modelamento neural dos dados...................................................................74 6.4 Testes do mtodo para diferentes conjuntos de dados...............................76 6.5 Validao do mtodo ...................................................................................79 6.5.1 Dados para validao ...............................................................................80 6.5.1.1 Processamento por ponto simples (single point)..................................80 6.5.1.2 Processamento relativo esttico ...........................................................85 6.5.1.3 Processamento Posicionamento Pontual Preciso (PPP) ......................98

7 CONCLUSES E RECOMENDAES ..................................................101 7.1 Quanto modelagem neural ....................................................................101 7.2 Quanto ao sistema MORE-GPS................................................................102 7.2.1 Limitaes do mtodo proposto .............................................................103 7.3 Quanto ao processamento GPS ................................................................104 7.3.1 O processamento pontual ......................................................................104 7.3.2 O processamento relativo ......................................................................105 8 REFERNCIAS BIBLIOGRFICAS .......................................................108

i

LISTA DE FIGURASFigura 1 Modulao Bifsica da onda portadora. ...................................11 Figura 2 Interpretao geomtrica da fase da portadora.. .....................17 Figura 3 Localizao das estaes que compe a rede do IGS................19 Figura 4 Representao resumida do processamento pelo AG...............22 Figura 5 Representao genrica de um neurnio biolgico e processo de transmisso sinptica........................................................25 Figura 6 Modelo no linear de neurnio artificial ..................................27 Figura 7 Fac-smile de trecho de um arquivo RINEX de observao da estao BOMJ-RBMC. ...........................................................38 Figura 8 Fac-smile de trecho de um arquivo de efemrides precisas, formato SP3, correspondente ao dia 339 do ano 2001. .........40 Figura 9 Localizao das estaes RBMC ...............................................42 Figura 10 Freqncia de observaes/estao/ano..................................44 Figura 11 N de estaes operando simultaneamente em 2000.............45 Figura 12 N de estaes RBMC operando simultaneamente em 2001. 45 Figura 13 N de estaes RBMC operando simultaneamente em 2002. 46 Figura 14 Representao grfica do nmero Sunspot do Ciclo Solar 23.............................................................................................48 Figura 15 Tela de inicializao do programa MORE-GPS .....................59 Figura 16 Tela principal do programa MORE-GPS................................59 Figura 17 Fluxograma descritivo do programa MORE-GPS..................64 Figura 18 Desempenho rede 1:6:1 para 5 minutos de observao .........68

ii

Figura 19 Desempenho rede 1:10:1 para 5 minutos de observao .......68 Figura 20 Desempenho alcanado pela estimativas de duas horas de observao...............................................................................73 Figura 21 Agrupamento regional das estaes RBMC ...........................75 Figura 22 Desempenho do treinamento para 5 minutos com agrupamento regional de estaes RBMC.............................76 Figura 23 Desempenho do treinamento para 5 minutos no dia 17/05/2000 (Dia GPS 138) ......................................................77 Figura 24 Desempenho do treinamento para 5 minutos no dia 29/01/2002 (Dia GPS 29) ........................................................78 Figura 25 Desempenho do treinamento para 5 minutos no dia 08/03/2002 (Dia GPS 67) ........................................................78 Figura 26 Desvios para a estao VICO..................................................82 Figura 27 Desvios para a estao UEPP .................................................83 Figura 28 Desvios para a estao RIOD..................................................85 Figura 29 Estaes para o processamento I ............................................86 Figura 30 Desvios linha base BOMJ-VICO.............................................88 Figura 31 Desvios linha base BRAZ-VICO .............................................88 Figura 32 Desvios linha base UEPP-VICO .............................................89 Figura 33 Desvios linha base RIOD-VICO..............................................89 Figura 34 Estaes para o processamento II...........................................90 Figura 35 Desvios linha base BRAZ-UEPP.............................................92 Figura 36 Desvios linha base CUIB-UEPP .............................................93 Figura 37 Desvios linha base RIOD-UEPP .............................................93 Figura 38 Desvios linha base VICO-UEPP .............................................93 Figura 39 Desvios linha base PARA-UEPP ............................................94 Figura 40 Estaes envolvidas no processamento III .............................95 Figura 41 Desvios da linha base IMPZ-RIOD.........................................97 Figura 42 Desvios da linha base BRAZ_RIOD........................................97 Figura 43 Desvios da linha base VICO-RIOD.........................................97 Figura 44 Desvios da linha base UEPP-RIOD ........................................98

iii

Figura 45 Desvios da linha base PARA-RIOD ........................................98

iv

LISTA DE TABELASTabela 1 Resumo de alguns componentes dos sinais dos satlites.........10 Tabela 2- Descrio resumida do Algoritmo de aprendizado backpropagation padro.........................................................34 Tabela 3 Informaes das estaes RBMC em maio 2003. .....................43 Tabela 4 Resumo dos dados escolhidos para modelagem. ......................47 Tabela 5 Comparativo entre diferentes topologias testadas para fase. .69 Tabela 6 Comparativo entre diferentes topologias testadas para cdigo. .....................................................................................69 Tabela 7 Desvios para o posicionamento pontual I.................................82 Tabela 8 Desvios para o posicionamento pontual II ...............................83 Tabela 9 Desvio para o posicionamento pontual III................................84 Tabela 10 Coordenadas oficiais das estaes utilizadas no processamento I......................................................................87 Tabela 11 Desvios do processamento I ....................................................87 Tabela 12 - Coordenadas oficiais das estaes utilizadas no processamento II ....................................................................91 Tabela 13 Desvios do processamento II...................................................91 Tabela 14 - Coordenadas oficiais das estaes utilizadas no processamento III ...................................................................95 Tabela 15 Desvios do processamento III .................................................96 Tabela 16 Coordenadas geodsicas ITRF2000 das estaes VICO, UEPP e RIOD (PPP)...............................................................99

v

LISTA SIGLASASCII AG C/A DEGED DOY ESSC-USP FIR FLINN ftp GIPSY GLONASS GNSS GPS IBGE IGS ITRF JPL MLP MSE N American Standard Code for information Interchange Auto Gipsy Coarse/Acquisition code Departamento de Geodsia Day Of the Year ( 0-365) Escola de Engenharia de So Carlos-Universidade de So Paulo Filter Inpulse Response Fiducial Laboratories for International National Science Network File Transfer Protocol GPS Inferred Positioning System Global Navigation Satellite System Global Navigation Satellite Systems Global Positioning System Instituto Brasileiro de Geografia e Estatstica International GPS Service for Geodynamics International Terrestial Reference Frame Jet Propulsion Laboratory Multi-Layer Perceptron Mean of Squared Error Ambiguidade

vi

NASA NGS NAVSTAR NOAA OASIS P PPP PRN RBMC RINEX RNAs RMS SA SAD69 SGB SIVAM SNNS SOM SPS SP3 SVN TEC URL WGS84 WWW

National Aeronautics and Space Administration National Geodetic Survey, USA Navigation System using Time And Ranging National Oceanic & Atmospheric Administration Orbit Analysis and Simulatio Software Precise code (Cdigo preciso) Precise Point Positioning Pseudo Randon Noise Rede Brasileira de Monitoramento Contnuo Receiver Independent Exchange Format Redes Neurais Artificiais Root Mean Square Selective Availability South American Datum 1969 Sistema Geodsico Brasileiro Sistema de Vigilncia da Amaznia Stuttgart Neural Network Simulator Self Organizing Map Standard Position Service Formato de efemrides usado pelo NGS Space Vehicle Number Total Electron Content Uniform Resource Locator World Geodetic System 1984 World Wide Web

vii

RESUMOSILVA, C. A. U. UM MTODO PARA ESTIMAR OBSERVVEIS GPS

USANDO REDES NEURAIS ARTIFICIAIS. So Carlos, 2003, 112 p. Tese Escola de Engenharia de So Carlos, Universidade de So Paulo.

O NAVSTAR-GPS, com uma grande variedade de conjuntos receptores e sua aplicabilidade prtica em diversas reas, transformou-se no mais difundido dos sistemas de posicionamento. Porm, necessidades cada vez maiores em termos de preciso trouxeram consigo o nus de um custo elevado com a aquisio de equipamentos de dupla freqncia. Este trabalho consiste no desenvolvimento de um mtodo que possibilite a modelagem das observveis GPS, atravs de Redes Neurais Artificiais, bem como a agregao destes dados a um arquivo gerado por um receptor de uma freqncia, conferindo-lhe caractersticas especficas de arquivos gerados por receptores de dupla freqncia e cdigo P. Isto possibilita que dados gerados por receptores de uma freqncia, a imensa maioria dos receptores utilizados no Brasil, possam ser processados como vetores de bases longas. Os resultados obtidos indicam que o uso de modelos neurais, treinados por algoritmos de aprendizado supervisionado, so uma alternativa promissora para estimar dados GPS.

Palavras-chave: GPS; Redes Neurais Artificiais, Modelagem, portadora L2, cdigo P.

viii

ABSTRACTSILVA, C. A. U. A METHOD TO ESTIMATE GPS DATA OBSERVABLES USING ARTIFICIAL NEURAL NETWORKS. So Carlos, 2003. 112 p. Thesis School of Engineering of So Carlos, University of So Paulo.

The NAVSTAR-GPS, with a great variety of receivers and its practical aplicabillity in several areas, transformed itself in the most known positioning system. But the necessity of improving the results precision brings with it a cost increasing caused by the use of equipments of dual frequency equipments. This work consist on the development of a method that makes possible the GPS data modelling using Neural Networks, as well as the aggregation of these data into a file generated by single frequency receiver, providing to the system specific characteristics of files generated by double frequency an P code receiver. This makes possible that data generated by receivers of single frequency, the majority of receivers in Brazil, can be processed as vectors of long bases. The results obtained indicate that the use of Neural Network models, with algorithms of supervised learning are a promissing alternative to estimate GPS data.

Keywords: GPS; Artificial Neural Networks, Modelling, L2 Carrier, P code.

1

1INTRODUO

O NAVSTAR/GPS, do ingls Navigation System using Time and

Ranging/Global Positioning System, um sistema de posicionamento global,fundamentado em rdio-navegao por satlites, que utiliza diferentes observveis para calcular distncias entre os centros de fase das antenas dos satlites e de receptores localizados na superfcie da terra ou prximo dela, com o objetivo de determinar a posio tridimensional dos pontos de interesse. Neste trabalho, o sistema ser tratado apenas por GPS. Inicialmente desenvolvido e implementado com fins militares, o GPS foi liberado posteriormente pelo congresso americano para uso civil, ainda que com degradaes intencionais em sua preciso, PARKINSON (1996). Aps essa liberao, ocorreram profundas transformaes no conceito de posicionamento em diversas reas do conhecimento com diferentes aplicaes, tais como: Mensurao e suas reas afins, Transporte terrestre, areo e naval, Telefonia mvel, Monitoramento de segurana, Servios de emergncia, Monitoramento de fauna e flora, Controle de queimadas, Fiscalizao de desmatamento e outros. Resumidamente, pode-se dizer que os primeiros projetos, da chamada Era espacial, datam do incio dos anos 50. Aps duas dcadas de pesquisas, os americanos e os russos implantaram o GPS e o GLONASS, respectivamente, que so hoje os nicos sistemas de posicionamento global operacionais. Ambos compem o chamado GNSS (Global Navigation Satellite System).

2

Existe ainda um projeto liderado pelos pases membros da unio europia para implantao de um outro sistema, o GALILEO. Este est sendo desenvolvido principalmente para aplicaes civis, com previso de lanamento dos primeiros satlites para 2005. A operao contnua do sistema GPS, a grande variedade de receptores no mercado, e sua aplicabilidade prtica em diversas reas o transformaram no mais popular dos sistemas de posicionamento. Porm, as necessidades cada vez maiores em termos de preciso no posicionamento trouxeram consigo o nus de um custo elevado na aquisio de conjuntos receptores e dependendo da estratgia de posicionamento, a necessidade de um aumento considervel nos tempos de coleta e de processamento dos dados. A possibilidade de se obter uma melhor preciso no posicionamento por ponto simples passou ento a ser objeto de estudo de vrios pesquisadores, visando eliminar a necessidade de posicionamento relativo, minimizar o tempo da sesso de observao e otimizar o custo dos levantamentos. Nesse sentido, novas possibilidades tm se apresentado promissoras, tais como, o Posicionamento Pontual Preciso, tambm chamado de mtodo PPP1, que proporciona preciso tridimensional da ordem de alguns centmetros e demanda baixo esforo computacional em relao s redes, MONICO (2001). Maiores informaes acerca deste mtodo so apresentadas no item 3.3.1. O termo posicionamento pontual, do ingls single point, refere-se tradicionalmente as estimativas das coordenadas de uma determinada estao, atravs da anlise de pseudodistncias entre as antenas dos satlites e de um receptor, geralmente baseadas no cdigo C/A (com limitaes impostas pelos parmetros contidos na mensagem de navegao, que tm preciso de poucos metros para rbitas e de dezenas de metros para relgios), ZUNBERGE; BERTINGER (1996) apud ZUNBERGE (1997). O uso de receptores de dupla freqncia possibilita ao uso de um modelo de combinao linear dos sinais da portadora L1 e L2, definida como L3, ou

1

Precise Point Positioning

3

ainda, ion free, onde so eliminados os efeitos da ionosfera na propagao do sinal GPS, geralmente uma fonte de erros importante em se tratando de vetores de linhas-base longas. Desde o surgimento do GPS, vrias foram as questes e dvidas levantadas sobre ele, quase todas no sentido de melhor compreend-lo e aprimor-lo numa incessante tentativa de explorar todas as suas possibilidades. Uma delas : seria possvel fazer com que dados observados por receptores de uma freqncia (L1) possam ser processados de forma a se obter um nvel de preciso similar queles gerados por receptores de dupla freqncia (L1 e L2)? Uma segunda questo : seria possvel modelar, prever ou estimar dados GPS? e ainda uma outra pergunta surge: Qual ferramenta seria adequada a esta modelagem? LUO; UNBEHAUEN (1998) lanaram uma luz sobre estas perguntas quando afirmaram que a utilizao de Redes Neurais Artificiais no processamento de sinais estava se ampliando com aplicaes em diversas reas como filtragem, estimativa de parmetros, deteco de sinais, reconhecimento de padres, reconstruo de sinais, sistemas de identificao, compreenso e transmisso. Redes Neurais Artificiais, neste trabalho, tratadas apenas por Redes Neurais ou ainda pela sigla RNAs, tm seu uso indicado nesta investigao em funo da excelente capacidade de generalizao, classificao, interpolao e extrapolao, tolerncia a erros e rudos e tambm pelo fato de no haver a necessidade prvia de parametrizaes explcitas na modelagem. A hiptese inicial desta investigao configura-se ento na assero de que possvel estimar dados GPS da portadora L2 e cdigo P2 utilizando modelagem a partir de RNAs, a despeito dos erros inerentes propagao do sinal GPS, quer intencionais ou no, da poca e do local onde tenham sido observados, desde que sejam satisfeitas determinadas restries. Estas restries referem-se necessidade de existirem dados de um conjunto de estaes GPS, equipadas com receptores de dupla freqncia e cdigo P, dependendo dos objetivos do usurio, rastreando simultaneamente

4

quele que se deseja estimar, dentro de uma determinada regio de abrangncia. Os limites desta regio so objeto de estudos futuros. Existe ainda uma restrio relativa necessidade de existncia de efemrides precisas em formato SP3.

1.1. ObjetivosO objetivo central deste trabalho desenvolver um mtodo para estimar dados GPS, mais especificamente, a contagem de ciclos da fase da portadora L2 e a pseudodistncia a partir do cdigo P2, para serem agregados aos dados de um receptor de nica freqncia (L1 e C/A), obtendo-se um novo conjunto (L1, C/A, L2Modif, P2Modif). Esses dados sero estimados atravs da utilizao de um modelo de rede neural, usando algoritmos de aprendizado supervisionado, alimentados por dados oriundos de receptores de dupla freqncia (L1, C/A, L2, P2) da Rede Brasileira de Monitoramento Contnuo (RBMC), mantida pelo Instituto Brasileiro de Geografia e Estatstica (IBGE). Este novo conjunto de dados (L1, C/A, L2Modif, P2Modif) modificado, ser testado mediante diferentes condutas de processamentos tais como: ponto simples e processamento relativo de bases longas.

1.2. JustificativasEsta investigao justifica-se principalmente pela tentativa de elevar a preciso da posio tridimensional de uma dada estao GPS, observada pelo mtodo de posicionamento simples com receptor GPS de uma freqncia, a um nvel similar s coordenadas de uma estao observada com um receptor de dupla freqncia e cdigo P. Isto proporciona uma expressiva reduo de custo no eventual uso de receptores de dupla freqncia, funo da substituio destes, por receptores de uma freqncia. Se utilizado o PPP, ainda se obtm uma segunda vantagem, esta, relativa ao fato de que esse mtodo no necessita do uso simultneo de dois ou mais receptores, diretamente pelo usurio.

5

Este trabalho pode tambm ser legitimado em funo do uso que ele proporciona enorme massa de dados gerados e disponibilizados pelo Departamento de Geodsia do IBGE (DEGED), os dados da RBMC, que geralmente, so usados apenas pelo prprio instituto e tambm por pesquisadores, com aplicaes especficas em seus campos de estudo. O fato do mtodo proposto utilizar de forma continuada e sistemtica, os dados da RBMC confere a esta aplicao, o carter de democratizar e tornar mais conhecidos e utilizados esses dados. Alm de justificar e de tornar imprescindvel implantao, adensamento e manuteno de redes de estaes GPS ativas que utilizem conjuntos receptores de dupla freqncia. O Brasil no conta com uma densa rede de estaes ativas de receptores de dupla freqncia e cdigo P, o que facilitaria diversas aplicaes geodsicas, que normalmente requerem um refinamento maior em termos de preciso espacial do posicionamento. At junho de 2003, a nica rede de estaes GPS com estas caractersticas a RBMC, composta atualmente de apenas 15 estaes e que no so suficientes para cobrir de maneira uniforme toda a extenso territorial brasileira. Isto fica mais evidente ao se observar os imensos vazios na regio amaznica, onde atualmente a nica estao em operao est localizada em Manaus. Entretanto, existe um nmero significativo de estaes dotadas de receptores de uma freqncia, tal como aquelas que compem a Rede INCRA de Base Comunitrias do GPS (RIBAC), composta atualmente por 44 estaes. A possibilidade de que possam ser utilizadas como se fossem de dupla freqncia e cdigo P traria grandes benefcios em termos de preciso, principalmente para o processamento relativo de bases longas.

6

2O ESTADO DA ARTE

Esta investigao um hbrido, fruto da unio entre duas reas de conhecimento, um problema de GPS pela Engenharia - Mensurao e a busca da soluo atravs de Redes Neurais Artificiais pela Cincia da Computao. Ainda na dcada de 40 MCCULLOCH & PITTS (1943) desenvolveram o primeiro modelo artificial de um neurnio biolgico, onde se concentram muito mais em descrever e apresentar as capacidades computacionais de um neurnio artificial do que apresentar tcnicas de aprendizado. Apenas com o trabalho de HEBB (1949) estas tcnicas de aprendizado tarnaram-se objeto de estudo. Posteriormente, o trabalho de WIDROW & HOFF (1960) apresentou uma regra de aprendizado baseada no gradiente descendente para minimizao do erro da rede, denominada regra delta, que ainda hoje utilizada. ROSENBLATT (1958), criou um novo modelo, o perceptron, com sinapses ajustveis, que se prestaria ao terinamento de certos tipos de padres. As Redes Neurais Artificias ficariam adormecidas durante toda a dcada de 70, em grande parte por conta do trabalho de MINSKY & PAPERT (1969), que chamaram a ateno para algumas tarefas que o perceptron no era capaz de executar, j que s resolve problemas linearmente separveis. O principal argumento de MINSKY e PAPERT era que o problema do crescimento explosivo tanto do espao ocupado, como do tempo requerido para a resoluo de problemas complexos, afetariam as RNAs, inclusive os perceptrons.

7

HOPFIELD (1982) publicou um artigo que foi o responvel por parte da retomada das pesquisas na rea, onde mostrou a relao entre redes recorrentes auto-associativas e sistemas fsicos. A descrio do algoritmo de treinamento

backpropagation por RUMELHART (1986) mostrou que a viso de MINSKY ePAPERT acerca do perceptron era bastante pessimista. Provando que as RNAs de mltiplas camadas so realmente capazes de resolver problemas complexos. O avano acelerado da microeletrnica tambm contribuiu para que nas ltimas duas dcadas, pesquisadores se dedicassem ao estudo e aplicao de RNAs em diversas reas do conhecimento, BRAGA; CARVALHO; LUDERMIR (2000). Existem diversos trabalhos que abordam sob os mais variados aspectos tanto a tecnologia GPS quanto RNAs. Porm, na Mensurao a maioria dos trabalhos com aplicao em GPS est voltada utilizao prtica que se d desta tecnologia, principalmente na obteno de coordenadas com variadas aplicaes nos diferentes segmentos tais como: Geodsia, Topografia, Cadastro urbano e rural, Fotogrametria, Sensoriamento Remoto, Sistema de Informaes Geogrficas, Monitoramento de veculos, Monitoramento de deformaes de estruturas e outros. H uma outra corrente de pesquisadores que se ocupa com estudo e modelagem dos erros inerentes ao processo de transmisso, propagao ou recepo do sinal GPS, sempre visando obter-se uma maior acuracidade para as coordenadas. Com relao s redes neurais, sabe-se que o Brasil um dos pases que registra um dos maiores crescimentos mundiais no estudo da inteligncia artificial ou inteligncia computacional. Segundo levantamento do Conselho Nacional de Redes Neurais, praticamente todas as grandes universidades federais, estaduais e algumas particulares possuem estudos voltados para esta rea. So comuns trabalhos que apresentam a utilizao de RNAs principalmente em previso de dados, algoritmos de aprendizado, otimizao de sistemas, reconhecimento de padres e outros. Dentre os trabalhos, j desenvolvidos, relacionando RNAs aos diferentes segmentos da Mensurao pode-se citar: o processamento digital de imagens de

8

satlites (Sensoriamento Remoto) PANDEY et al. (2001), a modelagem numrica do terreno (Topografia), BACA (2001) e a predio de anomalia gravitacional (Geofsica), TIERRA; FREITAS (2000). Freqentemente, utiliza-se o sistema GPS apenas como instrumento de orientao e navegao. LORA; HEMERLY; LAGES (1998) desenvolveram um mtodo onde a idia possibilitar um bom nvel de automao em embarcaes, que seriam guiadas por este sistema. Nesta aplicao, RNAs so utilizadas no treinamento adaptativo de mquinas e o GPS serve apenas para fornecer parte do padro de entradas externas, ou seja, as coordenadas de pontos, para a rede neural. O trabalho de HERNNDEZ-PAJARES et al. (1997) prope e aplica a modelagem do Total Electrons Content (TEC) da camada ionosfrica e busca quantificar seus efeitos na propagao do sinal GPS utilizando os modelos Self

Organizing Map (SOM) e Hopfield.E, mais recentemente, MAIA et al. (2002) apresentaram a possibilidade da predio da contagem de ciclos de uma portadora GPS utilizando o modelo Temporal FIR MLP. O que indica que se possvel prever o comportamento temporal de uma observvel, ainda que por um curto perodo de tempo, provavelmente tambm seja possvel estimar o comportamento de uma observvel em funo de outra. Apesar de uma minuciosa e exaustiva busca, no foi encontrado durante a fase de reviso bibliogrfica nenhum trabalho que caminhasse na mesma linha de pesquisa proposta nesta investigao. Este fato impossibilitou a citao expressa de trabalhos anteriores. desejvel que em se tratando de uma tese de doutoramento se exijam como atributos bsicos um carter indito, uma significativa relevncia e a exeqibilidade.

9

3O SISTEMA DE POSICIONAMENTO GLOBAL NAVSTAR/GPS

Apesar de este ser um assunto cujos fundamentos so amplamente apresentados em literatura especfica, existem algumas nuances que podem ser ressaltadas e o sero, como forma de oportunizar um bom entendimento, ainda que superficial devido complexidade e extenso dos temas, aos profissionais quer sejam eles ligados Mensurao ou Cincia da Computao. Quanto a este captulo, a abordagem ter como foco principal seu princpio de funcionamento, a caracterizao dos sinais e seu processamento. Detalhes pormenorizados tais como histrico e sistemas predecessores, segmentos nos quais est dividido, erros aos quais est sujeito, constelao, configurao orbital e prescries do tempo foram propositalmente omitidos, em funo de serem assuntos amplamente apresentados por diversos autores tais como: SEEBER (1993); LEICK (1995), PARKINSON (1996), HOFFMANNWELLENHOF (2001), e outros. No sero explanadas nenhumas das outras caractersticas do sistema que no estejam relacionadas caracterizao, descrio e processamento do sinal recebido pelas antenas receptoras dos equipamentos.

10

3.1. O Sinal GPSSob a tica da Engenharia, sinais so funes ou seqncias que servem para transportar informao de uma fonte de mensagens a um destinatrio. As caractersticas especficas dos sinais dependem do canal de comunicao utilizado para este transporte. Este canal definido pelo tipo de distoro que introduz os sinais. Esta distoro pode ser: determinstica linear, determinstica no linear ou aleatria, KOVCS, 1996. Os sinais so processados no lado do transmissor com a finalidade de produzi-los e configur-los, e no lado do receptor para extrair a informao neles contida, se possvel com a mxima eficincia. (No caso do sinal GPS, a fonte geradora, so os satlites artificiais GPS, e o canal de comunicao, as portadoras, e o destinatrio, o receptor GPS so elementos pr-definidos com caractersticas gerais muito bem especificadas). A Geodsia por Satlites baseada em dados transmitidos atravs de ondas eletromagnticas, oriundas de osciladores a bordo dos satlites que geram uma freqncia fundamental f o . Duas portadoras da banda L so geradas pela multiplicao de constantes por f o , resultando nas portadoras L1 e L2. Estas so moduladas por cdigos para fornecer leituras dos relgios dos satlites ao receptor e tambm para transmitir informaes tais como os parmetros orbitais, HOFFMANN-WELLENHOF et al. (2001). Os componentes desses sinais encontram-se resumidos na Tabela 1.

Tabela 1 Resumo de alguns componentes dos sinais dos satlites (Adaptada de HOFFMANN-WELLENHOF et al., 2001).Componentes Freqncia fundamental Portadora L1 Portadora L2 Cdigo P Cdigo C/A Freqncia (MHz)

f0 154 f 0

= 10,23

= 1575,42 = 1227,60 = 10,23 = 1,023

( 19,0 cm) ( 24,4 cm)

120 f 0f0 f 0 / 10

11

Os satlites GPS so reconhecidos atravs de diferentes critrios de nomeao e numerao. Um destes critrios o nmero Pseudo-Random-Noise (PRN), rudo falsamente aleatrio. Os cdigos que formam o PRN so modulados, em fase, sobre as duas portadoras, L1 e L2. Esta modulao possibilita que se executem medies de distncias a partir do tempo de propagao da modulao (Leick, 1995). De forma bastante simplificada pode-se dizer que os cdigos so uma seqncia com os estados + 1 e 1 , correspondentes aos valores binrios 0 e 1. A chamada modulao bifsica executada com um efeito de 180 na fase da portadora sempre que ocorrer uma mudana de estado. Esta modulao est ilustrada na Figura 1.

Figura 1 Modulao Bifsica da onda portadora (Adaptada de HOFFMANNWELLENHOF et al., 2001). O principal motivo para o uso de uma segunda freqncia nos satlites GPS minimizar os efeitos da camada ionosfrica na propagao do sinal. Assim, o uso de um conjunto receptor/antena de dupla freqncia permite que se tenham prontamente disponveis, as observveis das duas freqncias, cuja composio independe da ionosfera. Usurios que faam uso de receptores de uma freqncia normalmente dependem da eliminao dos efeitos ionosfricos atravs da eliminao de erros que ocorre na dupla diferena e/ou da utilizao de modelos ionosfricos.

12

Diversas razes, para as quais no cabe uma anlise mais detalhada neste momento, concorrem para que no Brasil a maioria dos usurios do sistema GPS utilize receptores de uma freqncia. Dentre elas pode-se destacar a significativa diferena de custo entre os conjuntos receptores de uma e dupla freqncias. Caso se utilize para observao conjuntos receptores de uma freqncia, a estimativa do atraso ionosfrico normalmente realizada a partir da aplicao de diferentes modelos, geralmente alimentados por parmetros transmitidos na mensagem de navegao. Uma descrio geral desses modelos pode ser encontrada em SILVA (2000). Testes e comparaes entre esses modelos podem ser obtidos em LEANDRO (2003).

3.2 As observveis GPSO conceito relacionado s observveis GPS refere-se a distncias calculadas a partir de medies de fase ou tempo, baseadas na comparao entre sinais gerados internamente pelos receptores e recebidos dos satlites GPS. A forma de medir as distncias a partir dos sinais recebidos difere dos distancimetros eletrnicos terrestres pelo uso de dois relgios, um no satlite e outro no receptor. Este fato faz com que as distncias sejam influenciadas pelos erros de ambos, por isso so chamadas de pseudodistncias, HOFFMANNWELLENHOF et al. (2001). O princpio fundamental da navegao por GPS reside em medies das pseudodistncias. Ao conhecerem-se as coordenadas dos satlites em um determinado sistema de referncia possvel se calcular as coordenadas da antena de um dado receptor, neste mesmo sistema. Para a determinao das coordenadas de pontos seria necessrio observar apenas trs satlites, estaria assim solucionado o problema de geometria. Porm devido ao no sincronismo dos relgios do satlite e do receptor, um quarto satlite necessrio, para solucionar este problema.

13

3.2.1. PseudodistnciaPseudodistncias calculadas a partir de leituras de cdigo so funo do tempo de viagem do sinal GPS entre as antenas dos satlites e de um dado receptor. Elas so o resultado da multiplicao da velocidade da luz pelo tempo deS propagao do sinal ( R ) resultante do processo de correlao cruzada. Embora

os relgios dos satlites possuam osciladores de alta preciso, seu sistema de tempo diferente dos relgios dos receptores. Estes tm osciladores de menor preciso, mas pode-se relacionar esses dois sistemas de tempo, satlites( t S ) e receptor ( t R ), ao sistema de tempo GPS ( tGPS ), utilizando-se as seguintes expresses:

tGPS S = t S dt S

(1) (2)

tGPS R = t R dt Ronde:

tGPS S = sistema de tempo GPS do satlite; tGPS R = sistema de tempo GPS do receptor;dt S = erro do relgio do satlite em relao ao tempo GPS no instante t S ;dt R = erro do relgio do receptor em relao ao tempo GPS no instante t R .A partir das equaes (1) e (2) pode-se escrever a equao da pseudodistncia da seguinte forma:S PDi R = c R + c(dt R dt S ) + P D i R S S

(3)

onde:

c = velocidade da luz no vcuo;S R = tempo de propagao do sinal, contado desde sua gerao no satlite

at a correlao no receptor;

14

PD i S = erro da medida de pseudodistncia; Ri = ndice que representativo do tipo de cdigo a partir do qual apseudodistncia foi obtida (C/A, sobre a portadora L1, e ou do cdigo P, sobre as portadoras L1 e ou L2); Existem diversos fatores que podem ser considerados no clculo da pseudodistncia, e o so por diferentes autores. Entretanto, um detalhe particularmente importante a ser observado refere-se ao tempo de propagaoS R . Seu produto pela velocidade da luz no representa exatamente a distncia S geomtrica R entre as antenas dos satlites e de um dado receptor. Isto ocorre S devido aos erros provocados pela atmosfera terrestre (ionosfera = IiR

eS

S troposfera TiR ) e tambm devido aos efeitos de multicaminhamento ( M PDi R ).

MONICO (2000) descreve uma equao possvel para a pseudodistncia que considere esses fatores e pode ser representada por:S S S S PDi R = R + c(dt R dt S ) + Ii R + Ti R + M PD i R + PDi R S S

(4)

3.2.2 Fase da portadoraComparativamente pseudodistncia, a fase da portadora ou simplesmente fase, mais precisa, e por isso considerada a observvel a se utilizar em aplicaes geodsicas (MONICO, 2000). Chamando-se de S (t ) a fase da portadora reconstruda e recebida com a freqncia f S e de R (t ) a fase da portadora de referncia, gerada internamente no receptor com uma freqncia f R . O parmetro t uma poca no sistema de tempo GPS, reconhecida a partir de uma poca inicial t0 = 0 . Assim, pode-se escrever as seguintes equaes ( HOFFMANN-WELLENHOF et al. ,2001):

S (t ) = f S t f S R (t ) = f R t OR

l oS c

(5)

15

S As fases iniciais, O e OR , so causadas pelos erros dos relgios e so

iguais a:S O = f S S OR = f R R

(6)

S Conseqentemente a fase R (t ) dada por:

S R (t ) = S (t ) R (t ) S R (t ) = f S

l + f S S + f R R + ( f S f R )t c

(7)

O desvio das freqncias f S , f R em relao freqncia nominal f apenas da ordem de frao de Hz. Isto pode ser constatado ao se considerar que a estabilidade na freqncia em um curto intervalo de tempo de sendo f 1,5 GHz, o erro da freqncia df = 1,5. 10 -3 Hz. Assim, o erro da freqncia ( aproximadamente t = 0,07 segundos) pode ser negligenciado durante a propagao do sinal, o erro mximo do ciclo da fase est abaixo do nvel de rudo, por isso os erros dos relgios dos receptores so na ordem de milisegundos e so menos efetivos, podendo-se escrever a equao anterior de forma simplificada:S R (t ) = f

df = 10 12 , f

l f c

(8)

Inicialmente, o nmero inteiro N de ciclos da portadora, chamado de ambiguidade entre as antenas dos satlites e de um dado receptor desconhecido. Porm, se a observao continuada sem perda de contato, ou seja, sem a chamada perda de ciclo, o nmero permanece o mesmo e a fase poca t dada por:S S R (t ) = R t to

+N

(9)

16

S R

t to

denota a frao de fase na poca t adicionado ao nmero inteiro

de ciclos desde a poca inicial to . Uma interpretao geomtrica da equao (9) representada pela FiguraS 2, onde i a notao abreviada para R ti to

e por simplificao, a frao do

batimento de fase inicial , o , assumida como sendo zero. Fazendo a substituio da equao (9) na (8) e nomeando a quantidade observao negativaS por = R , a equao da pseudodistncia da fase resume-se em:

=

1

l+

c

+ N

(10)

Onde: = comprimento de onda. Multiplicando-se a equao acima por , a fase expressa em ciclos para uma distncia que se diferencia da pseudodistncia do cdigo apenas por um inteiro multiplicado por . A distncia l representa a distncia entre o satlite na poca t da emisso e o receptor na poca da recepo t + t . A fase da portadora pode ser medida melhor que 0,01 ciclos, que corresponde a 2 mm de resoluo, HOFFMANN-WELLENHOF et al. (2001).

17

Figura 2 Interpretao geomtrica da fase da portadora. (Adaptada de HOFFMANN-WELLENHOF et al., 2001).

3.3 O Processamento de dados GPSNo haveria sentido em descrever detalhadamente as formas clssicas de posicionamento e processamento de dados GPS, tais como posicionamento simples e relativo uma vez que estas se encontram bastante difundidas em toda a literatura pertinente. Maiores detalhes podem ser encontrados em SEEBER (1993); LEICK (1995), PARKINSON (1996), HOFFMANN-WELLENHOF (2001), e outros. Ainda que esta pesquisa se utilize destas formas de processamento para efeito de anlise e comparao de resultados, ser descrito apenas, o posicionamento pontual preciso que, apesar de figurar entre as inovaes no processamento de dados GPS nos ltimos anos ainda quase que completamente desconhecido tanto por pesquisadores quanto por usurios do sistema GPS no Brasil. Os dados relativos ao uso do Auto-Gipsy por usurios do Brasil, mostram apenas 222 consultas ao sistema desde 1998, http://milhouse.jpl.nasa.gov/ag/usage.html, 01/06/2003.

18

3.3.1 Posicionamento Pontual Preciso (PPP)O PPP, do ingls Precise Point Positioning, um mtodo que utiliza as informaes de fase das portadoras L1 e L2, e pseudodistncias, a partir dos cdigos C/A e P em conjunto com as efemrides precisas e correes de relgio, fornecidas pelo International GPS Service (IGS), para processamento pontual. Este fato provoca uma limitao no seu uso, uma vez que apenas dados oriundos de receptores com estas caractersticas podem ser submetidos ao servio automatizado de processamento. Alm disso, os dados s podem ser processados entre uma e duas semanas aps sua observao, tempo necessrio para clculo e liberao das efemrides precisas pelo IGS, SILVA; SEGANTINE (2001). Este mtodo possui uma forma de processamento de dados GPS que utiliza uma estratgia relativamente nova. E, como tal, possui vantagens e desvantagens quando comparado s formas tradicionais de processamento. Esta diferena decorre da metodologia utilizada na estimativa das coordenadas para uma determinada estao GPS. O aspecto mais incomum deste tipo de processamento e que o diferencia dos demais que os erros dos relgios so modelados como coeficientes polinomiais, que so estimados como parmetros estocsticos e no cancelados como ocorre na dupla diferena de fase, usada pela maioria dos mtodos de processamento GPS ( WEBB; ZUMBERGE, 1997). A essncia deste mtodo calcular rbitas e erros dos relgios de todos os satlites disponveis, atravs de uma rede global ativa de alta preciso, neste caso a rede IGS, que se encontra ilustrada pela Figura 3, e usar todas estas informaes para resolver os parmetros de uma estao de qualquer local no mundo (posio, relgio e troposfera mida).

19

Figura 3 Localizao das estaes que compe a rede do IGS. (Fonte:http://igscb.jpl.nasa.gov/network/allmaps.html, 10/03/03). uma ferramenta que pode ser usada para processar desde uma nica estao at uma rede com centenas de pontos. A preciso das coordenadas calculadas individualmente no PPP comparvel a solues de redes, ou seja, variam de poucos milmetros a poucos centmetros. Entretanto, ele incapaz de identificar correlaes entre estaes, GREGORIUS (1996). O JPLs Flinn Analysis o setor, dentro do JPL, responsvel pela determinao e fornecimento de rbitas e correes precisas de relgios com uma repetibilidade diria de poucos milmetros na componente horizontal e cerca de um centmetro na vertical das coordenadas dos satlites. A preciso obtida est em um fator entre 100 a 1000 vezes melhor que a possvel pela mensagem de navegao, possibilitando ps-processamento de dados de um receptor simples com preciso de poucos centmetros quando usado em conjunto com efemrides precisas (ZUMBERGE, 1998). O PPP usa para processamento os programas GIPSY e OASIS II, ambos desenvolvidos pelo Jet propulsion Laboratory (JPL). Eles utilizam mdulos comuns apesar de serem dois pacotes independentes. Uma das facilidades proporcionada pelo JPL a anlise automtica e gratuita de dados GPS, que um servio disponvel a um usurio qualquer atravs do uso de e-mail e ftp. Este servio designado por Auto-Gipsy, descrito a seguir.

20

3.3.1.1 O Auto-GIPSY (AG)O JPL possibilita o processamento automatizado de dados GPS com o sistema AG. Qualquer usurio, de qualquer lugar, que utilize e-mail e ftp2 e que possua dados, adequados s exigncias do PPP pode obter as coordenadas da estao observada, alm de diversas outras informaes estatsticas, em cerca de 5 a 10 minutos aps o envio dos dados. Estas informaes podem ser descritas como: Tempo de observao uma hora; Receptor de dupla freqncia e cdigo P; Taxa de coleta de dados 30 segundos ( taxas menores que 30 devem ser submltiplos de 30 s); Mtodo de posicionamento esttico; Formato RINEX do arquivo com nomenclatura internacional. A anlise automtica funciona regularmente desde 1998 e possibilita a anlise de dados GPS coletados por um receptor numa localizao arbitrria. Porm, a principal vantagem para o usurio quando se utiliza do servio automatizado que no despende tempo de aprendizado, instalao e manuteno de um complexo programa de anlise GPS. O procedimento para utilizao do AG envolve: Disponibilizar o arquivo RINEX de observao (apenas este), nomeado adequadamente, para download em uma rea de ftp anonymous (opcionalmente comprimido); Enviar um e-mail para [email protected]. No local destinado ao assunto do e-mail, deve-se escrever Static. O corpo do e-mail deve conter a URL3 (endereo de ftp) onde est seu arquivo RINEX a ser processado. Apenas dados oriundos de satlites com elevao acima de 15 so considerados. O sistema detecta automaticamente a maioria das condies de anormalidade nos dados. Caso ocorra problema quanto a informaes e ou2 3

File Transfer Protocol Uniform Resource Locator

21

formato dos dados, o usurio receber um e-mail como resposta avisando destes erros. O tempo de resposta, geralmente, cerca de 10 minutos. Aps esse perodo, o usurio receber um e-mail com o endereo de ftp onde se encontram oito arquivos para serem copiados com as seguintes informaes: 1. 2. Explicaes detalhadas de todos os resultados (readme); Estimativas de coordenadas (, , h, em WGS 84, com as devidas correes para o ITRF4 2000) do centro de fase da antena receptora, seus desvios e a correlao entre si (*.gd) ; 3. 4. 5. 6. Componentes cartesianas referentes a um determinado ITRF (*.stacvx); Componentes cartesianas sem um ITRF definido (*.stacov); Resduos posteriores do ajustamento (*.prf); Erros formais em parmetros estimados tais como: atraso zenital na troposfera mida, desvio de fase, erro do relgio do receptor e coordenadas da estao (*.tdf); 7. 8. Parmetros utilizados pelo GIPSY no processamento (*.rgnml);

logfile (resumo dos dados utilizados).

Uma grande vantagem deste servio a anlise eficaz de dados observados com receptores GPS de diferentes fabricantes sem a necessidade de formar dados diferenciados com receptores de referncia. alcanada uma preciso diria de alguns poucos milmetros na dimenso horizontal e aproximadamente 1cm na dimenso vertical para receptores estacionrios, http://milhouse.jpl.nasa.gov/ag/agfaq.html, 15/04/2003. Uma importante limitao do PPP o fato de que o receptor utilizado nas sees de observao necessariamente tem que ser capaz de receber os sinais L1, L2, P1 ou C1 e P2. Se o receptor for de dupla freqncia, mas no corresponder a este padro, o AG no processa os dados, SILVA (2000). mais uma forma de anlise e ps-processamento de dados GPS, que possibilita a um usurio do sistema obter coordenadas com uma preciso compatvel4

com

trabalhos

topogrficos

e

com

trabalhos

geodsicos de

International Terrestrial Reference Frame, referente a correo peridica do deslocamento dos plos terrestres.

22

planimetria, de forma simples, rpida e com baixo custo de execuo e uso do sistema. A Figura 4 apresenta um resumo do processamento pelo AG.

Figura 4 Representao resumida do processamento pelo AG.

3.4 O formato RINEXOs dados GPS, frutos da observao e coleta realizados por um receptor, normalmente so armazenados em um formato binrio, prprio e especfico, que reconhecido e processado apenas por programas oferecidos pelo fabricante. Entretanto, para resolver o problema de processamento de observaes GPS feitas com receptores de diferentes fabricaes, definiu-se um formato padro que independe do tipo e modelo do receptor com o qual ele foi obtido. A este formato deu-se o nome RINEX, do ingls Receiver Independent Exchange

Format. O RINEX em sua verso atual consiste de seis diferentes arquivos deacordo com o padro ASCII:

23

1. Dados de observao; 2. Dados de navegao; 3. Dados meteorolgicos; 4. Mensagem de navegao GLONASS; 5. Mensagem de navegao GEO; 6. Dados de relgio de receptor e satlite. Cada arquivo consiste de uma seo de cabealho e uma seo de dados. O cabealho contm informaes gerais para todo o arquivo e colocado no incio do arquivo. A seo de dados traz informaes especficas para cada poca observada. Uma descrio detalhada do formato com espaamentos, tipo de dados, construo e exemplo do formato pode ser obtida em GURTNER (2002).

24

4REDES NEURAIS ARTIFICIAIS (RNAs)

As RNAs no so um assunto propriamente novo, pois o primeiro modelo artificial de um neurnio biolgico data de 1943, resultado do trabalho do neuroanatomista e psiquiatra Warren MaCulloch e do matemtico Walter Pitts. Entretanto, merecero nfase naquilo que possibilite o conhecimento bsico de seus fundamentos bem como a descrio dos paradigmas de aprendizagem, evidenciando-se o modelo MLP (Multi Layer Perceptron5) e o algoritmo

backpropagation, responsvel pelo ressurgimento das RNAs no final da dcada80. Muitos autores conceituam e descrevem Redes Neurais Artificiais,

sempre enfatizando as caractersticas que mais evidenciam a utilizao que se quer dar a elas. Vrias dessas definies podem ser encontradas em HERTZ; KROGH; PALMER (1991), HAYKIN (1999); BRAGA; CARVALHO; LUDERMIR (2000) e outros. Optou-se, neste trabalho, por uma abordagem que faz uma analogia entre RNAs e estatstica, numa tentativa de tornar mais claros seus conceitos fundamentais e adequ-los a um jargo mais familiar engenharia. Porm, deve-se enfatizar que o estudo das RNAs um importante campo dentro da Inteligncia Artificial, rea da Cincia da Computao. SARLE (1994) descreve redes neurais como sendo uma ampla classe de modelos discriminantes e regresso no linear flexvel, modelos de reduo de dados e sistemas dinmicos no lineares. Com freqncia, compostos por5

Modelo artificial de um neurnio biolgico

25

diversos

neurnios,

isto

,

elementos

de

clculo

lineares

ou

no,

interconectados atravs de ligaes, por vezes complexas e freqentemente organizados em camadas. RNAs podem ser usadas basicamente de trs formas: 1. Como 2. Como modelos que simulam adaptativo o de em sistema sinais nervoso em biolgico real e ou

inteligncia; processador tempo para controladores implementados hardware aplicaes

especficas, tal como em robs; 3. Como mtodos analticos de dados. Este trabalho limitar-se- apenas estimativa e anlise de dados.

4.1 Inspirao BiolgicaA inteligncia potencial, alegada s redes neurais, levou diversos pesquisadores implementao de redes neurais em hardwares. Contudo, RNAs muito raramente tm mais que centenas ou poucos milhares de neurnios, enquanto que o crebro humano tem cerca de 100 bilhes de neurnios biolgicos, ilustrados pela Figura 5.Segmento do dendritoEntradas sinpticas

Espinha dendrtica

Axnio Telodendro Potencial de ao

Corpo celular Dendritos basais

Fenda sinpticaDendrito

Axnio

Terminais sinpticos Neurotransmissores

Vescula sinptica

Figura 5 Representao genrica de um neurnio biolgico e processo de transmisso sinptica. (Adaptada de HAYKIN, 1999).

26

Apesar de existirem computadores com funcionamento paralelo, RNAs comparveis complexidade do crebro humano ainda esto muito alm de nossa capacidade tecnolgica. Milhares de fibras nervosas, chamadas dendritos, so conectadas ao corpo celular ou soma do neurnio. Funcionam como conexes de entrada, cada uma com menos de um mcron de dimetro. O corpo celular capaz de executar operaes complexas sobre os sinais de entrada, contudo, estas operaes podem ser aproximadas por um somatrio simples destes, HAYKIN (1999). A extenso do soma uma nica e longa fibra nervosa chamada axnio. Esta estrutura recebe e analisa o valor do somatrio exterior. Se este valor for superior a um determinado limite mnimo, o axnio produz uma voltagem de sada de 10 3 V , tambm denominada potencial de ao, que conduzida sua extremidade. A extremidade do axnio se ramifica em diversos terminais sinpticos ou telodendros. Estes terminais se conectam aos dendritos ou soma das unidades vizinhas atravs de complexas estruturas chamadas sinapses. Segundo KOVCS (1997), no ocorre um contato direto entre telodendro e dendrito, mas sim uma conexo qumica temporria (processo de transmisso sinptica), o que provoca a excitao, inibio ou modulao da unidade seguinte. No telodendro h vesculas com neurotransmissores que so responsveis pela conduo do potencial de ao entre os neurnios. Quando o potencial de ao atinge a membrana do telodendro, abrem-se canais provocados pela fuso entre a membrana do mesmo e as membranas das vesculas. Esta fuso permite a sada dos neurotransmissores, que se difundem pela fenda sinptica e se ligam aos receptores da membrana do dendrito. Esta ligao desestabiliza a membrana, permite a entrada de ons e possibilita a conduo do potencial de ao para outro neurnio, HAYKIN (1999).

27

4.2 Neurnio ArtificialRedes Neurais so sistemas de processamento de informaes compostos por um grande nmero de elementos de processamento simples chamados de neurnios artificiais, ou simplesmente neurnios. Muitos modelos de RNAs tm sido propostos e extensivamente usados para processamento de sinais. O modelo inicial para um neurnio artificial, foi proposto por McCulloch e Pitts e posteriormente aprimorado por ROSENBLATT (1958), que o nomeou de

perceptron (Figura 6). Ele representa uma aproximao extremamentesimplificada sob a tica neurofisiolgica, porm conserva algumas das caractersticas bsicas do neurnio biolgico e viabiliza a sua implementao computacional. pesosbias

x1Sinais de entrada

wk1 wk 2. . . . . . . .

bk

Funo de ativao

x2

uk

(.)

sada

yk

Somatrio

xm

wkm

Figura 6 Modelo no linear de neurnio artificial (Adaptada de HAYKIN, 1999). Onde xm so as entradas da rede, wkm so os pesos, ou pesos sinpticos, associados a cada entrada, bk o termo bias , u k a combinao linear dos sinais de entrada, (.) a funo de ativao e y k a sada do neurnio. Pode-se dizer que nos pesos que reside todo o conhecimento adquirido pela rede. Os pesos que so os parmetros ajustveis e que mudam e se adaptam medida que o conjunto de treinamento apresentado rede. Assim sendo,o processo de aprendizado supervisionado em uma RNA com pesos, resulta em sucessivos ajustes dos pesos sinpticos de tal forma que a sada da rede seja o mais prximo possvel da resposta desejada.

28

Tipicamente, a ordem de amplitude normalizada da sada do neurnio est no intervalo [0, 1] ou alternativamente [1, 1] . O modelo neural tambm inclui um termo chamado de bias, aplicado externamente, simbolizado por bk . O bias bk tem o efeito do acrscimo ou decrscimo da funo de ativao na entrada da rede, dependendo se positiva ou negativa, respectivamente. Regies de deciso so intervalos fixos onde a resposta desejada pode estar. O bias serve para aumentar os graus de liberdade, permitindo uma melhor adaptao, por parte da rede neural, ao conhecimento fornecido a ela.

4.3 Topologia tima.A priori, quanto mais camadas de neurnios, melhor seria o desempenhoda rede neural pois aumenta a capacidade de aprendizado, melhorando a preciso com que ela delimita regies de deciso. Mas, na prtica, aumentar o nmero de camadas intermedirias, s vezes, se torna invivel devido ao trabalho computacional. Existem pesquisadores como HECHT; NIELSEN (1989), que afirmam que com apenas uma camada intermediria na rede neural, j possvel calcular uma funo arbitrria qualquer a partir de dados fornecidos. De acordo com estes autores, a camada oculta deve ter por volta de (2i+1) neurnios, onde i o nmero de variveis de entrada. Outros, como CYBENKO (1988) estudaram o nmero de camadas intermedirias necessrias implementao de funes em RNAs. Seus resultados indicam que uma camada intermediria suficiente para aproximar qualquer funo contnua e duas camadas intermedirias aproximam qualquer funo matemtica. LIPPMANN (1987) afirma que em havendo uma segunda camada intermediria na rede neural, esta deve ter o dobro de neurnios da camada de sada. No caso de apenas uma camada oculta, ela dever ter s (i+1) neurnios, onde s o nmero de neurnios de sada e i o nmero de neurnios na entrada.

29

Outros autores defendem que em redes pequenas o nmero de neurnios da camada oculta pode ser a mdia geomtrica entre o nmero de neurnios de entrada pelo nmero de neurnios de sada.

4.4 Caractersticas e propriedades teis das RNAsRNAs so capazes de processar uma grande quantidade de dados e fazer previses, algumas vezes com uma acurcia surpreendente e embora essa caracterstica no as torne inteligentes no sentido usual da palavra, redes Neurais Artificiais definitivamente aprendem. O algoritmo de aprendizado formado por um conjunto de procedimentos bem definidos, capazes de adaptar os parmetros de uma RNA. Existe um conjunto de ferramentas representadas por diversos algoritmos que diferem entre si atravs da forma como se d o ajuste de pesos, BRAGA; CARVALHO; LUDERMIR (2000). O poder de generalizao, atribudo s redes neurais, refere-se capacidade que elas possuem de produzir sadas razoveis a entradas que nunca lhe tenham sido apresentadas (aprendizado). Essa caracterstica possibilita a soluo de problemas complexos. A utilizao de redes neurais possibilita as seguintes capacidades e propriedades teis: No linearidade ( uma propriedade importante, particularmente se o sinal de entrada gerado por mecanismos fsicos, inerentemente no lineares); Traado entrada-sada (aprendizado supervisionado); Adaptatividade (capacidade de adaptar os pesos sinpticos, modificando-os em funo de entradas externas); Resposta clara (classificao, interpolao e extrapolao); Informao contextual (cada neurnio potencialmente afetado pela atividade global de todos os outros neurnios da rede); Tolerncia a erros;

30

Analogia neuro-biolgica (resoluo de problemas complexos).

4.5 Os Modelos Neurais.H dezenas de diferentes modelos de RNAs descritos na literatura. primeira vista, o processo de seleo pode parecer uma tarefa difcil, frente ao nmero de possibilidades. Porm, provvel que uns poucos modelos forneam uma soluo excelente (MASTERS, 1994). Muitos modelos neurais so similares ou idnticos a tcnicas estatsticas populares tais como: modelos lineares generalizados, regresso polinomial, regresso no paramtrica e anlise de discriminantes, anlise de grupos e componentes principais, especialmente onde a nfase a predio de fenmenos complexos ao invs de uma explicitao das correlaes entre as variveis. Estes modelos neurais podem ser muito teis em diferentes tipos de aplicao. Apesar de existirem diversos mtodos para o treinamento de redes neurais, eles podem ser agrupados em dois paradigmas principais que so os aprendizados: supervisionado e no supervisionado. Existem ainda os aprendizados por reforo e por competio, mas o mtodo de aprendizado supervisionado o mais usado em RNAs, quer de neurnios com pesos, quer de neurnio sem pesos, e possui este nome em funo de que tanto entradas quanto sadas desejadas so fornecidas rede durante o processo de treinamento, BRAGA; CARVALHO; LUDERMIR (2000). Esta investigao utilizar apenas o mtodo de aprendizado supervisionado. SARLE (1994) afirma que embora muitos modelos de redes neurais sejam similares ou idnticos a modelos estatsticos bastante conhecidos, a terminologia na literatura de RNAs muito diferente que aquela usada por estatsticos. Por exemplo, na literatura de RNAs: Variveis so chamadas de caractersticas; Variveis independentes so chamadas de entradas; Valores estimados ou preditos so chamados de sadas; Variveis dependentes so chamadas de valores de treinamento;

31

Resduos so chamados de erros; Estimar ou prever so chamados de treinamento, aprendizado, adaptao ou auto-organizao; Critrio de estimao chamado de funo erro, funo custo, ou funo Lyapunov; Observaes so chamadas de padres de treinamento; Parmetros estimados so chamados de pesos (sinpticos); Transformaes so chamadas de links funcionais; Regresso ou anlise de discriminantes so chamadas de aprendizado supervisionado ou heteroassociao; Anlise de classes chamada de aprendizado competitivo ou Adaptative Vector Quantization; Interpolao e/ou extrapolao so chamadas de generalizao. Os termos estatsticos, amostra e populao no parecem ter equivalentes no jargo de RNAs. Embora os dados sejam sempre divididos em conjunto de treinamento e teste, para que se efetive a validao cruzada.

4.5.1 O Modelo Perceptron Multi Camadas (Multilayer Perceptrons ou MLP).Um perceptron, MCCULLOCH & PITTS (1943), calcula a combinao linear de entradas chamadas de entradas da rede. Ento, uma funo de ativao possivelmente no linear aplicada s entradas da rede para produzir uma sada. Um perceptron pode ter uma ou mais sadas. Se possuir uma funo de ativao linear, similar a um modelo de regresso linear. Segundo SARLE (1994) ao introduzir-se na rede uma camada extra de neurnios, chamada de intermediria ou camada oculta, ainda assim, existe apenas uma nica camada com pesos a serem estimados. Se o modelo inclui pesos, estimados entre a camada de entrada e a camada oculta, e a camada oculta usa funo de ativao no linear, tal como a funo logstica, o modelo torna-se genuinamente no linear. O modelo resultante chamado de Multilayer

Perceptron ou MLP.

32

As

redes

de

mltiplas

camadas

so

aproximadores

universais,

RUMELHART et al. (1986) e devem ser usadas quando se tem pouco conhecimento e dados insuficientes acerca do relacionamento entre as variveis independentes e dependentes. Pode-se variar a complexidade do modelo MLP atravs da variao do nmero de camadas intermedirias e do nmero de neurnios em cada camada intermediria. Com um pequeno nmero de neurnios ocultos, uma MLP um modelo paramtrico que fornece uma alternativa til regresso polinomial. Com um nmero mdio de neurnios ocultos, a MLP pode ser considerada como um modelo quase paramtrico. Se o nmero de neurnios intermedirios aumenta com o tamanho da amostra, a MLP torna-se um modelo no paramtrico. Considerando uma MLP para ajustamento de uma curva de regresso no linear simples, usando uma entrada, uma sada linear e uma camada intermediria com uma funo de ativao logstica, a curva pode ter muitas ondulaes e como existem neurnios ocultos, este tipo de MLP atuaria como uma regresso polinomial ou um ajustamento quadrtico. Diferentes de polinmios, MPLs so fceis de expandir para mltiplas entradas e mltiplas sadas sem um aumento exponencial do nmero de parmetros. MPLs so treinadas normalmente por um algoritmo chamado de regra delta generalizada, sugerida inicialmente por WIDROW; HOFF (1960), que calcula derivadas pela simples aplicao da regra da cadeia chamada

backpropagation.Freqentemente, o termo backpropagation aplicado tambm ao prprio mtodo de treinamento ou rede treinada, desta forma. Esta confuso na literatura em redes neurais geral quando se trata de diferenciar modelos de mtodos ou algoritmos de treinamento. Embora uma MLP com uma camada intermediria seja um aproximador universal, existem diversas aplicaes onde o uso de mais de uma camada intermediria pode ser til. Eventualmente uma funo altamente no linear pode ser aproximada com poucos pesos quando se usam mltiplas camadas intermedirias ao invs de apenas uma.

33

Em estatstica necessita-se ter uma informao priori sobre a estrutura do modelo matemtico. Em redes neurais o usurio estima esta estrutura pela escolha do nmero de camadas e o nmero de neurnios e as funes de transferncia entre os neurnios de uma rede.

4.5.2 O algoritmo backpropagationPara treinar a rede so utilizados vetores de entrada associados a seus respectivos vetores de sada desejada, at que a rede aproxime uma determinada funo e possa a partir da oferecer sadas adequadas a vetores de entrada diferentes daqueles com os quais foi treinada. O backpropagation padro um algoritmo gradiente descendente tal como a regra da cadeia. Atravs dele os pesos das conexes entre os neurnios da rede, so atualizados ao longo de um gradiente descendente de uma determinada funo. O termo backpropagation refere-se a forma como o gradiente calculado para redes de mltiplas camadas no lineares. Existe um nmero razovel de variaes a partir do algoritmo bsico, que so baseadas em tcnicas de otimizao, tais como o gradiente conjugado e mtodos de Newton. O algoritmo backpropagation bsico tem duas fases, para cada padro apresentado: Feed-forward as entradas se propagam pela rede, da camada de entrada at a camada de sada; Feed-backward os erros se propagam na direo contrria ao fluxo de dados, indo da camada de sada at a primeira camada escondida. O backpropagation o algoritmo de Redes Neurais mais utilizado em aplicaes prticas de previso, classificao e reconhecimento de padres em geral. A Tabela 2 apresenta sucintamente este algoritmo. Maiores detalhes acerca das diferentes funes de ativao, regra de atualizao de pesos e uma descrio matemtica, podem ser encontrados em HAYKIN (1989). Foi

34

demonstrado por CYBENKO, (1989) que o backpropagation um aproximador universal capaz de representar qualquer funo. Tabela 2- Descrio resumida do Algoritmo de aprendizado backpropagation padro. Inicializao pesos iniciados com valores aleatrios e pequenos ( w 0.1 ); Treinamento Loop at que o erro de cada neurnio de sada seja tolerncia, para todos os padres do conjunto de treinamento; 1. Aplica-se um padro de entrada o de entrada Xi com o respectivo vetor de sada da Yi desejado; 2. Calculam-se as sadas dos neurnios, comeando da primeira camada escondida at a camada de sada; 3. Calcula-se o erro para cada neurnio da camada de sada. Se erro tolerncia, para todos os neurnios, volta ao passo 1; 4. Atualiza-se os pesos de cada neurnio, comeando pela camada de sada, at a primeira camada escondida. 5. Volta-se ao passo 1 caso a diferena entre a sada da rede e a resposta desejada seja maior que uma determinada limite, especificado pelo usurio. Um dos fatores que influenciam o aprendizado a forma como ele se d. O algoritmo bsico pode ser implementado tanto para o aprendizado incremental quanto para o aprendizado acumulativo. No modo de aprendizado incremental os pesos so atualizados a cada apresentao de um novo padro, ele utiliza o mtodo do gradiente descendente mas tende a aprender melhor o ltimo padro apresentado. No modo de aprendizado acumulativo, tambm chamado de modo batch, os pesos so ajustados apenas depois da apresentao de todos os padres, ou seja, depois de um ciclo completo na apresentao dos padres. Muitas das variaes do algoritmo bsico utilizam esta forma de aprendizado como tentativa de acelerar o processo de treinamento da rede.

35

4.5.2.1 Algoritmo de treinamento rpidoPara um treinamento mais rpido podem-se utilizar diversos artifcios, entre eles pode-se destacar a taxa de aprendizado varivel e os algoritmos de gradiente conjugado. Existem ainda como alternativa os chamados de mtodos

de Newton para treinamento acelerado.A diferena fundamental utilizada nos mtodos de Newton em comparao ao algoritmo padro est na matriz Hessiana (segunda derivada) do ndice de erro aos valores atuais de pesos e bias. Os mtodos de Newton sempre convergem mais rpido que os mtodos de gradiente conjugado, mas, infelizmente, o clculo da derivada segunda complexo e demorado para determinar a matriz Hessiana. Assim, utiliza-se uma segunda classe de algoritmos que, apesar de baseados no mtodo de Newton, no necessitam do clculo da derivada segunda, so chamados de mtodos Quase-Newton ou ainda de mtodos secantes. Os mtodos Quase-Newton tm sido publicados com sucesso nos estudos de FLETCHER (1963), GOLDFARB (1970) E SHANNO (1970). Os algoritmos

backpropagation que utilizam essas tcnicas so denominados de BFGS (asiniciais dos pesquisadores). Semelhante aos algoritmos Quase-Newton, o algoritmo LevenbergMarquardt foi desenvolvido para aproximar velocidade de treinamento de segunda ordem sem ter que calcular a matriz Hessiana. Quando a funo erro faz a somatria quadrtica, a matriz Hessiana pode ser aproximada como:

H = JTJE o gradiente pode ser calculado como:

(11)

g = J Te

(12)

Onde J a matriz Jacobiana que contm a primeira derivada dos erros da rede com os respectivos pesos e bias e e o vetor de erros da rede. A matriz Jacobiana pode ser calculada atravs da tcnica backpropagation padro.

36

O algoritmo Levenberg-Marquardt usa esta aproximao Quase-Newton para a matriz Hessiana com a seguinte atualizao:

xk + a = xk J T J + I

[

]

1

JTe

(13)

Quando o mdulo de zero, este o mtodo de Newton e usa a aproximao da matriz Hessiana. Quando grande, isto faz com que o gradiente descendente tenha um pequeno incremento a cada passo. Os algoritmos que usam os mtodos de Newton so mais rpidos e mais precisos quanto menor for o erro mnimo desejado no treinamento. Assim, diminudo depois de cada passo bem sucedido (reduo do erro) e s aumentado quando o erro aumentar. Deste modo, o erro sempre diminuir a cada iterao do algoritmo. Este algoritmo aparece na bibliografia como sendo o mtodo mais rpido para o treinamento de redes neurais de tamanho moderado. Alm disso, encontra-se implementado de forma bastante eficiente como uma ferramenta do programa MATLAB sob o nome trainlm (DEMUTH; BEALE, 1997).

37

5MATERIAIS E MTODOS

Esta pesquisa, em relao ao mtodo, acatou as idias de John Dewey, posteriormente difundidas por NORTHROP apud CASTRO (1977) que indicam que se inicie com uma pergunta, a partir da qual se estruturam as explicaes, hipteses e a natureza dos dados que possam respond-las. Assim sendo, as perguntas que motivaram esta investigao j foram feitas no Captulo 1 e so repetidas a seguir: Seria possvel fazer com que dados observados por receptores de uma freqncia (L1) possam ser processados de forma a se obter um nvel de preciso similar queles gerados por receptores de dupla freqncia (L1 e L2)? Seria possvel modelar, estimando o comportamento das observveis GPS? Qual ferramenta seria adequada a esta modelagem?

5.1 Materiais.Os dados utilizados em todos os procedimentos de investigao desta pesquisa referem-se a: Arquivos de dados obtidos nos receptores da RBMC, no formato RINEX, exemplificado na Figura 7, contendo as observveis L1, C1, L2, P2 e D1;

38

Arquivos de dados GPS no formato RINEX gerados por receptores de freqncia simples, que observaram em estaes cujas coordenadas j se conhecia de observaes anteriores; Arquivos de efemrides precisas disponibilizados pelo IGS6; Informaes sobre atividade solar disponibilizadas pelo NOAA7.

Figura 7 Fac-smile de trecho de um arquivo RINEX de observao da estao BOMJ-RBMC. Para o desenvolvimento do mtodo proposto, buscou-se utilizar

exclusivamente dados e informaes disponveis gratuitamente na Internet, numa tentativa de que o mtodo possa ser utilizado posteriormente sem a necessidade da compra de dados alm da facilidade e rapidez de acesso a eles. Adicionalmente, esta caracterstica dos dados permite que o experimento possa ser reproduzido, a qualquer tempo, a partir de conjuntos de dados diferentes daqueles utilizados neste experimento.6 International GPS Service. 7 National Oceanic & Atmospheric Administration.

39

A aproximao de funes que representem um determinado fenmeno fsico, por vezes sob comportamento no linear, atravs de RNAs nas quais se utilizem modelos com aprendizado supervisionado, tal como proposto nesta investigao, necessitam de um professor externo. Ou seja, para que a rede neural aprenda necessrio ensin-la e isso feito atravs da separao do conjunto de dados disponveis em trs conjuntos: 1. Treinamento; 2. Validao; 3. Testes. Como a prpria nomenclatura indica, os conjuntos de treinamento e validao so usados durante o processo de treinamento e o conjunto de testes usado j para a obteno das estimativas. Esta uma tcnica estatstica chamada de validao cruzada, HAYKIN (1999). A formao de padres de mapeamento entrada/sada que possibilitou a preparao dos arquivos, para ensinar a rede neural, incluiu alm de dados de observao, a insero de dados de posio precisa dos satlites GPS. Estes dados podem ser obtidos atravs da Internet como arquivos de efemrides precisas atravs, por exemplo, do endereo: ftp://igscb.jpl.nasa.gov/igscb/product, 02/12/2002. Um exemplo destes arquivos apresentado na Figura 8.

40

Figura 8 Fac-smile de trecho de um arquivo de efemrides precisas, formato SP3, correspondente ao dia 339 do ano 2001. As efemrides precisas so disponibilizadas como arquivos ASCII, em formatos especficos. O formato adotado nesta investigao o SP3. De forma bastante resumida, pode-se dizer que o arquivo de efemrides traz consigo informaes da posio mais provvel dos satlites GPS em intervalos regulares de tempo. So apresentadas as coordenadas cartesianas X S , Y S , Z S e o erro do relgio dos satlites. Maiores detalhes sobre este formato podem ser obtidos no seguinte endereo eletrnico: http://www.ngs.noaa.gov/GPS/SP3_format.html, 02/12/2002. Inicialmente, os dados retirados ou calculados a partir dos arquivos de observao das estaes que compem a rede GPS para uma determinada poca foram: o ngulo de elevao de cada satlite, os valores correspondentes contagem de ciclos das portadoras L1 e L2, as pseudodistncias a partir dos cdigos C/A e P2 e posio inicial aproximada da estao ( X R , YR , Z R ). Do arquivo

41

de efemrides precisas pode-se retirar as coordenadas ( X S , Y S , Z S ) para o mesmo satlite, mesma poca. Na verdade esses dados sero utilizados em funo das caractersticas dos receptores utilizados pela rede de estaes GPS usada para o treinamento da rede neural. Por isso, por exemplo, se utilizar a pseudodistncia P2, mas nada impede que se utilize a pseudodistncia P1, por exemplo, caso seja esse o padro dos receptores para treinamento. A Rede Brasileira de Monitoramento Contnuo (RBMC) uma rede ativa composta atualmente de 15 estaes, sendo quatorze geridas pelo IBGE8 e uma pelo INPE9. Possui caractersticas necessrias e desejveis realizao do experimento, tais como: receptores de dupla freqncia e cdigo P simultaneidade de operao em diversas estaes disponibilizao gratuita dos dados via rede WWW10 Posio da estao bem conhecida. As estaes de Fortaleza e Braslia alm de comporem a RBMC, tambm fazem parte da rede IGS. A localizao de todas as estaes da RBMC est ilustrada na Figura 9.

8 9

Instituto Brasileiro de Geografia e Estatstica Instituto Nacional de Pesquisas Espaciais World Wide Web

10

42

Figura 9 Localizao das estaes RBMC. (Adaptada de http://www.ibge.net/home/geografia/geodesico/rbmc.shtm. 06/04/2003). Existe a expectativa da entrada em operao, prevista para 2003, de seis estaes adicionais referentes ao Sistema Integrado de Vigilncia da Amaznia, designado por projeto SIVAM. Estas recobririam os vazios de observao GPS que hoje ainda persistem na Amaznia Legal e complementariam a RBMC, perfazendo um total de 21 estaes. H de se notar que, em se tratando de Amaznia, bem como parte do nordeste brasileiro, tem de se ter cuidados especiais na utilizao de dados GPS. O equador geomagntico que passa pela Amaznia brasileira, uma regio cuja camada ionosfrica freqentemente est sujeita ao dos chamados jatos de eltrons. Isso pode gerar uma brusca mudana no TEC e este por sua vez pode ocasionar uma intensa variao em seu ndice de refrao. Este fato pode provocar diversos efeitos no sinal GPS que vo desde o atraso at a interrupo de sua propagao. Maiores detalhes sobre os efeitos ionosfera no sinal GPS podem ser encontrados em CAMARGO (1999) e FONSECA JUNIOR (2002).

43

Assim,

quando

da

entrada

em

operao

das

estaes

SIVAM,

necessariamente, tero que se realizar testes no sentido de avaliar a funcionalidade do mtodo proposto sob condies adversas de atividade solar geomagntica. A Tabela 3 contm informaes relativas ao estabelecimento da RBMC desde o incio de sua implantao e do gradual acrscimo do nmero de estaes entre 1993 e 2002. Tabela 3 Informaes das estaes RBMC em maio 2003. Localizao/UF Fortaleza (IGS)/CE Braslia/DF Curitiba/PR Presidente Prudente/SP Bom Jesus da Lapa/BA Manaus/AM Viosa/MG Cuiab/MT Imperatriz/MA Porto Alegre/RS Salvador/BA Recife/PE Crato/CE Rio de Janeiro/RJ Santa Maria/RS Cdigo IBGE FORT BRAZ PARA UEPP BOMJ MANA VICO CUIB IMPZ POAL SALV RECF CRAT RIOD SMAR Incio de operao 13/05/93 03/03/95 13/12/96 18/12/96 18/02/97 28/04/97 22/05/97 18/06/97 16/02/98 28/10/98 20/05/99 06/07/99 09/04/00 21/07/01 08/11/01

As exigncias que limitam o uso do mtodo proposto dependem diretamente da disponibilidade de dados simultneos quele que se pretende estimar, ou seja, dados de observao dentro de uma determinada regio, neste caso, a rea de abrangncia da RBMC e efemrides precisas para o dia no qual foram feitas as observaes. Apesar de vrios institutos de pesquisa disponibilizarem as efemrides precisas, aqui se utilizaram aquelas fornecidas pelo IGS, devido ao seu carter oficial e tambm metodologia utilizada em sua determinao. Embora neste trabalho tenham sido usados dados da RBMC, nada impede que dados de outras redes, implantadas em outros pases ou continentes, sejam utilizados para obteno de estimativas usando o mtodo proposto,

44

obviamente, desde que possuam caractersticas similares quelas apresentadas pela RBMC e aprsentadas anteriormente nesse item. Como a RBMC foi escolhida como base dos dados, com os quais efetivamente se constri o modelo, buscou-se fazer um levantamento estatstico dos dados gerados pelo IBGE com a finalidade de ratificar o seu uso para esta aplicao, alm de conseguir-se uma viso mais ampla acerca da freqncia e qualidade de seus dados. De posse dos dados referentes a todas as estaes da RBMC desde a sua implantao at junho de 2002, pode-se fazer uma seleo no sentido de agrupar os dados e obter um indicativo sobre quantos e quais dados eleger para proceder as estimativas neurais. Este trabalho gerou informaes acerca do perodo mais adequado a utilizar, quais as estaes e dias nos quais havia um maior nmero de estaes operando simultaneamente. Esses resultados so apresentados em forma de grficos na Figura 10.400 tota l de dia s obs erva dos 350 300 250 200 150 100 50 0 vico u epp sa v riod recf poa l pa ra bra z sma r cu ib 2000 bon j cra t ma n a fort impz 2002 E sta es RBMC 2001

Figura 10 Freqncia de observaes/estao/ano. Uma das necessidades do mtodo proposto a utilizao da maior quantidade disponvel de dados, neste caso, dados da RBMC. Este o motivo pelo qual no sero utilizados dados anteriores ao segundo semestre de 1999, funo de s estarem em operao no mximo 11 estaes. Assim, utilizou-se para efeito de modelagem e testes, os dados compreendidos entre o ano 2000 e

45

2002, que foram gentilmente cedidos pelo DEGED11 do IBGE ao Departamento de Transportes da EESC-USP com a estrita finalidade de pesquisa. Uma viso geral da simultaneidade de observaes das estaes RBMC para o perodo escolhido, ou seja, os anos de 2000, 2001 e 2002 so ilustrados nas Figuras 11, 12 e 13 respectivamente. Para o ano de 2002, s se obteve dados at o dia 307 (03/11/2002).

16 N de es ta es s imu lt n ea s 14 12 10 8 6 4 2 0 1 31 61 91 121 151 181 211 241 271 301 331 361 Dia s do a n os 2000

Figura 11 N de estaes operando simultaneamente em 2000

16 N de est aes simult n eas 14 12 10 8 6 4 2 0 1 31 61 91 121 151 181 211 241 271 301 331 361 Dias do ano 2001

Figura 12 N de estaes RBMC operando simultaneamente em 2001.11

Departamento de Geodsia

46

N d e est aes simu lt n eas

14 12 10 8 6 4 2 0 1 31 61 91 121 151 181 211 241 271 301 331 361 Dias do ano 2002

Figura 13 N de estaes RBMC operando simultaneamente em 2002.

5.1.1 Critrios adotados para escolha dos dados e desenvolvimento do mtodo propostoComo critrio inicial, buscou-se determinar entre o perodo de 2000 a 2002, os intervalos com o maior nmero de estaes que coletaram dados simultaneamente. Baseado na estatstica de operao simultnea das estaes RBMC, evidenciadas pelas Figuras 11, 12 e 13, adotou-se alguns dias como dados para a modelagem. importante ressaltar que a estao Fortaleza possui caractersticas operacionais que diferem do restante da rede. A principal diferena est na taxa de coleta dos dados. Em todas as estaes da RBMC a taxa de coleta de 15 segundos exceto para Fortaleza que possui taxa de coleta de 30 segundos. A taxa de 15 segundos de particular interesse para o desenvolvimento do mtodo proposto, pois quanto menor a taxa de coleta, maior ser a quantidade de dados (padres de entrada) disponveis para treinamneto da rede para pequenas intervalos de tempo, o que certamente concorrer para uma melhor generalizao da rede. FAZAN (2002), submeteu os dados gerados pela RBMC a uma srie de testes com o objetivo de verificar a sua qualidade e constatou que a estao de Fortaleza apesar de possuir uma freqncia diria dentro do mesmo padro das

47

outras estaes, possui um aproveitamento das observaes relativamente menor que as demais. Estas duas caractersticas da estao Fortaleza fizeram com que as observaes geradas por ela fossem ignoradas durante o processo de modelagem, o que no chega a prejudicar a aplicao do mtodo, pois existe uma outra estao que cobre a mesma rea, a estao CRAT, localizada em Crato-Ce. A Tabela 4 resume esses dados, j considerando a excluso da estao de Fortaleza. Tabela 4 Resumo dos dados escolhidos para modelagem. Data 12/05/2000 17/05/2000 18/05/2000 13/11/2001 25/11/2001 05/12/2001 29/01/2002 07/02/2002 08/03/2002 Dia Semana N de Atividade Solar GPS GPS estaes (Emisso de raios-X) 133 1061 13 Baixa com eventos de alta 138 1062 13 Mdia com eventos de alta 139 1062 13 Moderada com eventos de alta 317 1140 14 Baixa com eventos de alta 329 1142 14 Baixa 339 1143 14 Baixa 29 1151 12 Moderada 38 1152 12 Moderada 67 1156 12 Moderada com eventos de alta

Alm disso, buscou-se distribuir os dados em diferentes meses dos anos numa tentativa de validar o mtodo proposto independente do perodo no qual os dados foram observados, o que comprovar a eficcia da modelagem proposta sob diferentes perodos de observao, conjuntos de estaes e condies de atividade solar. De acordo com os critrios adotados por LEANDRO (2003), o ndice de emisso de raios-X pode ser utilizado para estimar a atividade solar classificando-a, por exemplo, em alta, moderada ou baixa. Entretanto, essa uma classificao relativa, pois a emisso de raios-X apenas uma dentre vrias grandezas que podem ser levadas em considerao, como a emisso de partculas, fluxo de ondas de rdio e nmero de manchas solares representado pelo nmero Sunspot.

48

Em janeiro de 2003 o sol passou por um perodo de alta intensidade que teve seu pice entre 2000 e 2001. Assim, mesmo os perodos considerados de baixa intensidade so de alta quando comparados ao perodo prximo a 1997, considerado um perodo de calmaria como pode ser visto na Figura 14 para o atual ciclo solar (ciclo 23).

Figura 14 Representao grfica do nmero Sunspot do Ciclo Solar 23. (Fonte: http://www.sec.noaa.gov/SolarCycle/index.html, 28/01/2003.) As emisses solares de raios-X podem ser avaliadas a partir de dados e grficos, obtidos em relatrios de ndices geofsicos e solares, medidos atravs do satlites GOES-X e disponibilizados na Internet pelo National Oceanic and

Atmospheric

Administration

(NOAA)

sob

o

endereo:

http://www.sec.noaa.gov/weekly/, 28/01/2003.

5.2 MetodologiaDe posse de todas as informaes e dados descritos no item 5.1, pde-se delinear a seqncia de etapas, regras de procedimentos e estratgias de processamento adotadas no curso da investigao.

49

Devido a algumas restries relativas a observao simultnea das estaes RBMC, o conjunto de dados escolhido est exatamente em um perodo no qual ocorrem os mximos da atividade solar no atual ciclo. Este fato possibilitar, caso a hiptese inicial seja validada, que se comprove que o mtodo proposto funciona, mesmo sob intensa atividade solar, que provoca variaes bruscas no TEC e este por sua vez, na propagao do sinal GPS.

5.2.1 Etapas realizadas nesta investigao1. Reviso Bibliogrfica; 2. Busca e definio das estaes GPS com receptores L1/L2 e cdigo P que possam ser utilizadas sistematicamente para treinamento da rede neural; 3. Busca e ou implementao do algoritmo neural que melhor se adaptou extrapolao e interpolao para estimativas de dados GPS; 4. Criao e montagem do padro de entradas mais representativo com dados obtidos de tal forma a se obter, como respostas, um conjunto de L2 e ou P2 por satlite/poca; 5. Desenvolvimento de aplicativos que possibilitem: a. Ler e extrair de um conjunto de arquivos de dados GPS, para um determinado conjunto de pocas especficas (240 pocas por hora a cada 15 segundos); b. Ler e extrair de um arquivo de efemrides precisas atravs de interpolao os dados de posio para cada a cada 15 segundos; c. A partir das informaes obtidas no arquivo GPS e tambm de efemrides precisas, c