Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
UNIVERSIDADE FEDERAL DE PERNAMBUCO PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE
PRODUÇÃO
PROCESSOS SEMI-MARKOVIANOS E ANÁLISE DE
VARIABILIDADE POPULACIONAL PARA ESTIMAÇÃO DA
INDISPONIBILIDADE DOS TRABALHADORES POR
ACIDENTES DO TRABALHO
DISSERTAÇÃO SUBMETIDA À UFPE
PARA OBTENÇÃO DE GRAU DE MESTRE
POR
FLÁVIO LEANDRO ALVES DOS SANTOS
Orientador: Enrique Andrés López Droguett, Ph.D.
RECIFE, ABRIL / 2013
Catalogação na fonte
Bibliotecária Margareth Malta, CRB-4 / 1198
S237p Santos, Flávio Leandro Alves dos.
Processos semi-markovianos e análise de variabilidade populacional
para estimação da indisponibilidade dos trabalhadores por acidentes do
trabalho / Flávio Lendro Alves dos Santos. - Recife: O Autor, 2013.
ix, 76 folhas, il., gráfs., tabs.
Orientador: Prof. Dr. Enrique Andrés López Droguett.
Dissertação (Mestrado) – Universidade Federal de Pernambuco. CTG.
Programa de Pós-Graduação em Engenharia de Produção, 2013.
Inclui Referências e anexos.
1. Engenharia de Produção. 2. Processo Semi-Markov. 3. Análise de
variabilidade populacional. 4. Inferência Bayesiana. I. Droguett, Enrique
Andrés López. (Orientador). II. Título.
UFPE
658.5 CDD (22. ed.) BCTG/2013-160
ii
Aos meus pais,
Maria de Fátima e Luís Pedro
pela dedicação, incentivo e amor.
iii
AGRADECIMENTOS
Primeiramente gostaria de agradecer a Deus, que sempre me deu força em todos os
momentos para concluir o mestrado e sem ele não conseguiria atingir esse objetivo.
A minha a minha mãe, Maria de Fátima, meu pai, Luís Pedro e meus irmãos (Janaina e
Franklin) que sempre me deram amor e apoio em todas as ocasiões da minha vida.
A minha querida namorada, Mayra Queiroz, pelo incentivo em realizar essa jornada, por
sua paciência em momentos difíceis e pelo amor que existe entre nós.
Aos meus amigos Ricardo Ferreira, Guilherme Cerqueira, Manoel Torres, Rodrigo
Bernardo, Romero Sales e Thiago Albuquerque pela grande amizade, pelas conversas
construtivas e por todos os momentos que passamos juntos nessa jornada.
Ao Professor Enrique Droguett, por ter me aceitado como seu aluno e pelos excelentes
conselhos que me possibilitou à conclusão deste trabalho.
Ao Professor Márcio Moura, pelo incentivo, companheirismo e grande ajuda prestada
neste trabalho.
Aos amigos do Ceerma, Ana Agra, Edlaine Correia, Daniella Nóbrega, Cláudia Silva,
Victor Viana, Yuri Dourado, Marcela Guimarães, Jeane Kury e Rodolfo Araújo por fazer o
dia a dia de trabalho ser sempre agradável.
De forma geral, agradeço a todos que contribuíram direta e indiretamente por esse
trabalho, seja com ajuda acadêmica ou com conselhos de incentivo.
iv
RESUMO
O presente trabalho propõe uma metodologia que permite obter métricas de
Disponibilidade e Indisponibilidade de um funcionário que trabalha em uma das seis regiões
de atuação de uma Companhia de geração de energia elétrica, através da integração entre o
processo semi-Markoviano (PSM) e Análise de variabilidade populacional Bayesiana.
A Análise de variabilidade populacional Bayesiana é um método para se chegar a uma
distribuição a priori para avaliação Bayesiana dos parâmetros de confiabilidade baseado em
dados parcialmente relevante. Já o processo semi-Markoviano pode ser visto como um
processo cujas sucessivas transições de estados são governadas pelas probabilidades de
transição do processo Markoviano (PM), mas sua permanência em qualquer estado é descrita
por uma variável aleatória que depende do estado atual ocupado e do estado em que a
próxima transição será feita.
A integração do PSM e da Análise de variabilidade populacional Bayesiana origina um
modelo híbrido o qual é capaz de representar o comportamento do trabalhador que sofre
diversos tipos de acidentes do trabalho com diferentes tempos de recuperação e taxas de
falhas. Diante deste contexto, será utiliza a Análise de variabilidade populacional Bayesiana
para a estimação da distribuição da taxa de acidentes e de recuperação para o processo semi-
Markoviano.
Após aplicação da metodologia, é exposto métricas de um operário em cada uma das
seis regiões de atuação da companhia elétrica como: Tempo operacional médio,
Disponibilidade média, Disponibilidade instantânea ao final da missão, Tempo falho médio,
Indisponibilidade média, Indisponibilidade instantânea ao final da missão e a Probabilidade
do funcionário não acidentado e acidentado por acidente de trabalho.
v
ABSTRACT
This paper proposes a methodology to obtain metrics availability and unavailability of an
employee working in one of six areas of activity of a company to generate electricity, through
the integration between the semi-Markov process (PSM) and Bayesian approach for
population variability analysis.
The Bayesian approach for population variability analysis is a method to reach a prior
distribution for Bayesian assessment of reliability parameters based on data partially relevant.
Already the semi-Markov process can be seen as a process whose successive state transitions
are governed by the transition probabilities of the Markov process (MP), but his stay in any
state is described by a random variable that depends on the current state and busy state
wherein the next transition will be made.
The integration of SPM and Bayesian approach for population variability analysis yields
a hybrid model which is able to represent the behavior of workers who suffer from various
types of accidents at work with different recovery times and failure rates. Given this context,
it uses Bayesian approach for population variability analysis to estimate the distribution of
accident rates and recovery to semi-Markov process.
After application of the methodology, metrics is exposed workers in the six regions of
operation of the utility as: average operating time, average availability, instant availability at
the end of the mission, Time flawed medium Unavailability average Unavailability instant the
end of the mission, expected number of accidents and the probability of non-injured
employees and injured by an accident at work.
vi
SUMÁRIO
1 INTRODUÇÃO .................................................................................................................................. 1
1.1 Objetivos ................................................................................................................................. 5
1.1.1 Objetivo geral .................................................................................................................. 5
1.1.2 Objetivos específicos ....................................................................................................... 5
1.2 Estrutura da dissertação ......................................................................................................... 5
2 FUNDAMENTAÇÃO TEÓRICA ........................................................................................................... 6
2.1 Conceitos e Aplicações ............................................................................................................ 6
2.2 Processos semi-Markovianos .................................................................................................. 7
2.2.1 PSMH descrito por probabilidades de transição ............................................................. 9
2.2.2 PSMH descrito por taxas de transição .......................................................................... 10
2.3 Inferência Bayesiana ............................................................................................................. 11
2.4 Análise de variabilidade populacional Bayesiana ................................................................. 13
2.4.1 Mistura de funções de Verossimilhança ....................................................................... 16
2.4.2 Modelo Lognormal-Poisson-Lognormal ........................................................................ 17
2.4.3 Caso especial: Modelo Lognormal-Poisson ................................................................... 20
2.4.4 Especificação a priori ..................................................................................................... 21
2.4.5 Medidas de variabilidade .............................................................................................. 21
3 METODOLOGIA PROPOSTA ........................................................................................................... 23
3.1 Integração: Processo semi-Markoviano e Análise de variabilidade populacional Bayesiana 23
4 EXEMPLO DE APLICAÇÃO .............................................................................................................. 27
4.1 Descrição do Problema ......................................................................................................... 27
4.2 Definição e categorização das variáveis ................................................................................ 29
4.3 Testes de aderência e homogeneidade ................................................................................ 30
4.4 Análise de variabilidade populacional Bayesiana ................................................................. 31
4.5 Análise de Sensibilidade ........................................................................................................ 47
4.6 Processos semi-Markovianos ................................................................................................ 50
5 CONCLUSÃO .................................................................................................................................. 54
5.1 Limitações e Desafios Futuros ............................................................................................... 55
REFERÊNCIAS BIBLIOGRÁFICAS ............................................................................................................. 56
ANEXOS ................................................................................................................................................. 64
Anexo I – Análise gráfica das métricas de disponibilidade e indisponibilidade das Regiões B, C, D, E
e F. ..................................................................................................................................................... 64
vii
LISTA DE FIGURAS
Figura 2.1: Esquema Bayesiano. Fonte: PAULINO et al.(2003, p 22). ................................................... 13
Figura 3.1: Fluxograma para obtenção das métricas de disponibilidade e indisponibilidade. ............. 26
Figura 4.1: Linha do tempo de N trabalhadores. Fonte: MARCOULAKI et al. (2012). .......................... 27
Figura 4.2: Modelo Estocástico para a disponibilidade e indisponibilidade do trabalhador. ............... 28
Figura 4.3: Percentual de funcionários nas regiões de atuação da Companhia de geração de energia
elétrica. .................................................................................................................................................. 29
Figura 4.4: Função Densidade de Probabilidade da taxa do tempo (dias) entre acidentes dos
funcionários da Companhia de geração de energia elétrica. ................................................................ 33
Figura 4.5: Função de Distribuição Acumulada a posteriori da taxa do tempo(dias) entre acidentes dos
funcionários das regiões de atuação da Companhia de geração de energia elétrica .......................... 34
Figura 4.6: Função Densidade de Probabilidade da taxa de recuperação (dias) dos funcionários da
região A da Companhia de geração de energia elétrica. ...................................................................... 35
Figura 4.7: Função de Distribuição Acumulada a posteriori da taxa de recuperação (dias) do
funcionário da Companhia de geração de energia elétrica da região A. .............................................. 36
Figura 4.8: Função Densidade de Probabilidade a posteriori da taxa de recuperação (dias)dos
funcionários da região B da Companhia de geração de energia elétrica. ............................................ 37
Figura 4.9: Função de Distribuição Acumulada a posteriori da taxa de recuperação (dias) dos
funcionários da Companhia de geração de energia elétrica na região B. ............................................ 38
Figura 4.10: Função Densidade de Probabilidade a posteriori dos dias de recuperação dos
funcionários da região C da Companhia de geração de energia elétrica. ............................................ 39
Figura 4.11: Função de Distribuição Acumulada a posteriori da taxa de recuperação dos funcionários
da Companhia de geração de energia elétrica na região C. ................................................................. 40
Figura 4.12: Função Densidade de Probabilidade a posteriori dos dias de recuperação dos
funcionários da região D da Companhia de geração de energia elétrica. ............................................ 41
Figura 4.13: Função de Distribuição Acumulada a posteriori da taxa de recuperações dos funcionários
da Companhia de geração de energia elétrica na região D. ................................................................. 42
Figura 4.14: Função Densidade de Probabilidade a posteriori dos dias de recuperação dos
funcionários da região E da Companhia de geração de energia elétrica. ............................................. 43
Figura 4.15: Função de Distribuição Acumulada a posteriori da taxa de recuperação dos funcionários
da Companhia de geração de energia elétrica na região E. ................................................................. 44
Figura 4.16: Função Densidade de Probabilidade a posteriori dos dias de recuperação dos
funcionários da região F da Companhia de geração de energia elétrica. ............................................. 45
Figura 4.17: Função de Distribuição Acumulada a posteriori da taxa de dias de recuperação dos
funcionários da Companhia de geração de energia elétrica na região F. ............................................. 46
Figura 4.18: Função Densidade de Probabilidade a posteriori da taxa de acidente para os percentis
5%, 50% e 95% da taxa do tempo (dias) entre acidentes n a região A. ................................................ 48
Figura 4.19: Função Densidade de Probabilidade a posteriori da taxa de acidentes para os percentis
5%, 50% e 95% da taxa de recuperação nas categorias da região A. ................................................... 49
Figura 4.20: Taxa de visita ao Estado 0 – trabalhador disponível – na região A. ................................. 51
Figura 4.21: Taxa de visita aos Estados (1, 2, 3, 4 e 5) em que o funcionário não está apto ao trabalho
na região A. ........................................................................................................................................... 52
Figura 4.22: Probabilidade dos Estados (1, 2, 3, 4 e 5) em que o funcionário não está apto ao trabalho
na região A. ........................................................................................................................................... 52
viii
LISTA DE TABELAS
Tabela 4.1: Teste de homogeneidade de Levene: dias de recuperação por região .............................. 30
Tabela 4.2: Teste de homogeneidade de Levene: dias de recuperação na região A............................. 30
Tabela 4.3: Teste de homogeneidade de Levene: dias de recuperação na região B. ............................ 30
Tabela 4.4: Teste de homogeneidade de Levene: dias de recuperação na região C. ............................ 30
Tabela 4.5: Teste de homogeneidade de Levene: dias de recuperação na região D. ........................... 31
Tabela 4.6: Teste de homogeneidade de Levene: dias de recuperação na região E. ............................ 31
Tabela 4.7: Teste de homogeneidade de Levene: dias de recuperação na região F. ............................ 31
Tabela 4.8: Curvas percentuais da distribuição de variabilidade da taxa de dias até o acidente. ....... 32
Tabela 4.9: Estimativa da taxa de acidente e Fator de Erro para o tempo (dias) até o acidente na
região A. ................................................................................................................................................ 47
Tabela 4.10: Estimativa da taxa de acidentes e fator de erro para os dias de recuperação das
categorias da região A .......................................................................................................................... 48
Tabela 4.11: Métricas de Disponibilidade e Indisponibilidade do funcionário da Companhia de geração
de energia elétrica nas regiões de atuação. ......................................................................................... 50
1
1 INTRODUÇÃO
O estudo da segurança do trabalho passa a tomar uma atenção maior após a Revolução
Industrial, quando começou a surgir o trabalhador assalariado e o empregador capitalista na
imagem de patrão. Segundo Bitencourt & Quelhas (1998) as tarefas do dia a dia dos operários
se tornaram mais simples com ajuda das máquinas na produção, acarretando tarefas
repetitivas que levou ao aumento do número de acidentes. De acordo com Costa (2003),
diante de um cenário de exploração aos trabalhadores que tinham carga horária elevada, sem
descanso na jornada de trabalho semanal e das condições de periculosidade ambiental que
contribuíam para o aumento dos números de acidentes, foi criada a primeira lei trabalhista que
surgiu na Inglaterra para coibir essas irregularidades aos funcionários.
O conceito de acidente do trabalho típico é dado conforme o Art. 19, caput, da Lei nº
8.213/1991:
“É o que ocorre pelo exercício do trabalho a serviço da empresa ou pelo
exercício do trabalho dos segurados referidos no inciso VII do art. 11 desta
Lei, provocando lesão corporal ou perturbação funcional que a causa à
morte ou a perda ou redução, permanente ou temporária, da capacidade
para o trabalho”.
O conceito de acidente de trajeto ou acidente de percurso é dado conforme o Art. 21,
caput, da Lei nº 8.213/1991:
“Acidente de trajeto é o acidente sofrido pelo segurado ainda que
fora do local e horário de trabalho, a serviço da empresa ou no
percurso da residência para o local de trabalho ou deste para aquela,
qualquer que seja o meio de locomoção, inclusive veículo de
propriedade do segurado”.
A previdência Social garante aos trabalhadores cobertura nos afastamentos por
acidentes ocorridos no ambiente de trabalho ou em razão da sua execução. O conceito de
acidente segundo o regulamento da Previdência social – Art. 30, parágrafo único, Decreto nº
3.048/1999 é definido a seguir:
2
“Entende-se como acidente de qualquer natureza ou causa aquele de
origem traumática e por exposição a agentes exógenos (físicos,
químicos e biológicos), que acarrete lesão corporal ou perturbação
funcional que cause a morte, a perda, ou a redução permanente ou
temporária da capacidade laborativa”.
Conforme RIVM (2008) sempre que um trabalhador exerce suas atividades ligadas ao
trabalho e depara com várias situações de perigo, existe a possibilidade de um acidente que
poderá resultar em uma lesão corporal. Tais lesões não irão acontecer sempre, mas ocorrerão
ocasionalmente na população ativa durante o tempo de vida dos funcionários.
Segundo dados da OIT (Organização Internacional do Trabalho), cerca de 317 milhões
de trabalhadores sofrem acidentes do trabalho a cada ano. Isto representa uma média de
850.000 lesões diárias, fazendo que os trabalhadores passem quatro ou mais dias afastados de
seus empregos. Os dados da EUROSTAT (2007) mostram que 3,2% entrevistados da União
europeia (EU-27) relataram que no período de um ano sofreram um ou mais acidentes de
trabalho. Esse percentual corresponde aproximadamente 6,9 milhões de pessoas na EU-27.
No Brasil, segundo o Ministério da Previdência Social (MPAS), em 2011 foram registrados
711.164 casos de acidentes e doenças do trabalho, entre os trabalhadores assegurados da
Previdência Social.
A experiência devido à ocorrência de acidentes do trabalho tem levado agências
reguladoras a serem mais rigorosas na garantia da segurança, por exemplo, no setor elétrico a
norma CFR 1910 padrão 29 subparte S da OSHA (Occupational Safetyand Health
Administration) exige que em uma planta do setor elétrico todos os perigos devam ser
identificados a fim de determinar suas severidades e designar quais equipamentos de proteção
pessoal e práticas seguras de trabalho devem ser seguidas de forma a proteger os operadores e
sistema.
A causa do acidente pode ser definida como qualquer fator que, se removido, teria
evitado o acidente; é a ação e/ou a condição que precede imediatamente o acidente,
(REDONDO, 1970). Conforme a NBR 14280 (2001) existem várias causas que contribuem
para a ocorrência do acidente do trabalho que são fatores pessoais (falta de conhecimento,
motivação deficiência e etc.), ato de insegurança (forma imperfeita de trabalhar, que violam
as regras de segurança) e ambiente de trabalho (manutenção inadequada, ferramentas
inadequadas e etc.).
3
Assim, os acidentes do trabalho geram diversos prejuízos para os funcionários e para a
empresa, portanto gerenciar os riscos associados a acidentes do trabalho é fundamental, não
apenas para reduzir custos relativos aos acidentados, mas também devido à indisponibilidade
do sistema. Segundo a CNP/SP (2004) os acidentes do trabalho acarretam perdas gerais ao
empreendimento devido ao tempo perdido, aos transtornos para os empregados, pela parada
das máquinas, setores que podem ser interditados por longo prazo de tempo, redução do
rendimento do trabalhador ao voltar do período de recuperação, perda de prestigio com o
público consumidor de seus produtos, aumento de gastos com processos judiciais de
indenização e custos com ações corretivas para minimizar futuros acidentes. Marcoulaki et al.
(2012) ainda expõe que as perdas de tempo de trabalho estão vinculadas aos prejuízos
econômicos da empresa e as estimativas de perda de tempo não podem levar em conta apenas
o número de acidentes, pois é uma função da frequência dos acidentes e a gravidade do
acidente.
Desta maneira, funcionários e contratados que trabalham em uma empresa estão
frequentemente envolvidos em acidentes de trabalho e alguns desses acidentes deixam por
vários dias de afastamento o trabalhador até sua recuperação, esse tempo de afastamento do
empregado gera prejuízos financeiros a empresa. Com base no cenário relatado anteriormente,
é importante se ter ferramentas que permitam calcular a indisponibilidade do trabalhador, isto
é, o período entre o momento que o funcionário sofreu o acidente até sua plena recuperação,
assumindo sua atividade na empresa.
Alguns modelos Markovianos ou semi-Markovianos são encontrados na literatura com
objetivo de calcular a disponibilidade ou indisponibilidade de sistemas ou equipamentos,
como por exemplo, os citados por Mendes (2008), Jens (2006), Vesely (1993) e Moura &
Droguett (2008). Segundo Mathieu et al. (2005), os modelos semi-Markovianos possuem
algumas vantagens em relação aos modelos Markovianos por ter maior tratabilidade
matemática e simples interpretação. Enquanto nos processos Markovianos (PM) as
distribuições de transições entre os estados têm distribuição exponencial (caso contínuo), no
caso semi-Markoviano os tempos entre transições podem assumir diferentes tipos de
distribuições.
Aplicações dos processos semi-Markovianos (PSM) podem ser encontradas em várias
áreas, como por exemplo, o estudo feito na área financeira por D’amico (2005), que emprega
modelos semi-Markovianos de confiabilidade em um ambiente de risco de crédito a empresas.
Felli (2007) utiliza um modelo semi-Markoviano para explorar o perfil da população dos
pacientes de um ensaio clínico com intuito de desenvolver novos medicamentos e tratamentos
4
complexos. Ainda dentro da área de saúde, Wu (1982) desenvolveu um modelo de sobrevida
baseado em um PSM para descrever multi-estados, onde os dados estão parcialmente
censurados. Janssen & Manca (2001) utilizou o PSM na ciência atuarial para modelos de
recompensa de seguros de saúde. Outros recentes trabalhos que têm como tema central o PSM
são os de D’amico & Petroni (2012), Lefebvre (2011), Gosavi (2011), Guenther (2010), Hunt
& Devolder (2011) e Zhang & Hou (2012).
Os esforços para diminuir os prejuízos econômicos gerados pela indisponibilidade do
trabalhador devido a acidentes do trabalho é umas das maiores preocupações das organizações
atualmente. A fim de se obter a disponibilidade e indisponibilidade do trabalhador será
utilizado o Processo semi-Markoviano que é uma generalização do Processo Markoviano e
por isso fornece uma maior flexibilidade para a modelagem de sistemas dinâmicos complexos
(WANG, 2010).
Porém, ainda existem vários tipos de acidentes que podem ter diferentes tempos de
recuperação e taxas de falhas, tornando a amostra não homogênea. Nesses casos, não é
realista assumir que todos os funcionários de uma empresa possuam as mesmas medidas de
confiabilidade, pois desta forma não proporcionará estimativas adequadas para os parâmetros
(taxas de transições do PSM). Para superar essas dificuldades será utilizada a Análise de
variabilidade populacional (ver (Droguett et al. (2004), Kaplan (1983), Ramos et. al. (2012),
Pörn (1996) e Sivini (2006)) para a estimação da distribuição da taxa de acidentes e de
recuperação, de acordo com as categorias do problema em estudo. Os dados necessários para
obtenção da distribuição da taxa de acidentes são: tempo até o acidente e o tempo que os
acidentados passam em licença médica.
A Análise de variabilidade populacional Bayesiana é um método para se chegar a uma
distribuição a priori para avaliação Bayesiana dos parâmetros de confiabilidade baseado em
dados parcialmente relevante (DROGUETT et al., 2004). Desta forma, à medida que as novas
evidências tornam-se disponíveis, as distribuições de probabilidade destes parâmetros assim
como o nível de conhecimento sobre o comportamento do sistema podem ser atualizadas.
Neste trabalho, é apresentado uma exemplo de aplicação em uma Companhia de
geração de energia elétrica dividida em 6 regiões de atuação, onde será obtido a
Disponibilidade e Indisponibilidade do trabalhador. Com base na disponibilidade e
indisponibilidade a companhia elétrica será capaz de estimar por quantos dias seu funcionário
ficará afastado pelo acidente do trabalho e consequentemente estimar seus custos, podendo
aperfeiçoar as condições do ambiente de trabalho a fim de diminuir os acidentes
economizando recursos para a empresa.
5
1.1 Objetivos
1.1.1 Objetivo geral
Desenvolver uma metodologia que permita obter as métricas de Disponibilidade e
Indisponibilidade: Tempo operacional médio, Disponibilidade média, Disponibilidade
instantânea ao final da missão, Tempo falho médio, Indisponibilidade média,
Indisponibilidade instantânea ao final da missão e a Probabilidade do funcionário não
acidentado e acidentado por acidente de trabalho via hibridismo entre processo semi-
Markovianos e Análise de variabilidade populacional Bayesiana.
1.1.2 Objetivos específicos
Para se atingir o objetivo geral, os seguintes objetivos específicos são estabelecidos:
Teste de homogeneidade entre as regiões de atuação da Companhia de geração de
energia elétrica;
Análise de variabilidade populacional Bayesiana para estimar a Função Densidade
de Probabilidade para as taxas de acidentes e as taxas de recuperações do processo
semi-Markoviano;
Análise dos resultados encontrados.
1.2 Estrutura da dissertação
Este trabalho desenvolve-se em seis capítulos, como descrito na sequencia, constituindo
a presente introdução o primeiro capítulo. O capítulo dois trata da fundamentação teórica
fundamentação teórica onde são expostos conceitos e definições referentes à processos semi-
Markovianos, inferência Bayesiana e Análise de variabilidade populacional Bayesiana. O
terceiro capítulo apresenta os procedimentos metodológicos para o desenvolvimento do
trabalho proposto da integração do processo semi-Markoviano e da Análise de variabilidade
populacional Bayesiana. No capítulo 4, é apresentada a descrição do problema assim como os
resultados alcançados da análise do modelo híbrido para o mesmo. No capítulo cinco são
apresentadas as conclusões e considerações finais. E, ao final deste, listam-se as fontes
bibliográficas utilizadas nesta pesquisa.
6
2 FUNDAMENTAÇÃO TEÓRICA
2.1 Conceitos e Aplicações
Segundo Howard (2007), o PSM pode ser visto como um processo cujas sucessivas
transições de estados são governadas pelas probabilidades de transição do PM, mas sua
permanência em qualquer estado é descrita por uma variável aleatória que depende do estado
atual ocupado e do estado em que a próxima transição será feita.
Alguns desenvolvimentos científicos sobre o PSM podem ser citados, como é o caso em
que Grabski (2007) em seu trabalho apresenta definições básicas e teoremas de PSM, onde o
mesmo permite construir diversos modelos de confiabilidade. Grabski (2002), em outro
estudo, aborda as propriedades da função de confiabilidade de um sistema com taxa de falha
modelada por um PSM, onde as funções de confiabilidade são obtidas utilizando
transformada de Laplace-Stieltjes. Moura (2006) propõe um modelo para a avaliação da
medida de disponibilidade de sistemas tolerantes a falha baseado na integração de um PSM
com tempo contínuo e redes Bayesianas, onde essa integração resulta em um modelo
estocástico híbrido que é capaz de representar as características dinâmicas de um sistema.
Ouhbi & Limnios (2002) investigam e propõem uma fórmula simples para a taxa de falha
(ROCOF) de um sistema de estados finitos de PSM, a partir da fórmula para a ROCOF é
obtido um estimador estatístico desta função, onde esse estimador é fortemente consistente e
assintoticamente normal. Veeramany & Pandey (2010) apresentam um modelo para avaliar as
frequências de ruptura e confiabilidade do sistema de tubulação de uma usina nuclear com
base na teoria de PSM, onde esse modelo é capaz de incorporar o efeito do envelhecimento de
degradação dos tubos da usina. Yu (2010) apresenta uma visão geral do modelo semi-
Markoviano oculto, incluindo modelagem, inferência, estimação, implementação e aplicações.
Xie (2005) estuda a política de rejuvenescimento de dois níveis para sistemas de software
com processo de degradação. O PSM é construído, e com base na sua solução de forma
fechada é obtida a disponibilidade do sistema como uma função bivariada, em seguida a
política rejuvenescimento é analisada para maximizar a disponibilidade do sistema. Pievatolo
& Valadè (2003) estudam o desempenho da confiabilidade do sistema de energia constante,
onde é apresentado um modelo analítico capaz de lidar com distribuições de tempos de falha e
reparo não exponencial utilizando o PSM e, assumindo independência estocástica para os
componentes do sistema em estudo, é calculado o tempo médio entre acidentes e o tempo
médio de recuperação do compressor de saída de voltagem. Chen & Trived (2005) constroem
um processo de decisão semi-Markov para otimização da política de manutenção baseados em
7
problemas de manutenção preventiva, e apresentam a abordagem conjunta da taxa de inspeção
e política de manutenção. El-Gohary (2004) mostra estimativas obtidas por Máxima
verossimilhança e pela abordagem Bayesiana dos parâmetros de um modelo de confiabilidade
semi-Markov com três estados, onde o núcleo de renovação que depende de um vetor de
parâmetros desconhecido é utilizado para definir o PSM que pode ser usado para descrever
alguns modelos de confiabilidade. Dong (2009) utiliza uma metodologia baseada no processo
homogêneo semi-Markoviano oculto adicionado a uma estrutura temporal para previsão de
partículas no ar que são importantes para o controle e redução de poluentes no ar.
2.2 Processos semi-Markovianos
PSMHs contínuos no tempo podem ser introduzidos considerando uma nomenclatura
similar à dada em Corradi et al. (2004). Permita { } representar o espaço finito de
estados e definir as seguintes variáveis aleatórias , onde e são
o estado e o instante da n-ésima transição, respectivamente.
O processo estocástico { } é chamado de processo de renovação Markoviano
homogêneo se
]
]
(2.1)
O núcleo de um PSMH é definido como:
] (2.2)
A equação (2.1) é a probabilidade do PSMH alcançar o estado j no instante dado
que permaneceu no estado i por unidades de tempo, onde t é o tempo de
permanência no estado i dado que o PSMH desloca-se para o estado j.
De acordo com Howard (2007), o núcleo descreve fundamentalmente um PSMH
já que governa estocasticamente as transiçõs entre estados assim como os tempos de
permanência t ambos condicionados no estado corrente i.
O PSMH deixará o estado i depois de permanecer neste estado por t unidades de tempo
com probabilidade dada por:
8
] (2.3)
o qual representa a função de distribuição acumulada (CDF) do tempo de espera no estado i.
As equações (2.2) e (2.3) são relacionadas como segue:
∑
(2.4)
Na verdade, significa a probabilidade do PSMH deixar o estado i quando o seu
estado sucessor é desconhecido.
O comportamento estocástico ao longo do tempo de um PSMH pode ser avaliado
calculando as probabilidades (probabilidade do PSMH estar no estado j no instante t)
dadas as condições iniciais . Permita, portanto, ser o número de vezes que o
estado j de um PSMH é visitado a partir de qualquer outro estado r no intervalo [0, t].
Permita, também, que ] seja seu valor esperado. Caso seja
continuamente diferenciável, então é a sua função densidade
correspondente. Como o processo sobre consideração é regular, isto é, não mais do que uma
transição pode ocorrer em qualquer intervalo , então pode ser assumida
como a probabilidade de uma transição ocorrer para o estado j em um intervalo de tempo
infinitesimal dt como segue:
{ }.
Assim, segue que:
∑ ∑ ∫
, (2.5)
onde é a derivada do núcleo do PSMH on instante t.
A equação (2.5) significa que o estado j pode ser alcançado se o PSMH estava
inicialmente no estado i e permanece neste estado até o instante t, quando uma transição para
o estado j ocorre, ou se o PSMH alcançou o estado i no instante , permanecendo neste estado
por unidades de tempo, então uma transição para o estado j ocorre.
9
O somatório ao longo do número de estados N leva em consideração todos os possíveis
estados intermediários por onde o PSMH pode transitar. O termo integral, por sua vez,
significa que a transição para o estado i pode ocorrer em qualquer instante de tempo ].
A equação (2.5) corresponde a um sistema de N equações integrais com raízes ,
. As probabilidades ] podem ser obtidas a partir das condições
iniciais como segue:
[ ]
∫
[ ] (2.6)
A equação (2.6) significa que um PSMH pode estar no estado j no instante t se estava
inicialmente no estado j e permanece neste estado pelo menos até o instante t ou se visitou o
estado j em qualquer instante ] com probabilidade e permaneceu lá por
unidades de tempo. A equação (2.6) corresponde a N integrações diretas que podem ser
resolvidas independentemente usando a solução da equação (2.5).
A definição dos PSMHs por probabilidades ou taxas de transição depende de como o
núcleo e a função de distribuição são definidas. Nas próximas duas seções, as
particularidades de cada tipo de definição serão analisadas.
2.2.1 PSMH descrito por probabilidades de transição
Para descrever um PSMH a partir de suas probabilidades de transição, é preciso definir as
probabilidades do processo Markoviano embutido e as funções de distribuição do
tempo de permanência t no estado i dado o próximo estado j a ser ocupado pelo processo.
Basicamente, segue que:
] , (2.7)
onde ] é a matriz de probabilidades de transição do processo Markoviano homogêneo
embutido no PSMH.
10
A CDF do tempo de permanência t dado i e j é definida como:
] (2.8)
As probabilidades são relacionadas como segue:
{
Basicamente, um PSMH descrito por probabilidades de transição funciona da seguinte
maneira: quando o estado i é alcançado, o próximo estado j a ser ocupado pelo processo é
imediatamente amostrado a partir das probabilidades do processo Markoviano
homogêneo. Dados os estados i e j, o tempo de permanência t no estado i é amostrado da CDF
. Assim o tempo da próxima transição é determinado como .
2.2.2 PSMH descrito por taxas de transição
Os requisitos de informação para definição de um PSMH a partir de suas taxas de
transição são as funções . A taxa de transição de um PSMH é definida em Becker
et al. (2000) como:
, (2.9)
onde e são os instantes da última e próxima transições, respectivamente. O tempo de
permanência t é dado pela diferença .
A equação (2.9) significa que uma transição para o estado j ocorre em um intervalo de
tempo infinitesimal dt depois que o processo permaneceu no estado i por uma duração t, dado
que não houve antes qualquer transição deixando tal estado.
Para o caso homogêneo, no qual as taxas de transição dependem apenas do tempo
decorrido desde a última transição (tempo de permanência), Becker et al. (2000) definem o
núcleo como:
11
∫
( ∫
) (2.10)
onde
∑
A CDF do tempo de espera no estado i é definida como:
( ∫
) (2.11)
Basicamente, um PSMH descrito por taxas de transição funciona da seguinte maneira:
quando o estado i é alcançado, o tempo de permanência t no estado i e o próximo estado j a
ser ocupado pelo processo são amostrados diretamente a partir do núcleo .
2.3 Inferência Bayesiana
Os métodos bayesianos têm origem na ideia de impor uma probabilidade aos motivos de
um evento observado a partir de um valor tomado a priori e atualizado em função dessa
observação (COUTINHO, 1994).
O uso da inferência Bayesiana se faz vasto na literatura. Sobre este tema podemos citar
trabalhos como o de Silva & Mattos (2001) que propõem uma aplicação de métodos de
computacionais, para análise de confiabilidade com abordagem Bayesiana, em itens de
produtos manufaturados em degradação. Galvanin (2007) sugere uma metodologia para
extração de contornos de telhados de edifícios usando Modelo Digital de Elevação (MDE),
inferência Bayesiana e Markov Random Field (MRF). Ribeiro (2005) realiza aplicações da
inferência Bayesiana em estudos de confiabilidade em dados de falha em análises de
segurança, explicando o impacto da mesma em estudos de análise de riscos (EAR) ambientais
em plantas industriais e em análises probabilísticas de segurança (APS) em instalações
nucleares. Vieira (2006) expõe uma metodologia Bayesiana de controle da qualidade de
produtos indústrias, em unidades em testes sobre forte estresse. Moselhy & Marzouk (2012)
12
expõem uma nova abordagem para inferência Bayesiana que se baseia na construção de
mapas. Scotto & Soares (2007) apresentam um método que combina a metodologia Bayesiana
e as técnicas de valor extremo para estimar a ocorrência de ondas elevadas.
Um dos primeiros autores a definir probabilidade como o grau de confiança foi
Bernoulli na sua obra Ars Conjectandi de 1713, onde define que “Probabilidade é o grau de
certeza e difere da certeza absoluta assim como a parte difere do todo”.
O grau de confiança é uma medida do conhecimento de um indivíduo sobre uma dada
proposição ou evento. Desta forma, o grau de confiança é subjetivo. É uma medida de
incerteza (ou certeza) e, portanto é uma representação do estado mental e não do mundo
externo.
A inferência Bayesiana é baseada em probabilidade subjetiva ou credibilidade a
posteriori associada a diferentes valores do parâmetro θ (desconhecido) e condicionada pelo
particular valor de y observado (PAULINO et al., 2003).
As vantagens da abordagem Bayesiana são: o tratamento numérico, ausência de
assintóticos, enquadramento formal para a combinação de informações e recuso intuitivo,
(KÉRY, 2010).
O conhecimento a priori sobre o parâmetro é resumido pela densidade , onde
é a verossimilhança ou distribuição de probabilidade condicional de y dado , e o
conhecimento atualizado está presente na densidade a posteriori, . A partir do teorema
de Bayes se tem:
(2.12)
onde o denominador do lado direito é a probabilidade marginal. Para o caso discreto
∑ , ou seja, a soma para todos os valores possíveis de e no caso
contínuo temos ∫
, (CONGDON, 2006).
Conforme Kéry (2010) observa-se que na equação (2.12) a distribuição a
posteriori, é proporcional ao produto da função de verossimilhança, , e da
distribuição a priori do parâmetro . Para assegurar que este produto é uma função de
distribuição de probabilidade adequada, isto é, com integral igual a 1, o termo
, que não
depende de , funciona como uma constante normalizadora de . Assim, o teorema de
Bayes pode ser escrito da forma abaixo:
13
(2.13)
Pode-se reescrever equação acima em palavras como
A verossimilhança tem importante tarefa na fórmula de Bayes, pois fornece um meio de
combinar as informações sobre o parâmetro θ contidas nos dados observados em y. Esta
forma simplificada do teorema de Bayes será útil em problemas que envolvam estimação de
parâmetros já que o denominador é apenas uma constante normalizadora (EHLERS, 2003).
Na visão de Paulino (2003) para os bayesianos a distribuição a posteriori incorpora, por
via do teorema de Bayes, toda a informação disponível sobre o parâmetro. No esquema
Bayesiano (Figura 2.1) nota-se que todas as inferências são realizadas a partir da aplicação
lógica do cálculo de probabilidade.
Figura 2.1: Esquema Bayesiano. Fonte: PAULINO et al.(2003, p 22).
2.4 Análise de variabilidade populacional Bayesiana
Análise de variabilidade populacional é um método para se chegar a uma distribuição a
priori para avaliação Bayesiana dos parâmetros de confiabilidade baseado em dados
parcialmente relevante (DROGUETT et al., 2006).
Dados
Amostra
Distribuição
a priori
Teorema de
Bayes
Raciocínio
Dedutivo
Inferência
Estatística
Modelo
Experimental
14
Segundo Kaplan (1983) a análise de variabilidade é primeira etapa de duas etapas da
atualização dos parâmetros do processo Bayesiano. A segunda etapa do processo Bayesiano
corresponde à atualização com base em dados específicos do sistema.
Segundo Droguett et al. (2004), a distribuição da variabilidade populacional é
desenvolvida com base no tempo de execução dos dados. No entanto, as estimativas da taxa
de ocorrência também podem estar disponíveis e constituem outra fonte valiosa de
informação, principalmente quando os dados são escassos ou faltantes. Neste caso, o uso de
técnicas bayesianas é de fundamental importância, bem como a opinião do especialista. O uso
dessas técnicas consiste na atualização de alguma distribuição de probabilidade inicial, a
distribuição priori, baseada na evidência específica. As soluções para a análise de
variabilidade populacional, também conhecida como Bayes hierárquico, Bayes empírico, ou
análise não homogênea, envolvem o uso de modelos Bayes hierárquico de distribuição
paramétrica para descrever a variabilidade. O interesse é investigar a variabilidade das taxas
de acidente e de recuperação.
Desta forma, se X indica a medida de interesse (taxa de acidente e recuperação), a
avaliação da distribuição da variabilidade populacional de X é baseada nos seguintes tipos de
informação:
: Análise ou opinião do especialista;
: Análise dos dados de exposição (tempo de execução ou demanda) com
operação de sistemas semelhantes em aplicações análogas;
: Estimativas ou distribuições sobre a confiabilidade de X medidas de várias
fontes, tais como base de dados ou opiniões de especialistas.
A análise Bayesiana de variabilidade populacional tem a capacidade de utilizar dados
oriundos de quaisquer das três fontes descritas anteriormente, bem como agregar valores
permitindo uma melhor avaliação do sistema.
A verdadeira distribuição de variabilidade populacional pode ser apresentada como
membro de uma família de distribuição paramétrica. Quando esta distribuição é incerta, esta
incerteza é expressa sobre a forma de distribuição de probabilidade sobre todos os membros
da família distribucional. Se denota a variabilidade distribucional
do modelo paramétrico, então a distribuição de probabilidade sobre todos os
parâmetros do modelo pode ser usada para descrever a incerteza sobre a distribuição da
variabilidade do modelo. A estimativa da densidade da variabilidade populacional é dada por:
15
∫
∫ ( )
(2.14)
A equação (2.14) consiste na representação de uma “mistura” de distribuições do
modelo escolhido, onde o modelo paramétrico da variabilidade é representado por
e , que representa a incerteza sobre a distribuição de
variabilidade. Tem-se que a distribuição de incerteza sobre o espaço de ( ) , onde
, é a mesma que a incerteza sobre os valores de , uma vez que para cada
valor de existe um único ( ) e vice-versa. Desta forma, o objetivo de estimar ( )
fica reduzido a estimar . Considerando que o estado de conhecimento a priori sobre é
representado pela distribuição de probabilidade , e dada a evidência disponível, , usa-
se o teorema de Bayes para encontrar a distribuição de probabilidade a posteriori sobre .
Seja uma distribuição de probabilidade sobre os parâmetros do
modelo de variabilidade , onde foram descritos anteriormente.
Então a distribuição sobre X do sistema específico condicional a e a nova evidência
é dada por:
∫ ( )
∫
∫ ( )
(2.15)
onde .
A distribuição a posteriori dos parâmetros da variabilidade populacional baseado nos
três tipos de evidência é obtida através do teorema de Bayes
( | )
∫
(2.16)
onde é a verossimilhança da informação, e é a distribuição a priori
sobre . Assumindo que as evidências e são independentes, a função de
verossimilhança torna-se:
16
( | ) ( | ) ( | ) (2.17)
Por outro lado, escrevendo a equação (2.17) em termos das verossimilhanças das
informações de cada item, obtém-se:
( | ) ∏ ( | ) ( | )
(2.18)
observar-se que ( | ) e ( | ) são as probabilidades das evidências e do
i-ésimo item do total de n itens, assumindo que o conjunto de parâmetros da curva da
variabilidade populacional é .
Observa-se que a medida de confiabilidade para o i-ésimo sistema, , é desconhecido,
sabendo que é um dos possíveis valores de X. Além disso, X tem distribuição de acordo
com , com também desconhecido. Portanto, é possível calcular as probabilidades de
observar as informações e permitindo que a medida de confiabilidade possa assumir
todos os valores possíveis, isto é, calculando a média de ( | ) sobre a distribuição
X.
( | ) ∫ ( | ) ( | )
(2.19)
A equação (2.19) pode ser substituída na equação (2.18) para a obtenção da função de
verossimilhança da informação total.
2.4.1 Mistura de funções de Verossimilhança
De acordo com Droguett et al. (2006), para a execução da análise de variabilidade
populacional de uma medida de confiabilidade é fundamental especificar uma distribuição de
probabilidade adequada que possa descrever a variabilidade subjacente da medida de
interesse, , assim como a função de verossimilhança . A construção da
verossimilhança depende do tipo de evidência disponível. São considerados dois tipos de
categorias de evidência:
Tipo (Evidência de exposição): número de acidentes e tempo de exposição
(tempo de serviço ou número de demandas). Por exemplo, {
17
} ou { }, onde é o número de acidentes, é o
tempo para observar acidentes no i-ésimo sistema, é o número total de
demandas e é o número total de funcionários.
Tipo (Fonte de estimativas): considera-se a opinião do especialista. A
evidência é sob a forma de { } , onde
é a estimativa
fornecida pela i-ésima fonte e é o desvio padrão logarítmico que representa a
opinião do i-ésimo especialista.
Podem existir várias versões das misturas de funções de verossimilhança dependendo da
medida de interesse X e de como os dados são apresentados. Serão apresentados a seguir o
desenvolvimento dos modelos Lognormal-Poisson-Lognormal e Lognormal-Binomial-
Lognormal, respectivamente. Também serão apresentados os dados obtidos através da opinião
de especialistas são casos especiais dos modelos mistos. Formulações alternativas com os
modelos Gama-Poisson-Lognormal e Beta-Binomial-Lognormal seguem diretamente.
A especificação da distribuição de probabilidade que irá descrever a variabilidade se
deve a natureza da medida de confiabilidade, por exemplo, o número de falhas observadas em
um instante de tempo poderá ser modelado pela distribuição Poisson.
Como relatado anteriormente, há possibilidade de diferentes formas de construção da
verossimilhança que depende da natureza da evidência e da escolha da distribuição de
probabilidade da variabilidade subjacente, que geraram diferentes modelos de mistura de
verossimilhança, tais como Lognormal-Poisson-Lognormal, Lognormal-Binomial-
Lognormal, Gama-Poisson-Lognormal e Beta-Binomial-Lognormal.
2.4.2 Modelo Lognormal-Poisson-Lognormal
Suponha-se que o interesse seja avaliar a variabilidade populacional da taxa de acidente
e as fontes disponíveis são: dados observados em operação { } e
estimativas dadas por diferentes especialistas , definidos anteriormente. Considera-se
que a variabilidade populacional do verdadeiro valor da taxa de falha siga uma
distribuição Lognormal:
√ [
(
)
] (2.20)
18
Portanto, a distribuição a posteriori dos parâmetros da variabilidade da equação 44 pode
se escrita por:
( | )
∫ ∫
(2.21)
Para o i-ésimo sistema a verossimilhança do tipo de informação , , pode
ser construída caso seja conhecida a taxa de falha , de cada sistema, pode-se usar a
distribuição Poisson para estimar a probabilidade das falhas observadas em .
(2.22)
Tomando como base o modelo de erro multiplicativo proposto por Mosleh (1992), a
função de verossimilhança para o i-ésima fonte estimada, , pode ser escrita em
termos da distribuição Lognormal com média , isto é:
√
[
(
)
] (2.23)
que é considerado um especialista imparcial. Utilizando a transformação , a
equação (2.20) pode ser rescrita da seguinte forma:
|
| (2.24)
desde que , então
√
[
(
)
] (2.25)
portanto,
√
[
(
)
] (2.26)
19
tem distribuição normal com média igual a .
Como é conhecido apenas que é um dos possíveis valores para a taxa de falha
representada pela distribuição da variabilidade populacional ( ) ao integrar-se a
probabilidade da equação (2.19) sobre todos os possíveis valores de , a fim de calcular a
probabilidade dos dados incondicionais em relação ao valor desconhecido de
∫
(2.27)
onde se considera os dados observados durante um período de execução e as estimativas das
evidências são independentes. Observa-se que a i-ésima estimativa do especialista é a
mesma para o i-ésimo sistema para os dados observados no tempo de execução .
Substituindo a equação (2.26) e (2.22) na equação (2.27):
∫
[
(
)
(
)
] (2.28)
Uma possível solução para equação (2.28) pode ser obtida se
{
[(
)
(
)
]} [
(
)
]
Desta forma, pode-se mostrar que:
√
(2.29)
Assim, a função de verossimilhança dada pela equação 56 é
∫
[
{(
)
}]
realizando algumas manipulações algébricas torna-se:
20
[
]
∫
[
(
)
] (2.30)
A equação anterior pode ser escrita como o produto entre as distribuições Gama e
Lognormal.
[
]
√ ∫
√
[
(
)
] (2.31)
Substituindo as expressões e
dados pela equação (57), tem-se:
[
]
√ √
∫
(
√
) (2.32)
Portanto, a probabilidade total é obtida substituindo-se na equação (2.29) na equação a
seguir:
∏
(2.33)
2.4.3 Caso especial: Modelo Lognormal-Poisson
Quando os dados de execução estão disponíveis e considerando o modelo de
variabilidade populacional tendo uma distribuição Lognormal, pode-se utilizar o modelo
Lognormal-Poisson com parâmetros e para estabelecer sua verossimilhança, dada na
forma a seguir:
∫
√
(
)
√ ∫
√
(
)
(2.34)
21
Observa-se que a equação acima pode ser definida como o produto das distribuições
Gama e Lognormal.
2.4.4 Especificação a priori
A análise de variabilidade populacional pode ser usada para construir a distribuição a
priori para análises específicas do sistema de confiabilidade com base em dados e opinião de
especialistas para sistemas similares. A distribuição a priori pode ser informativa ou não.
Quando se refere à distribuição a priori informativa leva-se em consideração a opinião do
especialista da área de estudo em relação ao parâmetro de interesse. Uma a priori não
informativa será baseada apenas em evidências. Quanto maior o número de evidências
utilizadas na obtenção da verossimilhança, menor será a influência da distribuição a priori
para obter a posteriori. Em um modelo com distribuição Lognormal, a priori será definida
fornecendo-se a mediana e um Fator de Erro (FE). Segundo Mosleh (1992), o fator de erro é
uma relação do percentil superior ao valor mediano de uma quantidade incerta, distribuída de
acordo com uma distribuição Lognormal. O fator de erro é dado na equação
(2.35)
onde é a mediana e é 95º percentil que indica que há 95% de dados inferiores a esse
valor. Quanto maior o FE, maior o grau de incerteza da taxa. Quando menor o FE, maior a
confiança se tem na qualidade das informações adquiridas.
2.4.5 Medidas de variabilidade
Segundo Droguett et. al. (2004), a função de verossimilhança e as distribuições a priori
são incorporadas em procedimento de inferência Bayesiana em que a densidade a posteriori
, é calculada. A inferência Bayesiana em que a densidade a posteriori é executada
usando o método Markov Chain Monte Carlo (MCMC), que permite que amostras sejam
geradas de uma função de densidade contínua não normalizada. O MCMC resulta em um
conjunto de amostras { }, representando a densidade a posteriori sobre os
parâmetros do modelo de distribuição de variabilidade ( ) { }.
22
Dado S, a densidade de variabilidade populacional estimada é calculada a seguir:
∫ ( )
∑ ( )
A média e variância são calculadas a seguir:
∫
∑
(2.36)
∫
∑
(2.37)
onde e são a média e variância de ( ).
Os resultados gerados incluem limites de incerteza da densidade de variabilidade
acumulada:
∫
(2.38)
e na forma de z-percentis , é definido como , pode-se encontrar
o valor de a seguir:
∫
(2.39)
Com base nos limites o analista tem um referencial para avaliar a incerteza estimada da
distribuição de variabilidade populacional.
23
3 METODOLOGIA PROPOSTA
O presente capítulo tem por objetivo apresentar como será a conexão entre o processo
semi-Markoviano e Análise de variabilidade populacional Bayesiana. O modelo proposto será
apresentado através de uma aplicação a um banco de dados de uma Companhia de geração de
energia elétrica com diversos tipos de acidentes do trabalho e tempos de recuperação
distintos.
3.1 Integração: Processo semi-Markoviano e Análise de variabilidade
populacional Bayesiana
O objetivo geral do presente trabalho é desenvolver uma metodologia que permita
representar de forma mais realista sistemas complexos através do hibridismo entre o processo
semi-Markoviano e Análise de variabilidade populacional Bayesiana, que permite obter
métricas de Disponibilidade e Indisponibilidade (disponibilidade média, disponibilidade
instantânea ao final da missão, indisponibilidade média, indisponibilidade instantânea ao final
da missão). Segundo Rausand & Hoyland (2003), a disponibilidade instantânea, , é
definida como sendo a probabilidade de um sistema estar disponível para o uso no tempo t:
]
A probabilidade que um sistema esteja indisponível no instante de tempo t é definida
como (Indisponibilidade instantânea). A soma de e deve ser unitária.
(3.1)
A Disponibilidade média, , e Indisponibilidade média, , considerando o
intervalo de tempo T são definidas por (CASSADY, 2003)
∫
(3.2)
∫
(3.3)
24
Também será possível obter através do hibridismo entre o processo semi-Markoviano e
Análise de variabilidade populacional Bayesiana o Tempo operacional médio e o Tempo
falho médio do funcionário, assim como a Taxa de visita aos Estados e a Probabilidade do
funcionário não acidentado e acidentado por acidente de trabalho.
A Disponibilidade e Indisponibilidade do trabalhador serão estimadas utilizando a
distribuição de probabilidade das variáveis “tempo até o acidente” e “recuperação”, através
dos seguintes passos abaixo (ver Figura 4.1):
i. Supor que inicialmente, que um funcionário i qualquer da Companhia de
geração de energia elétrica possa estar em qualquer um dos seis estados:
operacional (0), apto a executar suas atividades; acidentado (1), situação em que
se encontra em licença médica de até 3 dias; acidentado (2), situação em que se
encontra em licença médica de 4 até 14 dias; acidentado (3), situação em que se
encontra em licença médica de 15 dias até 1 mês; acidentado (4), situação em
que se encontra em licença médica acima de 1 mês até 3 meses; acidentado (5),
situação em que se encontra em licença médica acima de 3 meses. Portanto, o
ciclo acidente-recuperação pode ser modelado por um processo estocástico para
o qual as taxas de transição entre estados precisam ser estimadas a partir de
dados de acidentes de trabalho;
ii. Como relatado no Item 1, é preciso estimar a Função Densidade de
Probabilidade para as taxas de acidentes λ e as taxas de recuperações μ. Neste
trabalho, serão usados métodos Bayesianos de estimação da distribuição da taxa
de acidentes e de recuperação, de acordo com as categorias relatadas
anteriormente. Os dados necessários exigidos para isto são, respectivamente,
tempo até o acidente e o tempo em que os acidentados passam em licença
médica. O processo semi-Markoviano, será utilizado para obter a
disponibilidade e indisponibilidade média do funcionário ao longo de um
período de um ano.
iii. Portanto, a partir dos Itens 2, é estimado a incerteza sobre a disponibilidade e
indisponibilidade média dos acidentados através de percentis que são traçados
em torno desse indicador.
iv. As saídas do passo 3 multiplicadas por um horizonte de tempo de interesse de
um ano irão fornecer o tempo perdido esperado que os funcionários da
Companhia de geração de energia elétrica passarão indisponíveis (em licença
médica). É importante destacar que os funcionários pertencentes a diferentes
25
categorias (em licença médica) terão frequências e severidades distintas de
acidentes.
v. Do passo 4, obtém a incerteza (percentis de 5%, 50% e 95%) sobre o tempo que
os funcionários de cada categoria passariam em licença médica ao longo do ano.
vi. A saída do passo 5 seria a curva de incerteza (percentis 5%, 50% e 95%) dos
dias perdidos de trabalho de cada categoria definida anteriormente. Com estas
informações, será possível priorizar determinados grupos de funcionários da
Companhia elétrica que possuem maior probabilidade de ocorrência e
severidade de acidentes;
vii. A partir do momento que novos acidentes acontecerão, as taxas de transição λ e
μ serão reavaliadas, i.e., suas PDF’s serão novamente estimadas no passo 2 e
todos os passos serão seguidos novamente para estimação da disponibilidade e
indisponibilidade do trabalhador no ano seguinte.
26
Figura 3.1: Fluxograma para obtenção das métricas de disponibilidade e indisponibilidade.
27
4 EXEMPLO DE APLICAÇÃO
4.1 Descrição do Problema
Considere um ambiente de trabalho com trabalhadores e um período de observação
que inicia em e termina em . A Figura 4.1, mostra a linha do tempo para cada
trabalhador (o tempo de trabalho não é necessariamente o mesmo para todos os
trabalhadores), , onde o mesmo trabalha entre e e durante
esse tempo se envolve em acidentes. O trabalhador começa a trabalhar na empresa no
instante , e depois de um intervalo de tempo , sofre um acidente, retornando ao trabalho
após o primeiro acidente, depois do intervalo . Um segundo acidente ocorre depois do
intervalo , e o tempo de retorno ao trabalho é representado por , e assim ocorre
sucessivamente. Os tempos iniciais coincidem com . Os tempos
finais coincidem com . Apenas os trabalhadores 1, 6, 8 e 9
permaneceram empregados durante todo período de observação, enquanto os demais
trabalharam apenas por uma porção de tempo. O tempo trabalhado do trabalhador n antes de
acidentes ocorrer é denotado por . O respectivo tempo de recuperação é
denotado por . O intervalo entre o último acidente de, , e é denotado por .
Figura 4.1: Linha do tempo de N trabalhadores. Fonte: MARCOULAKI et al. (2012).
28
O comportamento dinâmico do trabalhador em uma empresa é representado por um
processo estocástico semi-Markoviano como mostra a Figura 4.2. Os trabalhadores que se
encontram no Estado 0 estão desempenhando sua função normalmente (disponíveis para
trabalhar). Já os trabalhadores que permanecem nos Estados (1, 2, 3, 4 e 5) estão se
recuperando de um acidente (indisponíveis, pois sofreram um acidente) são classificados
segundo a Eurostat (2007) da seguinte forma: Estados 1 – De 0 até 3 dias, Estados 2 - De 4
até 14 dias, Estados 3 – De 15 dias até 1 mês, Estados 4 – Acima de 1mês até 3 meses e
Estados 5 - Acima de 3 meses. Um processo aleatório gera os acidentes com taxa , de modo
que um trabalhador que estava disponível (Estado 0), passa a ficar indisponível nos demais
estados. Outro processo aleatório gera um tempo de recuperação de um acidente, para que um
trabalhador que está no Estado 1 retorne ao Estado 0 com taxa . De forma análoga é obtido
às taxas .
Assim, as taxas ,
são independentes e suas transições podem assumir
qualquer tipo de distribuição de probabilidade. Portanto, o PSM se adapta em nosso problema
por ter maior flexibilidade em termos de distribuições de probabilidade e não possui a
limitação de assumir que os tempos entre eventos sejam necessariamente exponenciais o que
permite um maior poder de generalização do modelo.
Figura 4.2: Modelo Estocástico para a disponibilidade e indisponibilidade do trabalhador.
Porém, existem vários tipos de acidentes do trabalho com diferentes taxas de
recuperação e taxas de acidentes, que podem ocasionar a formação de uma amostra não
homogênea, ou seja, as taxas de recuperação e taxas de acidentes por diferentes tipos de
29
acidentes não têm variabilidade semelhante, por esse motivo não proporciona uma amostra
realista e não possuem o mesmo parâmetro de confiabilidade para o problema.
Para superar essas dificuldades será necessário utilizar a Análise da variabilidade
populacional para superar a falta de homogeneidade da população e estimar a distribuição das
taxas de transição de acidente ( ) e de recuperação (
) entre os estados
disponíveis e indisponíveis.
Supondo uma Companhia de geração de energia elétrica composta por 5.576
funcionários divididos em seis regiões (A, B, C, D, E e F) de atuação. Desse contingente, 804
acidentes foram observados no período entre Janeiro de 2005 a Setembro de 2012.
Figura 4.3: Percentual de funcionários nas regiões de atuação da Companhia de geração de energia elétrica.
Observa-se pela Figura 4.3, que as regiões de atuação da Companhia de geração de
energia elétrica das regiões A, B e C possuem maior percentual de concentração de
funcionários.
A análise de Disponibilidade e Indisponibilidade do trabalhador será modela através do
software E&P Office, versão 3.2. Os testes estatísticos serão realizados no software livre R,
versão 2.15.1.
4.2 Definição e categorização das variáveis
Tomando como base a data de admissão do assalariado e realizando a diferença entre a
data do acidente é possível obter uma nova variável chamada “tempo até o acidente”. A
0,00
10,00
20,00
30,00
40,00
50,00
A BC
DE
F
44,40
17,08 16,26
11,61
7,24
3,42
Po
rce
nta
gem
(%
)
Região
30
variável “recuperação” corresponde ao tempo decorrido desde a ocorrência do acidente até o
retorno do acidentado ao trabalho, a mesma é categorizada segundo a classificação da
Eurostat (2007) da seguinte forma: 0 até 3 dias, 4 até 14 dias, 15 dias até 1 mês, acima de 1
mês até 3 meses e acima de 3 meses.
4.3 Testes de aderência e homogeneidade
A fim de verificar qual a distribuição de probabilidade se ajusta para as variáveis
“tempo até o acidente” e “recuperação” foi utilizado o teste de kolmogorov-smirnov (ver
Mood et. al. 1976, p. 508), onde nenhuma distribuição paramétrica se ajustou aos dados.
Portanto, será utilizada para as duas variáveis distribuições não paramétricas obtidas pela
Análise de variabilidade populacional Bayesiana, uma vez que a variável “recuperação” não é
homogênea em relação à região de atuação da Companhia de geração de energia elétrica.
A fim de indicar que as variâncias não são iguais para as regiões, foi utilizado o teste de
homogeneidade de Levene (ver Levene, 1960) (Tabela 4.1), verifica-se que se rejeita a
hipótese das regiões de atuação da Companhia de geração de energia elétrica ter a mesma
variância em relação ao número de dias de recuperação, isto é, as regiões não apresentam
variâncias homogêneas.
Tabela 4.1: Teste de homogeneidade de Levene: dias de recuperação por região
Levene Valor de p
Recuperação 1402,234 0,009
Com o propósito de verificar a homogeneidade dentro de cada região, as mesma foram
divididas em 2 grupos, primeiro grupo até o valor da sua mediana e o segundo acima do valor
da sua mediana. A seguir são apresentados os resultados dos testes de homogeneidade:
Tabela 4.2: Teste de homogeneidade de Levene: dias de recuperação na região A.
Levene Valor de p
Recuperação 600,13 0,004
Tabela 4.3: Teste de homogeneidade de Levene: dias de recuperação na região B.
Levene Valor de p
Recuperação 178,40 <0,0001
Tabela 4.4: Teste de homogeneidade de Levene: dias de recuperação na região C.
31
Levene Valor de p
Recuperação 163,91 <0,0001
Tabela 4.5: Teste de homogeneidade de Levene: dias de recuperação na região D.
Levene Valor de p
Recuperação 18,13 <0,0001
Tabela 4.6: Teste de homogeneidade de Levene: dias de recuperação na região E.
Levene Valor de p
Recuperação 99,64 0,002
Tabela 4.7: Teste de homogeneidade de Levene: dias de recuperação na região F.
Levene Valor de p
Recuperação 18,13 0,002
Observa-se que em todas as regiões são não homogêneas em relação aos dias de
recuperação devido a acidentes de trabalho. Assim, para desenvolver uma distribuição de
probabilidade que possa caracterizar a incerteza dos parâmetros da variabilidade populacional
será utilizada a metodologia da Análise de variabilidade populacional.
4.4 Análise de variabilidade populacional Bayesiana
Nesta seção, será utilizada a Análise de variabilidade populacional Bayesiana discutida
na Seção 2.4, visto que os dados coletados são provenientes de acidentes do trabalho distintos,
caracterizando desta forma uma população que não apresenta variância constante. Portanto, é
assumido que a variabilidade da taxa de acidentes é distribuída de acordo com o modelo
Lognormal-Poisson apresentado na equação 2.34 Através da Análise de variabilidade será
possível estimar distribuição de probabilidade para o processo semi-Markoviano.
A Tabela 4.8 apresenta os valores para as curvas da média e dos percentis de 5%, 50%
(mediana) e 95% da distribuição acumulada da variabilidade populacional da taxa de acidente
das seis regiões de atuação da Companhia de geração de energia elétrica.
32
Tabela 4.8: Curvas percentuais da distribuição de variabilidade da taxa de dias até o acidente.
Valor Média Curva de 5% Curva de 50% Curva de 95%
Região A
1st 0,000089 0,000075 0,000098 0,000125
5th 0,000107 0,00009 0,00011 0,000132
10th 0,000116 0,0001 0,000117 0,000137
50th 0,000146 0,000133 0,000146 0,00016
90th 0,000185 0,000154 0,000182 0,000218
95th 0,000201 0,000159 0,000194 0,000241
99th 0,000242 0,000168 0,000218 0,000292
Região B
1st 0,00009 0,00007 0,00011 0,00015
5th 0,00011 0,00009 0,00012 0,00015
10th 0,00012 0,0001 0,00013 0,00016
50th 0,00016 0,00014 0,00016 0,00019
90th 0,00021 0,00016 0,00021 0,00028
95th 0,00024 0,00017 0,00022 0,00032
99th 0,00031 0,00018 0,00025 0,00041
Região C
1st 0,00008 0,00007 0,0001 0,00013
5th 0,0001 0,00008 0,0001 0,00013
10th 0,00011 0,00009 0,00011 0,00014
50th 0,00013 0,00011 0,00013 0,00015
90th 0,00016 0,00013 0,00016 0,0002
95th 0,00018 0,00013 0,00017 0,00022
99th 0,00021 0,00014 0,00018 0,00026
Região D
1st 0,00004 0,00002 0,00005 0,00008
5th 0,00006 0,00004 0,00007 0,0001
10th 0,00008 0,00006 0,00008 0,00011
50th 0,00016 0,00013 0,00016 0,0002
90th 0,00033 0,00021 0,00032 0,00052
95th 0,00042 0,00024 0,00038 0,00069
99th 0,00071 0,0003 0,00055 0,00119
Região E
1st 0,00007 0,00005 0,0001 0,00015
5th 0,0001 0,00007 0,00011 0,00016
10th 0,00012 0,00008 0,00013 0,00017
50th 0,00017 0,00013 0,00017 0,00022
90th 0,00026 0,00017 0,00024 0,00037
95th 0,0003 0,00018 0,00026 0,00045
99th 0,00043 0,0002 0,00031 0,00065
Região F
1st 0,00004 0,00002 0,00006 0,00012
5th 0,00006 0,00003 0,00008 0,00013
10th 0,00008 0,00004 0,00009 0,00014
50th 0,00013 0,00009 0,00013 0,00019
90th 0,00023 0,00013 0,0002 0,00039
95th 0,00028 0,00014 0,00023 0,0005
99th 0,00046 0,00015 0,00029 0,00082
33
Região A
Região B
Região C
Região D
Região E
Região F
Figura 4.4: Função Densidade de Probabilidade da taxa do tempo (dias) entre acidentes dos funcionários da
Companhia de geração de energia elétrica.
A Figura 4.4 apresenta a Função Densidade de Probabilidade da distribuição não
paramétrica para a variável “tempo até o acidente” das regiões de atuação, obtida através da
Análise de variabilidade populacional Bayesiana.
0
0,2
0,4
0,6
0,8
1
0 0,00005 0,0001 0,00015 0,0002 0,00025
Taxa de acidentes
0
0,2
0,4
0,6
0,8
1
0 0,0001 0,0002 0,0003
Taxa de acidentes
0
0,2
0,4
0,6
0,8
1
0 0,00005 0,0001 0,00015 0,0002
Taxa de acidentes
0
0,2
0,4
0,6
0,8
1
0 0,0002 0,0004 0,0006
Taxa de acidentes
0
0,2
0,4
0,6
0,8
1
0 0,0001 0,0002 0,0003
Taxa de acidentes
0
0,2
0,4
0,6
0,8
1
0 0,0001 0,0002 0,0003
Taxa de acidentes
34
Figura 4.5: Função de Distribuição Acumulada a posteriori da taxa do tempo(dias) entre acidentes dos
funcionários das regiões de atuação da Companhia de geração de energia elétrica
De fato, como mostra a Figura 4.5, é possível observar a curva em vermelho
correspondente a Função de Distribuição Acumulada da variabilidade populacional. As outras
duas curvas correspondem aos percentis inferior (5%) e superior (95%), onde essas curvas
mostram a incerteza em torno da estimativa da variabilidade populacional da taxa de
recuperação. Observa-se principalmente nas regiões D, E e F uma menor incerteza para
valores baixos da taxa de recuperação.
Região A Região B
Região C Região D
Região E Região F
35
De 0 até 3 dias
De 4 até 14 dias
De 15 dias até 1 mês
Acima de 1 mês até 3 meses
Acima de 3 meses
Figura 4.6: Função Densidade de Probabilidade da taxa de recuperação (dias) dos funcionários da região A da
Companhia de geração de energia elétrica.
A Figura 4.6 apresenta a Função Densidade de Probabilidade da distribuição não
paramétrica da taxa de recuperação, devido algum acidente de trabalho das categorias na
região A, obtida através da análise de variabilidade populacional. A categoria “De 4 até 14
dias” apresenta uma menor incerteza, uma vez que sua distribuição probabilidade apresenta
uma menor dispersão do que as demais.
0
0,2
0,4
0,6
0,8
1
0 0,2 0,4 0,6
Taxa de recuperação
0
0,2
0,4
0,6
0,8
1
0 0,05 0,1 0,15 0,2
Taxa de recuperação
0
0,2
0,4
0,6
0,8
1
0 0,02 0,04 0,06 0,08 0,1
Taxa de recuperação
0
0,2
0,4
0,6
0,8
1
0 0,01 0,02 0,03
Taxa de recuperação
0
0,2
0,4
0,6
0,8
1
0 0,005 0,01 0,015 0,02
Taxa de recuperação
36
Figura 4.7: Função de Distribuição Acumulada a posteriori da taxa de recuperação (dias) do funcionário da
Companhia de geração de energia elétrica da região A.
De fato, como mostra a Figura 4.7, é possível observar a curva em azul correspondente
a Função de Distribuição Acumulada da variabilidade populacional. As outras duas curvas
correspondem aos percentis inferior (5%) e superior (95%), onde essas curvas mostram a
incerteza em torno da estimativa da variabilidade populacional da taxa de recuperação. Os
limites de incerteza podem ser resultado da pequena quantidade de evidência utilizada na
Análise e de variabilidade populacional ou do valor do fator de erro atribuído.
De 0 até 3 dias De 4 até 14 dias
Acima de 3 meses
De 15 dias até 1 mês Acima de 1 mês até 3 meses
37
De 0 até 3 dias
De 4 até 14 dias
De 15 dias até 1 mês
Acima de 1 mês até 3 meses
Figura 4.8: Função Densidade de Probabilidade a posteriori da taxa de recuperação (dias)dos funcionários da
região B da Companhia de geração de energia elétrica.
De acordo com a Figura 4.8 as categorias “De 0 até 3 dias” e “Acima de 1 mês até 3
meses” apresentam uma maior incerteza em relações as demais categorias, já que as mesmas
possuem caudas extensas nas suas distribuições de probabilidade.
0
0,2
0,4
0,6
0,8
1
0 1 2 3 4 5
Taxa de recuperação
0
0,2
0,4
0,6
0,8
1
0 0,05 0,1 0,15 0,2
Taxa de recuperação
0
0,2
0,4
0,6
0,8
1
0 0,05 0,1
Taxa de recuperação
0
0,2
0,4
0,6
0,8
1
0 0,02 0,04 0,06 0,08 0,1
Taxa de recuperação
38
Figura 4.9: Função de Distribuição Acumulada a posteriori da taxa de recuperação (dias) dos funcionários da
Companhia de geração de energia elétrica na região B.
Observa-se na Figura 4.9 que os limites de incerteza das categorias “De 0 até 3 dias” e
“Acima de 1 mês até 3 meses” são menores para valores baixos da taxa de recuperação, isto
é, tem menor incerteza para esse valores.
Na região B a categoria “Acima de 3 meses” possui apenas 2 observações
impossibilitando a realização da Análise de variabilidade populacional, não permitindo a
construção de uma distribuição não paramétrica para a mesma.
De 0 até 3 dias De 4 dias até 14 dias
De 15 dias até 1 mês Acima de 1mês até 3 meses
39
De 0 até 3 dias
De 4 até 14 dias
De 15 dias até 1 mês
Acima de 1 mês até 3 meses
Acima de 3 meses
Figura 4.10: Função Densidade de Probabilidade a posteriori dos dias de recuperação dos funcionários da
região C da Companhia de geração de energia elétrica.
A Figura 4.10 apresenta a Função Densidade de Probabilidade da distribuição não
paramétrica da variável “recuperação” das categorias na região C, obtida através da análise de
variabilidade populacional.
0
0,2
0,4
0,6
0,8
1
0 0,5 1 1,5 2
Taxa de recuperação
0
0,2
0,4
0,6
0,8
1
0 0,05 0,1 0,15 0,2
Taxa de recuperação
0
0,2
0,4
0,6
0,8
1
0 0,05 0,1
Taxa de recuperação
0
0,2
0,4
0,6
0,8
1
0 0,01 0,02 0,03
Taxa de recuperação
0
0,2
0,4
0,6
0,8
1
0 0,01 0,02
Taxa de recuperação
40
Figura 4.11: Função de Distribuição Acumulada a posteriori da taxa de recuperação dos funcionários da
Companhia de geração de energia elétrica na região C.
Na Figura 4.11 é possível observar as curvas de 5% e 95% de incerteza da distribuição
de variabilidade acumulada da taxa de recuperação, onde os valores inferiores e superiores da
probabilidade do tempo de recuperação, bem como os limites de incerteza são de uma
possível falta de evidência utilizada na Análise e de variabilidade populacional e do valor do
Fator de Erro atribuído.
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
3.00E-03 1.00E+00 2.00E+00 3.00E+00 4.00E+00 5.00E+00
Taxa de recuperação
5% Variabilidade populacional média 95%
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
0.00E+00 1.00E-01 2.00E-01 3.00E-01 4.00E-01 5.00E-01 6.00E-01
Taxa de recuperação
5% Variabilidade populacional 95%
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
0.00E+00 5.00E-02 1.00E-01 1.50E-01 2.00E-01 2.50E-01 3.00E-01
Taxa de recuperação
5% Variabilidade populacional média 95%
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
0.00E+00 2.00E-02 4.00E-02 6.00E-02 8.00E-02 1.00E-01 1.20E-01 1.40E-01
Taxa de recuperação
5% Variabilidade populacional média 95%
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
0.00E+00 2.00E-01 4.00E-01 6.00E-01 8.00E-01 1.00E+00
Taxa de recuperação
5% Variabilidade populacional média 95%
De 0 até 3 dias De 4 dias até 14 dias
De 15 dias até 1 mês Acima de 1mês até 3 meses
Acima de 3 meses
41
De 0 até 3 dias
De 4 até 14 dias
De 15 dias até 1 mês
Figura 4.12: Função Densidade de Probabilidade a posteriori dos dias de recuperação dos funcionários da
região D da Companhia de geração de energia elétrica.
Através da Figura 4.12 observa-se que a Função Densidade de Probabilidade da
categoria “De 15 dias até 1 mês” tem uma dispersão maior que as demais categorias
evidenciando uma maior incerteza em relação as duas outras categorias.
0
0,2
0,4
0,6
0,8
1
0 5 10
Taxa de recuperação
0
0,2
0,4
0,6
0,8
1
0 0,05 0,1 0,15 0,2 0,25
Taxa de recuperação
0
0,2
0,4
0,6
0,8
1
0 1 2 3
Taxa de recuperação
42
Figura 4.13: Função de Distribuição Acumulada a posteriori da taxa de recuperações dos funcionários da
Companhia de geração de energia elétrica na região D.
Na Figura 4.13 nota-se que na categoria “De 15 dias até 1 mês“ praticamente não existe
incerteza para valores baixos da variabilidade populacional da taxa de recuperação, uma vez
que seus limites estão muitos próximos.
Na região D as categorias “Acima de 1 mês até 3 meses” (nenhuma observação) e
“Acima de 3 meses” (uma observações) não possuem dados suficientes para realizar a Análise
de variabilidade populacional, impossibilitando a construção de uma distribuição não
paramétrica para a mesma. Uma alternativa para superar essa limitação de ter poucas
observações seria utilizar em conjunto os dados empíricos com a opinião do especialista para
realizar a Análise de variabilidade populacional.
De 0 até 3 dias De 4 dias até 14 dias
De 15 dias até 1 mês
43
De 0 até 3 dias
De 4 até 14 dias
De 15 dias até 1 mês
Figura 4.14: Função Densidade de Probabilidade a posteriori dos dias de recuperação dos funcionários da
região E da Companhia de geração de energia elétrica.
É possível observar através da Figura 4.14, uma maior incerteza nas categorias “De 0
até 3 dias” e “De 15 dias até 1 mês”, uma vez que a Função densidade dessas categorias
apresenta uma grande dispersão.
0
0,2
0,4
0,6
0,8
1
0 5 10 15
Taxa de recuperação
0
0,2
0,4
0,6
0,8
1
0 0,1 0,2 0,3
Taxa de recuperação
0
0,2
0,4
0,6
0,8
1
0 0,2 0,4 0,6 0,8 1
Taxa de recuperação
44
Figura 4.15: Função de Distribuição Acumulada a posteriori da taxa de recuperação dos funcionários da
Companhia de geração de energia elétrica na região E.
Na Figura 4.15 é possível observar que os limites de incerteza da categoria “De 4 até 14
dias” são maiores tanto para todos valores da taxa de recuperação em relação as demais
categorias.
Na região E as categorias “Acima de 1 mês até 3 meses” (nenhuma observação) e
“Acima de 3 meses” (duas observações) não possuem dados suficientes para realizar a
Análise de variabilidade populacional, impedindo a construção de uma distribuição não
paramétrica para a mesma. Uma possível solução para a falta de dados empíricos é a opinião
do especialista, assim os dados empíricos e a opinião do especialista são utilizadas para
realizar a Análise de variabilidade populacional.
De 0 até 3 dias De 4 dias até 14 dias
De 15 dias até 1 mês
45
De 0 até 3 dias
De 4 até 14 dias
De 15 dias até 1 mês
Figura 4.16: Função Densidade de Probabilidade a posteriori dos dias de recuperação dos funcionários da
região F da Companhia de geração de energia elétrica.
A Figura 4.16 apresenta a Função Densidade de Probabilidade a posteriori da taxa da
recuperação na região F, obtida através da análise de variabilidade populacional. As
categorias “De 4 até 14 dias “ e “De 15 dias até 1 mês” apresentam grande dispersão na sua
distribuição aumentando a incerteza sobre a taxa de recuperação.
0
0,2
0,4
0,6
0,8
1
0 5 10
Taxa de recuperação
0
0,2
0,4
0,6
0,8
1
0 5 10
Taxa de recuperação
0
0,2
0,4
0,6
0,8
1
0 5 10 15
Taxa de recuperação
46
Figura 4.17: Função de Distribuição Acumulada a posteriori da taxa de dias de recuperação dos funcionários
da Companhia de geração de energia elétrica na região F.
Através da Figura 4.17 é possível que a categoria “De 0 até 3 dias” possui limites de
incerteza mas estreitos para baixos valores e mas largos para grandes valores. As demais
categorias têm limites de incerteza muito próximos para baixos valores.
Na região F as categorias “Acima de 1 mês até 3 meses” e “Acima de 3 meses” (duas
observações) não possuem dados suficientes para realizar a Análise de variabilidade
populacional, impossibilitando a construção de uma distribuição não paramétrica para a
mesma. Um recurso para solucionar a falta de dados empíricos das categorias mencionadas
acima é a opinião do especialista, desta forma os dados empíricos e a opinião do especialista
são empregadas para realizar a Análise de variabilidade populacional.
De 0 até 3 dias De 4 dias até 14 dias
De 15 dias até 1 mês
47
4.5 Análise de Sensibilidade
Com a análise de sensibilidade é possível avaliar o grau de confiança dos resultados em
situações de decisões incertas ou suposições sobre os dados e resultados usados. A função da
análise de sensibilidade é identificar se a modificação de alguns critérios é suficiente para
modificar os resultados e a interpretação.
São testados diferentes valores para a priori, com intuito de verificar se existe uma
sensibilidade muito grande dessas a priori em relação aos dados. É calculada a taxa dos
percentis (5%, 50% e 95%) dos dados empíricos, onde as mesmas serão estimativas da
mediana da distribuição a priori. Os valores do Fator de Erro (FE) são obtidos pela equação
(2.35) (
) tomando os valores das taxas dos percentis 50% e 95%, onde esses valores
serão estimativas do FE da distribuição a priori. Realizando a análise de sensibilidade com os
diversos valores obtidos será possível observar o quão sensível é a distribuição a posteriori
em relação da distribuição a priori.
É feito uma análise de sensibilidade com 3 distribuição diferentes, assumindo os valores
estimados da taxa de acidentes para os percentis 5%, 50% e 95% para as variáveis “tempo até
o acidente” e “recuperação” nas categorias da região A, pois a mesma possui uma maior
concentração de funcionários do que as demais regiões.
A Tabela 4.9 mostra que se tem um baixo valor para o Fator de Erro para o tempo até o
acidente na região A, com isso pode-se concluir que se em uma boa qualidade das
informações adquiridas para essa região.
Tabela 4.9: Estimativa da taxa de acidente e Fator de Erro para o tempo (dias) até o acidente na região A.
Fator de erro 1.60448
Estimativa da taxa de acidentes 5% 0.0046
Estimativa da taxa de acidentes 50% 0.00013
Estimativa da taxa de acidentes 95% 0.00008
48
Figura 4.18: Função Densidade de Probabilidade a posteriori da taxa de acidente para os percentis 5%, 50% e
95% da taxa do tempo (dias) entre acidentes n a região A.
Observa-se que na Figura 4.18 não há grande dispersão dos dados e a distribuição a
posteriori não é tão sensível em relação à distribuição a priori, uma vez que as curvas das
distribuições estão muito próximas uma da outra.
De acordo com a Tabela 4.10 a categoria “De 0 a 3 dias” apresenta um valor, mas
elevado que as demais categorias, este alto valor da pode indicar uma baixa qualidade das
informações para essa categoria.
Tabela 4.10: Estimativa da taxa de acidentes e fator de erro para os dias de recuperação das categorias da
região A
Categorias Estimativa da taxa de acidente
Fator de erro 5% 50% 95%
De 0 a 3 dias 39,216 3,226 0,333 9,677
De 4 até 14 dias 0,25 0,125 0,077 1,625
De 15 dias até 1mês 0,0667 0,0667 0,0415 1,607
Acima de 1 mês até 3 meses 0,029 0,151 0,011 1,315
Acima de 3 meses 0,011 0,008 0,004 1,925
0
0,2
0,4
0,6
0,8
1
0,0000000 0,0000500 0,0001000 0,0001500 0,0002000 0,0002500 0,0003000
Taxa de acidentes
fdp 5% fdp 50% fdp 95%
49
Figura 4.19: Função Densidade de Probabilidade a posteriori da taxa de acidentes para os percentis 5%, 50% e
95% da taxa de recuperação nas categorias da região A.
Através da Figura 4.19 é possível observar que as categorias “De 0 a 3 dias” e “Acima
de 1 mês até 3 meses” possuem uma maior dispersão dos dados em relação as demais
categorias, além disso, a sensibilidade da distribuição a posteriori é grande em relação a
distribuição a priori.
De 0 a 3 dias.
De 4 até 14 dias.
De 15 dias até 1mês.
Acima de 1 mês até 3 meses.
Acima de 3 meses.
0
0,5
1
0 5 10 15 20 25
Taxa de recuperação
fdp 5% fdp 50% fdp 95%
0
0,5
1
0 0,05 0,1 0,15 0,2 0,25
Taxa de recuperação
fdp 5% fdp 50% fdp 95%
0
0,5
1
0,00 0,05 0,10 0,15
Taxa de recuperação
fdp 5% fdp 50% fdp 95%
0
0,5
1
0 0,02 0,04 0,06
Taxa de recuperação
fdp 5% fdp 50% fdp 95%
0
0,5
1
0 0,01 0,02 0,03
Taxa de recuperação
fdp 5% fdp 50% fdp 95%
50
4.6 Processos semi-Markovianos
Nesta seção, a evolução temporal da disponibilidade e indisponibilidade é estimada a
partir do processo semi-Markoviano discutido na Seção 2.2. O uso do processo semi-
Markoviano é utilizado em nosso caso para ter um maior detalhamento das métricas de
Disponibilidade e Indisponibilidade.
A Tabela 4.11 apresenta importantes resultados de Disponibilidade e Indisponibilidade
do funcionário das regiões de atuação da companhia elétrica.
De maneira geral, as 6 regiões analisadas possuem um Tempo Operacional Médio
semelhante, dando-se destaque para a região E, que mostrou possuir o maior desses tempos.
Essa semelhança é confirmada pela análise da Disponibilidade Média, onde os valores se
encontraram entre 97,1% (Região C) e 98,7% (Região E). Analogamente, o Tempo Falho e a
Indisponibilidade – ambos os valores médios, podem ser analisados com a mesma linha de
raciocínio. A região C apresenta o maior valor para o Tempo Falho Médio, Indisponibilidade
Média e Indisponibilidade Instantânea ao Final da Missão.
Tabela 4.11: Métricas de Disponibilidade e Indisponibilidade do funcionário da Companhia
de geração de energia elétrica nas regiões de atuação.
Métrica Região
A B C D E F
Tempo Operacional Médio 355,886 357,185 354,388 358,017 360,303 356,933
Disponibilidade Média 0,975 0,978 0,971 0,981 0,987 0,978
Disponibilidade Instantânea ao Final da Missão 0,968 0,97 0,959 0,97 0,983 0,962
Tempo Falho Médio 9,114 7,815 10,612 6,983 4,697 8,067
Indisponibilidade Média 0,025 0,021 0,029 0,019 0,013 0,022
Indisponibilidade Instantânea ao Final da Missão 0,031 0,03 0,041 0,03 0,017 0,038
Para melhor explorar os resultados obtidos acima, alguns gráficos podem fornecer um
maior detalhamento sobre o comportamento dessas métricas. A Figura XX demonstra o
comportamento das curvas de disponibilidade e indisponibilidade da Região A. Existem
indícios de uma leve perda de disponibilidade ao longo do ano, demonstrando uma alta
capacidade dos trabalhadores em se manterem disponíveis ao serviço. Existem diversos
fatores que contribuem para esse resultado, os quais podem ser melhores explorados pela
companhia.
51
Figura XX: Disponibilidade e Indisponibilidade do trabalhador da região A da Companhia de geração de
energia elétrica em um período de 1 ano.
Figura 4.20: Taxa de visita ao Estado 0 – trabalhador disponível – na região A.
A Figura 4.20 representa um resultado interessante – a taxa de visita do trabalhador ao
estado de disponibilidade. Apesar de apresentar uma baixa taxa, esse resultado é uma
implicação direta da disponibilidade do trabalhador na maior parte do seu tempo. Ou seja, o
fato do trabalhador estar 97,5% (Tabela 4.11) do tempo disponível acarreta em poucas saídas
do estado 0. Consequentemente, isso implica poucas visitas ao mesmo estado, visto sua
permanência nele.
0,00
0,01
0,02
0,03
0,04
0,05
0 40 80 120 160 200 240 280 320 360
Ind
isp
on
ibili
dad
e
Dias
95% Média 5%
0,94
0,96
0,98
1
0 40 80 120 160 200 240 280 320 360
Dis
po
nib
ilid
ade
Dias
95% Média 5%
0
0,0002
0,0004
0,0006
0,0008
0,001
0 40 80 120 160 200 240 280 320 360
Fre
qu
ên
cia
Dias
Média Percentil 5% Percentil 50% Percentil 95%
52
Figura 4.21: Taxa de visita aos Estados (1, 2, 3, 4 e 5) em que o funcionário não está apto ao trabalho na
região A.
A Figura 4.21 é um resultado análogo ao anterior, pois demonstra as taxas de visita aos
demais estados. Devido à longa permanência no estado de disponibilidade, é de se esperar
baixas taxas de visitas nos demais estados, o que é comprovado pelos gráficos. É de se
destacar a maior taxa para o Estado 1 – afastamento por até 3 dias, justificado pelo próprio
período de afastamento (período curto).
Figura 4.22: Probabilidade dos Estados (1, 2, 3, 4 e 5) em que o funcionário não está apto ao trabalho na
região A.
0,000156
0,000158
0,000160
0,000162
0,000164
0 50 100 150 200 250 300 350 400
Fre
qu
ên
cia
Dias
Estado 1 Estado 2 Estado 3 Estado 4 Estado 5
0,000
0,010
0,020
0,030
0 40 80 120 160 200 240 280 320 360
Pro
bab
ilid
ade
Dias
Estado 1 Estado 2 Estado 3 Estado 4 Estado 5
53
A Figura 4.22 destaca a probabilidade de o trabalhador estar indisponível por diferentes
períodos de tempo – Estados 1 a 5. Percebe-se que é mais provável o trabalhador se afastar
por mais de 3 meses (Estado 5), o que pode indicar a ocorrência de acidentes de trabalhos
mais graves na companhia. Portanto, a companhia pode trabalhar em campanhas e medidas
com o objetivo de diminuir tais acidentes.
Vale ressaltar que análises semelhantes são feitas para as demais regiões e tais gráficos
estão presentes no Anexo I.
54
5 CONCLUSÃO
A primeira etapa para o desenvolvimento deste trabalho foi mostra definições, motivos
e suas consequências do acidente do trabalho tanto para os funcionários como para a empresa
de forma geral.
Em seguida, foram apresentadas as técnicas para chegar ao modelo hibrido entre o
processo semi-Markoviano e a Análise de variabilidade populacional Bayesiana, onde
também foi apresentada uma breve revisão bibliográfica dos mesmos.
Na continuação do trabalho, são apresentadas as etapas para chegar ao modelo hibrido e
em seguida é realizado um exemplo de aplicação da metodologia em uma Companhia de
energia elétrica. Foi realizado testes de homogeneidade entre as regiões de uma companhia de
energia, onde foi possível verificar que os tempos de recuperação não apresentam variâncias
iguais tanto entre as regiões como dentro de cada uma delas. Neste caso, não é realista
assumir que todos os empregados da região, composta por diferentes subpopulações, possuam
os mesmo parâmetros de confiabilidade para a taxa de recuperação.
Para contornar há não homogeneidade entre as regiões foi utilizada a Análise de
variabilidade populacional Bayesiana que é um procedimento de estimação utilizado para a
quantificação da variabilidade de métricas de confiabilidade num conjunto de subpopulações
de sistemas similares. As distribuições de variabilidade obtidas são usadas como distribuições
a priori em atualizações Bayesianas específicas para um sistema. A Análise de variabilidade
populacional foi utilizada para estimar a Função Densidade de Probabilidade para as taxas de
acidentes e as taxas de recuperações do processo semi-Markoviano, de acordo com as
categorias das regiões. Com o PSM foi possível estimar as métricas de Disponibilidade e
Indisponibilidade: Disponibilidade média, Disponibilidade instantânea ao final da missão,
Tempo falho médio, Indisponibilidade média, Indisponibilidade instantânea ao final da
missão, Tempo operacional médio e a Probabilidade do funcionário não acidentado e
acidentado por acidente de trabalho para o trabalhador das 6 regiões de atuação.
Os resultados obtidos através do hibridismo do PSM e Analise de variabilidade
populacional mostrou que a região C apresenta os maiores valores para o Tempo falho médio,
Indisponibilidade média, Indisponibilidade instantânea ao final da missão, enquanto a região
E apresentou os menores valores para essas métricas. Esses resultados mostraram que a região
E merece uma maior atenção com as politica de segurança para seus funcionários. Além
55
desses resultados, foi apresentado o comportamento da disponibilidade e indisponibilidade do
trabalhador durante um período de 1 ano.
Com essas informações a Companhia de geração de energia elétrica será capaz de
conhecer o comportamento dos funcionários em cada região de atuação e promover novas
políticas de segurança do trabalho para os seus trabalhadores, assim diminuindo os gastos
com despesas médicas, parada das máquinas e redução de rendimento do trabalhador ao voltar
do período de recuperação.
5.1 Limitações e Desafios Futuros
A limitação que se deve ser considera é o fato de algumas regiões possuírem um
número muito pequeno de observações em determinadas categorias que inviabiliza a
realização da Análise de variabilidade populacional, consequentemente impedindo a
estimação da Função densidade de probabilidade da taxa de acidente e recuperação que são
utilizadas no processo semi-Markoviano. Uma provável solução para a falta de observações
em algumas regiões e/ou para uma possível baixa qualidade dos dados é a utilização da
opinião do especialista (Engenheiro, Estatístico e etc.) em conjunto com os dados empíricos,
pois quanto maior for o conhecimento do especialista sobre a probabilidade do acidente
menor será a incerteza sobre sua distribuição de probabilidade.
.
56
REFERÊNCIAS BIBLIOGRÁFICAS
ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR-14280: 2001. Cadastro de
acidente de trabalho – Procedimento e classificação. Rio de Janeiro, 2001.
BITENCOURT, C. L., QUELHAS, O. L. G. Historico da evolução dos conceitos de
segurança. In: Encontro nacional de engenharia de produção, n 18, 1998, Niterói. Disponível
em http://www.abepro.org.br/biblioteca/ENEGEP1998_ART369.pdf. Acessado em 17 de
Setembro de 2012.
COMISSÃO TRIPARTITE PERMANENTE DE NEGOCIAÇÃO DO SETOR ELÉTRICO
NO ESTADO DE SÃO PAULO (CPN). Curso básico de segurança em instalações e serviços
em eletricidade –NR 10, 2004.
CORRADI, G., J. JANSSEN, et al. Numerical Treatment of Homogeneous semi Markov
Processes in Transient Case - a Straightforward Approach. Methodology and Computing in
Applied Probability, v.6, p.233-246. 2004
COUTINHO, C. Q. Introdução ao conceito de probabilidade por uma visão frequentista-
Estudo Epistemológico e Didático, 1994 (Mestrado. PUC-SP).
COSTA, H. J. Acidentes de trabalho na atualidade. Porto Alegre: Síntese, 2003.
CHEN, D., TRIVEDI, K. S. Optimization for condition-based maintenance with semi-Markov
decision process. Reliability Engineering & System Safety, v.90, p.25-29. 2005.
CONGDON, P. Bayesian Statistical Modelling, 2. ed. London: John Wiley & Sons, 2006.
57
D’AMICO, G., JANSSEN, J. and Manca, R. Homogeneous Semi-Markov reliability models
for credit risk management. Decisions in Economics and Finance, v.28, p.79-93. 2005.
DONG, M., YANG, D., KUANG, Y., HE, D., ERDAL, S. AND KENSKI, D. PM2.5
concentration prediction using hidden semi-Markov model-based times series data mining,
Expert Systems with Applications, 36 (5), 9046-9055, 2009.
DROGUETT, E. L., GROEN, F., MOSLEH, A. The combined use of data and expert
estimates in population variability analysis. Reliability Engineering & System Safety, v. 83, n.
3, p. 311-321, mar. 2004.
DROGUETT, E. L., GROEN, F. J., MOSLEH, A. Avaliação Bayesiana da variabilidade das
medidas de confiabilidade Pesquisa Operacional. Rio de Janeiro, v 26, n. 1, abril de 2006.
EHLERS, R. S. Introdução a Inferência Bayesiana.
http://www.leg.ufpr.br/~paulojus/CE227/ce227/. Acesso em 23 de Fevereiro de 2012.
EL-GOHARY, A. Bayesian estimations of parameters in a three state reliability semi-Markov
models. Applied Mathematics and Computation, v. 154, n. 1, p. 53-67, jun. 2004.
EUROSTAT: Labour Force Survey 2007 ad hoc module on acidentes ar work and work-
related health problems, EUROSTAT publication 63/2009.
FELLI, J. C., ANDERSON, W. H., KREMIDAS, J. P, RUBERG, S. J. A semi-Markov model
for patient progression through clinical trials. European Journal of Operational Research
176:542 – 9. 2007.
58
GALVANIN E. A. S. Extração automática de contornos de telhados de edifícios em um
modelo digital de elevação, utilizando inferência Bayesiana e campos aleatórios de Markov.
Presidente Prudente, 2007 (Doutorado – Universidade Estadual Paulista).
GOSAVI, A. Approximate Policy Iteration for Semi-Markov Control Revisited. Procedia
Computer Science, v. 6, p. 249-255, jan. 2011.
GRABSKI, F. Applications of semi-Markov processes in reliability. RELIABILITY: THEORY
& APPLICATIONS, n. 1, p. 60-75, 2007.
GRABSKI, F. The reliability of an object with semi-Markov failure rate. Applied
Mathematics and Computation, v.135, p.1-16. 2003.
GUENTHER, M. C. et al. Passage-time computation and aggregation strategies for large
semi-Markov processes. Performance Evaluation, v. 68, n. 3, p. 221-236, mar. 2011.
HOWARD, R. A. Dynamic Probabilistic Systems v.II: Semi-Markov and Decision Processes.
Mineola, New York: Dover Publications, INC. 2007.
HUNT, J., DEVOLDER, P. Semi-Markov regime switching interest rate models and minimal
entropy measure. Physica A: Statistical Mechanics and its Applications, v. 390, n. 21-22, p.
3767-3781, out. 2011.
JANSSEN, J., MANCA, R. Numerical solution of Non Homogeneous semi-Markov process
in Transient Case. Methodology and Computing in Applied Probability, v.3, p271-293. 2001.
59
JENS, R. D. Modelo de Monitoramento e avaliação da confiabilidade e disponibilidade de
sistemas de distribuição de energia elétrica com base nas condições de uso de
transformadores, 2006. (Mestrado - Universidade de São Paulo Escola Politécnica).
KAPLAN, S. On a “two-stage” Bayesian procedure for determining failure rates from
experiential data. IEEE Trans. On Power Apparatus and Systems. Vol. Pas-102, No 1, Jan.
1983.
KÉRY, M. Introduction to Winbugs for ecologists.1. ed. London: Elsevier Inc., 2010.
LEFEBVRE, M.., PEROTTO, S. A semi-Markov process with an inverse Gaussian
distribution as sojourn time. Applied Mathematical Modelling, v. 35, n. 9, p. 4603-4610, set.
2011.
LEVENE, H. Robust Tests for Equality of Variances. Stanford University Press, Palo Alto,
1960.
MARCOULAKI, E.C., PAPAZOGLOU, I.A., KONSTANDINIDOU, M. Prediction of
occupational accident statistics and work time loss distributions using Bayesian analysis.
Journal of Loss Prevention in the Process Industries, 25, 467-477. 2012.
MATHIEU, E. et al. Parametric and Non Homogeneous Semi-Markov Process for HIV
Control. Methodology and Computing in Applied Probability, v. 9, n. 3, p. 389-397, 3 jul.
2007.
60
MENDES, E. M. P. Contributos para a melhoria da disponibilidade e para redução de riscos
em unidades de transformação de subprodutos de origem animal. Universidade Minho. 2008.
MINISTÉRIO DA PREVIDÊNCIA SOCIAL (MPAS). Disponível em
http://www.mpas.gov.br/vejaNoticia.php?id=48094. Acessado em 30 de Abril de 2013.
MOOD, A. M., GRAYBILL, F. A., BOES, D. C. Introduction to the theory of statistics.
Series in probability and statistics. McGraw-Hill, New York. 1974.
MOSELHY, T. A., MARZOUK, Y. M. Bayesian inference with optimal maps. J. Comput.
Phys., 231: in press, 2012.
MOSLEH, A. Bayesian modeling of expert-to-expert variability and dependence in estimating
rare event frequencies. Reliability Engineering & System Safety, v. 38, n. 1, p. 47-57, 1992.
MOURA, M. C., DROGUETT, E. L. A continuous-time semi-markov bayesian belief
network model for availability measure estimation of fault tolerant systems. Pesquisa
Operacional, Rio de Janeiro, v. 28, n. 2, 2008.
MOURA, M. C. Semi-Markov Processes and Bayesian Networks for reliability performance
indicators assessment of fault tolerant systems (in Portuguese). (Master). Production
Engineering Department - CTG, Federal University of Pernambuco, Recife, PE, Brazil, 2006.
NATIONAL INSTITUTE FOR PUBLIC HEALTH AND THE ENVIRONMENT (RIVM).
The Quantification of Occupational Risk: The development of a risk assessment model and
software. RIVM Report 620801001/2008.
61
OLIVEIRA, A. C. R. Impacto da especialização de dados de falha em análises probabilísticas
de segurança de plantas de processo. 2005. (Doutorado-UNIVERSIDADE FEDERAL DO
RIO DE JANEIRO).
ORGANIZAÇÃO INTERNACIONAL DO TRABALHO (OIT). XIX Congresso sobre
Segurança e Saúde no Trabalho discute a construção de locais de trabalho. Publicado no site:
(http://www.oitbrasil.org.br). Acessado em 10 de Dezembro de 2012.
OUHBI, B. LIMNIOS, N. The rate of occurrence of failures for semi-Markov processes and
estimation. Statistics & Probability Letters, v. 59, n. 3, p. 245-255, out. 2002
PAULINO, C. D., TURKMAN, M. A. A., MURTEIRA, B. Estatística Bayesiana. 1. ed.
Lisboa: Fundação Calouste Gulbenkian, 2003.
PIEVATOLO, A., VALADÈ, I. UPS reliability analysis with non-exponential duration
distribution. Reliability Engineering and System Safety, v.81, p.183-189. 2003.
PÖRN, K. The two-stage Bayesian method used for the T-Book application. Reliability
Engineering & System Safety, v. 51, n. 2, p. 169-179, 1996.
RAMOS, M. A., DROGUETT, E. L., MARTINS, M. R., BARBOSA, C. Desenvolvimento de
metodologia bayesiana de análise Quantitativa de risco para terminais de gnl e aplicação para
um terminal offshore. Congreso Latino Iberoamericano de Investigación Operativa, 2012.
RAUSAND, M. HØYLAND, A. System reliability theory: models, statistical methods, and
applications. 2. Ed. Wiley-Interscience, 2003.
62
REDONDO, S. F. Manual do inspetor de segurança. In: INDUSTRIAL SAFETY; CBAI
(Comissão Brasileiro-Americana de Educação Industrial). São Paulo, 1961. Impresso em
1970.
ROSS, S. M. Introduction to Probability Models. Berkeley. 9. ed. California: Academic Press.
2007.
SCOTTO, M. G., SOARES, C. G. Bayesian inference for long-term prediction of significant
wave height. 2007.
SILVA, R. R., MATTOS, N. M. Análise Bayesiana da confiabilidade de itens submetidos a
testes de degradação. 2002.
SIVINI, A.L. Desenvolvimento de banco de dados de confiabilidade: uma aplicação em
estações redutoras de pressão de gás natural. Dissertação de Mestrado, Programa de Pós-
graduação em Engenharia de Produção, Universidade Federal de Pernambuco, Recife, PE,
2006.
SMITH, W.L., 1955. Regenerative stochastic processes. Proc. R. Soc. Lond. Ser. A 232, 6–
31.
SNEDECOR, GEORGE W., COCHRAN, WILLIAM G. Statistical methods. 8. ed. Ames:
Blackwell, c1989. 503 p. ISBN 978-0-8138-1561-9.
VEERAMANY, A.; PANDEY, .M. A. Reliability analysis of nuclear piping system using
semi-Markov process model. 2010.
63
VESELY, W. E. Quantifying maintenance effects on unavailability and risk using Markov
Modeling. Reliability Engineering & System Safety, 41 (1993) 177-187.
VIEIRA, D. S. Uso de métodos bayesianos em testes de vida acelerados no controle da
qualidade de produtos industriais, 2006. (Mestrado - Universidade Federal de São Carlos).
WANG, A. H., YAN, S., LIU, P. A Semi-Markov Survivability Evaluation Model for
Intrusion Tolerant Database Systems. 2010 International Conference on Availability,
Reliability and Security, p. 104-111, fev. 2010.
WU, S.C. Semi-Markov for survival data with covariates. v. 206, p. 197-206, 1981.
XIE, W., HONG, Y., TRIVEDI, K. Analysis of a two-level software rejuvenation policy.
Reliability Engineering & System Safety, v.87, p.13-22. 2005.
YU, S.-Z. Hidden semi-Markov models. Artificial Intelligence, v. 174, n. 2, p. 215-243, fev.
2010.
ZHANG, X., HOU, Z. The first-passage times of phase semi-Markov processes. Statistics &
Probability Letters, v. 82, n. 1, p. 40-48, jan. 2012.
64
ANEXOS
Anexo I – Análise gráfica das métricas de disponibilidade e indisponibilidade
das Regiões B, C, D, E e F.
Figura A1: Indisponibilidade do trabalhador na região B da Companhia de geração de energia elétrica durante
um período de 1 ano.
Figura A2: Disponibilidade do trabalhador na região B da Companhia de geração de energia elétrica durante
um período de 1 ano.
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0 40 80 120 160 200 240 280 320 360
Ind
isp
on
ibili
dad
e
Dias
95% Média 5%
0,93
0,94
0,95
0,96
0,97
0,98
0,99
1
0 40 80 120 160 200 240 280 320 360
Dis
po
nib
ilid
ade
Dias
95% Média 5%
65
Figura A3: Taxa de visita ao Estado (0) em que o funcionário está apto ao trabalho na região B.
Figura A4: Taxa de visita aos Estados (1, 2, 3 e 4) em que o funcionário não está apto ao trabalho na região B.
0
0,0002
0,0004
0,0006
0,0008
0 40 80 120 160 200 240 280 320 360
Fre
qu
ên
cia
Dias
Percentil 95% Média Percentil 50% Percentil 5%
0,000176
0,000178
0,00018
0,000182
0,000184
0,000186
0,000188
0 40 80 120 160 200 240 280 320 360
Fre
qu
ên
cia
Dias
Estado 1 Estado 2 Estado 3 Estado 4
66
Figura A5: Probabilidade dos Estados (1, 2, 3 e 4) em que o funcionário não está apto ao trabalho na região B.
Figura A6: Indisponibilidade do trabalhador na região C da Companhia de geração de energia elétrica durante
um período de 1 ano.
0
0,005
0,01
0,015
0,02
0,025
0 40 80 120 160 200 240 280 320 360
Pro
bab
ilid
ade
Dias
Estado 1 Estado 2 Estado 3 Estado 4
0,00
0,01
0,02
0,03
0,04
0,05
0 40 80 120 160 200 240 280 320 360
Ind
isp
on
ibili
dad
e
Dias
95% Média 5%
67
Figura A7: Disponibilidade do trabalhador na região C da Companhia de geração de energia elétrica durante
um período de 1 ano.
Figura A8: Taxa de visita ao Estado (0) em que o funcionário está apto ao trabalho na região C.
0,94
0,95
0,96
0,97
0,98
0,99
1
0 40 80 120 160 200 240 280 320 360
Dis
po
nib
ilid
ade
Dias
95% Média 5%
0,00000
0,00020
0,00040
0,00060
0,00080
0 40 80 120 160 200 240 280 320 360
Fre
qu
ên
cia
Dias
Média Percentil 5% Percentil 50% Percentil 95%
68
Figura A9: Taxa de visita aos Estados (1, 2, 3, 4 e 5) em que o funcionário não está apto ao trabalho na região
C.
Figura A10: Probabilidade dos Estados (1, 2, 3, 4 e 5) em que o funcionário não está apto ao trabalho na
região C.
0,000137
0,000139
0,000141
0,000143
0,000145
0 40 80 120 160 200 240 280 320 360
Fre
qu
ên
cia
Dias
Estado 1 Estado 2 Estado 3 Estado 4 Estado 5
0
0,005
0,01
0,015
0,02
0,025
0,03
0 40 80 120 160 200 240 280 320 360
Pro
bab
ilid
ade
Dias
Estado 1 Estado 2 Estado 3 Estado 4 Estado 5
69
Figura A11: Indisponibilidade do trabalhador na região D da Companhia de geração de energia
elétrica durante um período de 1 ano.
Figura A12: Disponibilidade do trabalhador na região D da Companhia de geração de energia elétrica durante
um período de 1 ano.
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0 40 80 120 160 200 240 280 320 360
Ind
isp
on
ibili
dad
e
Dias
95% Média 5%
0,88
0,9
0,92
0,94
0,96
0,98
1
0 50 100 150 200 250 300 350 400
Dis
po
nib
ilid
ade
Dias
95% Média 5%
70
Figura A13: Taxa de visita ao Estado (0) em que o funcionário está apto ao trabalho na região D.
Figura A14: Taxa de visita aos Estados (1, 2 e 3) em que o funcionário não está apto ao trabalho na região D.
0
0,0002
0,0004
0,0006
0,0008
0,001
0,0012
0 40 80 120 160 200 240 280 320 360
Fre
qu
ên
cia
Dias
Média Percentil 5% Percentil 50% Percentil 95%
0,000234
0,000237
0,00024
0,000243
0,000246
0 40 80 120 160 200 240 280 320 360
Fre
qu
ên
cia
Dias
Estado 1 Estado 2 Estado 3
71
Figura A15: Probabilidade dos Estados (1, 2, 3, 4 e 5) em que o funcionário não está apto ao trabalho na
região D.
Figura A16: Indisponibilidade do trabalhador na região E da Companhia de geração de energia elétrica
durante um período de 1 ano.
0
0,01
0,02
0,03
0,04
0,05
0 40 80 120 160 200 240 280 320 360
Pro
bab
ilid
ade
Dias
Estado 1 Estado 2 Estado 3
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0 40 80 120 160 200 240 280 320 360
Ind
isp
on
ibili
dad
e
Dias
95% Média 5%
72
Figura A17: Disponibilidade do trabalhador na região E da Companhia de geração de energia elétrica durante
um período de 1 ano.
Figura A18: Taxa de visita ao Estado (0) em que o funcionário está apto ao trabalho na região E.
0,93
0,94
0,95
0,96
0,97
0,98
0,99
1
0 40 80 120 160 200 240 280 320 360
Dis
po
nib
ilid
ade
Dias
95% Média 5%
0
0,0002
0,0004
0,0006
0,0008
0 40 80 120 160 200 240 280 320 360
Fre
qu
ên
cia
Dias
Média Percentil 5% Percentil 50% Percentil 95%
73
Figura A19: Taxa de visita aos Estados (1, 2, e 3) em que o funcionário não está apto ao trabalho na região E.
Figura A20: Probabilidade dos Estados (1, 2, e 3) em que o funcionário não está apto ao trabalho na região E.
0,0002
0,0002008
0,0002016
0,0002024
0,0002032
0,000204
0 50 100 150 200 250 300 350 400
Fre
qu
ên
cia
Dias
Estado 1 Estado 2 Estado 3
0
0,004
0,008
0,012
0,016
0,02
0 40 80 120 160 200 240 280 320 360
Pro
bab
ilid
ade
Estado 1 Estado 2 Estado 3
74
Figura A21: Indisponibilidade do trabalhador na região F da Companhia de geração de energia elétrica
durante um período de 1 ano.
Figura A22: Disponibilidade do trabalhador na região F da Companhia de geração de energia elétrica durante
um período de 1 ano.
0
0,02
0,04
0,06
0,08
0,1
0,12
0 40 80 120 160 200 240 280 320 360
Ind
isp
on
ibili
dad
e
Dias
95% Média 5%
0,88
0,9
0,92
0,94
0,96
0,98
1
0 40 80 120 160 200 240 280 320 360
Dis
po
nib
ilid
ade
Dias
Média 5% 95%
75
Figura A23: Taxa de visita ao Estado (0) em que o funcionário está apto ao trabalho na região F.
Figura A24: Taxa de visita aos Estados (1, 2, e 3) em que o funcionário não está apto ao trabalho na região F.
0
0,0001
0,0002
0,0003
0,0004
0,0005
0,0006
0,0007
0 40 80 120 160 200 240 280 320 360
Fre
qu
ên
cia
Dias
Média Percentil 5% Percentil 50% Percentil 95%
0,000158
0,00016
0,000162
0,000164
0,000166
0 40 80 120 160 200 240 280 320 360
Fre
qu
ên
cia
Dias
Estado 1 Estado 2 Estado 3
76
Figura A25: Probabilidade dos Estados (1, 2, e 3) em que o funcionário não está apto ao trabalho na região F.
0
0,004
0,008
0,012
0,016
0,02
0,024
0,028
0 40 80 120 160 200 240 280 320 360
Pro
bab
ilid
ade
Dias
Estado 0 Estado 1 Estado 2