37
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CIÊNCIAS EXATAS E DA TERRA DEPARTAMENTO DE ESTATÍSTICA CURSO DE ESTATÍSTICA Uma Introdução à Análise de Sobrevivência com Fração de Cura Talita Viviane Siqueira de Barros Natal-RN Junho de 2014

Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

CENTRO DE CIÊNCIAS EXATAS E DA TERRA

DEPARTAMENTO DE ESTATÍSTICA

CURSO DE ESTATÍSTICA

Uma Introdução à Análise de Sobrevivência com Fração de

Cura

Talita Viviane Siqueira de Barros

Natal-RN

Junho de 2014

Page 2: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

Talita Viviane Siqueira de Barros

Uma Introdução à Análise de Sobrevivência com Fração de

Cura

Monografia de Graduação apresentada ao

Departamento de Estatística da

Universidade Federal do Rio Grande do

Norte em cumprimento com as exigências

legais para obtenção do título de bacharel

em Estatística.

Orientadora:

Profª. Drª. Dione Maria Valença

Natal – RN

Junho de 2014

Page 3: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

Catalogação da Publicação na Fonte. UFRN / SISBI / Biblioteca Setorial Centro de Ciências Exatas e da Terra – CCET.

Barros, Talita Viviane Siqueira de. Uma introdução à análise de sobrevivência com fração de cura / Talita Viviane

Siqueira de Barros. - Natal, 2014. 27 f. : il. Orientadora: Profa. Dra. Dione Maria Valença. Monografia (Graduação) – Universidade Federal do Rio Grande do Norte.

Centro de Ciências Exatas e da Terra. Departamento de Estatística. 1. Análise de sobrevivência – Monografia. 2. Modelo de longa duração –

Monografia. 3. Modelo de mistura padrão – Monografia. I. Valença, Dione Maria. II. Título.

RN/UF/BSE-CCET CDU: 519.24-7:61

Page 4: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que
Page 5: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

Agradecimentos

Agradeço em primeiro lugar a Deus nosso pai criador, pela força e perseverança

ao longo dessa jornada, pela presença em todos os momentos de minha vida seja ele

feliz ou triste e pela oportunidade de estudar nesta universidade.

A minha mãe Telvalúcia Siqueira que nunca mediu esforços para que eu

chegasse até essa etapa de minha vida, sempre me apoiando e incentivando a ser uma

boa aluna. E ao meu pai, Reginaldo Barros (in memorian) que mesmo não estando

presente fisicamente sei que me apóia sempre. Ao meu irmão Arthur Siqueira por toda

tranquilidade transmitida ao longo dessa etapa. Ao meu esposo Clodoaldo Gonzaga,

pela compreensão e por ser amigo e companheiro em todos os momentos que passamos

juntos. Sempre acreditando em meu potencial. E a minha filha Sarah Siqueira, tudo que

fiz foi por ela.

A querida professora Dione por ter me orientado na elaboração desta monografia

e pela sua inesgotável paciência em transmitir sempre o máximo de seu conhecimento e

experiência e pelos conselhos tanto para a vida acadêmica como para a vida pessoal.

A todos os professores com quem tive a oportunidade de conviver, tanto do

departamento de Estatística quanto de outros departamentos da UFRN. Em especial aos

meus queridos professores André Pinho, Pledson, Iloneide, Formiga, Carla, Jeanete, ao

melhor professor do mundo Paulo Roberto e a Fidel por ter aceitado compor minha

banca.

Aos amigos e companheiros de curso, que sempre se fizeram presentes seja no

início ou no fim do curso. Um agradecimento com muito prezar à Cintya, Regina,

Jéssica, Rumenick, Jhonnata, Isaac, Jailton, Jocelânio, Glauco e Marcos.

A todos que direta ou indiretamente me deram o incentivo necessário para que

eu concluísse essa etapa tão importante em minha vida.

Page 6: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

“Talvez não tenha conseguido fazer o

melhor, mas lutei para que o melhor fosse

feito. Não sou o que deveria ser, mas

Graças a Deus, não sou o que era antes.”

(Marthin Luther King)

Page 7: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

Resumo

Na teoria de análise de sobrevivência usual, um pressuposto do modelo é que se o

indivíduo for acompanhado por um período suficientemente longo, o evento de

interesse irá ocorrer. Contudo, na prática alguns indivíduos podem ser considerados

imunes à ocorrência do evento, ou curados. Modelos que tratam de dados de

sobrevivência com estas características são chamados de modelos com fração de cura ou

modelos de longa duração. Uma classe de modelos com fração de cura muito popular é

conhecida como modelo de mistura padrão. O objetivo desta monografia é estudar e

descrever brevemente o modelo de mistura padrão paramétrico e o seu ajuste a dados de

sobrevivência com fração de cura. Foi considerada a distribuição Weibull para modelar

os tempos de vida. A teoria estudada é ilustrada com uma aplicação a um conjunto de

dados sobre o tempo até a recidiva do câncer de mama em mulheres que foram

submetidas ao tratamento cirúrgico de retirada total ou parcial da mama. Utilizou-se o

pacote gfcure no software R para ajuste do modelo.

Palavras-Chave: Análise de sobrevivência, Modelo de longa duração, Modelo de

mistura padrão

Page 8: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

Abstract

In theory of usual survival analysis, an assumption of the model is that if the individual

is accompanied by a sufficiently long period, the event of interest will occur. Yet in

practice some individuals can be considered immune to the event, or cured. Models

dealing with survival data with these characteristics are referred to cure fraction models

or models of long duration. One class of models with fractional very popular cure is

known as pattern mixture model. The purpose of this monograph is to study and briefly

describe the model of parametric standard mixture and its adjustment to survival data

with fractional healing. Considering the Weibull distribution to model of lifetimes. To

illustrate the study with an application to a set of data on the time to recurrence of breast

Ca ncer in women who underwent surgical treatment of partial or total removal of the

breast cancer. Gfcure package in R software was used to fit the model.

Key words: Analysis of survival, long-term model, model standard mixture

Page 9: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

SUMÁRIO

1. INTRODUÇÃO .......................................................................................................... 1

2. ANÁLISE DE SOBREVIVÊNCIA ........................................................................... 3

2.1 Função de sobrevivência. .................................................................................... 4

2.2 Modelo para censura aleatória............................................................................. 5

2.3 Análise paramétrica............................................................................................. 6

2.3.1 Modelo Weibull. ......................................................................................... 7

3. MODELOS DE LONGA DURAÇÃO ...................................................................... 9

3.1 Modelo de mistura padrão................................................................................... 9

3.2 Função de verossimilhança ............................................................................... 11

4. APLICAÇÃO ........................................................................................................... 14

5. CONSIDERAÇÕES FINAIS .................................................................................. 19

REFERÊNCIAS .......................................................................................................... 20

APÊNDICE A ............................................................................................................... 22

Page 10: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

1

1 INTRODUÇÃO

A análise de sobrevivência é formada por um conjunto de técnicas estatísticas

para analisar dados, que consistem nos tempos até a ocorrência de um evento de

interesse, comumente chamado de “tempo de sobrevivência” ou “tempo de vida”. Para

exemplificar medidas de tempo que podem ser estudadas em análise de sobrevivência,

pode-se considerar o tempo até que um ex-presidiário possa retornar à cadeia; um aluno

possa concluir sua graduação; a ocorrência da falha de uma lâmpada; a morte após o

diagnóstico de certa doença ou mesmo até que um cliente abandone a instituição

financeira. Um fato que caracteriza dados de sobrevivência é a possibilidade da

presença de censura, que é a ocorrência da observação parcial da resposta de interesse.

Com o passar dos anos o desenvolvimento de técnicas para análise de dados de

sobrevivência com diferentes abordagens tem crescido de maneira rápida. Na

abordagem clássica, para um indivíduo em que foi observado o tempo de censura,

supõe-se que o tempo até a ocorrência do evento (embora não tenha sido observado) é

finito. Esta suposição implica que o evento poderia ser observado para este indivíduo.

Contudo, na prática uma parte da população pode ser imune à ocorrência do evento.

Assim para alguns indivíduos o evento pode nunca ocorrer, mesmo que estes sejam

acompanhados por um longo período de tempo. Modelos desenvolvidos

especificamente para tratar desses casos são conhecidos como modelos de longa

duração ou modelos com fração de cura.

A análise de sobrevivência com fração de cura vem sendo amplamente estudada

na literatura estatística e aplicada a problemas em diversas áreas do conhecimento e por

vários autores. Inicialmente Boag (1949) e Berkson e Gage (1952) propuseram um

modelo para analisar dados de indivíduos portadores de câncer com base em uma

mistura de distribuições paramétricas, em que há na população uma proporção θ de

indivíduos curados ou imunes ao evento. Estes modelos, conhecidos como modelos de

mistura padrão, são descritos em detalhes no livro Maller e Zhou (1996). Além disso,

foram propostos na literatura outros modelos mais sofisticados que tentam explicar

melhor o mecanismo biológico envolvido no processo de cura. Diversas referências,

descrições e exemplos destes outros modelos podem ser encontrados, por exemplo, nas

dissertações de Guedes (2011) e Carneiro (2012).

Page 11: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

2

O objetivo desta monografia é estudar e descrever brevemente o modelo de

mistura padrão e o seu ajuste a dados de sobrevivência com fração de cura, pelo método

da máxima verossimilhança (Bolfarine e Sandoval, 2010). A teoria estudada é ilustrada

com uma aplicação a um conjunto de dados reais sobre o tempo até a recidiva do câncer

de mama em mulheres atendidas pelo Hospital Prof. Dr. Luiz Antônio em Natal – RN

entre 1991 e 2004, que foram submetidas ao tratamento cirúrgico de retirada total ou

parcial da mama (MACEDO e VALENÇA, 2009). Foi considerada a distribuição

Weibull para modelar os tempos de vida.

Este trabalho apresenta 5 capítulos, dispostos da seguinte forma: No Capítulo 2 é

apresentada uma breve revisão dos principais conceitos em Análise de Sobrevivência,

como função de sobrevivência, o modelo para censura aleatória e a distribuição

Weibull. O modelo de mistura padrão é discutido no Capítulo 3, onde se encontra a

função de verossimilhança para este modelo considerando uma distribuição Weibull

para os indivíduos em risco. Uma aplicação dos conceitos apresentados nos capítulos

anteriores a um conjunto de dados reais de câncer de mama é ilustrada no Capítulo 4. O

Capítulo 5 trata de comentários finais, bem como possibilidades de pesquisas futuras.

Em seguida, são apresentadas as referências bibliográficas. E por fim, o Apêndice A

que fornece os algoritmos utilizados no software R.

Page 12: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

3

2 ANÁLISE DE SOBREVIVÊNCIA

Dados de sobrevivência representam, em geral, o resultado do acompanhamento

de indivíduos no decorrer do tempo, até a ocorrência de um determinado evento de

interesse, por exemplo, a morte de um paciente com alguma doença, o retorno de uma

doença, ou o abandono de uma instituição financeira por um cliente, entre outros.

A principal característica nos dados é a presença de censura, que é identificada

como a observação parcial da resposta, ou seja, quando por algum motivo o

acompanhamento do objeto em estudo é interrompido e a falha ou evento de interesse

não é observado. Os tipos de censura mais conhecidos são censura tipo I, tipo II ou

aleatória. Esses mecanismos são tipos de censura à direita, onde o tempo de ocorrência

do evento de interesse está à direita do tempo de censura observado. A censura pode ser

classificada como informativa ou não informativa. De acordo com Carvalho et al.

(2005) uma censura é dita não informativa quando o motivo da perda não esta

relacionada com o evento em estudo. Um exemplo da ocorrência de censura informativa

seria a existência de um grupo de pacientes com tempos censurados por terem deixado o

estudo devido à agressividade do tratamento. A censura admitida neste trabalho foi a

não informativa.

A censura do tipo I ocorre quando o tempo para o término do estudo é fixado

antes do início e as observações que não apresentaram a falha até este instante são

censuradas. A censura do tipo II acontece quando uma quantidade de falhas a ser

observada é previamente fixada. Quando essa quantidade é atingida, o estudo acaba e as

observações que não falharam são ditas censuradas. O mecanismo de censura que

assume ocorrências aleatórias destes tempos parciais é conhecido como censura

aleatória. No caso de acompanhamento com pacientes até a morte por uma determinada

causa, por exemplo, uma mudança de endereço, a recusa de um paciente a continuar no

estudo, a morte por outro motivo que não seja o estudado ou mesmo a finalização do

estudo quando o indivíduo permanece vivo, levam a ocorrência de censuras aleatórias.

A Figura 01 ilustra os tipos de censura descritos. Em (a) ilustra-se a censura tipo

I, no qual é estabelecido um tempo final do estudo em 18 unidades de tempo. Em (b)

observa-se a censura do tipo II, onde o estudo acaba quando ocorre a n-ésima falha, e

Page 13: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

4

5 10 15 20

1

2

3

4

5

6

Tempo

Pac

ient

e

FalhaCensura

(c) Dados com censura aleatória

neste caso foi na 4ª falha. E em (c) tem-se a ilustração da censura aleatória, na qual o

indivíduo pode entrar e/ou sair do estudo em qualquer momento.

Figura 01: Ilustração dos mecanismos de censura (a) do tipo I, (b) do tipo II e (c) do

tipo aleatória.

2.1 FUNÇÃO DE SOBREVIVÊNCIA

Considere T uma variável contínua não-negativa, que representa o tempo até a

ocorrência do evento de interesse para um determinado indivíduo, com função de

densidade de probabilidade e função de distribuição acumulada . Define-se

5 10 15 20

1

2

3

4

5

6

Tempo

Pac

ient

e

FalhaCensura

(a) Dados com censura tipo I

5 10 15 20

1

2

3

4

5

6

Tempo

Pac

ient

e

FalhaCensura

(b) Dados com censura tipo II

Page 14: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

5

então a função de sobrevivência, denotada por como a probabilidade de T ser maior

que t:

é uma função monótona decrescente e representa a probabilidade do evento

de interesse não ocorrer em pelo menos t unidades de tempo. possui as seguintes

propriedades e .

No modelo de longa duração ou com fração de cura esta última propriedade é

violada e o limite não tende a zero, tornando a função de sobrevivência imprópria.

Uma função importante na Análise de Sobrevivência é a função risco (taxa de

falha) associada a T e denotada por é definida por:

sendo, e .

Algumas relações matemáticas entre as funções definidas acima podem ser

estabelecidas:

2.2 MODELO PARA CENSURA ALEATÓRIA

Considere um estudo com n indivíduos, cujo tempo de vida para o i-ésimo

individuo é e tempo de censura (à direita) é , sendo estas variáveis aleatórias

Page 15: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

6

independentes, para i=1, 2,..., n. De fato, é observada a variável ,

juntamente com a variável indicadora:

São consideradas as seguintes suposições:

e são independentes;

são independentes e identicamente distribuídos;

são independentes e identicamente distribuídos;

tem função de sobrevivência e função densidade de probabilidade

;

tem função de sobrevivência e função densidade de probabilidade .

A função de verossimilhança do parâmetro , associada à amostra observada de

, para i=1, 2, ..., n é dada por:

Para maximizar , aplica-se o logaritmo natural na função de

verossimilhança. Denota-se a função de log-verossimilhança por , que

fica da seguinte forma:

2.3 ANÁLISE PARAMÉTRICA

Em análise de sobrevivência o uso de modelos probabilísticos tem sido

amplamente utilizado na literatura. Os modelos exponencial, Weibull e log-normal se

Page 16: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

7

destacam por se adequarem a várias situações práticas comprovadamente, segundo

Colosimo e Giolo (2006). A seguir será apresentado o modelo Weibull importante no

desenvolvimento deste trabalho.

2.3.1 MODELO WEIBULL

A distribuição Weibull é frequentemente usada em estudos biomédicos e

industriais e foi proposta por Weibull (1939), citado por Colosimo e Giolo (2006). Essa

distribuição é bastante utilizada, pois possui diferentes formas e sua propriedade básica

é que a função risco é monótona, deste modo, ela crescente, decrescente ou constante.

Uma variável aleatória T com distribuição Weibull possui função densidade dada por:

em que ߛ, é o parâmetro de forma, e α, é o parâmetro de escala e ambos positivos. O

parâmetro ߛ não tem unidade de medida e α tem a mesma unidade que t.

A função de sobrevivência e a função risco são representadas por:

Os percentis da distribuição Weibull são dados por:

Page 17: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

8

Se , então possui distribuição valor extremo com

parâmetros µ e . E a função densidade de probabilidade é expressa da seguinte forma:

em que e . Quando µ=0 e σ=1 tem-se a distribuição valor extremo

padrão.

A Figura 02 apresenta as funções e para diferentes valores dos

parâmetros .

Figura 02: Exemplos da função densidade, da sobrevivência e do risco da distribuição

Weibull para diferentes valores dos parâmetros (훾, α), segundo Colosimo e Giolo

(2006).

0 200 400 600 800

0.00

0.01

0.02

0.03

0.04

log(tempo)

h(t)

(3,0;250)(4,0;350)(8,0;600)(1,0;150)(0,5;050)

0 200 400 600 800

0.0

0.2

0.4

0.6

0.8

1.0

1.2

log(tempo)

S(t)

(3,0;250)(4,0;350)(8,0;600)(1,0;150)(0,5;050)

0 200 400 600 800

0.00

00.

002

0.00

40.

006

log(tempo)

f(t)

(3,0;250)(4,0;350)(8,0;600)(1,0;150)(0,5;050)

Page 18: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

9

3 MODELOS DE LONGA DURAÇÃO

Na teoria de análise de sobrevivência usual, o pressuposto do modelo é que se o

indivíduo for acompanhado por um período suficiente de tempo, o evento de interesse

irá ocorrer. Contudo na prática pode ocorrer que a falha nunca seja observada, devido à

possibilidade do indivíduo ser imune ao evento (“curado”). Modelos que tratam de

dados de sobrevivência com estas características são chamados de modelos com fração

de cura ou modelos de longa duração. Entretanto, Maller e Zhou (1996) sugerem que o

tempo de acompanhamento deve ser suficientemente grande para ter indícios reais de

que existe uma fração de curados.

Nos modelos de longa duração é possível separar a população em dois grupos,

sendo um o grupo dos imunes e o outro o grupo dos suscetíveis. No grupo dos imunes

mesmo que o tempo do estudo seja infinito, nunca será observada a falha. Desta forma,

os indivíduos deste grupo sempre serão censurados ao fim do estudo e não será possível

diferenciá-los dos censurados no processo. Já o grupo dos suscetíveis é formado por

aqueles indivíduos que estão sob-risco de falha.

Se o tempo de acompanhamento for suficientemente grande, a característica que

indica a presença de uma fração de cura em um conjunto de dados é a ocorrência de um

alto percentual de censura à direita no fim do estudo, segundo Maller e Zhou (1996).

Graficamente, isto pode ser visto quando a curva de sobrevivência estimada pelo

Page 19: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

10

método de Kaplan e Meier (1958) se estabiliza em um ponto acima do zero por um

período de tempo razoável, segundo SILVA, 2013.

3.1 MODELO DE MISTURA PADRÃO

Os modelos de mistura padrão são modelos com fração de cura muito populares,

que foram inicialmente propostos por Boag (1949) e Berkson e Gage (1952) e são

descritos em detalhes em Maller e Zhou (1996). O modelo considera uma variável com

distribuição de Bernoulli para classificar o indivíduo em imune ou suscetível à

ocorrência do evento.

Assim, considere que associada a cada indivíduo existe uma variável aleatória

M, sendo:

em que, M assume uma distribuição Bernoulli com parâmetro , ou seja,

Considere que a população de indivíduos pode ser particionada de acordo com

esta variável M, em dois conjuntos: os imunes (M = 0) e os suscetíveis (M = 1),

conforme mostra o diagrama abaixo (Figura 03).

Figura 03: Diagrama de uma população com a presença de fração de cura

População

M=1

M=0

Page 20: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

11

É possível perceber que todos os indivíduos com M = 0, não estão sujeitos ao

evento. Então, assume-se que o tempo de sobrevivência é infinito. Portanto:

Assim, o modelo de mistura padrão consiste em uma mistura de distribuições, e

considera uma função de sobrevivência S(t) própria (isto é, ) para os

indivíduos suscetíveis ao evento de interesse (que estão sob risco de falha), e uma

função de sobrevivência dada por para os indivíduos que são

imunes ao evento.

A função de sobrevivência, função densidade e a função risco para a população

total (com e sem fração de cura), denotadas respectivamente por , ficam da

seguinte forma:

Page 21: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

12

em que e são, respectivamente, a função de sobrevivência e densidade do

modelo assumido para os indivíduos em risco, que neste trabalho será a distribuição

Weibull e corresponde a fração de curados. Consequentemente, é uma função

de sobrevivência imprópria, isto é:

3.2 FUNÇÃO DE VEROSSIMILHANÇA

Para maximizar a função de verossimilhança no modelo de mistura padrão, em

que é assumida a distribuição Weibull (훾, α) para os indivíduos suscetíveis, tem-se

que: é uma variável aleatória representando o tempo de vida do i-ésimo indivíduo

suscetível. Para i=1, 2,..., n considere que Zi ~ Weibull(훾, α) e representa o tempo de

vida populacional, sendo:

Page 22: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

13

em que Mi ~ Bernoulli(1-θi) e supõe-se que Mi e Zi são independentes. Considere ainda

que é o tempo de censura e Yi = min(Ti,Ci) é o tempo de sobrevivência observado e

denota-se a variável indicadora de falha representada por , como sendo:

Para tratar de populações heterogêneas com respeito à fração de cura, considere

também um vetor de covariáveis associados ao i-ésimo indivíduo

e X uma matriz n por (p+1) que contém esses

vetores:

, ,

O conjunto de dados observados fica da forma D = (n, Y, δ, X). As covariáveis

são incorporadas ao modelo através do parâmetro θ, que representa a fração de cura. Por

meio de uma relação sendo β o vetor de parâmetros de regressão

correspondente à . Dessa forma, para cada indivíduo i, i = 1, 2, ..., n tem-se uma

fração de cura associada. E a relação que geralmente é utilizada é a do modelo log-

logístico (ver por exemplo Maller e Zhou, 1996):

Page 23: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

14

Seja o vetor de parâmetros desconhecidos que será estimado.

Pode-se mostrar que o logaritmo da função de verossimilhança do modelo de mistura

padrão Weibull é dado por:

(3.1)

Para detalhes sobre a obtenção da função de verossimilhança consulte Guedes

(2011) e Carneiro (2012).

A estimação dos parâmetros é dada pela maximização da função 3.1, e como não

existe solução analítica, a maximização é obtida numericamente. O pacote gfcure

(PENG et al. 1998) utilizado no software R (R DEVELOPMENT CORE TEAM 2011)

apresenta solução para este e outros modelos de mistura padrão. Para maximizar a

função de verossimilhança este pacote adota uma combinação de um método livre de

derivadas (simulated annealing) e o método de Newton Raphson. Detalhes sobre o

procedimento numérico são encontrados em Peng et. al. (1998).

4 APLICAÇÃO

Page 24: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

15

Para a aplicação será utilizado um banco de dados que estuda o tempo até a

recidiva do câncer de mama em mulheres atendidas no Hospital Prof. Dr. Luiz Antônio

entre 1991 e 2004, em Natal - RN. Os dados contêm informações sobre n = 355

pacientes e foram estudados em Macedo e Valença (2009). Eles realizaram um estudo

retrospectivo, no qual foi analisado o prontuário de 485 pacientes com diagnóstico de

câncer de mama confirmado por meio de exame anátomo-patológico para identificar os

fatores que influenciam no tempo em que a paciente permanece livre da doença

(recidiva), após a cirurgia de retirada total ou parcial da mama. Foram desconsideradas

130 observações por não se enquadrarem nos critérios do estudo. Para cada paciente foi

contabilizado o tempo (em meses) entre a cirurgia (remissão), até o retorno da doença

(recidiva). O mecanismo de censura associado aos dados foi a censura aleatória

(mudança de endereço, fim do estudo sem apresentar a recidiva, etc) e não informativa.

Este estudo pretende analisar como as covariáveis que influenciam no tempo até

a recidiva da doença identificada por Macedo e Valença (2009) influenciam na

probabilidade da cura do câncer (não recidiva da doença).

Tabela 01: Resumo das medidas para o tempo até a recidiva de pacientes com câncer

de mama, segundo o tipo de observação – Natal/RN 1991 a 1995.

Tempos (em meses) Medidas descritivas

Geral Censurados Falha

Mínimo 2 4 2

1º Quartil 31 54 16

Mediana 70 86 30,5

Média 65,62 75,49 38,97

2º Quartil 95,5 99 60

Máximo 134 134 108

Na Tabela 01, observa-se que as medidas descritivas quando o tempo de censura

é analisado são mais altas que as dos tempos de falha. Por exemplo, a mediana para os

Page 25: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

16

0 20 40 60 80 100 120

0.0

0.2

0.4

0.6

0.8

1.0

Gráfico da curva de sobrevivência

Kaplan-Meier Câncer de mamaTempo

Sob

revi

vênc

ia

tempos de censura é de 86 meses, enquanto para os tempos de falha a mediana é 30,5

meses, o que corresponde a uma diferença de 55,5 meses.

Na Figura 04 abaixo, é apresentado o gráfico com a curva de sobrevivência

estimada pelo método não-paramétrico de Kaplan e Meier (1958), em que se pode

observar que a curva de sobrevivência se estabiliza em torno de 60%.

Figura 04: Gráfico da curva

de sobrevivência estimada pelo

método Kaplan e Meier (1958) para o tempo até a recidiva de pacientes com câncer de

mama – Natal/RN 1991 a 1995.

Os dados se caracterizam por apresentarem um alto percentual de censuras ao

fim do estudo, chegando a 73%. Como também, pode-se observar que a curva de

sobrevivência estimada pelo Kaplan e Meier (1958) não tende a zero, sendo assim é

razoável pensar que algumas mulheres não terão a recidiva da doença. Portanto, será

estimada a fração de cura nesse conjunto de dados. Para estimar a fração de cura foi

ajustado um modelo de mistura padrão aos dados, e para os tempos até a recidiva foi

utilizado o modelo Weibull. A estimativa encontrada para a fração de cura considerando

a população homogênea foi de 56,3%, ou seja, estima-se que aproximadamente 56%

das mulheres não iram apresentar a recidiva do câncer de mama.

Agora, serão descritas as covariáveis que foram selecionadas através de método

gráfico para ser incluída na fração de cura que selecionou duas covariáveis e a interação

Page 26: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

17

não foi significante, porém será omitido o processo de seleção por não ser objeto de

estudo desta monografia. Mais informações sobre as demais covariáveis pode ser

encontrado em Macedo e Valença (2009). Ao incluir as covariáveis no estudo, os dados

não estão mais sendo considerados homogêneos. Sendo assim, será possível determinar

diferentes frações de cura para cada grupo formado. As covariáveis consideradas são

PLC e TNC, descritos abaixo:

PLC: Proporção de Linfonodos Comprometidos, essa covariável é um fator

constituído de três categorias, sendo elas: Grupo 0: 0% de Linfonodos comprometidos;

Grupo 1: 0 a 50% de Linfonodos comprometidos e Grupo 2: mais de 50% de

Linfonodos comprometidos. A proporção de linfonodos comprometidos foi obtida

fazendo a razão entre número de linfonodos comprometidos (metástase) pelo número de

linfonodos ressecados.

TNC: Tipo de Tratamento não cirúrgico, que também é fator com duas

categorias, sendo elas: REF: Tratamento com hormonioterapia e TNC1: Tratamento

sem hormonioterapia.

Para incluir as covariáveis na fração de cura foram criadas as seguintes variáveis

indicadoras:

Tabela 02: Variáveis indicadoras criadas para a covariável Proporção de linfonodos

comprometidos.

Variáveis indicadoras PLC

PLC1 PLC2

0% 0 0

De 0% até 50% 1 0

Maior que 50% 0 1

Tabela 03: Variáveis indicadoras criadas para a covariável Tipo de tratamento não

cirúrgico.

TNC Variável indicadora

Page 27: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

18

0 20 40 60 80 100 120

0.0

0.2

0.4

0.6

0.8

1.0

(b) Gráfico das curvas de sobrevivência, segundo a proporção de linfonodos comprometidos

Tempo

Sob

revi

vênc

ia

Grupo 0Grupo 1Grupo 2

0 20 40 60 80 100 120

0.0

0.2

0.4

0.6

0.8

1.0

(a) Gráfico das curvas de sobrevivência, segundo o tipo de tratamento não cirúrgico

Tempo

Sob

revi

vênc

ia

REFTNC1

TNC1

Com hormonioterapia 0

Sem hormonioterapia 1

A Figura 05 mostra a curva de sobrevivência segundo as covariáveis

consideradas no estudo. Pode-se perceber que os níveis dos fatores diferem.

Figura 05: Curvas de sobrevivência segundo o tipo de tratamento não cirúrgico e a

proporção de linfonodos comprometidos para o tempo até a recidiva de pacientes com

câncer de mama – Natal/RN 1991 a 1995.

No gráfico (a) da Figura 05, o nível REF corresponde ao tratamento com

hormonioterapia e o nível TNC1 se refere ao tratamento sem hormonioterapia. Já no

gráfico (b), o Grupo 0 representa uma proporção de 0% de linfonodos comprometidos;

o Grupo 1 corresponde à proporção maior que 0% chegando até 50% de linfonodos

comprometidos, enquanto o Grupo 2 equivale à proporção acima de 50% dos

linfonodos comprometidos. Na Tabela 04 é possível encontrar as estimativas das frações de cura para os

grupos formados pela combinação das covariáveis. Essas estimativas foram obtidas

através do pacote gfcure utilizado no software R. Os comandos usados para obtenção

das estimativas são dados no Apêndice A.

Page 28: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

19

Tabela 04: Fração de cura estimada para o tempo até a recidiva de pacientes com

câncer de mama, segundo o Tratamento não cirúrgico e a Proporção de linfonodos

comprometidos – Natal/RN 1991 a 1995.

PLC TNC

0% 0% - 50% > 50%

Com hormonioterapia 0,78 0,633 0,075

Sem hormonioterapia 0,241 0,133 0,007

Observa-se na Tabela 04, que as mulheres que fazem o tratamento não cirúrgico

com hormonioterapia apresentam uma fração de cura que se destaca consideravelmente

das que fazem o tratamento sem a hormonioterapia, para qualquer nível da covariável

proporção de linfonodos comprometidos. É possível perceber também que quanto

menor a proporção de linfonodos comprometidos maior é a fração de cura. O grupo que

se destacou com a maior fração de cura foi o das mulheres que fizeram o tratamento

com hormonioterapia e apresentaram uma proporção de linfonodos comprometidos de

0%, ou seja, de todos os linfonodo ressecados nenhum apresentava metástase.

Page 29: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

20

5 CONSIDERAÇÕES FINAIS

Neste trabalho foram apresentados brevemente os principais conceitos em

análise de sobrevivência. Bem como uma nova abordagem nesta área de conhecimento

que incorpora uma fração de cura. Estes modelos descrevem a população de forma mais

realística que os modelos de sobrevivência usuais, visto que o indivíduo pode se curar e

nunca apresentar o evento de interesse, ou seja, incorpora a possibilidade de cura. Dessa

forma, esses modelos se mostram mais convenientes e condizentes com a realidade.

Foi apresentada brevemente a caracterização do modelo de longa duração em

análise de sobrevivência, através do modelo de mistura padrão que considera uma

variável Bernoulli para classificar os indivíduos em curados e não curados.

O modelo foi aplicado ao conjunto de dados real que estuda o tempo até a

recidiva do câncer de mama, caracterizado por uma grande proporção de censuras ao

fim do estudo. Indicando assim a presença de uma fração de cura na população. Para a

estimação dos parâmetros foi considerada a distribuição Weibull para modelar os

tempos de sobrevivência dos indivíduos em risco, assumindo censura à direita, aleatória

e não informativa. Os resultados expostos foram obtidos com a utilização do software

livre R (R DEVELOPMENT CORE TEAM, 2011).

A fração de cura foi estimada incluindo duas covariáveis, sendo elas: a

proporção de linfonodos comprometidos e o tipo de tratamento não cirúrgico. O grupo

que apresentou maior fração de cura foi das mulheres que tinham 0% de linfonodos em

metástase e realizou o tratamento com hormonioterapia. Em contrapartida, as mulheres

que apresentaram mais de 50% de linfonodos comprometidos e realizaram o tratamento

sem hormonioterapia apresentaram a menor fração de cura.

Como pesquisa futura seria interessante pensar no estudo de modelos de mistura

padrão com a inclusão de covariáveis associadas também aos parâmetros da distribuição

Weibull. Visto que existem diversos modelos com fração de cura, sugere-se o estudo de

outros modelos com fração de cura, bem como estudar diagnósticos em modelos com

fração de cura.

Page 30: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

21

REFERÊNCIAS

BERKSON, J. e GAGE, R. P. The likelihood ratio, Wald, and Lagrange multiplier tests: an expository note. Journal of the American Statistical Association. 1952, p.501-515. BOAG, J. W. Maximum likelihhod estimates of the proportion of patients cured by cancer therapy. Journal of the Royal Statistical Society. 1949, p. 15-53. BOLFARINE, Heleno; SANDOVAL, Mônica Carneiro. Introdução à inferência estatística. 2ª ed. Rio de Janeiro: SBM, 2010. (coleção Matemática aplicada). CALSAVARA, Vinícius Fernando. Modelo de sobrevivência com fração de cura usando um termo de fragilidade e tempo de vida Weibull modificada. Dissertação (Mestrado) - Universidade Federal de São Carlos. São Carlos, 2011. CARNEIRO, Hérica Priscila de Araújo. Testes de Hipóteses em Modelos de Sobrevivência com Fração de Cura. Dissertação (Mestrado) - Universidade Federal do Rio Grande do Norte. Natal, 2012. CARVALHO, Marília Sá, Andreozzi, Valeska Lima, CODEÇO, Cláudia Torres, BARBOSA, M.T.S., SHIMAKURA, Silvia Emiko. Análise de sobrevida: Teoria e aplicações em saúde. Rio de Janeiro: Editora Fiocruz, 2005. COLOSIMO, Enrico Antônio; GIOLO, Suely Ruiz. Análise de sobrevivência aplicada. São Paulo, SP: E. Bücher, 2006. GOUVEIA, Bruno Pauka. Modelo de mistura padrão com tempos de vida exponenciais ponderados. Dissertação (Mestrado) - Universidade Federal de São Carlos. São Carlos, 2010. GUEDES, Alysson Lívio Vasconcelos. Modelo de Tempo de Falha Acelerado com Fração de Cura: Uma abordagem unificada. Dissertação (Mestrado) - Universidade Federal do Rio Grande do Norte. Natal, 2011.

Page 31: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

22

KAPLAN, E. L.; MEIER, P. Noparametris estimation from incomplete observations. Journal of the American Statistical Association. p. 457-481, 1958. MACEDO, C.P.C.; VALENÇA, D.M.. Aplicação do Modelo de Cox Para Identificar Fatores de Risco em Pacientes com Câncer de Mama. Revista Brasileira de Estatística, 2009. MALLER, Ross A; ZHOU, Xian. Survival analysis with long-term survivors. Chichester Inglaterra: Wiley, c1996. 278 p. (Wiley Series in Probability and Statistics). PENG, Y., DEAR, K.B.G. and DENHAM, J. W. A generalized F mixture model for cure rate estimation. Statistics in Medicine 17, p. 813—830, 1998. R Development Core Team (2011). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL http://www.R-project.org/. SILVA, Rumenick Pereira da. Modelo gama generalizado com longa duração: teoria e prática. Biblioteca Digital de Monografia da UFRN, 2013. VALENÇA, Dione Maria. Análise de Sobrevivência. Natal-RN: Departamento de

Estatística da UFRN, 2013. (Notas de aula).

Page 32: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

23

APÊNDICE A – Aspectos computacionais

Neste Capítulo são apresentados os comandos utilizados no programa R para

elaboração dos gráficos e para as análises estatísticas. Para estimação dos parâmetros

foi utilizado o pacote gfcure que maximiza a função de verossimilhança do modelo com

fração de cura. O pacote gfcure pode ser baixado no site

http://www.math.mun.ca/~ypeng/research/, que é o site do autor Yingwei Peng. E em

seguida deve ser instalado no software R. Deve-se ter atenção, pois o pacote só funciona

em algumas versões do software. Foi utilizada para este trabalho a versão R 2.13.0.

### Exemplo tipos de censura

# Tipo I

plot(c(0.8,5,10,15,20),c(1,2,4,6,5),type="n", bty="l",

xlab="Tempo", las=1, ylab="Paciente", cex.axis=1.5,

cex.lab=1.5)

segments(c(0,0,0,0,0,0), c(1,2,3,4,5,6),

c(7,18,18,10,18,15), c(1,2,3,4,5,6))

points(c(7,18,10,15,18,18), c(1,3,4,6,2,5),

pch=c(16,1,16,16,16,1), cex=1.5)

legend(13, 4.5, c("Falha","Censura") , pch=c(16,1),

cex=1.5)

title("(a) Dados com censura tipo I")

# Tipo II

plot(c(0.8,5,10,15,20), c(1,2,4,6,5), type="n", bty="l",

xlab="Tempo", las=1, ylab="Paciente", cex.axis=1.5,

cex.lab=1.5)

segments(c(0,0,0,0,0,0), c(1,2,3,4,5,6),

c(18,15,9,20,13,20), c(1,2,3,4,5,6))

Page 33: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

24

points(c(20,15,9,20,13,20), c(1,2,3,4,5,6),

pch=c(16,16,16,1,16,1), cex=1.5)

legend(13, 3.7, c("Falha","Censura"), pch=c(16,1),

cex=1.5)

title("(b) Dados com censura tipo II")

# Aleatório

plot(c(0.8,5,10,15,20), c(1,2,4,6,5), type="n", bty="l",

xlab="Tempo", las=1, ylab="Paciente", cex.axis=1.5,

cex.lab=1.5)

segments(c(0,0,2,0,7,0), c(1,2,3,4,5,6),

c(6,18,13,10,18,15), c(1,2,3,4,5,6))

points(c(6,18,13,10,18,15), c(1,2,3,4,5,6),

pch=c(16,1,16,1,1,16), cex=1.5)

legend(13, 4.5, c("Falha","Censura"), pch=c(16,1),

cex=1.5)

title("(c) Dados com censura aleatória")

##Densidade, Sobrevivência e risco da log-normal

par(mfrow=c(1,3))

stln = function(t) pnorm( (-log(t)+mi)/sig )

mi = 0; sig = 0.5; curve(stln, ylim=c(0,1), xlim=c(0,4),

col=1, bty="l", xlab="log(tempo)",ylab="S(t)")

mi = 0; sig = 0.7;

curve(stln,ylim=c(0,1),xlim=c(0,4),col=2,add=T)

mi = 0; sig = 1.5;

curve(stln,ylim=c(0,1),xlim=c(0,4),col=3,add=T)

mi = 1; sig = 0.7;

curve(stln,ylim=c(0,1),xlim=c(0,4),col=4,add=T)

mi = 1; sig = 2;

curve(stln,ylim=c(0,1),xlim=c(0,4),col=6,add=T)

legend(3, 0.8, c("(0; 0,5)","(0; 0,7)","(0; 1,5)","(1;

0,7)","(1; 2,0)"), lty=1, col=c(1,2,3,4,6), cex=1.2)

Page 34: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

25

denln = function(t) (1/(sqrt(2*pi)*t*sig))*exp(-

0.5*(((log(t)-mi)/sig)^2))

mi = 0; sig = 0.5; curve(denln, ylim=c(0,1), xlim=c(0,4),

col=1, bty="l", xlab="log(tempo)", ylab="f(t)")

mi = 0; sig = 0.7; curve(denln, col=2, add=T, ylim=c(0,1),

xlim=c(0,4))

mi = 0 ;sig = 1.5

;curve(denln,col=3,add=T,ylim=c(0,1),xlim=c(0,4))

mi = 1 ;sig = 0.7 ;curve(denln,col=4,add=T)

mi = 1 ;sig = 2 ;curve(denln,col=6,add=T)

legend(3,0.8,c("(0; 0,5)","(0; 0,7)","(0; 1,5)","(1;

0,7)","(1; 2,0)"), lty=1, col=c(1,2,3,4,6),cex=1.2)

risln = function(t) ((1/(sqrt(2*pi)*t*sig))*exp(-

0.5*(((log(t)-mi)/sig)^2)))/(pnorm( (-log(t)+mi)/sig ))

mi = 0 ;sig = 0.5

;curve(risln,ylim=c(0,2.5),xlim=c(0,4),col=1,bty="l",

xlab="log(tempo)",ylab="h(t)")

mi = 0 ;sig = 0.7 ;curve(risln,col=2,add=T)

mi = 0 ;sig = 1.5 ;curve(risln,col=3,add=T)

mi = 1 ;sig = 0.7 ;curve(risln,col=4,add=T)

mi = 1 ;sig = 2 ;curve(risln,col=6,add=T)

legend(3,2.5,c("(0; 0,5)","(0; 0,7)","(0; 1,5)","(1;

0,7)","(1; 2,0)"), lty=1, col=c(1,2,3,4,6),cex=1.2)

# Importação de dados

mama<-read.table("mama.csv",header=T,sep=",",dec=",")

summary(mama) #Percentual de censura 73%

# Carregando o pacote para análise de sobrevivência

require(survival)

# Transformando em fatores

attach(mama)

Page 35: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

26

mama$PLC2 <-factor(PLC2,labels=c("REF","PLC2.1","PLC2.2"))

PLC2 <-factor(PLC2,labels=c("REF","PLC2.1","PLC2.2"))

PLC2 <-C(PLC2,treatment)

contrasts(PLC2) # mosta as variáveis dummy criadas para os

fatores

mama$TNCRRR <-factor(TNCRRR,labels=c("REF","TNC1"))

TNCRRR <-factor(TNCRRR,labels=c("REF","TNC1"))

TNCRRR <-C(TNCRRR,treatment)

contrasts(TNCRRR) # mosta as variáveis dummy criadas para

os fatores

#censura=0; óbito=1

summary(mama$TEMPO)

summary(mama$TEMPO[mama$CENS==0])

summary(mama$TEMPO[mama$CENS==1])

# Kaplan-Meier

skm=survfit(Surv(TEMPO,CENS)~1,data=mama,conf.type='none')

plot(skm,xlab="Tempo", ylab="Sobrevivência",main="Gráfico

da curva de sobrevivência", sub="Kaplan-Meier Câncer de

mama")

# Carregando o pacote gfcure, para análise de

sobrevivência com fração de cura

attach("E:\\Talita\\gfcure\\gfcure\\.RData")

load.gfcure("E:\\Talita\\gfcure\\gfcure")

#### Modelo de mistura padrão sem covariáveis

# Ajuste usando o gfcure

mod=gfcure(Surv(TEMPO,CENS) ~ 1, cureform=~1,

data=mama, dist="weibull")

Page 36: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

27

mod # Fracao de cura = 0.563

summary(mod)

## Kaplan-Meier segundo as covariáveis

# Segundo o tipo de tratamento nao cirurgico (TNCRRR)

skm=survfit(Surv(TEMPO,CENS)~mama$TNCRRR)

plot(skm,xlab="Tempo", ylab="Sobrevivência",main="(a)

Gráfico das curvas de sobrevivência, segundo o \ntipo de

tratamento não cirúrgico",

col=1:2,cex.axis=1.5,cex.lab=1.5, cex.main=1.5)

legend(9,0.35,c("REF","TNC1") ,col=1:2,lty=1,cex=1.5)

# Segundo a proporcao de linfonodo comprometido (PLC2)

skm=survfit(Surv(TEMPO,CENS)~mama$PLC2)

plot(skm,xlab="Tempo", ylab="Sobrevivência",main="(b)

Gráfico das curvas de sobrevivência, segundo a \nproporção

de linfonodos comprometidos",

col=1:3,cex.axis=1.5,cex.lab=1.5, cex.main=1.5)

legend(5,0.3,c("Grupo 0","Grupo 1","Grupo 2")

,col=1:3,lty=1,cex=1.5)

### Incluindo covariáveis na fração de cura

mod2=gfcure(Surv(TEMPO,CENS) ~ 1, cureform=~PLC2+TNCRRR,

data=mama, dist="weibull")

mod2

summary(mod2)

##Estimando a fração de cura

xb = c(mod2$coef[3] + mod2$coef[4]*0 + mod2$coef[5]*0 +

mod2$coef[6]*0,

mod2$coef[3] + mod2$coef[4]*0 + mod2$coef[5]*0 +

mod2$coef[6]*1,

mod2$coef[3] + mod2$coef[4]*1 + mod2$coef[5]*0 +

mod2$coef[6]*0,

Page 37: Uma Introdução à Análise de Sobrevivência com Fração de Cura · A análise de sobrevivência é formada por um conjunto de técnicas estatísticas para analisar dados, que

28

mod2$coef[3] + mod2$coef[4]*1 + mod2$coef[5]*0 +

mod2$coef[6]*1,

mod2$coef[3] + mod2$coef[4]*0 + mod2$coef[5]*1 +

mod2$coef[6]*0,

mod2$coef[3] + mod2$coef[4]*0 + mod2$coef[5]*1 +

mod2$coef[6]*1)

teta = exp(xb)/( 1+exp(xb) )