
Como analisar os dados da PNAD Contínua?

em 27 de Novembro de 2024
Em estudos de sobrevida, as pessoas são acompanhadas por meio da ocorrência de um evento. Esse evento pode ser, por exemplo, o diagnóstico da doença, ou a realização de cirurgia, ou o nascimento. Geralmente, as pessoas são incluídas no estudo em diferentes tempos do ano calendário; porém, na análise, todos os indivíduos têm seu tempo de sobrevivência contado a partir da entrada no estudo (que é considerado como tempo zero). Os inícios são, portanto, truncados à esquerda, ou seja, a observação de cada indivíduo começa a partir de determinado momento, sem levar em conta o que aconteceu no passado (Cox & Oakes, 1984). O evento final corresponde geralmente ao óbito, ou à variação de um parâmetro biológico, ou ainda a um determinado evento que indique a modificação do estado inicial (cura, recorrência, retorno ao trabalho etc.). O evento final é denominado falha (failure), por referir-se mais freqüentemente a eventos indesejáveis como o aparecimento de doença ou morte (Kleinbaum, 1995).
Em estudos em que há seguimento, pode ocorrer que alguns indivíduos não sejam observados até a ocorrência da falha, ou seja, tenham seu tempo de observação incompleto. Esse tipo de perda no tempo de observação é denominado censura. Isso pode ocorrer quando os indivíduos permanecem sem mudança de estado ao término do estudo, ou falecem por causas não relacionadas com a doença de interesse, ou abandonam o estudo, ou fogem à observação. Por vezes, a cura e/ou recuperação também podem ser consideradas como censura na observação. Os estudos em que existe censura são denominados com observações incompletas. Uma suposição importante é a de que os indivíduos censurados em determinado tempo t são representativos de todos os indivíduos que estavam sujeitos ao risco de ter falha em t (Szklo & Nieto, 2000).
A análise de sobrevida é importante quando o tempo entre exposição e evento é de interesse clínico.Para doenças altamente letais, como o câncer metastático, pode-se avaliar, por exemplo se um subgrupo submetido a um novo tratamento pode ter vantagem de sobrevida nos primeiros três anos, mas mortalidade semelhante após cinco anos., sendo que a comparação da mortalidade no final do período não discrimina entre tempos de sobrevida mais longos e mais curtos (Ferreira & Patino, 2016).
Na análise de sobrevida, os parâmetros mais importantes são a probabilidade de sobrevivência no curso de cada um dos intervalos considerados e a probabilidade de sobrevida acumulada (tratada correntemente como taxa de sobrevida), isto é, a probabilidade de sobreviver do tempo zero até o tempo final considerado. Esta última equivale à probabilidade de sobreviver em todos os intervalos anteriores ao momento considerado e, usualmente, é denominada S(t) (Teixeira et al., 2002).
A estimativa da probabilidade de sobrevida é, com certeza, mais válida e mais precisa para o período inicial do seguimento, no qual estão disponíveis informações sobre a maioria dos pacientes. Nos períodos posteriores, as informações podem ficar limitadas devido às perdas de seguimento e ao pequeno número de eventos (Fletcher et al., 1996). Somente nas décadas de 1950 e de 1960 apareceram as primeiras propostas de estimadores das probabilidades de sobrevida que incorporavam a censura, vale dizer, modelos para observações incompletas. As principais técnicas são o método atuarial e o método do produto-limite de Kaplan-Meier (Teixeira et al., 2002; Ferreira & Patino, 2016).
Assim o método mais utilizado hoje é Kapla-Meier. Na análise de sobrevida pelo método de Kaplan-Meier (Kaplan & Meier, 1958; Lee, 1992; Kleinbaum, 1995) os intervalos de tempo não são fixos, mas determinados pelo aparecimento de uma falha (por exemplo, o óbito). Nessa situação, o número de óbitos em cada intervalo deve ser um. Esse é um método não paramétrico, ou seja, que independe da distribuição de probabilidade (Colton, 1979), e para calcular os estimadores, primeiramente, deve-se ordenar os tempos de sobrevida em ordem crescente (Teixeira et al., 2002).
Assim, os sobreviventes ao tempo t (lt) são ajustados pela censura, ou seja, os pacientes censurados entram no cálculo da função de probabilidade de sobrevida acumulada até o momento de serem considerados como perda. Isto propicia o uso mais eficiente das informações disponíveis (Szklo & Nieto, 2000).
Esse Artigo é uma síntese dos trabalhos lsitados nas referências, previamente publicados. Para mais informações entrar em contato ou consultar as obras.
REFERÊNCIAS
COLTON, T., 1979. Statistica in Medicine. Padova: Piccin Editore.
COX, D. R., 1972. Regression models and life tables (with discussion). Journal of the Royal Statistical Society: Series B, 34:187-220.
Ferreira, J. C., & Patino, C. M. (2016). O que é análise de sobrevida e quando devo utilizá-la?. Jornal Brasileiro de Pneumologia, 42(1), 77-77.
KAPLAN, E. L. & MEIER, P., 1958. Non parametric estimation from incomplete observation. Journal of the American Statistics Association, 53:457-481.
KLEINBAUM, D. G., 1995. Survival Analysis: A Self-Learning Text. New York: Springer.
LEE, E. T., 1992. Statistical Methods for Survival Data Analysis. 2nd Ed. New York: John Wiley & Sons.
SZKLO, M. & NIETO, F. J., 2000. Epidemiology: Beyond the Basics. Annapolis: Aspen Publishers
TEIXEIRA, M. T. B.; FAERSTEIN, E.; LATORRE, M. . R.. Técnicas de análise de sobrevida. Cad. Saúde Pública, Rio de Janeiro , v. 18, n. 3, p. 579-594, June 2002.