Modeling the cumulative incidence function of clustered competing risks data : a multinomial GLMM approach

Laureano, Henrique Aparecido, 1993-

dc.contributor.advisor	Bonat, Wagner Hugo, 1985-	pt_BR
dc.contributor.author	Laureano, Henrique Aparecido, 1993-	pt_BR
dc.contributor.other	Ribeiro Junior, Paulo Justiniano, 1967-	pt_BR
dc.contributor.other	Universidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Métodos Numéricos em Engenharia	pt_BR
dc.date.accessioned	2022-03-30T18:06:51Z
dc.date.available	2022-03-30T18:06:51Z
dc.date.issued	2021	pt_BR
dc.identifier.uri	https://hdl.handle.net/1884/73131
dc.description	Orientador: Prof. PhD Wagner Hugo Bonat	pt_BR
dc.description	Coorientador: Prof. PhD Paulo Justiniano Ribeiro Jr.	pt_BR
dc.description	Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Tecnologia, Programa de Pós-Graduação em Métodos Numéricos em Engenharia. Defesa : Curitiba, 03/09/2021	pt_BR
dc.description	Inclui referências: p. 75-79	pt_BR
dc.description	Área de concentração: Programação Matemática: Métodos Estatísticos	pt_BR
dc.description.abstract	Resumo: Dados de riscos competitivos agrupados são um caso especial de dados de tempo de falha. Além da estrutura de grupo que implica uma dependência latente intra-grupo entre seus elementos, esse tipo de dado é caracterizado por 1) múltiplas causas/variáveis competindo para ser a responsável pela ocorrência de um evento, uma falha; e 2) censura, quando o evento de interesse não ocorre no período de estudo, ou ocorre por uma diferente causa. Para lidar com este tipo de dado, propomos um modelo linear generalizado misto (GLMM), ou seja, um modelo de efeitos latentes/aleatórios, em vez de um modelo de sobrevivência usual. Em análise de sobrevivência, a modelagem é usualmente feita por meio da taxa de risco, e a acomodação da dependência intra-grupo acaba por gerar uma complicada função de verossimilhança, às vezes intratável. Nós, por outro lado, modelamos as causas competidoras agrupadas na escala da probabilidada, por meio da função de incidência acumulada (CIF, em inglês) de cada causa competidora. Em nossa modelagem, supomos uma distribuição de probabilidade multinomial para as causas competidoras e censura, condicionado aos efeitos latentes. Os efeitos latentes são acomodados por meio de uma distribuição Gaussiana multivariada e são modelados via os parâmetros de sua matriz de covariância. As distribuições de probabilidade são conectadas por meio da CIF, modeladas aqui seguindo a especificação em Cederkvist et al. (2019), com base em sua decomposição como o produto de uma função de nível de risco instantâneo com uma função de nível de tempo de trajetória. Os efeitos latentes são inseridos nestas funções. Para tornar a estimativa dos parâmetros do modelo o mais eficiente possível, usamos o template model builder (TMB) (KRISTENSEN et al., 2016). Com este pacote R (R Core Team, 2021), temos 1) a função de log-verossimilhança escrita em C++; 2) acesso a eficientes bibliotecas de álgebra linear; 3) implementação eficiente da aproximação de Laplace para os efeitos latentes; e 4) uma rotina computacional de diferenciação automática, o estado da arte em computação de derivadas. Para verificar a performance do modelo foi realizado um amplo estudo de simulação, baseado em diferentes formulações de estruturas latentes, com o objetivo de verificar qual delas é a mais adequada a um cenário real. O modelo se apresenta de difícil estimatição, com nossos resultados convergindo para uma estrutura latente onde os níveis de risco e de trajetória estão correlacionados. Os menores vieses nas estimativas dos paramêtros são encontrados nos cenários de CIF alta, mas com uma excessiva variablidade, mostrando que melhorias são necessárias.	pt_BR
dc.description.abstract	Abstract: Clustered competing risks data is a special case of failure time data. Besides the cluster structure which implies a latent within-cluster dependence between its elements, this kind of data is characterized by 1) multiple causes/variables competing to be the one responsible for the occurrence of an event, a failure; and 2) censorship, when the event of interest does not happen in the study period, or it happens by a different cause. To handle this type of data, we propose a generalized linear mixed model (GLMM) i.e., a latent-effects framework, instead of a usual survival model. In survival analysis, the modeling is usually done by means of the hazard rate, and the within-cluster dependence accommodation ends by generating a complicated likelihood function, sometimes intractable. We, on the other hand, model the clustered competing causes in the probability scale, in terms of the cumulative incidence function (CIF) of each competing cause. In our framework, we suppose a multinomial probability distribution for the competing causes and censorship, conditioned on the latent effects. The latent effects are accommodated via a multivariate Gaussian distribution and are modeled by the parameters of its covariance matrix. The probability distributions are connected via CIF, modeled here following Cederkvist et al. (2019) specification, based on its decomposition as the product of an instantaneous risk level function with a trajectory time level function. The latent effects are inserted in both functions. To make the model parameters estimation the most efficient as possible, we use the template model builder (TMB) (KRISTENSEN et al., 2016). With this R (R Core Team, 2021) package, we have 1) the log-likelihood function written in C++; 2) access to efficient linear algebra libraries; 3) efficient Laplace approximation implementation for the latent-effects; and 4) an automatic differentiation (AD) routine, the state-of-the-art in derivatives computation. To check the model performance a large simulation study is performed, based on different latent structure formulations, with the aim to verify which one is the most adequate to real scenarios. The model presents to be of difficult estimation, with our results converging to a latent structure where the risk and trajectory time levels are correlated. The smallest parameter estimates biases are found in scenarios with high CIF, but the estimates present an excessive variance, showing that improvements are necessary.	pt_BR
dc.format.extent	1 arquivo (101 p.) : PDF.	pt_BR
dc.format.mimetype	application/pdf	pt_BR
dc.language	Inglês	pt_BR
dc.subject	Métodos numéricos	pt_BR
dc.subject	Estatistica	pt_BR
dc.subject	Análise Numérica	pt_BR
dc.title	Modeling the cumulative incidence function of clustered competing risks data : a multinomial GLMM approach	pt_BR
dc.type	Dissertação Digital	pt_BR

Arquivos deste item

Nome:: R - D - HENRIQUE APARECIDO ...
Tamanho:: 1.842Mb
Formato:: PDF

Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

Dissertações [103]

Mostrar registro simples