Mostrar registro simples

dc.contributor.advisorBonat, Wagner Hugo, 1985-pt_BR
dc.contributor.authorLaureano, Henrique Aparecido, 1993-pt_BR
dc.contributor.otherRibeiro Junior, Paulo Justiniano, 1967-pt_BR
dc.contributor.otherUniversidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Métodos Numéricos em Engenhariapt_BR
dc.date.accessioned2022-03-30T18:06:51Z
dc.date.available2022-03-30T18:06:51Z
dc.date.issued2021pt_BR
dc.identifier.urihttps://hdl.handle.net/1884/73131
dc.descriptionOrientador: Prof. PhD Wagner Hugo Bonatpt_BR
dc.descriptionCoorientador: Prof. PhD Paulo Justiniano Ribeiro Jr.pt_BR
dc.descriptionDissertação (mestrado) - Universidade Federal do Paraná, Setor de Tecnologia, Programa de Pós-Graduação em Métodos Numéricos em Engenharia. Defesa : Curitiba, 03/09/2021pt_BR
dc.descriptionInclui referências: p. 75-79pt_BR
dc.descriptionÁrea de concentração: Programação Matemática: Métodos Estatísticospt_BR
dc.description.abstractResumo: Dados de riscos competitivos agrupados são um caso especial de dados de tempo de falha. Além da estrutura de grupo que implica uma dependência latente intra-grupo entre seus elementos, esse tipo de dado é caracterizado por 1) múltiplas causas/variáveis competindo para ser a responsável pela ocorrência de um evento, uma falha; e 2) censura, quando o evento de interesse não ocorre no período de estudo, ou ocorre por uma diferente causa. Para lidar com este tipo de dado, propomos um modelo linear generalizado misto (GLMM), ou seja, um modelo de efeitos latentes/aleatórios, em vez de um modelo de sobrevivência usual. Em análise de sobrevivência, a modelagem é usualmente feita por meio da taxa de risco, e a acomodação da dependência intra-grupo acaba por gerar uma complicada função de verossimilhança, às vezes intratável. Nós, por outro lado, modelamos as causas competidoras agrupadas na escala da probabilidada, por meio da função de incidência acumulada (CIF, em inglês) de cada causa competidora. Em nossa modelagem, supomos uma distribuição de probabilidade multinomial para as causas competidoras e censura, condicionado aos efeitos latentes. Os efeitos latentes são acomodados por meio de uma distribuição Gaussiana multivariada e são modelados via os parâmetros de sua matriz de covariância. As distribuições de probabilidade são conectadas por meio da CIF, modeladas aqui seguindo a especificação em Cederkvist et al. (2019), com base em sua decomposição como o produto de uma função de nível de risco instantâneo com uma função de nível de tempo de trajetória. Os efeitos latentes são inseridos nestas funções. Para tornar a estimativa dos parâmetros do modelo o mais eficiente possível, usamos o template model builder (TMB) (KRISTENSEN et al., 2016). Com este pacote R (R Core Team, 2021), temos 1) a função de log-verossimilhança escrita em C++; 2) acesso a eficientes bibliotecas de álgebra linear; 3) implementação eficiente da aproximação de Laplace para os efeitos latentes; e 4) uma rotina computacional de diferenciação automática, o estado da arte em computação de derivadas. Para verificar a performance do modelo foi realizado um amplo estudo de simulação, baseado em diferentes formulações de estruturas latentes, com o objetivo de verificar qual delas é a mais adequada a um cenário real. O modelo se apresenta de difícil estimatição, com nossos resultados convergindo para uma estrutura latente onde os níveis de risco e de trajetória estão correlacionados. Os menores vieses nas estimativas dos paramêtros são encontrados nos cenários de CIF alta, mas com uma excessiva variablidade, mostrando que melhorias são necessárias.pt_BR
dc.description.abstractAbstract: Clustered competing risks data is a special case of failure time data. Besides the cluster structure which implies a latent within-cluster dependence between its elements, this kind of data is characterized by 1) multiple causes/variables competing to be the one responsible for the occurrence of an event, a failure; and 2) censorship, when the event of interest does not happen in the study period, or it happens by a different cause. To handle this type of data, we propose a generalized linear mixed model (GLMM) i.e., a latent-effects framework, instead of a usual survival model. In survival analysis, the modeling is usually done by means of the hazard rate, and the within-cluster dependence accommodation ends by generating a complicated likelihood function, sometimes intractable. We, on the other hand, model the clustered competing causes in the probability scale, in terms of the cumulative incidence function (CIF) of each competing cause. In our framework, we suppose a multinomial probability distribution for the competing causes and censorship, conditioned on the latent effects. The latent effects are accommodated via a multivariate Gaussian distribution and are modeled by the parameters of its covariance matrix. The probability distributions are connected via CIF, modeled here following Cederkvist et al. (2019) specification, based on its decomposition as the product of an instantaneous risk level function with a trajectory time level function. The latent effects are inserted in both functions. To make the model parameters estimation the most efficient as possible, we use the template model builder (TMB) (KRISTENSEN et al., 2016). With this R (R Core Team, 2021) package, we have 1) the log-likelihood function written in C++; 2) access to efficient linear algebra libraries; 3) efficient Laplace approximation implementation for the latent-effects; and 4) an automatic differentiation (AD) routine, the state-of-the-art in derivatives computation. To check the model performance a large simulation study is performed, based on different latent structure formulations, with the aim to verify which one is the most adequate to real scenarios. The model presents to be of difficult estimation, with our results converging to a latent structure where the risk and trajectory time levels are correlated. The smallest parameter estimates biases are found in scenarios with high CIF, but the estimates present an excessive variance, showing that improvements are necessary.pt_BR
dc.format.extent1 arquivo (101 p.) : PDF.pt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.languageInglêspt_BR
dc.subjectMétodos numéricospt_BR
dc.subjectEstatisticapt_BR
dc.subjectAnálise Numéricapt_BR
dc.titleModeling the cumulative incidence function of clustered competing risks data : a multinomial GLMM approachpt_BR
dc.typeDissertação Digitalpt_BR


Arquivos deste item

Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples