Modelo de regressão misto unit gamma para dados contínuos limitados na presença de zeros e uns
Resumo
Resumo: O objetivo deste trabalho é propor um modelo de regressão para lidar com dados contínuos limitados correlacionados no intervalo [0,1]. O modelo proposto é especificado por uma distribuição de probabilidade de mistura, na qual a distribuição unit gamma é usada para descrever a parte contínua e a distribuição Bernoulli a parte discreta (zeros e uns). Para estimação dos parâmetros e inferência, fez-se uso do método de máxima verossimilhança. A implementação computacional foi feita em linguagem C++ por meio do pacote TMB do software estatístico R, o qual permite combinar o método de aproximação de Laplace com diferenciação automática. O modelo proposto foi motivado por um conjunto de dados que avaliou a proporção de sítios doentes correspondentes a um tipo específico de dente (molar, pré-molar, canino e incisivo) em indivíduos com doença periodontal. Em particular, os valores zero e um indicam casos livre de doença e altamente doentes, respectivamente. De acordo com medidas de bondade de ajuste, o modelo proposto superou o modelo de regressão misto beta aumentado de zeros e uns na análise dos dados Abstract: The main goal of this work is to propose a regression model to deal with correlated continuous bounded data in the interval [0,1]. The proposed model is specified by a mixed probability distribution, in which the unit gamma distribution is used to describe the continuous part and the Bernoulli distribution the discrete part (zeros and ones). For parameter estimation and inference, we adopted the maximum likelihood method. The computational implementation was done in C++ language using the TMB package of the R statistical software, which allows to combine the Laplace approximation method with automatic differentiation. The proposed model was motivated by a dataset that evaluated the proportion of diseased sites corresponding to a specific tooth type (molar, premolar, canine and incisor) in individuals with periodontal disease. In particular, the values zero and one indicates disease-free and highly diseased cases, respectively. According to goodness of fit measures, the proposed model outperforms the augmented mixed beta regression model in data analysis.
Collections
- Data Science & Big Data [107]