Statistical methods to deal with different aspects of the covariance structure in applied forest biometrics
Resumo
Resumo: A biometria florestal é baseada em pesquisas que visam descrever o comportamento das árvores, com a finalidade de auxiliar o manejo florestal. Nesse contexto, o foco da presente pesquisa foi introduzir modelos estatísticos para melhorar o entendimento quanto ao comportamento das variáveis florestais, combinado com adequadas habilidades de predições. Capítulo I: Modelos lineares generalizados de covariância foram introduzidos para modelagem do afilamento do fuste de árvores de Pinus taeda. O componente de média foi baseado em um modelo não linear segmentado, enquanto quatro estruturas de covariância foram especificadas para uma explícita modelagem da variância e correlação. Os resultados mostraram que uma matriz de distância Euclidiana e estruturas de médias móveis de ordem 1 a 3 foram adequadas para remover o padrão de variância não constante dos resíduos, bem como a natural autocorrelação entre observações mensuradas ao longo do fuste das árvores. Esses modelos permitiram incluir de forma adequada uma análise de incertezas por meio de intervalos de confiança para a variável resposta. Capítulo II: Os modelos lineares generalizados de covariância multivariada foram introduzidos para modelagem conjunta das variáveis respostas altura e volume da Araucaria angustifolia, em floresta nativa. As duas variáveis respostas compartilharam informações devido a sua correlação significativa obtida no ajuste multivariado. A função de variância foi um componente importante para a resposta volume e melhorou as estatísticas de ajuste. Capítulo III: Métodos de regularização foram introduzidos para selecionar covariáveis correlacionadas em modelos lineares generalizados, para predizer a probabilidade de sobrevivência de árvores de Pinus taeda. A função de ligação complemento log-log foi a mais adequada na especificação do modelo Bernoulli. Esse resultado evidenciou que o comportamento da probabilidade de sobrevivência das árvores é assimétrico em relação ao preditor linear. A seleção de covariáveis a partir do procedimento stepwise foi mais parcimoniosa, quando comparada com os métodos de regularização baseados na abordagem elastic net, bem como os casos especiais de penalização lasso e ridge. Os modelos apresentaram ótima habilidade de predição, principalmente para predizer as árvores sobreviventes. Abstract: Forest biometrics is based on research that aims to describe the behavior of trees in order to assist the forest management. In this context, our focus was to introduce statistical models able to improve the understanding about the behavior of the forest variables, combined with suitable predictions ability. Chapter I: Covariance generalized linear models was introduced for Pinus taeda stem taper modeling. We define the mean component based on a non-linear segmented model, while four covariance structures were specified for an explicitly variance and correlation modeling. The results showed that an Euclidean distance matrix and moving average structure of order 1 to 3 were suitable for handling with non-constant variance pattern of the residuals, besides the natural autocorrelation among observations taken over the tree stem. Our models allowed to include a suitable uncertainty analysis based on confidence intervals for the response variable. Chapter II: We introduced the multivariate covariance generalized linear models for a jointly fitting of the response variables height and volume of Araucaria angustifolia, in native forest. Response variables shared information due to the significant correlation among them on the multivariate fitting. The variance function was an important component for the response volume and have potential to improve the fitting statistics. Chapter III: Regularizations methods were introduced for selecting correlated covariates in generalized linear models for predicting the Pinus taeda trees survival probability. The complementary log-log link function was the most suitable link function on the specification of the Bernoulli's model. Our result evidenced that the behavior of tree survival probability is asymmetric in relation to the linear predictor. Stepwise procedure was more parsimoniously for selecting covariates, when we compared to the regularization methods based on elastic net approach, as well as the special cases lasso and ridge penalization. Our models presented a great prediction ability, mainly for predicting the survival trees.
Collections
- Teses [375]