Show simple item record

dc.contributor.advisorGuedes, Carlos Conforti Ferreira, 1981-pt_BR
dc.contributor.authorNogueira e Silva, Matheus Pereira, 1997-pt_BR
dc.contributor.otherUniversidade Federal do Paraná. Setor de Ciências da Terra. Programa de Pós-Graduação em Geologiapt_BR
dc.date.accessioned2022-07-26T12:19:46Z
dc.date.available2022-07-26T12:19:46Z
dc.date.issued2021pt_BR
dc.identifier.urihttps://hdl.handle.net/1884/73914
dc.descriptionOrientação: Prof. Dr. Carlos Conforti Ferreira Guedespt_BR
dc.descriptionDissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências da Terra, Programa de Pós-Graduação em Geologia. Defesa : Curitiba,pt_BR
dc.descriptionInclui referências: p. 86-106pt_BR
dc.description.abstractResumo: A demanda por banco de dados de solos para fins forenses é comum durante casos criminais onde não há amostras para confronto direto com o vestígio questionado. Para isso, diversos autores já detalharam métodos para inferir a origem de amostras de solo, como a aplicação de intervalos de confiança, similaridade estatística ou aprendizagem de máquina. Entretanto, ainda não foi testada a eficiência destes métodos para predizer a origem de solos gerados em clima subtropical úmido, sob moderada pedogênese. A fim de contribuir com esta lacuna, avaliou-se a preditibilidade de um banco de dados pedológico construído em uma área de 100 km² ao norte da Região Metropolitana de Curitiba (RMC), onde foram coletadas 232 amostras de solo superficial (< 5 cm), 14 amostras para validação e 38 amostras de subsuperfície (horizonte B). Para determinar suas assinaturas físicas, químicas e colorimétricas, as amostras foram submetidas a análise de susceptibilidade magnética, gamaespectrometria, colorimetria, pXRF e ATR-FTIR. Foram escolhidos três métodos de predição: (1) intervalos de confiança (ICs); (2) distâncias Euclidianas n-dimensionais (EDs); e (3) aprendizagem supervisionada (AS). Essa última envolveu a aplicação dos algoritmos de (a) redes neurais, (b) máquinas de vetores de suporte, (c) árvores de decisão, (d) regressão logística, (e) k-vizinhos mais próximos, (f) gradient boosting e (g) floresta aleatória. Após as análises estatísticas descritiva, frequentista e multivariada, foram gerados modelos geoestatísticos das 28 variáveis a partir da técnica da krigagem Bayesiana empírica (EBK) com regressão preditiva, utilizando-se como matrizes explicativas bases cartográficas geológicas e aerogeofísicas, cujos produtos foram utilizados no método preditivo dos ICs. Já para a técnica das EDs, os valores de dissimilaridade foram interpolados segundo o método do inverso do quadrado da distância (IQD). Observou-se que as variáveis que melhor se destacaram na discriminação das unidades geológicas e com alta correlação em subsuperfície foram a susceptibilidade magnética, brilho e os teores de Fe, Mn, Cu, Ni e grupo dos elementos leves (LE). O método dos ICs predizeram corretamente a origem de 4 de 14 amostras, reduzindo até 97,5% da área original. Já o método das EDs estimou de forma acurada a proveniência de 8 de 14 amostras, excluindo até 63,4% da área. Em termos de algoritmos de AS, redes neurais obtiveram os melhores resultados, onde foram capazes de predizer a unidade geológica de 71% das amostras de validação. Apesar das limitações e erros inerentes às análises não-destrutivas, do forte intemperismo químico e do alto teor de matéria orgânica, foram obtidos resultados satisfatórios de predição de proveniência, o que demonstra que a variabilidade espacial do solo superficial em ambientes subtropicais úmidos é factível de ser compreendida e utilizada como ferramenta forense, desde que os métodos adequados sejam aplicados.pt_BR
dc.description.abstractAbstract: When no samples are available for direct comparisons during a criminal investigation, forensic scientists must resort to georeferenced soil databases in order to find the source of a single questioned evidence. To this end, several authors addressed many methods to infer the origin of soil samples, such as establishing search range intervals, defining statistical similarity, or coding machine learning functions. However, little is currently known about the efficiency of these methods when it comes to highly weathered subtropical soils. Therefore, this study attempts to contribute to this subject by evaluating the predictability of a soil database built in a 100 km² area in the Curitiba Metropolitan Region, Brazil, where 232 topsoil (< 5 cm), 14 validation, and 38 subsoil samples (B horizon) were collected. To determine their physical, chemical, and colorimetric features, samples were subjected to magnetic susceptibility analysis, gamma-ray spectrometry, color analysis, pXRF, and ATR-FTIR. Three prediction methods were applied: (1) search range intervals (SR); (2) n-dimensional Euclidean distances (ED); and (3) supervised machine learning (ML), where 7 different algorithms were tested: (a) neural networks, (b) support vector machines, (c) decision trees, (d) logistic regression, (e) k-nearest neighbors, (f) gradient boosting, and (g) random forest. After the descriptive and multivariate statistical analyses, geostatistical models were generated for the 28 obtained variables using the empirical Bayesian kriging (EBK) with regression prediction method, where geological and airborne geophysical data were used as explanatory matrix. For the ED provenancing method, dissimilarity values were calculated and interpolated by applying the inverse distance weighting (IDW) approach. Findings, while preliminary, suggest that magnetic susceptibility, lightness, Fe, Mn, Cu, Ni, and the light elements group (LE) may be the most significant variables to discriminate parent rock and to correlate with subsurface data. The SR method managed to correctly predict the origin of 4 of 14 validation samples, reducing up to 97.5% of the original area. The ED method, on the other hand, accurately estimated the provenance of 8 out of 14 samples, excluding up to 63.4% of the area. In terms of ML algorithms, neural networks achieved the highest scores, where they matched the bedrock of 71% of the samples. Despite the limitations and errors inherent to non-destructive analyses, the intense chemical weathering, and the high organic matter content, overall soil provenancing results were suitable, demonstrating that spatial variability of topsoils developed under humid subtropical environments can be modeled and used in forensic contexts, as long as the right methods are applied.pt_BR
dc.format.extent1 recurso online : PDF.pt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.languageMultilinguapt_BR
dc.languageTexto em português e inglêspt_BR
dc.languageporengpt_BR
dc.subjectGeologia - Métodos estatísticospt_BR
dc.subjectPrática forensept_BR
dc.subjectGeologiapt_BR
dc.subjectSolos - Banco de dadospt_BR
dc.titlePredição da proveniência de vestígios de solo em ambiente subtropical : aplicação de métodos geoestatíticos em bancos de dadospt_BR
dc.typeDissertação Digitalpt_BR


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record